百科技术库 各行业技术资料 - 百科资料网
欢迎来到百科技术库 各行业技术资料 - 百科资料网! [免费注册] | [登录] 微信快捷登录 QQ登录 微博登录 | 帮助中心 各行业技术应有尽有!
全国服务热线 13310018778

栏目导航

最新技术
一种面向机械化工领域的中文实体识别方法和系统
一种面向机械化工领域的中文实体识别方法,包括:采取短文本预处理来提取有效内容;采用经过词典优化的中文分词器进行中文分词和词性标注;利用词频与类优先级函数所构成的权重函数用作权重计算同时基于规则式优化加权提取短文本目标关键词;搜索目标关键词上下文基于构建的有向概率状态转化图来进行关键词的上下文扩展从而获得目标实体。本发明还包括实施一种面向机械化工领域的中文实体识别方法的系统,包括依次连接的短文本预处理模块、中文分词和词性标注模块、权重计算和规则式优化加权模块、关键词搜索和扩展模块。本发明实现了高准确率的中文实体识别。
金融主体的识别方法、电子装置和存储介质
本申请涉及一种金融主体的识别方法、电子装置和存储介质,其中,该金融主体的识别方法包括:将待分析的金融文档输入两个以上各不相同的第一主体识别模型,得到第一预测结果集合,第一预测结果集合由与各第一主体识别模型对应的各第一预测结果组成,各第一预测结果包含由对应的第一主体识别模型预测得到的若干金融主体,根据各金融主体在第一预测结果集合中出现的次数,确定金融主体是否作为识别结果输出,通过本申请,解决了容易误判金融欺诈信息的主体的问题,实现了更加准确地识别金融欺诈信息的主体。
邮箱账号异常检测方法、装置、电子设备及存储介质
本申请提供一种邮箱账号异常检测方法、装置、电子设备及存储介质,该方法包括:获取第一邮箱账号在预设时间段内的多个邮件数据;对每一所述邮件数据进行特征提取,获得每一所述邮件数据对应的邮件特征;将所述账号通信特征、所述通联关系特征和所述邮件内容特征输入预先构建的检测模型中,获得所述检测模型输出的所述第一邮箱账号是否异常的检测结果。本申请实施例通过同时使用账号通信特征、通联关系特征和邮件内容特征作为特征向量,利用机器学习算法对多个邮件数据进行分析,从而从多个维度确定第一邮箱账号是否存在异常情况,提高了检测的准确性。
负例构造方法、装置、设备和存储介质
本公开提供了一种负例构造方法、装置、设备和存储介质,涉及人工智能技术领域,具体涉及自然语言处理、深度学习等技术领域。负例构造方法包括:确定原始查询语句中的待替换词;获取所述待替换词的关联词,所述关联词与所述待替换词的语义不同;用所述关联词替换所述待替换词,以获得替换查询语句,作为所述原始查询语句的负例。本公开可以提高构造负例的效率。
训练语言模型的方法和标签设置方法
本公开提供了一种训练语言模型的方法、标签设置方法、装置、设备、存储介质以及程序产品,涉及图像处理、计算机视觉、深度学习等人工智能技术领域,尤其涉及增强现实AR技术领域。具体实现方案为:获取至少一个标准词和与至少一个标准词具有相同含义的口语词,作为样本词;以及利用样本词和包含样本词的语句来训练语言模型。
基于RPA及AI的信息抽取方法、装置、设备及介质
本发明实施例公开一种基于RPA及AI的信息抽取方法、装置、设备及介质,该方法包括:对已标注的输入文本进行识别,确定包含标注信息的标注片段和不包含标注信息的非标注片段;根据标注内容确定待抽取的文本信息,通过将标注类别和文本信息进行组合,得到抽取节点;根据非标注片段的关键字段生成文本节点,该文本节点对应标识符的表示方式是按照关键字段在非标注片段中的重要度值来确定的;按照非标注片段和所述标注片段在输入文本中的位置,将文本节点和抽取节点进行组合,得到信息抽取模板,并基于信息抽取模板,对未标注的其他输入文本进行信息抽取。通过采用上述技术方案,提升了信息抽取的准确性。
变体文本的识别方法、装置及电子设备
本申请公开了一种变体文本的识别方法、装置及电子设备,所述方法包括:获取待识别文本;从待识别文本中获取第一目标字符的位置,根据第一目标字符的位置,在待识别文本中检测与第一目标字符之间存在预设字符间隔的第一文本字符,并在检测到第一文本字符为数字串时,从待识别文本中删除第一目标字符和第一文本字符;根据删除第一目标字符和第一文本字符后的待识别文本,确定目标文本,对目标文本进行变体字转换后,进行引导词匹配;若匹配到引导词,则将待识别文本标记为变体文本。
文本情感分析方法和装置
本公开公开了文本情感分析方法和装置,涉及人工智能技术领域,进一步涉及自然语言处理、云计算技术领域。具体实现方案为:首先获取待分析短文本,然后确定待分析短文本的主客观偏向类型,最后基于待分析短文本和与主客观偏向类型对应的情感分析模型,得到待分析短文本对应的情感类型,能够识别待分析文本的主客观偏向类型,使得每种类型的文本能够利用对应的情感分析模型进行分析,有效提升了文本情感分析的准确性和针对性,从而提高了文本在舆情产品中的分类精确度。
一种基于预训练模型的词对齐性能提升方法
本发明公开一种基于预训练模型的词对齐性能提升方法,步骤为:使用预训练模型获取句子中词语的词向量,构成互译句对的词向量矩阵X和Y;对词向量矩阵X和Y进行短语和术语的抽取,把短语和术语中的词的词向量进行加和平均处理,获得更新后的互译句对词向量矩阵X和Y;将词语和词语之间的词向量余弦计算值作为两个词之间的相似度,获得互译句对的相似度矩阵Sim;对Sim进行卷积操作,使得词对齐融入上下文词的信息;使用不同的词对齐抽取方法分别从更新后的互译句对相似度矩阵中抽取对应的词对齐信息。本发明通过基于预训练方法解决了深度学习需要训练数据大的问题,使用短语和术语表进行匹配,来解决预训练中词语之间相关度不大,而导致词语之间对齐不统一的问题。
文本处理方法、装置、设备以及存储介质
本申请实施例公开了一种文本处理方法、装置、设备以及存储介质,该方法适用于人工智能、大数据以及自然语言处理等领域。该方法包括:获取待评估文本集合,以及多个文本评估特征,待评估文本集合包括多个待评估文本;对多个待评估文本进行分类,得到多个文本集合;基于每个文本集合所包含的待评估文本的数量,确定多个文本集合中的目标文本集合;对于目标文本集合中的每个待评估文本,基于该待评估文本与多个文本评估特征的匹配度,确定该待评估文本的评估结果。采用本申请实施例,可提高文本处理效率,可准确对待评估文本进行评估,适用性高。

技术分类