百科技术库 各行业技术资料 - 百科资料网
欢迎来到百科技术库 各行业技术资料 - 百科资料网! [免费注册] | [登录] 微信快捷登录 QQ登录 微博登录 | 帮助中心 各行业技术应有尽有!
全国服务热线 13310018778

栏目导航

最新技术
语义匹配方法、装置、电子设备及存储介质
本申请提供了一种语义匹配方法、装置、电子设备及存储介质,所述方法包括:获取第一文本以及待与所述第一文本进行匹配的至少两个第二文本;基于文本语义,将所述第一文本向各所述第二文本进行命中,得到第一命中结果;基于文本语义,将所述第二文本分别向所述第一文本进行命中,得到第二命中结果;基于所述第一命中结果以及所述第二命中结果,确定与所述第一文本所匹配的第二文本。本申请实施例能够提高语义匹配的准确度。
训练语言模型的方法和标签设置方法
本公开提供了一种训练语言模型的方法、标签设置方法、装置、设备、存储介质以及程序产品,涉及图像处理、计算机视觉、深度学习等人工智能技术领域,尤其涉及增强现实AR技术领域。具体实现方案为:获取至少一个标准词和与至少一个标准词具有相同含义的口语词,作为样本词;以及利用样本词和包含样本词的语句来训练语言模型。
实体识别模型的训练与实体识别方法、装置
本公开提供了一种实体识别模型的训练与实体识别方法、装置,涉及自然语言处理、深度学习技术领域。实体识别模型的训练方法包括:获取训练数据;构建包含第一网络层、第二网络层与第三网络层的神经网络模型;使用多个训练文本、对应不同实体类型的行业词典、目标实体类型向量与多个训练文本中对应不同实体类型的实体标注结果训练所述神经网络模型,得到实体识别模型。实体识别方法包括:获取待识别文本;将所述待识别文本、对应不同实体类型的行业词典与目标实体类型向量输入实体识别模型;根据所述实体识别模型的输出结果,提取所述待识别文本中与目标实体类型对应的实体,作为所述待识别文本的实体识别结果。
摘要生成模型的训练方法、装置、设备和存储介质
本公开提供了一种摘要生成模型的训练方法、装置、设备和存储介质,涉及计算机技术领域,具体涉及自然语言处理、深度学习等人工智能领域。摘要生成模型的训练方法包括:获取文档样本对应的文档表示;基于所述文档表示,构造所述文档表示对应的摘要表示,所述摘要表示包括正摘要表示和负摘要表示;基于所述文档表示、所述正摘要表示、所述负摘要表示,构建总对比损失函数,并基于所述总对比损失函数训练摘要生成模型。本公开可以提高摘要生成模型的准确度。
基于RPA及AI的信息抽取方法、装置、设备及介质
本发明实施例公开一种基于RPA及AI的信息抽取方法、装置、设备及介质,该方法包括:对已标注的输入文本进行识别,确定包含标注信息的标注片段和不包含标注信息的非标注片段;根据标注内容确定待抽取的文本信息,通过将标注类别和文本信息进行组合,得到抽取节点;根据非标注片段的关键字段生成文本节点,该文本节点对应标识符的表示方式是按照关键字段在非标注片段中的重要度值来确定的;按照非标注片段和所述标注片段在输入文本中的位置,将文本节点和抽取节点进行组合,得到信息抽取模板,并基于信息抽取模板,对未标注的其他输入文本进行信息抽取。通过采用上述技术方案,提升了信息抽取的准确性。
变体文本的识别方法、装置及电子设备
本申请公开了一种变体文本的识别方法、装置及电子设备,所述方法包括:获取待识别文本;从待识别文本中获取第一目标字符的位置,根据第一目标字符的位置,在待识别文本中检测与第一目标字符之间存在预设字符间隔的第一文本字符,并在检测到第一文本字符为数字串时,从待识别文本中删除第一目标字符和第一文本字符;根据删除第一目标字符和第一文本字符后的待识别文本,确定目标文本,对目标文本进行变体字转换后,进行引导词匹配;若匹配到引导词,则将待识别文本标记为变体文本。
一种作业评阅系统及方法
本发明涉及一种作业评阅系统及方法。该评阅系统包括:作业提取模块,用于采用B/S架构、HTML5技术以及COM自动化技术提取文字陈述性作业;自动批阅分析模块,用于按照批阅库中的模糊语义,基于正则表达式的模糊语义定位识别算法以及深度学习语义向量相似度识别算法对所述文字陈述性作业进行模糊语义识别,确定分析结果;自动批注模块,用于基于正则表达式的模糊语义定位识别算法和Ajax异步通讯技术,根据所述分析结果对所述文字陈述性作业自动添加所述批阅库内的自动批注语句,并根据批注语句生成批注类别;自动总评模块,用于利用深度学习语义向量相似度识别算法,根据所述批注类别生成总评报告。本发明解决人工批阅,过程繁琐、统计困难的问题。
基于知识图谱构建规章的本体模型的方法
本发明提供一种基于知识图谱构建规章的本体模型的方法,用于通过知识图谱对规章文本进行处理从而形成一个本体模型,其特征在于,包括如下步骤:步骤S1,获取规章文本并进行划分;步骤S2,将主语、宾语分别构建为第一图节点以及第二图节点;步骤S3,将谓语以及宾语中的连接词构建为关系图节点;步骤S4,为第一图节点、第二图节点以及关系图节点分别构建关系链接;步骤S5,在规章文本存在索引号时,将该索引号构建为索引图节点,并为索引图节点构建一个第三关系连接并分别与第一图节点、第二图节点以及关系图节点链接;步骤S6,对规章文本进行抽象并确定对应实体类别以及关系类别;步骤S7,基于实体类别、关系类别以及规章文本构建本体模型。
基于预训练文本编码模型的分类体系扩展方法
本发明提出了一种基于预训练文本编码模型的分类体系扩展方法。本发明利用需要扩展的分类体系和分类体系中词汇的定义文本作为输入数据,通过微调自监督训练已经在广泛域下预训练过的模型,得到根据分类路径以及词定义打分的判断模型。在自监督训练过程中,本发明使用动态差额损失函数,并基于任务设计了对应的动态差额计算方法。相比大部分需要使用大量相关语料训练和预测的现有方法,本发明减少了在训练和预测过程中所需要的语料。实验结果表明,本方法具有显著优于现有其它方法的判断准确率。
收集表处理方法、装置、设备以及存储介质
本申请实施例公开了一种收集表处理方法、装置、设备以及存储介质,涉及人工智能中的计算机视觉技术和自然语言处理技术,其中,方法包括:响应于针对用于收集信息的收集表的创建请求,显示包括主题输入区域的收集表创建界面;响应于针对所述主题输入区域的输入操作,在所述主题输入区域中显示所输入的收集表主题信息,并根据所述收集表主题信息在所述收集表创建界面中显示候选素材列表;响应于针对所述候选素材列表中的目标收集表素材的选择操作,根据所述目标收集表素材和所述收集表主题信息得到目标收集表。通过本申请能够提高创建收集表的效率和便捷性。

技术分类