百科技术库 各行业技术资料 - 百科资料网
欢迎来到百科技术库 各行业技术资料 - 百科资料网! [免费注册] | [登录] 微信快捷登录 QQ登录 微博登录 | 帮助中心 各行业技术应有尽有!
全国服务热线 13310018778

栏目导航

最新技术
一种基于语言模型的跨专科文本结构化方法
本发明提出了一种基于语言模型的跨专科文本结构化方法。对于电子病历文本结构化任务来说,从抽取目标上来说分为分类型、文本跨度型和生成型三类。本发明使用了一种端到端的文本结构化方法,将病历文本视为知识,将字段名做一定变换后构造成问题,让模型回答出对应的字段值,将三类文本结构化任务转换为生成式的问答任务,使得算法具有跨专科任务的可迁移性与解决不同类型任务的灵活性。
一种单词学习方法、装置、系统及计算设备
本发明实施例公开了一种单词学习方法,包括:获取单词集合中当前待学习的目标单词,目标单词基于用户对单词集合的学习进度以及单词集合中各单词的学习顺序确定;显示所获取的目标单词;以及显示目标单词对应的关联例句,关联例句至少包括目标单词和单词集合中的其他单词。本发明实施例还公开了相应的单词学习装置、系统及计算设备。
训练语言模型的方法和标签设置方法
本公开提供了一种训练语言模型的方法、标签设置方法、装置、设备、存储介质以及程序产品,涉及图像处理、计算机视觉、深度学习等人工智能技术领域,尤其涉及增强现实AR技术领域。具体实现方案为:获取至少一个标准词和与至少一个标准词具有相同含义的口语词,作为样本词;以及利用样本词和包含样本词的语句来训练语言模型。
实体识别模型的训练与实体识别方法、装置
本公开提供了一种实体识别模型的训练与实体识别方法、装置,涉及自然语言处理、深度学习技术领域。实体识别模型的训练方法包括:获取训练数据;构建包含第一网络层、第二网络层与第三网络层的神经网络模型;使用多个训练文本、对应不同实体类型的行业词典、目标实体类型向量与多个训练文本中对应不同实体类型的实体标注结果训练所述神经网络模型,得到实体识别模型。实体识别方法包括:获取待识别文本;将所述待识别文本、对应不同实体类型的行业词典与目标实体类型向量输入实体识别模型;根据所述实体识别模型的输出结果,提取所述待识别文本中与目标实体类型对应的实体,作为所述待识别文本的实体识别结果。
摘要生成模型的训练方法、装置、设备和存储介质
本公开提供了一种摘要生成模型的训练方法、装置、设备和存储介质,涉及计算机技术领域,具体涉及自然语言处理、深度学习等人工智能领域。摘要生成模型的训练方法包括:获取文档样本对应的文档表示;基于所述文档表示,构造所述文档表示对应的摘要表示,所述摘要表示包括正摘要表示和负摘要表示;基于所述文档表示、所述正摘要表示、所述负摘要表示,构建总对比损失函数,并基于所述总对比损失函数训练摘要生成模型。本公开可以提高摘要生成模型的准确度。
基于RPA及AI的信息抽取方法、装置、设备及介质
本发明实施例公开一种基于RPA及AI的信息抽取方法、装置、设备及介质,该方法包括:对已标注的输入文本进行识别,确定包含标注信息的标注片段和不包含标注信息的非标注片段;根据标注内容确定待抽取的文本信息,通过将标注类别和文本信息进行组合,得到抽取节点;根据非标注片段的关键字段生成文本节点,该文本节点对应标识符的表示方式是按照关键字段在非标注片段中的重要度值来确定的;按照非标注片段和所述标注片段在输入文本中的位置,将文本节点和抽取节点进行组合,得到信息抽取模板,并基于信息抽取模板,对未标注的其他输入文本进行信息抽取。通过采用上述技术方案,提升了信息抽取的准确性。
变体文本的识别方法、装置及电子设备
本申请公开了一种变体文本的识别方法、装置及电子设备,所述方法包括:获取待识别文本;从待识别文本中获取第一目标字符的位置,根据第一目标字符的位置,在待识别文本中检测与第一目标字符之间存在预设字符间隔的第一文本字符,并在检测到第一文本字符为数字串时,从待识别文本中删除第一目标字符和第一文本字符;根据删除第一目标字符和第一文本字符后的待识别文本,确定目标文本,对目标文本进行变体字转换后,进行引导词匹配;若匹配到引导词,则将待识别文本标记为变体文本。
文本情感分析方法和装置
本公开公开了文本情感分析方法和装置,涉及人工智能技术领域,进一步涉及自然语言处理、云计算技术领域。具体实现方案为:首先获取待分析短文本,然后确定待分析短文本的主客观偏向类型,最后基于待分析短文本和与主客观偏向类型对应的情感分析模型,得到待分析短文本对应的情感类型,能够识别待分析文本的主客观偏向类型,使得每种类型的文本能够利用对应的情感分析模型进行分析,有效提升了文本情感分析的准确性和针对性,从而提高了文本在舆情产品中的分类精确度。
槽位填充方法、装置、设备及存储介质
本发明涉及人工智能,提供一种槽位填充方法、装置、设备及存储介质。该方法能够根据槽位填充请求获取待分析文本,对待分析文本进行切分,得到多个字符,基于每个字符遍历预设词典,得到词典分词,根据待分析文本从词典分词中选取出目标词汇,根据每个字符在目标词汇中的位置确定词汇类型,根据词汇类型对目标词汇进行表征处理,得到表征向量,计算目标词汇的词汇重要度,根据词汇重要度及表征向量生成词汇向量,获取每个字符的字符向量,拼接字符向量及词汇向量,得到目标向量,将目标向量输入至预先训练好的槽位填充模型中,得到槽位标签。本发明能够准确确定出槽位标签。此外,本发明还涉及区块链技术,所述槽位标签可存储于区块链中。
一种基于预训练模型的词对齐性能提升方法
本发明公开一种基于预训练模型的词对齐性能提升方法,步骤为:使用预训练模型获取句子中词语的词向量,构成互译句对的词向量矩阵X和Y;对词向量矩阵X和Y进行短语和术语的抽取,把短语和术语中的词的词向量进行加和平均处理,获得更新后的互译句对词向量矩阵X和Y;将词语和词语之间的词向量余弦计算值作为两个词之间的相似度,获得互译句对的相似度矩阵Sim;对Sim进行卷积操作,使得词对齐融入上下文词的信息;使用不同的词对齐抽取方法分别从更新后的互译句对相似度矩阵中抽取对应的词对齐信息。本发明通过基于预训练方法解决了深度学习需要训练数据大的问题,使用短语和术语表进行匹配,来解决预训练中词语之间相关度不大,而导致词语之间对齐不统一的问题。