百科技术库 各行业技术资料 - 百科资料网
欢迎来到百科技术库 各行业技术资料 - 百科资料网! [免费注册] | [登录] 微信快捷登录 QQ登录 微博登录 | 帮助中心 各行业技术应有尽有!
全国服务热线 13310018778

栏目导航

最新技术
翻译方法及分类模型的训练方法、装置、设备和存储介质
本公开提供了一种翻译方法及分类模型的训练方法、装置、设备和存储介质,涉及计算机技术领域,具体涉及自然语言处理、深度学习等人工智能领域。翻译方法包括:基于源语言文本中的分词,获得所述源语言文本的当前处理单元;采用分类模型,确定所述当前处理单元的分类结果;若所述分类结果为所述当前处理单元可被单独翻译,对所述当前处理单元进行翻译,以获得所述当前处理单元对应的目标语言的翻译结果。本公开可以有效地平衡翻译质量和翻译时延。
模型的训练方法、装置、设备和存储介质
本公开提供了一种模型的训练方法、装置、设备和存储介质,涉及计算机技术领域,具体涉及自然语言处理、深度学习等人工智能领域。语音翻译模型的训练方法包括:获取原始数据对,所述原始数据对包括第一原始数据和第二原始数据,所述第一原始数据和所述第二原始数据的语言或者模态不同;采用语料生成模型,对所述原始数据对进行处理,以获得生成数据对,所述生成数据对包括第一生成数据和第二生成数据,所述第一生成数据和所述第二生成数据的语言和模态均不同;采用所述生成数据对,训练翻译模型。本公开可以扩展翻译模型的训练数据的规模。
文本翻译方法、装置、电子设备及存储介质
本公开提供了文本翻译方法、装置、电子设备及存储介质,涉及自然语言处理和深度学习等人工智能领域,其中的方法可包括:针对待翻译的第一句子,获取对应的K个句子对,K为大于一的正整数,每个句子对中分别包括源语言句子和对应的目标语言句子,源语言为第一句子对应的语言,目标语言为第一句子的翻译结果对应的语言;分别根据各句子对生成一个翻译结果,将得到的K个翻译结果作为第一句子的翻译结果。应用本公开所述方案,可提升翻译结果的多样性等。
翻译模型的训练与翻译方法、装置
本公开提供了一种翻译模型的训练与翻译方法、装置,涉及自然语言处理、深度学习技术领域。翻译模型的训练方法包括:获取第一训练数据;构建包含记忆模块、编码模块与解码模块的神经网络模型;使用多个第一训练文本、多个第一训练文本的前文文本与多个第一训练文本的译文标注结果训练神经网络模型,得到翻译模型。翻译方法包括:获取待翻译篇章,确定待翻译篇章中的待翻译文本与待翻译文本的前文文本;针对每个待翻译文本,将该待翻译文本与该待翻译文本的前文文本输入翻译模型,根据翻译模型的输出结果得到待翻译文本的译文输出结果;根据每个待翻译文本的译文输出结果,得到待翻译篇章的翻译结果。
一种机器翻译结果的评估方法、装置、设备及存储介质
本申请提供一种机器翻译结果的评估方法、装置、设备及存储介质,涉及自然语言技术领域。该方法包括:获取多个机器系统对同一个源语言语料分别进行翻译后得到的目标语言语料;根据各机器系统的目标语言语料以及参考语言语料,确定各机器系统的实际匹配分数;根据各机器系统的实际匹配分数,确定该参考语言语料中各语义单元的第一困难权重;根据目标机器系统的目标语言语料中各语义单元是否存在于该参考语言语料中,得到该目标机器系统的目标语言语料中各语义单元的第二困难权重;根据第一困难权重以及第二困难权重,确定该目标机器系统的翻译结果的评估分数。应用本申请实施例,可以提高对机器翻译结果进行评估的准确性。
一种样本处理方法、装置、设备和介质
本发明实施例公开了一种样本处理方法、装置、设备和介质,其中,方法包括:获取预设文本匹配模型的初始训练样本,并对所述初始训练样本中的查询文本进行聚类处理,其中,所述查询文本为输入至所述预设文本匹配模型中的关键字;根据聚类处理的结果及各初始训练样本的时间戳,对所述初始训练样本中负样本进行去重和修正,得到目标模型训练样本。解决了现有技术中采集到的预设文本匹配模型的训练样本数据中负样本标签错误及重复率高,导致样本数据质量低的问题,实现了根据初始训练样本中查询文本相似度及样本时间戳进行样本去重,提升预设文本匹配模型的训练样本的质量。
模型训练方法、品牌词识别方法、装置及电子设备
本公开提供了一种模型训练方法、品牌词识别方法、装置及电子设备,涉及人工智能技术领域,尤其涉及自然语言处理技术领域。该方法包括:采用第一内容样本对第一知识增强语义表示模型进行训练得到第一品牌词识别模型;将第一品牌词识别模型作为知识蒸馏中的教师模型,将第二知识增强语义表示模型作为知识蒸馏中的学生模型,采用知识蒸馏的方法对第二知识增强语义表示模型进行训练,得到第二品牌词识别模型,第二品牌词识别模型的输出和第一品牌词识别模型的输出一致,第二知识增强语义表示模型的模型参数少于第一知识增强语义表示模型的模型参数。提高了品牌词识别的准确率。
语义表示模型的训练方法、装置、设备和存储介质
本公开提供了一种语义表示模型的训练方法、装置、设备和存储介质,涉及计算机技术领域,具体涉及自然语言处理、深度学习等人工智能领域。语义表示模型的训练方法包括:基于句子获得锚样本,以及,基于所述句子的句法信息,获得正样本和负样本;采用语义表示模型分别对所述锚样本、所述正样本和所述负样本进行处理,以获得锚样本语义表示、正样本语义表示和负样本语义表示;基于所述锚样本语义表示、所述正样本语义表示和所述负样本语义表示,构建对比损失函数;基于所述对比损失函数,训练所述语义表示模型。本公开可以在不修改模型结构的基础上,使得句子的语义表示包含句法信息。
语义解析方法、装置、电子设备及存储介质
本公开提供了语义解析方法、装置、电子设备及存储介质,涉及自然语言处理和深度学习等人工智能领域,其中的方法可包括:对输入的问题与对应的数据库进行编码;根据编码结果生成SQL查询语句,其中,针对任一SQL从句,分别进行以下处理:确定出问题中与该SQL从句对应的问题片段;根据所述问题片段生成该SQL从句。应用本公开所述方案,可提升生成的SQL查询语句的准确性等。
生成节点表示的方法、装置、电子设备和可读存储介质
本公开提供了一种生成节点表示的方法、装置、电子设备和可读存储介质,涉及深度学习技术领域。其中,生成节点表示的方法包括:获取待处理异构图;根据第一元路径,在所述待处理异构图中采样得到至少一条第一游走路径;根据所述至少一条第一游走路径,得到所述待处理异构图中每个节点的初始节点表示;根据每个节点的初始节点表示与每个节点的邻居节点的初始节点表示,生成每个节点的最终节点表示。本公开能够提升所生成的节点表示的准确性。