百科技术库 各行业技术资料 - 百科资料网
欢迎来到百科技术库 各行业技术资料 - 百科资料网! [免费注册] | [登录] 微信快捷登录 QQ登录 微博登录 | 帮助中心 各行业技术应有尽有!
全国服务热线 13310018778

栏目导航

最新技术
语言模型预训练方法、装置
本发明提供语言模型预训练方法,包括:获取基于第一特征初始化的第一词向量,所述第一特征包括图像特征;获取随机初始化的第二词向量;基于所述第一词向量与所述第二词向量训练语言模型。结合了包括图像和词语构成的多模态特征进行预训练,提升了语言与现实事物的关联性;降低了进行语言模型预训练所需的语料,有效利用了外部知识,有利于进一步提高语言模型在下游任务中的使用效果。本发明还提供的语言模型预训练装置能够实现本发明的语言模型预训练方法而具有相应优势。
基于履历文件的命名实体识别方法、装置和电子设备
本公开的实施例公开了基于履历文件的命名实体识别方法、装置和电子设备。该方法的一具体实施方式包括:获取履历文件;响应于确定履历文件的文件类型为目标文件类型,根据履历文件,生成至少一个文本区域图像;对至少一个文本区域图像中的每个文本区域图像进行图像分割,以生成子文本区域图像组;对子文本区域图像组集合中的每个子文本区域图像进行图像尺寸归一化处理,以生成归一化文本区域图像;识别归一化文本区域图像组集合中每个归一化文本区域图像包括的字符,以生成字符信息集合;根据字符信息集合,生成文本信息;根据字符信息集合、文本信息和目标命名实体识别模型,生成实体信息集合。该实施方式提高了实体识别的准确率。
一种智能标签粘贴监测方法及系统
本发明公开了一种智能标签粘贴监测方法,获取第一指令;获取设备的第一数据与第二数据,并在第一指令请求的作用下,生成第一标签;基于第一标签与第二数据,生成第一预览图,并获取第一预览图中第一标签粘贴在设备上的第一位置信息,第一预览图为第一标签粘贴在设备上的虚拟示意图;将第一标签粘贴到设备上,并获取第一标签与设备之间的粘贴的第二位置信息,将第一位置信息与第二位置信息做对比,误差范围小于预设阈值,标签识别的信息与设备信息一致,则粘贴成功;本发明的有益效果为提高了标签粘贴在设备上的准确性,增加了设备在现场运维效率,降低了标签粘贴的错误率;减少了标签打印过程中人为干预,提高了标签打印的效率。
语义识别方法、装置、电子设备及计算机可读存储介质
本申请公开了一种语义识别方法、装置、电子设备及存储介质。其中,该方法包括:在获取待识别文本时,基于待识别文本在标注文本索引库中获取候选文本集合,并在候选文本集合中获取与待识别语句最匹配的标注文本作为目标文本,从而根据目标文本对应的语义标注信息标注待识别文本,获得语义标注结果。如此,可以通过匹配的目标文本标注待识别文本,从而可以不经过实体模型对实体的抽取,快速获得待识别文本的语义识别结果,提升语义识别的响应速度,降低延迟。
中文实体识别模型的训练方法、装置、设备及存储介质
本申请为自然语言处理技术领域,本申请提供了一种中文实体识别模型的训练方法、装置、设备及存储介质,其中,所述方法包括:对中文文本进行多语言翻译,生成多种语言的源文本;利用机器翻译工具对多种源文本分别进行回译,得到多种源中文文本;利用预设投票机制对多种源中文文本进行相应的投票,将票数排在前N位的源中文文本作为目标中文文本;将目标中文文本输入中文实体识别模型进行训练,在训练出的实体识别结果满足要求时,完成所述中文实体识别模型的训练。本申请通过翻译、回译和投票的方式额外增加诸多高质量样本,提高了中文实体识别模型的训练效果。
一种针对中文文本的智能标注方法及系统
本发明公开了一种针对中文文本的智能标注方法及系统,所述方法包括:获取待标注数据集,以及待标注的实体和关系标签;基于实体关系抽取模型,对待标注数据集进行实体和关系识别,得到预标注结果;接收用户对预标注结果的修正,完成标注。本发明通过模型进行实体关系的识别,得到预标注结果,然后基于预标注结果,给出了一种基于可交互页面的人工标注方法,保证了实体和关系标注的精度。
一种多特征融合的供应链管理实体知识抽取的方法及系统
本发明公开了一种多特征融合的供应链管理实体知识抽取的方法及系统,将数据集中的文本句子转换为字符级向量表示和部首级向量表示,合并并输入卷积层后获得局部上下文特征向量;从字符级特征向量中获取上下文特征向量,输入卷积层中获得上下文突出特征向量;合并上下文特征向量、局部上下文特征向量和上下文突出特征向量后输出得到隐层向量;构造各个实体之间关系的权重连接图,提取区域节点特征,结合实体和权重连接图进行实体预测。本发明能够更好地针对未出现在训练集而未经过训练的汉字进行语义推理,从而降低了对供应链管理知识领域数据集进行知识抽取的难度,改善了知识抽取的效果,使得对该领域数据集的知识抽取能够达到预期的效果。
一种基于BERT与BiGRU-CRF的命名实体识别方法
本发明公开了一种基于BERT与BiGRU-CRF的命名实体识别方法,涉及计算机技术领域,包括以下步骤:通过网络爬虫获取电商行业的评论文本数据,并对所述文本数据进行标注,对标注文本数据进行预处理,构建训练数据集与验证数据集;并根据训练数据集、验证数据集训练BiGRU-CRF算法模型、BERT算法模型。本发明通过BERT预训练语言模型训练句子的词向量表示,对传统BERT模型训练任务做出改进,使用片段遮掩代替传统的字词遮掩;通过BiGRU模型进一步提取当前词与上下文的语义信息;通过CRF算法提取符合上下文逻辑的最优化标签。
实体识别方法、装置、电子设备及存储介质
本公开关于一种实体识别方法、装置、电子设备及存储介质,该方法包括:根据实体词表,将对象主题文本切分为多个字符和至少一个实体词,并确定包括对象主题文本中每个字符的词汇;确定每个字符的字向量,作为第一字向量,并确定实体词的词向量,作为第一词向量,确定词汇的词向量,作为第二词向量;根据包括同一字符的第二词向量和第一字向量,确定所述同一字符的第二字向量;根据每个字符的第二字向量和实体词的第一词向量,对对象主题文本进行实体识别,得到实体识别结果。本公开加强了字符在整体文本中的词汇分布,而且基于实体词强化了实体词的边界信息,提高了实体识别的准确率。
一种面向机械化工领域的中文实体识别方法和系统
一种面向机械化工领域的中文实体识别方法,包括:采取短文本预处理来提取有效内容;采用经过词典优化的中文分词器进行中文分词和词性标注;利用词频与类优先级函数所构成的权重函数用作权重计算同时基于规则式优化加权提取短文本目标关键词;搜索目标关键词上下文基于构建的有向概率状态转化图来进行关键词的上下文扩展从而获得目标实体。本发明还包括实施一种面向机械化工领域的中文实体识别方法的系统,包括依次连接的短文本预处理模块、中文分词和词性标注模块、权重计算和规则式优化加权模块、关键词搜索和扩展模块。本发明实现了高准确率的中文实体识别。

技术分类