百科技术库 各行业技术资料 - 百科资料网
欢迎来到百科技术库 各行业技术资料 - 百科资料网! [免费注册] | [登录] 微信快捷登录 QQ登录 微博登录 | 帮助中心 各行业技术应有尽有!
全国服务热线 13310018778

栏目导航

最新技术
一种文本信息提取方法、装置及设备
本申请实施例公开了一种文本信息提取方法、装置及设备,通过提取待处理文本的文本特征和词性特征并融合,得到文本融合特征,将其输入至第一层次的序列标注模型中,可以对当前层次对应的待抽取信息项进行标注。进而利用得到的标注结果与文本融合特征进行融合,得到更新后的文本融合特征。通过更换当前层次的序列标注模型,可以依次进行各个层次的序列标注模型的标注,得到各个层次的序列标注模型的标注结果。通过对所述各个层次的序列标注模型输出的待处理文本的标注结果进行解析,获得待处理文本包括的不同层次的待抽取信息项的信息抽取内容。可以实现在自动进行文本信息提取的基础上,得到待处理文本的较为准确的文本信息。
文本可读性评价方法、计算机设备及计算机存储介质
本申请实施例公开了一种文本可读性评价方法、计算机设备及计算机存储介质,用于评价文本是否通俗易懂。本申请实施例提供了根据多种语义距离评价文本可读性的具体实施方式,以及提供了一种更科学的语义模型训练的方式和具体步骤,可以评价文本面向各种不同知识背景人群的可读性和通俗易懂性,同时还量化了文本可读性评价指标,使得文本可读性不再由人为主观评价,提高了文本可读性评价的准确性和可靠程度,具有更高的可用性和可实践性。
语义工程平台的构建方法及语义工程平台
本发明提出了一种语义工程平台的构建方法及语义工程平台,所述语义工程平台的构建方法包括:从预设的数据集合中提取类人求解技术环节相关的语义工程问题,所述数据集合为自然语言初等数学应用题集合;对提取的语义工程问题进行语料和语义分析,得到语义表示实例数据,所述语义表示实例数据包括数据元变量的语料实例、变量之间的数值关系的语义实例、变量的逻辑关系的语义实例;根据得到的语义表示实例数据构建面向问题的语义工程平台。本发明能够针对数学应用题类人求解实际问题,实现具体专门的语义、语料积累,构建了面向问题的语义工程平台,为实现真正的类人思维的求解提供数据基础。
语义匹配方法、装置、电子设备及存储介质
本申请提供了一种语义匹配方法、装置、电子设备及存储介质,所述方法包括:获取第一文本以及待与所述第一文本进行匹配的至少两个第二文本;基于文本语义,将所述第一文本向各所述第二文本进行命中,得到第一命中结果;基于文本语义,将所述第二文本分别向所述第一文本进行命中,得到第二命中结果;基于所述第一命中结果以及所述第二命中结果,确定与所述第一文本所匹配的第二文本。本申请实施例能够提高语义匹配的准确度。
语义识别方法、装置、电子设备及计算机可读存储介质
本申请公开了一种语义识别方法、装置、电子设备及存储介质。其中,该方法包括:在获取待识别文本时,基于待识别文本在标注文本索引库中获取候选文本集合,并在候选文本集合中获取与待识别语句最匹配的标注文本作为目标文本,从而根据目标文本对应的语义标注信息标注待识别文本,获得语义标注结果。如此,可以通过匹配的目标文本标注待识别文本,从而可以不经过实体模型对实体的抽取,快速获得待识别文本的语义识别结果,提升语义识别的响应速度,降低延迟。
中文实体识别模型的训练方法、装置、设备及存储介质
本申请为自然语言处理技术领域,本申请提供了一种中文实体识别模型的训练方法、装置、设备及存储介质,其中,所述方法包括:对中文文本进行多语言翻译,生成多种语言的源文本;利用机器翻译工具对多种源文本分别进行回译,得到多种源中文文本;利用预设投票机制对多种源中文文本进行相应的投票,将票数排在前N位的源中文文本作为目标中文文本;将目标中文文本输入中文实体识别模型进行训练,在训练出的实体识别结果满足要求时,完成所述中文实体识别模型的训练。本申请通过翻译、回译和投票的方式额外增加诸多高质量样本,提高了中文实体识别模型的训练效果。
一种针对中文文本的智能标注方法及系统
本发明公开了一种针对中文文本的智能标注方法及系统,所述方法包括:获取待标注数据集,以及待标注的实体和关系标签;基于实体关系抽取模型,对待标注数据集进行实体和关系识别,得到预标注结果;接收用户对预标注结果的修正,完成标注。本发明通过模型进行实体关系的识别,得到预标注结果,然后基于预标注结果,给出了一种基于可交互页面的人工标注方法,保证了实体和关系标注的精度。
一种多特征融合的供应链管理实体知识抽取的方法及系统
本发明公开了一种多特征融合的供应链管理实体知识抽取的方法及系统,将数据集中的文本句子转换为字符级向量表示和部首级向量表示,合并并输入卷积层后获得局部上下文特征向量;从字符级特征向量中获取上下文特征向量,输入卷积层中获得上下文突出特征向量;合并上下文特征向量、局部上下文特征向量和上下文突出特征向量后输出得到隐层向量;构造各个实体之间关系的权重连接图,提取区域节点特征,结合实体和权重连接图进行实体预测。本发明能够更好地针对未出现在训练集而未经过训练的汉字进行语义推理,从而降低了对供应链管理知识领域数据集进行知识抽取的难度,改善了知识抽取的效果,使得对该领域数据集的知识抽取能够达到预期的效果。
一种基于BERT与BiGRU-CRF的命名实体识别方法
本发明公开了一种基于BERT与BiGRU-CRF的命名实体识别方法,涉及计算机技术领域,包括以下步骤:通过网络爬虫获取电商行业的评论文本数据,并对所述文本数据进行标注,对标注文本数据进行预处理,构建训练数据集与验证数据集;并根据训练数据集、验证数据集训练BiGRU-CRF算法模型、BERT算法模型。本发明通过BERT预训练语言模型训练句子的词向量表示,对传统BERT模型训练任务做出改进,使用片段遮掩代替传统的字词遮掩;通过BiGRU模型进一步提取当前词与上下文的语义信息;通过CRF算法提取符合上下文逻辑的最优化标签。
实体识别方法、装置、电子设备及存储介质
本公开关于一种实体识别方法、装置、电子设备及存储介质,该方法包括:根据实体词表,将对象主题文本切分为多个字符和至少一个实体词,并确定包括对象主题文本中每个字符的词汇;确定每个字符的字向量,作为第一字向量,并确定实体词的词向量,作为第一词向量,确定词汇的词向量,作为第二词向量;根据包括同一字符的第二词向量和第一字向量,确定所述同一字符的第二字向量;根据每个字符的第二字向量和实体词的第一词向量,对对象主题文本进行实体识别,得到实体识别结果。本公开加强了字符在整体文本中的词汇分布,而且基于实体词强化了实体词的边界信息,提高了实体识别的准确率。