百科技术库 各行业技术资料 - 百科资料网
欢迎来到百科技术库 各行业技术资料 - 百科资料网! [免费注册] | [登录] 微信快捷登录 QQ登录 微博登录 | 帮助中心 各行业技术应有尽有!
全国服务热线 13310018778

栏目导航

最新技术
一种应急处置预案方法和系统
本发明涉及验证技术领域,尤其涉及一种应急处置预案方法和系统,本发明根据智能设备获取集中管理人员的基本信息、历史行为轨迹等数据,从时序、空间、人员关系网络等多个维度提取特征数据,建立人员行为特征库,构建人物画像图谱;其次通过建立机构图谱,形成管辖区域机构联动网,实现监管;为应急预案的生成提供历史参考。本发明提高了教育改造工作质量与监管质量,节约人员管理成本,为人员的应急处置提供技术支持。
基于知识图谱构建规章的本体模型的方法
本发明提供一种基于知识图谱构建规章的本体模型的方法,用于通过知识图谱对规章文本进行处理从而形成一个本体模型,其特征在于,包括如下步骤:步骤S1,获取规章文本并进行划分;步骤S2,将主语、宾语分别构建为第一图节点以及第二图节点;步骤S3,将谓语以及宾语中的连接词构建为关系图节点;步骤S4,为第一图节点、第二图节点以及关系图节点分别构建关系链接;步骤S5,在规章文本存在索引号时,将该索引号构建为索引图节点,并为索引图节点构建一个第三关系连接并分别与第一图节点、第二图节点以及关系图节点链接;步骤S6,对规章文本进行抽象并确定对应实体类别以及关系类别;步骤S7,基于实体类别、关系类别以及规章文本构建本体模型。
一种基于感知数据的标签提取方法及其提取系统
本发明提供的一种基于感知数据的标签提取方法及其提取系统,包括以下步骤:S1.确定待提取的感知数据;S2.根据所述的感知数据,获得所述的感知数据的状态矢量;S3.根据所述的感知数据的状态矢量,提取所述的感知数据的A标签。提取系统包括:确定模块,用于确定待提取的感知数据;获得模块,用于根据所述的感知数据,获得所述的感知数据的状态矢量;提取模块,用于根据所述的感知数据的状态矢量,提取所述的感知数据的A标签。本发明根据感知数据的状态矢量,有针对性和选择地提取感知数据的标签,能够避免现有技术中单一特征作为感知数据的标签而导致的所提取的标签准确性低问题,从而提高了感知数据标签提取的准确性。
多源异构电力负荷数据融合方法、装置、设备和存储介质
本申请涉及一种多源异构电力负荷数据融合方法、装置、设备和存储介质。该方法包括:获取电力负荷数据的多源异构文本,对所述异构文本进行格式归一化处理;对所述异构文本提取关键字符构建知识字典,通过多源对象名分类得到所述异构文本的对象数据库;采用MapReduce编程模型并行处理技术将所述知识字典和所述对象名匹配,再将所述对象名和对象数据匹配;对Reduce处理后的多源匹配结果进行纵向参数融合与横向参数融合。通过对多源异构电网负荷大数据的多层次处理,提供了从融合到评估的一整套电力大数据融合策略及评估,数据融合的实用性强、效率高。
基于文本摘要的文本分类方法、装置、电子设备及介质
本发明涉及智能决策技术领域,揭露一种基于文本摘要的文本分类方法,包括:将获取到的待分类段落文本划分为单句,得到待分类单句集;利用基于关键词的抽取式摘要提取方法从待分类单句集中提取第一文本摘要;利用基于深度学习的抽取式摘要提取方法从待分类单句集中提取第二文本摘要;分别计算第一文本摘要及第二文本摘要与待分类段落文本的匹配程度,根据匹配程度确定目标文本摘要;利用文本分类模型对目标文本摘要进行文本分类,得到待分类段落文本的文本类别。本发明还提出一种基于文本摘要的文本分类装置、设备及存储介质。本发明还涉及区块链技术,所述待分类段落文本的文本类别可存储于区块链节点中。本发明可以提高文本分类的准确度。
检测日志序列异常的方法、装置及计算机存储介质
本发明提供了一种检测日志序列异常的方法、装置及计算机存储介质,包括从数据源中收集原始的日志序列数据;根据所述日志序列数据中日志序列的层次结构依次提取每一层的语义信息,生成每一层固定维度的语义向量;根据所述日志序列的语义向量利用SoftMax函数计算所述日志序列的概率分布,选择最大条件概率对应的结果作为输出类别。本发明能够从单词、日志和日志序列中提取更加丰富的语义特征,从而使装置能够学习更加准确的层次语义表达,达到更佳的检测效果,进一步提高了检测三种日志序列异常的能力。
基于预训练文本编码模型的分类体系扩展方法
本发明提出了一种基于预训练文本编码模型的分类体系扩展方法。本发明利用需要扩展的分类体系和分类体系中词汇的定义文本作为输入数据,通过微调自监督训练已经在广泛域下预训练过的模型,得到根据分类路径以及词定义打分的判断模型。在自监督训练过程中,本发明使用动态差额损失函数,并基于任务设计了对应的动态差额计算方法。相比大部分需要使用大量相关语料训练和预测的现有方法,本发明减少了在训练和预测过程中所需要的语料。实验结果表明,本方法具有显著优于现有其它方法的判断准确率。
文本数据的检测方法、装置、电子设备及存储介质
本申请涉及计算机技术领域,具体涉及一种文本数据的检测方法、装置、电子设备及存储介质,包括:获取样本数据集;将文本数据样本输入至预先训练的文本分类模型,得到多个预设文本类别的分类概率,并根据分类概率确定文本数据样本的第一概率统计值;从样本数据集中选取部分文本数据样本,并将部分文本数据样本的样本标签统一替换为替代样本标签;将带有替代样本标签的文本数据样本输入文本分类模型,得到多个文本类别的分类概率,并根据分类概率确定带有替代样本标签的文本数据样本的第二概率统计值;根据第一概率统计值与第二概率统计值之间的数值关系确定文本数据样本的样本标签是否标注正确。采用本申请提供的方法能提高文本数据样本的样本标签的正确率。
题库的生成方法、装置、计算机可读存储介质及处理器
本发明公开了一种题库的生成方法、装置、计算机可读存储介质及处理器。其中,该方法包括:获取的热点问题数据;对热点问题数据中的热点问题进行分类,得到分类结果;依据分类结果和热点问题数据,生成目标题库,其中,目标题库包括:不同类型的热点问题以及热点问题对应的答案。本发明解决了现有技术中的客服培训通常采用手动的出题,无法快速智能化的生成用于客服人员练习的题库的技术问题。
消除新闻中行业词歧义的方法、装置、设备和存储介质
本发明属于数据处理技术领域,具体涉及一种消除新闻中行业词歧义的方法、装置、设备和存储介质。其中方法包括:获取新闻,对新闻进行行业分类,得到行业标签分类结果;对行业标签分类结果进行标签共现检验,若检验未通过,则将全部的行业标签加入歧义判别列表中,若检验通过,则将存在歧义词集合中的特征词对应的行业标签加入歧义判别列表中,若不存在,则直接输出结果;通过预设的歧义判别模型对歧义判别列表中的行业标签进行判别,得到歧义判别结果,根据歧义判别结果进行输出。本发明摆脱了对歧义词表或知识图谱的重度依赖,可以自动发现歧义词表之外的歧义词带来的错误,大大减少了开发成本。