百科技术库 各行业技术资料 - 百科资料网
欢迎来到百科技术库 各行业技术资料 - 百科资料网! [免费注册] | [登录] 微信快捷登录 QQ登录 微博登录 | 帮助中心 各行业技术应有尽有!
全国服务热线 13310018778

栏目导航

最新技术
对话小说的交互展示方法、计算设备及计算机存储介质
本发明公开了一种对话小说的交互展示方法、计算设备及计算机存储介质,方法包括:每当接收用户在交互区所触发的第一内容展示指令时,根据对话小说中各个对话内容的展示顺序,获取待展示的对话内容组;其中,待展示的对话内容组包含展示顺序连续的至少两条对话内容,并且,至少两条对话内容对应同一对话角色;响应于第一内容展示指令,在展示区内按照展示顺序呈现待展示的对话内容组包含的至少两条对话内容。通过上述方式,用户进行一次交互则将接下来的同一对话角色的连续多个对话内容一并展示在展示区中,避免连续多个对话内容之间的关联性被切断的问题,还能够减少用户阅读小说内容的交互操作,能够提高用户阅读效率,能够提升用户阅读体验。
一种样本筛选方法及装置
本申请提供一种样本筛选方法及装置,其中所述样本筛选方法包括:获取样本问题,以及包含所述样本问题对应答案的样本语料,在所述样本语料的语料文本中提取文本片段作为所述语料文本的文本片段集,其中所述文本片段的尺寸根据所述样本问题对应的答案确定,对所述文本片段集中的文本片段进行筛选,并将包含完整的所述答案的文本片段作为所述样本问题的正样本文本,将不包含所述答案的文本片段作为所述样本问题的负样本文本。
文章原创检查方法、装置及存储介质
本发明公开了一种文章原创检查方法,包括:收到待检测文章,并标记所述文章的段落;根据标点符号将段落拆分出多个句子;并将段落的首段和末段的每一句子、中间段落随机选取一个句子放入待检队列;依次将所述待检队列的每一句子作为搜索关键词在搜索引擎中搜索,获取该句子对应的搜索结果;对所述搜索结果去重后计算所述搜索结果与对应的句子进行相似度计算,获得每一句子的相似度计算结果。此外还提供了文章原创检查装置及存储介质。本发明提供的技术方案,实现文章中的句子、段落、文章整体的相似度检查及其量化,提升了文章原创检查效率,且无须人为干预,节省人力,同时检查耗时短,结果判断准确。
一种文本信息处理方法、装置、电子设备及存储介质
本发明提供了一种文本信息处理方法、装置、电子设备、存储介质,方法包括:获取待处理文本信息;对所述待处理文本信息进行分词处理,确定至少一个候选关键词向量;对候选关键词向量进行动态调整,形成候选关键词向量集合,通过深度强化学习网络,基于所述候选关键词向量集合与奖励值参数,确定与所述待处理文本信息相匹配的关键词抽取策略;基于所述关键词抽取策略对所述候选关键词向量集合进行抽取,获得至少一个关键词向量作为所述待处理文本信息的关键词,由此,减少关键词提取中对词粒度的依赖,使得所提取的待处理文本信息的关键词适用不同的使用场景,提高用户的使用体验。
基于深度学习的数据处理方法、装置和系统
本发明公开一种基于深度学习的数据处理方法、装置和系统,对图片进行检测、分类和识别,在数据中心处理系统完成对每张图片的业务数据建模,还原业务信息,利用自然语言处理预训练模型,进行业务专业领域的文本实体识别,还原用户的行为和路径,形成用户整体的行为画像数据库,利用知识图谱和搜索算法,生成独立的实体并标准化处理。本发明基于深度学习原理,通过图片识别处理用户上传的业务相关资料,自动识别文本信息并进行排序,经过模型训练后结合业务专业领域知识图谱完成对用户行为信息的还原,可以构造出整体的行为画像,为后续产品应用提供客观数据,有效地解决了数据丢失或数据造假的问题。
一种能源行业公共数据模型构建方法
本发明公开了一种能源行业公共数据模型构建方法,包括如下步骤:确定公共数据模型中的数据主题域,能源大数据中心接入主题域包含的各类模型数据;构建能源大数据中心的实体对象池;构建能源专业词库的知识图谱搜索引擎;构建公共数据模型中的逻辑结构模型,逻辑结构模型划为核心集和领域集,核心集包括有定义类型结构的结构模型和基础模型,所述领域集包括有领域模型;根据知识图谱搜索引擎,判断领域模型中逻辑实体i与逻辑实体j的逻辑关系;根据判定结果实时更新领域模型集;通过低代码平台将逻辑结构模型转成物理模型。解决了能源大数据中心业务实体定义无法清晰划分、共享层模型共享性能差、多源数据无法统一接入的问题。
异质集成模型筛选方法和电子设备
本申请提供了一种异质集成模型筛选方法和电子设备,其中,该方法包括:根据待选模型集中的各个待选模型的预测得分,分别确定任意两个待选模型的初始相关系数;根据该初始相关系数,从该待选模型集中筛选出包含指定数量的目标模型的目标模型集。能够提高模型筛选的效率。
文本主题挖掘方法、装置、电子设备及存储介质
本申请提供一种文本主题挖掘方法、装置、电子设备及存储介质。该方法包括:获取多个文本数据;对多个文本数据进行语义分析,获得句向量;汇总句向量,获得句向量集合;根据句向量集合对多个文本数据进行聚类分析,获得聚类结果;当聚类结果中的簇集合满足聚类结束条件时,将簇集合的主题结果作为多个文本数据的文本主题;其中,聚类结果包括多个簇集合,每一所述簇集合包括多个句向量。本申请实施例通过预先对多个文本数据进行语义表示,获得对应的句向量,然后根据句向量对多个文本数据进行聚类分析,从而获得多个文本数据的文本主题,不论文本数据的长短,均能够较准确的进行主题分析,从而提高了主题分析的准确性。
知识图谱构建方法、装置和设备
本申请提供一种知识图谱构建方法、装置和设备,该方法包括:获取待处理的文本数据和所述文本数据所属的目标领域;识别出所述文本数据的标题层级结构;根据所述标题层级结构和与所述目标领域匹配的目标图谱纲要,抽取出所述文本数据中的三元组集合;根据所述三元组集合,构建所述文本数据的知识图谱。本申请实现了无需将待处理的文本预先处理成特定格式,即可自动构建文本数据的知识图谱,节约人工成本。
评估咨询对话质量的方法、装置、设备和存储介质
本公开提供了一种评估咨询对话质量的方法、装置、设备和存储介质,涉及人工智能技术领域,具体涉及自然语言处理技术领域和深度学习技术领域。评估咨询对话质量的方法的具体实现方案为:获得待处理咨询对话的特征信息;基于特征信息,采用预定等级分类模型确定待处理咨询对话的质量等级。