百科技术库 各行业技术资料 - 百科资料网
欢迎来到百科技术库 各行业技术资料 - 百科资料网! [免费注册] | [登录] 微信快捷登录 QQ登录 微博登录 | 帮助中心 各行业技术应有尽有!
全国服务热线 13310018778

栏目导航

最新技术
一种基于众包的人类行为文本数据集的构造以及处理方法
本发明公开了一种基于众包的人类行为文本数据集的构造以及处理方法,首先,确定需要收集的主题对象,依据具体的要求生成任务并发布于众包平台,获得设定主题下所有可能发生的人类示例的文本数据集;对于同一个行为或事件的文本经过不同人的撰写会表现在多个句子,因此需要把描述同一事件的不同句子聚类在一起,因此,对于获取的数据集采用聚类的方式将本属于同一行为的不同文本表现聚为一类;采用关联分析技术挖掘出行为之间存在的先后关系结构;采用互信息技术学习出行为之间存在的互斥关系结构,并将人类行为存在的各种关系构造成一个情节图,即表明在某种情况下会发生什么事件,并限制其发生的方式,提高对人类行为的分析的准确性。
文本分类方法、装置、计算机设备和存储介质
本申请涉及人工智能技术领域,提供了一种文本分类方法、装置、计算机设备和存储介质。方法包括:获取待处理文本;按字符类型对待处理文本中的字符序列进行切分处理,得到切分词块;确定切分词块在待处理文本中的位置,并根据切分词块所属的类别,得到切分词块的类别标识;根据切分词块、切分词块的类别标识以及切分词块在待处理文本中的位置,得到待处理文本的特征数据;根据特征数据,对待处理文本进行分类分析,得到分类结果。通过精细化的切词和子词切分处理,以及对切分词块进行类别标识,得到具有更丰富语义知识的特征数据,对待处理文本进行分类分析,可以得到更为准确的分类结果。
基于时效的数据处理方法、装置、电子设备及存储介质
本申请实施例提供了一种基于时效的数据处理方法、装置、电子设备及存储介质,涉及云技术及人工智能技术领域。该方法包括:获取待处理内容,待处理内容包括文本内容;确定文本内容的文本特征;根据文本内容的文本特征,确定待处理内容的第一时效类别;若第一时效类别为第一类别,则基于第一类别对应的时效确定待处理内容的时效;若第一时效类别为第二类别,则基于文本内容中的时间关键词确定待处理内容的时效,第二类别对应的时效大于第一类别对应的时效;根据待处理内容的时效进行处理。本申请实施例提升了待处理内容的时效的准确度,可以使应用程序推荐给用户的信息是没有过时的有效信息,提高用户体验。
基于主动学习的语料挖掘方法、装置及电子设备
本申请实施例提供了基于主动学习的语料挖掘方法、装置及电子设备,涉及人工智能领域。该方法包括:获取未标注语料;利用至少两个预先训练好的语料分类模型对未标注语料进行分类,得到至少两个语料分类模型输出的、针对未标注语料进行分类的第一分类类型和分类分数;选取第一分类类型不一致、且分类分数符合预设条件的未标注语料作为待标注语料,对待标注语料进行二次分类处理,得到待标注语料的第二分类类型。本技术方案能够有利于扩宽语料挖掘的覆盖面,提高语料挖掘的泛化性。
一种文本聚类处理方法及系统
本申请公开了一种文本聚类处理方法及系统,该方法包括:获取输入文本并基于预设模型对所述输入文本进行拆分;获取拆分后的输入文本的文本特征;获取所述文本特征针对预设至少一个聚类的生成概率;若所述生成概率中的最大值大于预设阈值,将所述输入文本归类为所述生成概率中最大值对应的聚类;若所述生成概率中的最大值小于或等于所述预设阈值,根据所述输入文本创建新的聚类。本方法不依赖标签数据,也不依赖文本相似度。当输入文本归类为某一聚类时,可以丰富该聚类的特征,从可以提高该聚类的覆盖范围,提高方案的通用性。当为输入文本创建新的聚类时,可以创建新的聚类,提高所有聚类的覆盖范围。
一种利用预训练模型的吉布斯受限文本摘要生成方法
本发明涉及文本摘要技术领域,涉及一种利用预训练模型的吉布斯受限文本摘要生成方法,其利用模型进行训练和生成文本摘要,训练如下:1)对文本源序列进行词向量化,加入相对位置编码,得到文本Word Embedding;2)利用注意力机制和Bi-LSTM来提取特征,训练模型,微调模型,得到编码器的输出;3)加入相对位置编码,得到目标序列Word Embedding;4)解码器端参数和Transformer的保持一致;5)将Attention矩阵输入全连接层,然后计算得到词汇表的概率表示;6)解码器端融入LDA模型进行关键词提取,结合Gibbs采样算法来提取生成摘要。本发明能较佳地生成文本摘要。
信息显示方法、装置、电子设备及可读存储介质
本申请公开了一种信息显示方法、装置、电子设备及可读存储介质,属于数据处理技术领域。该方法包括:确定用户在对话界面中引用的目标引用文本,计算目标引用文本中至少两个句子的第一得分值,选取至少两个句子中第一得分值高于分数阈值的目标句子作为摘要,在对话界面中显示摘要。
生成式文本摘要系统和方法
生成式文本摘要系统和方法。公开了一种生成式自动文本摘要系统和方法,其可以采用搜索和重新排名策略来改进摘要任务的性能。该系统和方法可以采用变换器神经模型来辅助摘要任务。变换器神经模型可以被训练以学习人类抽象,并且然后可以可操作来生成抽象式摘要。在生成多个摘要假设的情况下,可以采用最佳优先搜索算法和重新排名算法来选择最佳候选摘要作为输出摘要的一部分。
提要生成方法、信息生成及信息推荐方法、装置及设备
公开了一种提要生成方法、信息生成方法、装置及设备。根据集合中对象的文本描述信息和图像描述信息,构建由节点和节点间的连线组成的关系图,节点用于表征取自文本描述信息的文本或取自图像描述信息的图像,连线用于表征节点之间的关联关系;使用提要预测模型组件对节点的第一向量化表示和节点之间的关联关系的第二向量化表示进行处理,以得到提要预测结果;基于提要预测结果确定集合的提要。由此,通过引入图像信息,可以丰富信息源,根据额外的信息源使得可以生成信息更加丰富的提要;并且基于同时根据对象的文本描述信息和图像描述信息构建的关系图,可以生成相关性高且有吸引性的提要。
生成文本摘要的方法和装置
本发明公开了一种生成文本摘要的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:对待生成摘要的文本数据进行编码以得到隐层序列;根据预设要素词典和基于要素的覆盖度机制对隐层序列进行解码以生成文本摘要。该实施方式避免了对同一要素施加重复的注意力,进而减少摘要中对同一个要素的重复描述,降低了生成的摘要的冗余度,使得生成的文本摘要更为精简,准确,可以涵盖更多的信息。