百科技术库 各行业技术资料 - 百科资料网
欢迎来到百科技术库 各行业技术资料 - 百科资料网! [免费注册] | [登录] 微信快捷登录 QQ登录 微博登录 | 帮助中心 各行业技术应有尽有!
全国服务热线 13310018778

栏目导航

最新技术
目标人群搜索意图的识别方法、装置、电子设备及介质
本公开关于一种目标人群搜索意图的识别方法、装置、电子设备和存储介质,其中,该方法包括:在获取到搜索请求时,获取搜索请求中各搜索词在预设时间段之内的搜索特征和统计特征,其中,统计特征用于表征搜索词在预设时间段之内的分布情况;根据每个搜索词的搜索特征,从各搜索词中确定出候选搜索词;根据候选搜索词的统计特征,判定候选搜索词是否具有搜索目标人群意图。由此,通过根据搜索词在预设时间段之内的搜索特征和统计特征,确定搜索词是否具有搜索目标人群意图,提高了搜索准确性。
文本比对方法、装置、介质及电子设备
本公开涉及一种文本比对方法、装置、介质及电子设备,包括:获取原始文本文件和比对文本文件;根据原始文本文件和比对文本文件分别获取由原始文本构成的第一字符串和由比对文本构成的第二字符串;将第一字符串和第二字符串进行比对,确定比对结果;将比对结果显示在原始文本文件和/或比对文本文件中。这样,在对原始文本文件和该比对文本文件进行比对时无需考虑两个字符串中的字符之外的任何文件信息,简化了不同文本文件之间进行比对的方法,具有较快的文本比对速度,提高了文本比对的效率,而且比对结果还能够在原始文本文件和/或比对文本文件中进行显示,从而使得比对结果能够更加直观地展示出来。
语义匹配方法、装置和介质
公开了语义匹配方法、装置和介质,其涉及基于人工智能的自然语言处理。所述方法包括:对第一文本和第二文本执行分词和拼接处理,得到第一词序列;将第一词序列提供至嵌入网络,并转换为第一词向量;将第一词向量提供至变换网络,其中变换网络包括第一到第N变换层,并且每个变换层具有对应的分类网络;以及从第一到第N变换层依序进行以下操作:将该变换层所生成的特征向量提供至与其对应的分类网络;利用该分类网络基于其接收的特征向量生成语义匹配预测结果;在语义匹配预测结果满足预定条件的情况下,基于语义匹配预测结果生成第一文本和第二文本的语义匹配结果。
基于人工智能的图文内容质量识别方法和装置
本申请涉及一种基于人工智能的图文内容质量识别方法和装置。所述方法包括:获取待识别文章,并提取待识别文章的文章先验特征、文本内容和图文序列特征。对各文章先验特征进行特征交叉处理,得到交叉先验特征向量。根据文本内容生成待识别文章的文档特征向量。对各图文序列特征进行加权处理,得到加权处理后的图文序列特征向量,进而将交叉先验特征向量、文档特征向量和加权处理后的图文序列特征向量进行全连接处理,得到待识别文章的综合特征向量,基于综合特征向量确定待识别文章的图文内容质量。采用本方法结合了待识别文章的多个维度,对图文内容质量进行判定和识别,避免单一维度判断方式得到的片面结果,提升图文内容质量判定结果的准确度。
敏感词识别方法、系统及计算机可读存储介质
本发明公开了一种敏感词识别方法、系统及计算机可读存储介质,该方法包括在接收到待识别文本时,向分布式缓存服务器发送数据访问请求,其中,所述数据访问请求包括主键,分布式缓存服务器接收到数据访问请求时,从自身对应的缓存节点中获取主键对应的搜索树,并将搜索树发送至词库检索服务器;接收所述分布式缓存服务器返回的主键对应的搜索树;基于AC自动机算法确定待识别文本与搜索树的匹配结果,并根据匹配结果确定所述待识别文本中的敏感词。本发明通过在分布式缓存服务器中缓存了搜索树,在进行敏感词识别后,可直接访问分布式缓存服务器,以读取搜索树,减轻了数据库的压力并提升了敏感词识别的识别速度。
基于鲁棒矩阵分解的离散哈希检索方法
本发明公开了基于鲁棒矩阵分解的离散哈希检索方法,其通过互联网收集图像和文本两个模态的样本建立数据集;利用BOW算法提取图像和文本两个模态的样本的特征;利用矩阵分解算法学习图像和文本两个模态间的一致性和不一致性,其一致性由共享哈希码来表示,其不一致性由最小化共性来约束;所学习的哈希码可以捕捉不同模态的一致性信息,从而提高检索性能。本发明具有较高的检索性能,并容易应用到大规模数据集,具有广阔的应用前景。
非结构化文本事件抽取方法
本发明提供非结构化文本事件抽取方法,包括:通过利用多阶句法树和图神经网络对文本信息进行编码,得到更为丰富和表征能力更强的词特征向量,进而提升事件检测的能力;通过构建外部本体知识,融入到候选事件论元编码环节,增加论元词汇特征编码的差异性,从而提升事件论元识别准确率。
员工社区发现方法、系统、计算机和可读存储介质
本申请涉及一种员工社区发现方法、装置、系统、计算机设备和计算机可读存储介质,其中,该员工社区发现方法包括:交互序列获取步骤,获取目标员工的会话交互数据,将所述会话交互数据进行加密处理并根据一预设切分单位分为多个会话单元,并将所述会话单元输出为员工交互序列;序列模型获取步骤,基于所述员工交互序列通过序列建模方法构建并训练序列模型;序列向量获取步骤,基于所述序列模型得到所述员工交互序列的序列向量;员工社区发现步骤,将所述序列向量利用聚类算法进行聚类,完成社区发现。通过本申请,实现更准确、完善的发现员工社区。
在线客服场景下的文本内容敏感词过滤替换的方法及系统
本发明提供一种在线客服场景下的文本内容敏感词过滤替换的方法及系统,其中,方法包括:步骤S1:创建数据桶;步骤S2:获取预设的多个敏感词库,基于敏感词库对数据桶进行配置;步骤S3:获取需要进行敏感词过滤替换的文本;步骤S4:基于配置完成的数据桶对文本进行敏感词过滤替换,获得目标文本,输出目标文本。本发明的在线客服场景下的文本内容敏感词过滤替换的方法及系统,基于敏感词库对数据桶进行配置,当数据桶配置完成后,基于数据桶对需要进行敏感词过滤替换的文本进行敏感词过滤替换,最后输出过滤替换后的目标文本,使用简单且使用成本较低。
基于单级数据库的数据查询方法、装置、设备及存储介质
本发明涉及数据查询领域,揭露了一种基于单级数据库的数据查询方法,包括:从单级数据库中获取每个原始数据的标识字段及用户信息,将每个原始数据的标识字段及用户信息进行合并,形成多个用户记录;对每个用户记录构建倒排索引,得到用户记录的倒排索引库;响应于数据查询请求,从倒排索引库中查询数据查询请求的用户信息,得到目标用户信息,并根据目标用户信息,查询数据查询请求在单级数据库的标识字段,得到目标标识字段;根据目标标识字段,向单级数据库中查询数据,得到数据查询请求的数据查询结果。此外,本发明还提供一种基于单级数据库的数据查询装置、电子设备以及存储介质。本发明可以提高单级数据库的数据查询速度。