视频标签的处理方法和装置

文档序号:7779 发布日期:2021-09-17 浏览:39次 英文

视频标签的处理方法和装置

技术领域

本申请涉及计算机

技术领域

,具体而言,涉及一种视频标签的处理方法和装置。

背景技术

随着互联网技术的发展,社交平台中的用户可以在社交平台中发布社交视频,以供社交平台中的其它用户进行搜索浏览。

用户在将社交视频上传到社交平台时,可以对社交视频添加与视频内容相关的视频标签,如可以以hashtag(井号标签)的方式来添加一个或多个视频标签,这些视频标签使得用户可以根据需求在社交平台中搜索社交视频。

用户对社交视频所添加的视频标签完全由用户自定义设置,这样会使得部分用户所添加的视频标签与社交视频的主流主题之间存在严重不符的情况,使得用户根据视频标签在社交平台中搜索社交视频时,会存在搜索到的社交视频所反映的主流主题与社交视频的视频标签之间存在主题漂移的情况,因此如何快速检测社交视频所反映的主题与社交视频的视频标签之间存在的主题漂移情况成为亟待解决的技术问题。

发明内容

本申请的实施例提供了一种视频标签的处理方法和装置,可以解决相关技术中存在的搜索到的社交视频与社交视频的视频标签之间存在主题漂移的技术问题。

本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。

根据本申请实施例的一个方面,提供了一种视频标签的处理方法,包括:获取目标社交视频的视频标签序列,所述视频标签序列包括多个视频标签;基于所述视频标签在所述视频标签序列中的位置以及社交平台中包含所述视频标签的社交视频所对应的播放次数之和,在所述视频标签序列中选取主题视频标签;基于所述视频标签生成所述视频标签对应的词向量,以及基于所述主题视频标签生成所述主题视频标签对应的词向量;计算所述视频标签对应的词向量的平均值与所述主题视频标签对应的词向量的平均值之间的相似度;基于所述相似度,确定所述视频标签序列所包含的视频标签与所述目标社交视频之间的主题漂移结果。

根据本申请实施例的一个方面,提供了一种视频标签的处理装置,包括:获取单元,用于获取目标社交视频的视频标签序列,所述视频标签序列包括多个视频标签;选取单元,用于基于所述视频标签在所述视频标签序列中的位置以及社交平台中包含所述视频标签的社交视频所对应的播放次数之和,在所述视频标签序列中选取主题视频标签;生成单元,用于基于所述视频标签生成所述视频标签对应的词向量,以及基于所述主题视频标签生成所述主题视频标签对应的词向量;计算单元,用于计算所述视频标签对应的词向量的平均值与所述主题视频标签对应的词向量的平均值之间的相似度;执行单元,用于基于所述相似度,确定所述视频标签序列所包含的视频标签与所述目标社交视频之间的主题漂移结果。

在本申请的一些实施例中,基于前述方案,所述选取单元被配置为:确定社交平台中包含所述视频标签的社交视频的视频条数;在所述视频标签序列中,删除视频条数小于预定视频条数阈值的视频标签,生成更新后的视频标签序列;基于更新后的视频标签序列中剩余的视频标签在更新后的视频标签序列中的位置,以及社交平台中包含剩余的视频标签的社交视频所对应的播放次数之和,在更新后的视频标签序列中选取主题视频标签。

在本申请的一些实施例中,基于前述方案,所述选取单元被配置为:将所述视频标签与预定视频标签库中的视频标签进行匹配,所述预定视频标签库是包含无意义视频标签的视频标签库;在所述视频标签序列中,删除与预定视频标签库中的视频标签相匹配的视频标签,生成更新后的视频标签序列;基于更新后的视频标签序列中剩余的视频标签在更新后的视频标签序列中的位置,以及社交平台中包含剩余的视频标签的社交视频所对应的播放次数之和,在更新后的视频标签序列中选取主题视频标签。

在本申请的一些实施例中,基于前述方案,所述选取单元被配置为:确定社交平台中包含所述视频标签的社交视频的视频条数,以及确定社交平台所包含的社交视频的视频总条数;计算社交平台所包含的社交视频的视频总条数与确定社交平台中包含所述视频标签的社交视频的视频条数之间的比值;基于所述比值,确定所述视频标签序列包含的视频标签与所述目标社交视频之间的重要度,所述重要度与所述比值为负相关关系;在所述视频标签序列中,删除重要度小于预定重要度阈值的视频标签,生成更新后的视频标签序列;基于更新后的视频标签序列中剩余的视频标签在更新后的视频标签序列中的位置,以及社交平台中包含有剩余的视频标签的社交视频所对应的播放次数之和,在更新后的视频标签序列中选取主题视频标签。

在本申请的一些实施例中,基于前述方案,所述选取单元被配置为:基于所述视频标签在所述视频标签序列的位置,以及社交平台中包含所述视频标签的社交视频所对应的播放次数之和,确定所述视频标签与所述目标社交视频之间的主题匹配度,所述主题匹配度与所述位置对应的顺序编号为负相关关系,所述主题匹配度与社交平台中包含所述视频标签的社交视频所对应的播放次数之和为正相关关系;基于所述视频标签与所述目标社交视频之间的主题匹配度,在所述视频标签序列中选取主题视频标签。

在本申请的一些实施例中,基于前述方案,所述选取单元被配置为:基于所述视频标签在所述视频标签序列的位置、社交平台中包含所述视频标签的社交视频所对应的播放次数之和,以及社交平台中包含所述视频标签的社交视频的评论条数之和,确定所述视频标签与所述目标社交视频之间的主题匹配度,所述主题匹配度与评论条数之和为正相关关系。

在本申请的一些实施例中,基于前述方案,所述选取单元被配置为:计算社交平台中包含所述视频标签的社交视频所对应的播放次数之和,以及社交平台中包含所述视频标签的社交视频的评论条数之和之间的加权和;基于所述视频标签在所述视频标签序列的位置以及所述加权和,确定所述视频标签与所述目标社交视频之间的主题匹配度。

在本申请的一些实施例中,基于前述方案,所述执行单元被配置为:若所述相似度低于预定相似度阈值,则确定所述视频标签序列所包含的视频标签与所述目标社交视频之间产生主题漂移;若所述相似度高于或等于预定相似度阈值,则确定所述视频标签序列所包含的视频标签与所述目标社交视频之间未产生主题漂移。

在本申请的一些实施例中,基于前述方案,所述视频标签的处理装置还包括:添加单元,用于若所述相似度低于预定相似度阈值,则将所述目标社交视频添加至无法被社交用户搜索的搜索黑名单。

根据本申请实施例的一个方面,提供了一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述实施例中所述的视频标签的处理方法。

根据本申请实施例的一个方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中所述的视频标签的处理方法。

根据本申请实施例的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实施例中提供的视频标签的处理方法。

在本申请的一些实施例所提供的技术方案中,通过基于视频标签在视频标签序列中的位置以及社交平台中包含视频标签的社交视频所对应的播放次数之和,在视频标签序列中选取与社交视频所反映的主题相符合的主题视频标签,并通过计算视频标签对应的词向量的平均值与主题视频标签对应的词向量的平均值之间的相似度,通过该相似度来确定视频标签序列所包含的视频标签与社交视频所反映的主题之间的匹配情况,实现了准确地检测社交视频所反映的主题与社交视频的视频标签之间存在的主题漂移情况。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:

图1示出了可以应用本申请实施例的技术方案的示例性系统架构的示意图。

图2示意性示出了根据本申请的一个实施例的视频标签的处理方法的流程图。

图3示意性示出了根据本申请的一个实施例中的步骤S220的具体流程图。

图4示意性示出了根据本申请的一个实施例的视频标签的处理方法的流程图。

图5示意性示出了根据本申请的一个实施例中的步骤S220的具体流程图。

图6示意性示出了根据本申请的一个实施例中的步骤S220的具体流程图。

图7示意性示出了根据本申请的一个实施例中的步骤S220的具体流程图。

图8示出了根据本申请的一个实施例的视频标签的处理装置的框图。

图9示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。

此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。

附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。

机器学习(ML,Machine Learning)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

本申请实施例提供的方案涉及机器学习等技术,企业特征可以反映不同企业的特性信息,政务事项特征可以反映不同政务事项的特性信息,基于企业特征和政务事项特征生成融合后的特征向量,并基于融合后的特征向量预测企业的各类政务事项的办理频次,可以有效考虑到不同性质的企业对各类政务事项进行办理时的需求差异,进而向企业推荐与其业务关联度高的政务事项,提高了预测企业需要办理的政务事项的准确度,方便企业快速找到适合办理的政务事项。

图1示出了可以应用本申请实施例的技术方案的示例性系统架构的示意图。

如图1所示,系统架构可以包括客户端101、网络102和服务器103。客户端101和服务器103之间通过网络102连接,并基于网络102进行数据交互,该网络可以包括各种连接类型,例如有线通信链路、无线通信链路等等。

应该理解,图1中的客户端101、网络102和服务器103的数目仅仅是示意性的。根据实现需要,可以具有任意数目的客户端101、网络102和服务器103。

服务器103获取目标社交视频的视频标签序列,视频标签序列包括多个视频标签;基于视频标签在视频标签序列中的位置以及社交平台中包含视频标签的社交视频所对应的播放次数之和,在视频标签序列中选取主题视频标签;基于视频标签生成视频标签对应的词向量,以及基于主题视频标签生成主题视频标签对应的词向量;计算视频标签对应的词向量的平均值与主题视频标签对应的词向量的平均值之间的相似度;基于相似度,确定视频标签序列所包含的视频标签与目标社交视频之间的主题漂移结果。

以上可以看出,通过基于视频标签在视频标签序列中的位置以及社交平台中包含视频标签的社交视频所对应的播放次数之和,在视频标签序列中选取与社交视频所反映的主题相符合的主题视频标签,并通过计算视频标签对应的词向量的平均值与主题视频标签对应的词向量的平均值之间的相似度,通过该相似度来确定视频标签序列所包含的视频标签与社交视频所反映的主题之间的匹配情况,实现了准确地检测社交视频所反映的主题与社交视频的视频标签之间存在的主题漂移情况。

需要说明的是,本申请实施例所提供的视频标签的处理方法一般由服务器103执行,相应地,视频标签的处理装置一般设置于服务器103中。但是,在本申请的其它实施例中,客户端101也可以与服务器103具有相似的功能,从而执行本申请实施例所提供的视频标签的处理方法的方案。以下对本申请实施例的技术方案的实现细节进行详细阐述。

图2示意性示出了根据本申请的一个实施例中的视频标签的处理方法的流程图,该视频标签的处理方法可以由服务器来执行,该服务器可以是图1中所示的服务器。参照图2所示,该视频标签的处理方法至少包括步骤S210至步骤S250,详细介绍如下。

在步骤S210中,获取目标社交视频的视频标签序列,视频标签序列包括多个视频标签。

在本申请的一个实施例中,目标社交视频为社交平台的用户发布于社交平台中的社交视频,在目标社交视频发布于社交平台后,社交平台中的任意用户都可以浏览该社交视频。

用户可以为目标社交视频添加一个或多个视频标签,该视频标签是指由用户所添加的自定义视频标签,它可以是井号标签(hashtag),如“#旅行”、“#秋天”。用户为目标社交视频添加的视频标签可以作为用户在社交平台中的社交视频搜索引擎进行搜索的关键词,且这些视频标签可以作为社交视频的标注,与社交视频一同进行展示。

视频标签序列为用户在发布目标社交视频时添加的各个视频标签按照添加顺序组成的标签序列,用户添加视频标签的顺序对应视频标签在视频标签序列的位置,即第一个添加的视频标签会在视频标签序列的第一个位置,以此类推。

在步骤S220中,基于视频标签在视频标签序列中的位置以及社交平台中包含视频标签的社交视频所对应的播放次数之和,在视频标签序列中选取主题视频标签。

在本申请的一个实施例中,主题视频标签是指与目标社交视频所反映的主题匹配度较高的一类标签。用户为目标社交视频添加视频标签时,一般会根据目标社交视频所反映的主题来添加与主题相匹配的视频标签,通常情况下,用户为目标社交视频所添加的各个视频标签中,先添加的视频标签为与目标社交视频所反映的主题之间匹配度较高的一类视频标签。

基于此,视频标签序列所包含的视频标签在视频标签序列中的位置可以为作为确定视频标签是否为主题视频标签的一个因素。

在目标社交视频在上传至社交平台时,若用户为目标社交视频添加的视频标签是主题视频标签时,则其它用户通过该主题视频标签搜索到该目标社交视频后进行播放的可能性相对较高,那么该目标社交视频的播放次数相对较多;反之,若用户为目标社交视频所添加的视频标签不是主题视频标签时,则其它用户通过该主题视频标签搜索到该目标社交视频后进行播放的可能性相对较低,那么该目标社交视频的播放次数相对较少。

基于此,社交平台中包含某个视频标签的所有社交视频所对应的播放次数之和可以作为确定视频标签是否为目标社交视频的主题视频标签的一个因素。

在本申请的一个实施例中,针对视频标签序列所包含的所有视频标签,可以基于视频标签在视频标签序列中的位置以及社交平台中包含视频标签的社交视频所对应的播放次数之和这两个因素所对应的参数值来确定视频标签是否为符合条件的主题视频标签。

在本申请的一个实施例中,如图3所示,示意性示出了根据本申请的一个实施例中的步骤S220的具体流程图,步骤S220具体可以包括如下步骤S310至步骤S320,详细介绍如下。

在步骤S310中,基于视频标签在视频标签序列的位置,以及社交平台中包含视频标签的社交视频所对应的播放次数之和,确定视频标签与目标社交视频之间的主题匹配度,主题匹配度与位置对应的顺序编号为负相关关系,主题匹配度与社交平台中包含视频标签的社交视频所对应的播放次数之和为正相关关系。

在本申请的一个实施例中,视频标签与目标社交视频之间的主题匹配度作为表针视频标签与目标社交视频所反映主题之间的匹配程度的一种评估值,该评估值越大,则视频标签为主题视频标签的可能性较大。

视频标签序列所包含的视频标签在视频标签序列中的位置越靠前,则对应的顺序编号越小,其为主题视频标签的可能性较大,因而主题匹配度与视频标签序列所包含的视频标签在视频标签序列的位置对应的顺序编号为负相关关系。

社交平台中包含视频标签的社交视频所对应的播放次数之和越大,其为主题视频标签的可能性较大,主题匹配度与社交平台中包含视频标签的社交视频所对应的播放次数之和为正相关关系。

在本申请的一个实施例中,可以基于公式来计算视频标签与目标社交视频之间的主题匹配度,其中,A1为视频标签序列所包含的视频标签在视频标签序列的位置对应的顺序编号,B1为社交平台中包含视频标签的社交视频所对应的播放次数之和,S1为视频标签与目标社交视频之间的主题匹配度。

在本申请的一个实施例中,也可以基于公式来计算视频标签与目标社交视频之间的主题匹配度,其中,C和D为正常数,A2为视频标签序列所包含的视频标签在视频标签序列的位置对应的顺序编号,A2为社交平台中包含视频标签的社交视频所对应的播放次数之和,S2为视频标签与目标社交视频之间的主题匹配度。

在本申请的一个实施例中,步骤S310具体可以包括:基于视频标签在视频标签序列的位置、社交平台中包含视频标签的社交视频所对应的播放次数之和,以及社交平台中包含视频标签的社交视频的评论条数之和,确定视频标签与目标社交视频之间的主题匹配度,主题匹配度与评论条数之和为正相关关系。

在本实施例中,在目标社交视频在上传至社交平台时,若用户为目标社交视频所添加的视频标签是主题视频标签时,则其它用户通过该主题视频标签搜索到该目标社交视频后进行播放的可能性相对较高,那么该目标社交视频的播放次数相对较多,同时对该社交视频发起评论的可能性也相对较大,那么该目标社交视频的评论条数相对较多;反之,若用户为目标社交视频所添加的视频标签不是主题视频标签时,则其它用户通过该主题视频标签搜索到该目标社交视频后进行播放的可能性相对较低,那么该目标社交视频的播放次数相对较少,同时对该社交视频发起评论的可能性也相对较小,那么该目标社交视频的评论条数相对较少。

基于此,社交平台中包含某个视频标签的所有社交视频所对应的评论条数之和可以作为计算视频标签与目标社交视频之间的主题匹配度的一个因素。可以理解的是,主题匹配度与社交平台中包含视频标签的社交视频所对应的评论条数之和为正相关关系。

针对视频标签序列所包含的每一个视频标签,可以基于视频标签在视频标签序列中的位置、社交平台中包含视频标签的社交视频所对应的播放次数之和以及社交平台中包含某个视频标签的所有社交视频所对应的评论条数之和这三个因素所对应的参数值来计算视频标签与目标社交视频之间的主题匹配度。

在本申请的一个实施例中,在基于视频标签在视频标签序列中的位置、社交平台中包含视频标签的社交视频所对应的播放次数之和以及社交平台中包含某个视频标签的所有社交视频所对应的评论条数之和这三个因素所对应的参数值来计算视频标签与目标社交视频之间的主题匹配度时,可以先计算社交平台中包含视频标签的社交视频所对应的播放次数之和以及社交平台中包含某个视频标签的所有社交视频所对应的评论条数之和这两个因素所对应的参数值之和,并根据这两个因素所对应的参数值之和以及视频标签在视频标签序列中的位置来计算视频标签与目标社交视频之间的主题匹配度。

可选地,可以是基于公式来计算视频标签与目标社交视频之间的主题匹配度,其中,A1为视频标签序列所包含的视频标签在视频标签序列的位置对应的顺序编号,E3为社交平台中包含视频标签的社交视频所对应的评论条数之和,B1为社交平台中包含视频标签的社交视频所对应的播放次数之和,S1为视频标签与目标社交视频之间的主题匹配度。

参考图4,图4示意性示出了根据本申请的一个实施例的视频标签的处理方法的流程图,其中,在本实施例中,基于视频标签在视频标签序列的位置、社交平台中包含视频标签的社交视频所对应的播放次数之和,以及社交平台中包含视频标签的社交视频的评论条数之和,确定视频标签与目标社交视频之间的主题匹配度的步骤具体可以包括步骤S410至步骤S420,详细描述如下。

在步骤S410中,计算社交平台中包含视频标签的社交视频所对应的播放次数之和,以及社交平台中包含视频标签的社交视频的评论条数之和之间的加权和。

在步骤S420中,基于视频标签在视频标签序列的位置以及加权和,确定视频标签与目标社交视频之间的主题匹配度。

在本申请的一个实施例中,在基于视频标签在视频标签序列中的位置、社交平台中包含视频标签的社交视频所对应的播放次数之和以及社交平台中包含某个视频标签的所有社交视频所对应的评论条数之和这三个因素所对应的参数值来计算视频标签与目标社交视频之间的主题匹配度时,可以是先计算社交平台中包含视频标签的社交视频所对应的播放次数之和以及社交平台中包含某个视频标签的所有社交视频所对应的评论条数之和这两个因素所对应的参数值的加权和,并根据这两个因素所对应的参数值的加权和以及视频标签在视频标签序列中的位置来计算视频标签与目标社交视频之间的主题匹配度。

可选地,可以是基于公式来计算视频标签与目标社交视频之间的主题匹配度,其中,A4为视频标签序列所包含的视频标签在视频标签序列的位置对应的顺序编号,B4为社交平台中包含视频标签的社交视频所对应的播放次数之和,E4为社交平台中包含视频标签的社交视频所对应的评论条数之和,γ为社交平台中包含视频标签的社交视频所对应的播放次数之和所分配的权重,δ为社交平台中包含视频标签的社交视频所对应的评论条数之和所分配的权重,S4为视频标签与目标社交视频之间的主题匹配度。

图4所示实施例相对于用社交平台中包含视频标签的社交视频所对应的播放次数之和以及社交平台中包含某个视频标签的所有社交视频所对应的评论条数之和这两个因素所对应的参数值之和来计算视频标签与目标社交视频之间的主题匹配度的实施例,优点是,充分考虑到了社交平台中包含视频标签的社交视频所对应的播放次数之和与社交平台中包含某个视频标签的所有社交视频所对应的评论条数之和在确定视频标签与目标社交视频之间的主题匹配度中的不同作用,将对于确定主题匹配度的因素突出出来,使得确定的主题匹配度更为反映客观实际。

还请继续参考图3,在步骤S320中,基于视频标签与目标社交视频之间的主题匹配度,在视频标签序列中选取主题视频标签。

在本申请的一个实施例中,基于视频标签与目标社交视频之间的主题匹配度,在视频标签序列包含的视频标签中选取主题视频标签的方式可以有多种。

可选地,在视频标签序列包含的视频标签中,可以选取主题匹配度最大的预定数量的视频标签作为主题视频标签,如视频标签序列包含的视频标签为4个,预定数量设置为2个,则在视频标签序列包含的4个视频标签中,选取主题匹配度最大的2个视频标签作为主题视频标签。

可选地,在视频标签序列包含的视频标签中,可以选取主题匹配度较大的预定占比的视频标签作为主题视频标签,如视频标签序列包含的视频标签为5个,预定占比设置为0.6个,则在视频标签序列包含的5个视频标签中,选取主题匹配度最大的3个视频标签作为主题视频标签。

在本申请的一个实施例中,如图5所示,示意性示出了根据本申请的一个实施例中的步骤S220的具体流程图,步骤S220具体可以包括如下步骤S510至步骤S530,详细介绍如下。

在步骤S510中,确定社交平台中包含视频标签的社交视频的视频条数。

在本申请的一个实施例中,由于用户为目标社交视频添加的视频标签为用户自定义的视频标签,因此会存在与社交视频所反映的主题明显不相关联的视频标签,如胡乱输入的视频标签,而这类视频标签由于不是大多数用户所熟知的视频标签,因此在社交平台中所上传的其它社交视频中,也会较少部分的社交视频会包含该标签,因此可以依据社交平台中包含视频标签的社交视频的视频条数,从目标社交视频的视频标签序列找出与目标社交视频所反映的主题不相关联的视频标签。

在确定社交平台中包含某个视频标签的社交视频的视频条数时,具体的,针对社交平台中的某条社交视频,获取其对应的视频标签序列,针对其对应的视频标签序列,将视频标签序列中的每个视频标签都作为一个字符串,并将该字符串与视频标签对应的字符串进行匹配,只有当两个字符串完全一致时,则认为该条社交视频为包含视频标签的社交视频。

在步骤S520中,在视频标签序列中,删除视频条数小于预定视频条数阈值的视频标签,生成更新后的视频标签序列。

在本申请的一个实施例中,针对视频标签序列中的每一个视频标签,分别确定社交平台中包含该视频标签的社交视频的视频条数,对于视频条数小于预定视频条数阈值的视频标签,将其从视频标签序列中进行删除,生成更新后的视频标签序列。预定视频条数阈值作为根据实际情况所自定义的值,具体的,可以将其设置为一个正整数,如可以设置为200。

在步骤S530中,基于更新后的视频标签序列中剩余的视频标签在更新后的视频标签序列中的位置,以及社交平台中包含剩余的视频标签的社交视频所对应的播放次数之和,在更新后的视频标签序列中选取主题视频标签。

在本申请的一个实施例中,在得到更新后的视频标签序列,可以基于更新后的视频标签序列中剩余的视频标签在更新后的视频标签序列中的位置以及社交平台中包含视频标签的社交视频所对应的播放次数之和这个两个因素对应的参数值,在更新后的视频标签序列中选取主题视频标签。

图5所示实施例的技术方案中,针对目标社交视频对应的所有视频标签,将小于预定视频条数阈值的视频标签从目标社交视频的视频标签序列中删除,实现将视频标签序列中明显不是主题视频标签的视频标签剔除掉,相较于直接从视频标签序列所包含的所有视频标签中找出主题视频标签的方式,减少了不必要的数据处理,可以提高从目标社交视频的视频标签序列中找出主题视频标签的效率。

在本申请的一个实施例中,如图6所示,示意性示出了根据本申请的一个实施例中的步骤S220的具体流程图,步骤S220具体可以包括如下步骤S610至步骤S630,详细介绍如下。

在步骤S610中,将视频标签与预定视频标签库中的视频标签进行匹配,预定视频标签库是包含无意义视频标签的视频标签库。

在步骤S620中,在视频标签序列中,删除与预定视频标签库中的视频标签相匹配的视频标签,生成更新后的视频标签序列。

在步骤S630中,基于更新后的视频标签序列中剩余的视频标签在更新后的视频标签序列中的位置,以及社交平台中包含剩余的视频标签的社交视频所对应的播放次数之和,在更新后的视频标签序列中选取主题视频标签。

在本申请的一个实施例中,无意义视频标签为不能显著表达出社交视频所反映主题的一类视频标签,例如“视频号”、”短视频“以及“热门”等视频标签,无意义视频标签可以由人工统计无意义视频标签,并根据统计的无意义视频标签生成预定视频标签库,将视频标签序列所包含的每个视频标签与预定视频标签库中的无意义视频标签逐一进行匹配,以确定视频标签序列中的无意义视频标签。

具体的,针对视频标签序列所包含的每个视频标签,将视频标签整体作为一个字符串,并将该字符串与视频标签序列中的无意义视频标签对应的字符串进行匹配,只有当两个字符串完全一致时,则认为视频标签与预定视频标签库中的无意义视频标签相匹配。

在视频标签序列中,删除与预定视频标签库中的视频标签相匹配的视频标签,生成删除后的视频标签序列。在得到更新后的视频标签序列,可以基于更新后的视频标签序列中剩余的视频标签在更新后的视频标签序列中的位置以及社交平台中包含视频标签的社交视频所对应的播放次数之和这个两个因素对应的参数值,在更新后的视频标签序列中选取主题视频标签。

图6所示实施例的技术方案中,针对目标社交视频对应的所有视频标签,将不能显著表达出社交视频所反映主题的无意义视频标签从视频标签序列中删除,相较于直接从视频标签序列所包含的所有视频标签中找出主题视频标签的方式,减少了不必要的数据处理,可以提高从目标社交视频的视频标签序列中找出主题视频标签的效率。

在本申请的一个实施例中,如图7所示,示意性示出了根据本申请的一个实施例中的步骤S220的具体流程图,步骤S220具体可以包括如下步骤S710至步骤S750,详细介绍如下。

在步骤S710中,确定社交平台中包含视频标签的社交视频的视频条数,以及确定社交平台所包含的社交视频的视频总条数。

在步骤S720中,计算社交平台所包含的社交视频的视频总条数与确定社交平台中包含视频标签的社交视频的视频条数之间的比值。

在步骤S730中,基于比值,确定视频标签序列包含的视频标签与目标社交视频之间的重要度,重要度与比值为负相关关系。

在步骤S740中,在视频标签序列中,删除重要度小于预定重要度阈值的视频标签,生成更新后的视频标签序列。

在步骤S750中,基于更新后的视频标签序列中剩余的视频标签在更新后的视频标签序列中的位置,以及社交平台中包含有剩余的视频标签的社交视频所对应的播放次数之和,在更新后的视频标签序列中选取主题视频标签。

在本申请的一个实施例中,在视频标签序列所包含的所有视频标签中,会存在其它社交视频中也广泛出现的视频标签,那么这类视频标签相对于该目标社交视频的重要程度较低,其作为主体视频标签也是不太适合的,因此也可以将其从视频标签序列删除点。

具体的,可以确定社交平台中包含视频标签的社交视频的视频条数,以及确定社交平台所包含的社交视频的视频总条数,计算社交平台所包含的社交视频的视频总条数与确定社交平台中包含视频标签的社交视频的视频条数之间的比值,并基于该比值,确定视频标签序列包含的视频标签与目标社交视频之间的重要度。

可选地,可以直接将该比值作为视频标签序列包含的视频标签与目标社交视频之间的重要度,也可以将该比值取对数后作为视频标签序列包含的视频标签与目标社交视频之间的重要度。

重要度作为视频标签相对于该目标社交视频的重要程度的一个评估值,重要度越大,则视频标签相对于该目标社交视频的重要程度越高。上述比值越大,则表示社交平台中包含视频标签的社交视频的程度越高,因此视频标签序列包含的视频标签与目标社交视频之间的重要度越低,即该重要度与比值为负相关关系。

在视频标签序列中,删除重要度小于预定重要度阈值的视频标签,生成更新后的视频标签序列。在得到更新后的视频标签序列,可以基于更新后的视频标签序列中剩余的视频标签在更新后的视频标签序列中的位置以及社交平台中包含视频标签的社交视频所对应的播放次数之和这个两个因素对应的参数值,在更新后的视频标签序列中选取主题视频标签。

图7所示实施例的技术方案中,针对目标社交视频对应的所有视频标签,将相对于该目标社交视频的重要程度较低的视频标签从视频标签序列中删除,相较于直接从视频标签序列所包含的所有视频标签中找出主题视频标签的方式,减少了不必要的数据处理,可以提高从目标社交视频的视频标签序列中找出主题视频标签的效率。

还请继续参考图2,在步骤S230中,基于视频标签生成视频标签对应的词向量,以及基于主题视频标签生成主题视频标签对应的词向量。

在一个实施例中,在确定目标社交视频的视频标签序列后,可以分别基于视频标签生成视频标签对应的词向量,以及基于主题视频标签生成主题视频标签对应的词向量。视频标签对应的词向量和主题视频标签对应的词向量为向量维度相同的向量。

可选地,生成视频标签对应的词向量和主题视频标签对应的词向量时,具体可以采用预训练的机器学习模型来实现,该机器学习模型可以是Word2vec词向量计算模型,或者是GloVe词向量模型等,在此不作限定。

在步骤S240中,计算视频标签对应的词向量的平均值与主题视频标签对应的词向量的平均值之间的相似度。

在本申请的一个实施例中,在计算得到视频标签对应的词向量和主题视频标签对应的词向量,由于视频标签和主题视频标签均可以为多个,可以计算视频标签对应的词向量的平均值以及主题视频标签对应的词向量的平均值,并计算两者之间的相似度。

计算视频标签对应的词向量的平均值以及主题视频标签对应的词向量的平均值之间的相似度的方式有多种,可以采用余弦相似度公式或欧氏距离公式计算视频标签对应的词向量的平均值以及主题视频标签对应的词向量的平均值之间的相似度。

在步骤S250中,基于相似度,确定视频标签序列所包含的视频标签与目标社交视频之间的主题漂移结果。

在本申请的一个实施例中,视频标签对应的词向量的平均值以及主题视频标签对应的词向量的平均值之间的相似度越高,则目标社交视频的视频标签序列所包含的视频标签与目标社交视频所反映主题的匹配度越高,则可以确定视频标签序列所包含的视频标签与目标社交视频之间不存在主题漂移。

在本申请的一个实施例中,步骤S250具体可以包括:若相似度低于预定相似度阈值,则确定视频标签序列所包含的视频标签与目标社交视频之间产生主题漂移;若相似度高于或等于预定相似度阈值,则确定视频标签序列所包含的视频标签与目标社交视频之间未产生主题漂移。

若相似度低于预定相似度阈值,则确定视频标签序列所包含的视频标签与目标社交视频之间产生主题漂移;若相似度高于或等于预定相似度阈值,则确定视频标签序列所包含的视频标签与目标社交视频之间未产生主题漂移。

以上可以看出,通过基于视频标签在视频标签序列中的位置以及社交平台中包含视频标签的社交视频所对应的播放次数之和,在视频标签序列中选取与社交视频所反映的主题相符合的主题视频标签,并通过计算视频标签对应的词向量的平均值与主题视频标签对应的词向量的平均值之间的相似度,通过该相似度来确定视频标签序列所包含的视频标签与社交视频所反映的主题之间的匹配情况,实现了准确地检测社交视频所反映的主题与社交视频的视频标签之间存在的主题漂移情况。

在本申请的一个实施例中,本实施例中的视频标签的处理方法还可以包括:若相似度低于预定相似度阈值,则将目标社交视频添加至无法被社交用户搜索的搜索黑名单。

在本实施例中,若相似度低于预定相似度阈值,则确定目标社交视频对应的视频标签序列中包含的视频标签与目标社交视频的所反映的主题之间产生了明显的主题漂移,,可以将目标社交视频添加至无法被社交用户搜索的搜索黑名单,以使得用户在通过目标社交视频所包含的视频标签进行搜索时,不会查找到该目标社交视频。

通过将视频标签与社交视频所反映的主题严重不匹配的社交视频添加至无法被社交用户搜索的搜索黑名单,提高了在用户通过视频标签进行搜索时,向用户反馈视频标签与社交视频所反映的主题相匹配的社交视频的几率。

以下介绍本申请的装置实施例,可以用于执行本申请上述实施例中的视频标签的处理方法。对于本申请装置实施例中未披露的细节,请参照本申请上述的视频标签的处理方法的实施例。

图8示出了根据本申请的一个实施例的视频标签的处理装置的框图。

参照图8所示,根据本申请的一个实施例的视频标签的处理装置800,包括:获取单元810、选取单元820、生成单元830、计算单元840以及执行单元850。其中,获取单元810,用于获取目标社交视频的视频标签序列,所述视频标签序列包括多个视频标签;选取单元820,用于基于所述视频标签在所述视频标签序列中的位置以及社交平台中包含所述视频标签的社交视频所对应的播放次数之和,在所述视频标签序列中选取主题视频标签;生成单元830,用于基于所述视频标签生成所述视频标签对应的词向量,以及基于所述主题视频标签生成所述主题视频标签对应的词向量;计算单元840,用于计算所述视频标签对应的词向量的平均值与所述主题视频标签对应的词向量的平均值之间的相似度;执行单元850,用于基于所述相似度,确定所述视频标签序列所包含的视频标签与所述目标社交视频之间的主题漂移结果。

在本申请的一些实施例中,基于前述方案,所述选取单元820被配置为:确定社交平台中包含所述视频标签的社交视频的视频条数;在所述视频标签序列中,删除视频条数小于预定视频条数阈值的视频标签,生成更新后的视频标签序列;基于更新后的视频标签序列中剩余的视频标签在更新后的视频标签序列中的位置,以及社交平台中包含剩余的视频标签的社交视频所对应的播放次数之和,在更新后的视频标签序列中选取主题视频标签。

在本申请的一些实施例中,基于前述方案,所述选取单元820被配置为:将所述视频标签与预定视频标签库中的视频标签进行匹配,所述预定视频标签库是包含无意义视频标签的视频标签库;在所述视频标签序列中,删除与预定视频标签库中的视频标签相匹配的视频标签,生成更新后的视频标签序列;基于更新后的视频标签序列中剩余的视频标签在更新后的视频标签序列中的位置,以及社交平台中包含剩余的视频标签的社交视频所对应的播放次数之和,在更新后的视频标签序列中选取主题视频标签。

在本申请的一些实施例中,基于前述方案,所述选取单元820被配置为:确定社交平台中包含所述视频标签的社交视频的视频条数,以及确定社交平台所包含的社交视频的视频总条数;计算社交平台所包含的社交视频的视频总条数与确定社交平台中包含所述视频标签的社交视频的视频条数之间的比值;基于所述比值,确定所述视频标签序列包含的视频标签与所述目标社交视频之间的重要度,所述重要度与所述比值为负相关关系;在所述视频标签序列中,删除重要度小于预定重要度阈值的视频标签,生成更新后的视频标签序列;基于更新后的视频标签序列中剩余的视频标签在更新后的视频标签序列中的位置,以及社交平台中包含剩余的视频标签的社交视频所对应的播放次数之和,在更新后的视频标签序列中选取主题视频标签。

在本申请的一些实施例中,基于前述方案,所述选取单元820被配置为:基于所述视频标签在所述视频标签序列的位置,以及社交平台中包含所述视频标签的社交视频所对应的播放次数之和,确定所述视频标签与所述目标社交视频之间的主题匹配度,所述主题匹配度与所述位置对应的顺序编号为负相关关系,所述主题匹配度与社交平台中包含所述视频标签的社交视频所对应的播放次数之和为正相关关系;基于所述视频标签与所述目标社交视频之间的主题匹配度,在所述视频标签序列中选取主题视频标签。

在本申请的一些实施例中,基于前述方案,所述选取单元820被配置为:基于所述视频标签在所述视频标签序列的位置、社交平台中包含所述视频标签的社交视频所对应的播放次数之和,以及社交平台中包含所述视频标签的社交视频的评论条数之和,确定所述视频标签与所述目标社交视频之间的主题匹配度,所述主题匹配度与评论条数之和为正相关关系。

在本申请的一些实施例中,基于前述方案,所述选取单元820被配置为:计算社交平台中包含所述视频标签的社交视频所对应的播放次数之和,以及社交平台中包含所述视频标签的社交视频的评论条数之和之间的加权和;基于所述视频标签在所述视频标签序列的位置以及所述加权和,确定所述视频标签与所述目标社交视频之间的主题匹配度。

在本申请的一些实施例中,基于前述方案,所述执行单元850被配置为:若所述相似度低于预定相似度阈值,则确定所述视频标签序列所包含的视频标签与所述目标社交视频之间产生主题漂移;若所述相似度高于或等于预定相似度阈值,则确定所述视频标签序列所包含的视频标签与所述目标社交视频之间未产生主题漂移。

在本申请的一些实施例中,基于前述方案,所述视频标签的处理装置还包括:添加单元,用于若所述相似度低于预定相似度阈值,则将所述目标社交视频添加至无法被社交用户搜索的搜索黑名单。

图9示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。

需要说明的是,图9示出的电子设备的计算机系统900仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。

如图9所示,计算机系统900包括中央处理单元(Central Processing Unit,CPU)901,其可以根据存储在只读存储器(Read-Only Memory,ROM)902中的程序或者从储存部分908加载到随机访问存储器(Random Access Memory,RAM)903中的程序而执行各种适当的动作和处理,例如执行上述实施例中所述的方法。在RAM 903中,还存储有系统操作所需的各种程序和数据。CPU 901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(Input/Output,I/O)接口905也连接至总线904。

以下部件连接至I/O接口905:包括键盘、鼠标等的输入部分906;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分907;包括硬盘等的储存部分908;以及包括诸如LAN(Local Area Network,局域网)卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接至I/O接口905。可拆卸介质911,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器910上,以便于从其上读出的计算机程序根据需要被安装入储存部分908。

特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的计算机程序。在这样的实施例中,该计算机程序可以通过通信部分909从网络上被下载和安装,和/或从可拆卸介质911被安装。在该计算机程序被中央处理单元(CPU)901执行时,执行本申请的系统中限定的各种功能。

需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。

附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。

作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现上述实施例中所述的方法。

应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本申请实施方式的方法。

本领域技术人员在考虑说明书及实践这里公开的实施方式后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。

应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

完整详细技术资料下载
上一篇:石墨接头机器人自动装卡簧、装栓机
下一篇:标签识别方法及装置

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!