媒体内容搜索方法、装置、存储介质及电子设备
技术领域
本公开涉及媒体内容搜索领域,尤其涉及媒体内容搜索方法、装置、存储介质及电子设备。
背景技术
近来,深度学习在视频图像、语音识别、自然语言处理等相关领域得到了广泛应用。由于其较好的拟合能力以及端到端的全局优化能力,使得深度学习在多媒体内容理解这个场景中得到较多应用,但是深度学习大多在问题定义相对清楚的场景中,可以取得良好效果,将其直接应用到媒体内容搜索领域时的效果难以保证。并且,深度学习的模型更新较慢,难以跟随真实场景中用户行为适应性变化,因此基于深度学习进行媒体内容搜索会使得搜索结果对用户行为不敏感,影响搜索结果的准确度。
由此可知,相关技术中尚缺乏能够快速适应用户行为变化的媒体内容搜索方法。
发明内容
本公开提供媒体内容搜索方法、装置、存储介质及电子设备,以至少解决相关技术中缺乏能够快速适应用户行为变化的媒体内容搜索方法的技术问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种媒体内容搜索方法,包括:
获取查询条件下的媒体内容集合;
对于所述媒体内容集合中的每个媒体内容,计算所述媒体内容对应的满意度参数,所述满意度参数表征在所述查询条件下所述媒体内容触发用户产生预设消费行为的能力;
计算所述媒体内容对应的满意度置信度,所述满意度置信度表征所述满意度参数的可靠程度;
根据所述媒体内容对应的满意度参数和所述媒体内容对应的满意度置信度,对所述媒体内容集合中的媒体内容进行排序;
根据排序结果,确定搜索结果。
在一示例性的实施方式中,所述根据所述媒体内容对应的满意度参数和所述媒体内容对应的满意度置信度,对所述媒体内容集合中的媒体内容进行排序,包括:
根据所述媒体内容对应的满意度参数和所述媒体内容对应的满意度置信度,确定所述媒体内容对应的第一排序指标参数,所述第一排序指标参数表征在所述查询条件下所述媒体内容触发用户产生预设交互行为的能力;
按照所述第一排序指标参数降序的顺序,对所述媒体内容集合中的媒体内容进行排序。
在一示例性的实施方式中,所述根据所述媒体内容对应的满意度参数和所述媒体内容对应的满意度置信度,确定所述媒体内容对应的第一排序指标参数,包括:
计算所述媒体内容对应的吸引度参数,所述吸引度参数表征所述查询条件下所述媒体内容触发用户产生点击行为的能力;
计算所述媒体内容对应的吸引度置信度,所述吸引度置信度表征所述吸引度参数的可靠程度;
根据所述媒体内容对应的吸引度参数、所述媒体内容对应的吸引度置信度、所述媒体内容对应的满意度参数和所述媒体内容对应的满意度置信度,计算所述媒体内容对应的第一排序指标参数。
在一示例性的实施方式中,所述计算所述媒体内容对应的满意度参数,包括:
获取第一满意率,所述第一满意率为所述查询条件下所述媒体内容触发用户产生所述预设消费行为的概率;
获取第二满意率,所述第二满意率为所述查询条件下用户产生所述预设消费行为的概率;
根据所述第一满意率和所述第二满意率,计算所述满意度参数。
在一示例性的实施方式中,所述获取第一满意率,包括:
获取所述查询条件下所述媒体内容对应的长播率;
获取所述查询条件下所述媒体内容对应的点赞率;
获取所述查询条件下所述媒体内容对应的关注率;
根据所述长播率、所述点赞率和所述关注率,确定所述第一满意率。
在一示例性的实施方式中,所述计算满意度置信度,包括:
计算所述查询条件下所述媒体内容在第一预设时间内的播放次数;
根据所述播放次数计算所述满意度置信度。
在一示例性的实施方式中,所述根据所述播放次数计算所述满意度置信度,包括:
获取第一参量和第二参量;
将所述播放次数的方根的倒数,确定为第三参量;
计算所述第二参量和所述第三参量的乘积,将所述第一参量与所述乘积的差值确定为所述满意度置信度。
在一示例性的实施方式中,所述计算所述媒体内容对应的吸引度参数,包括:
根据历史搜索结果,统计所述媒体内容在每个展示位置的展示次数,以及所述媒体内容在全部展示位置的展示总数;
获取所述每个展示位置对应的第一点击率,所述第一点击率为所述查询条件下所述媒体内容在所述展示位置对应的点击率;
获取所述每个展示位置对应的第二点击率,所述第二点击率为所述查询条件下所述展示位置对应的点击率;
针对每个展示位置,根据所述展示位置对应的第一点击率和第二点击率,计算所述展示位置对应的位置偏差值;
针对所述每个展示位置,根据所述展示总数,以及所述每个展示位置对应的第一点击率、展示次数和位置偏差值,计算所述查询条件下所述媒体内容在所述每个展示位置的吸引度;
根据所述查询条件下所述媒体内容在所述每个展示位置的吸引度,得到所述吸引度参数。
在一示例性的实施方式中,所述根据所述展示位置对应的第一点击率和第二点击率,计算所述展示位置对应的位置偏差值,包括:
根据所述展示位置对应的第一点击率和第二点击率,计算点击率位置偏移水平值;
若所述点击率位置偏移水平值小于预设的第一截断阈值,则将所述点击率位置偏移水平值作为所述位置偏差值;
若所述点击率位置偏移水平值大于或等于所述第一截断阈值,则将所述第一截断阈值作为所述位置偏差值。
在一示例性的实施方式中,所述计算所述媒体内容对应的吸引度置信度,包括:
计算第二预设时间内所述查询条件下所述媒体内容对应的点击率的方差;
若所述方差大于预设的第二截断阈值,则将所述方差的对数函数值的相反数作为所述吸引度置信度;
若所述方差小于或等于所述第二截断阈值,则将所述第二截断阈值的对数函数值的相反数作为所述吸引度置信度。
在一示例性的实施方式中,所述根据所述媒体内容对应的满意度参数和所述媒体内容对应的满意度置信度,确定所述媒体内容对应的第一排序指标参数,还包括:
根据第一满意率和第二满意率,计算参考值;所述第一满意率为所述查询条件下所述媒体内容触发用户产生所述预设消费行为的概率,所述第二满意率为所述查询条件下用户产生所述预设消费行为的概率;
若所述参考值小于或等于预设阈值,则将所述媒体内容对应的第一排序指标参数设置为预设值。
在一示例性的实施方式中,所述根据排序结果,确定搜索结果,包括:
计算第二排序指标参数,所述第二排序指标参数表征所述媒体内容与所述查询条件的相关度;
按照所述第二排序指标参数降序的顺序,对所述排序结果进行排序,得到所述搜索结果。
根据本公开实施例的第二方面,提供一种媒体内容搜索装置,包括:
媒体内容集合获取模块,被配置为执行获取查询条件下的媒体内容集合;
满意度参数计算模块,被配置为执行对于所述媒体内容集合中的每个媒体内容,计算所述媒体内容对应的满意度参数,所述满意度参数表征在所述查询条件下所述媒体内容触发用户产生预设消费行为的能力;
满意度置信度计算模块,被配置为执行计算所述媒体内容对应的满意度置信度,所述满意度置信度表征所述满意度参数的可靠程度;
排序模块,被配置为执行根据所述媒体内容对应的满意度参数和所述媒体内容对应的满意度置信度,对所述媒体内容集合中的媒体内容进行排序;
搜索结果确定模块,被配置为执行根据排序结果,确定搜索结果。
在一示例性的实施方式中,所述排序模块,包括:
第一排序指标参数获取单元,被配置为执行根据所述媒体内容对应的满意度参数和所述媒体内容对应的满意度置信度,确定所述媒体内容对应的第一排序指标参数,所述第一排序指标参数表征在所述查询条件下所述媒体内容触发用户产生预设交互行为的能力;
排序单元,被配置为执行按照所述第一排序指标参数降序的顺序,对所述媒体内容集合中的媒体内容进行排序。
在一示例性的实施方式中,所述第一排序指标参数获取单元,包括:
吸引度参数计算单元,被配置为执行计算所述媒体内容对应的吸引度参数,所述吸引度参数表征所述查询条件下所述媒体内容触发用户产生点击行为的能力;
吸引度置信度计算单元,被配置为执行计算所述媒体内容对应的吸引度置信度,所述吸引度置信度表征所述吸引度参数的可靠程度;
第一排序指标参数计算单元,被配置为执行根据所述媒体内容对应的吸引度参数、所述媒体内容对应的吸引度置信度、所述媒体内容对应的满意度参数和所述媒体内容对应的满意度置信度,计算所述媒体内容对应的第一排序指标参数。
在一示例性的实施方式中,所述满意度参数计算模块,包括:
第一满意率获取单元,被配置为执行获取第一满意率,所述第一满意率为所述查询条件下所述媒体内容触发用户产生所述预设消费行为的概率;
第二满意率获取单元,被配置为执行获取第二满意率,所述第二满意率为所述查询条件下用户产生所述预设消费行为的概率;
满意度参数计算单元,被配置为执行根据所述第一满意率和所述第二满意率,计算所述满意度参数。
在一示例性的实施方式中,所述第一满意率获取单元被配置为执行获取所述查询条件下所述媒体内容对应的长播率;获取所述查询条件下所述媒体内容对应的点赞率;获取所述查询条件下所述媒体内容对应的关注率;根据所述长播率、所述点赞率和所述关注率,确定所述第一满意率。
在一示例性的实施方式中,所述满意度置信度计算模块,包括:
播放次数计算单元,被配置为执行计算所述查询条件下所述媒体内容在第一预设时间内的播放次数;
满意度置信度计算单元,被配置为执行根据所述播放次数计算所述满意度置信度。
在一示例性的实施方式中,所述满意度置信度计算单元,被配置为执行获取第一参量和第二参量;将所述播放次数的方根的倒数,确定为第三参量;计算所述第二参量和所述第三参量的乘积,将所述第一参量与所述乘积的差值确定为所述满意度置信度。
在一示例性的实施方式中,所述吸引度参数计算单元,包括:
展示次数确定单元,被配置为执行根据历史搜索结果,统计所述媒体内容在每个展示位置的展示次数,以及所述媒体内容在全部展示位置的展示总数;
第一点击率确定单元,被配置为执行获取所述每个展示位置对应的第一点击率,所述第一点击率为所述查询条件下所述媒体内容在所述展示位置对应的点击率;
第二点击率确定单元,被配置为执行获取所述每个展示位置对应的第二点击率,所述第二点击率为所述查询条件下所述展示位置对应的点击率;
位置偏差值计算单元,被配置为执行针对每个展示位置,根据所述展示位置对应的第一点击率和第二点击率,计算所述展示位置对应的位置偏差值;
吸引度计算单元,被配置为执行针对所述每个展示位置,根据所述展示总数,以及所述每个展示位置对应的第一点击率、展示次数和位置偏差值,计算所述查询条件下所述媒体内容在所述每个展示位置的吸引度;
吸引度参数确定单元,被配置为执行根据所述查询条件下所述媒体内容在所述每个展示位置的吸引度,得到所述吸引度参数。
在一示例性的实施方式中,所述位置偏差值计算单元,被配置为执行根据所述展示位置对应的第一点击率和第二点击率,计算点击率位置偏移水平值;若所述点击率位置偏移水平值小于预设的第一截断阈值,则将所述点击率位置偏移水平值作为所述位置偏差值;若所述点击率位置偏移水平值大于或等于所述第一截断阈值,则将所述第一截断阈值作为所述位置偏差值。
在一示例性的实施方式中,所述吸引度置信度计算单元,被配置为执行计算第二预设时间内所述查询条件下所述媒体内容对应的点击率的方差;若所述方差大于预设的第二截断阈值,则将所述方差的对数函数值的相反数作为所述吸引度置信度;若所述方差小于或等于所述第二截断阈值,则将所述第二截断阈值的对数函数值的相反数作为所述吸引度置信度。
在一示例性的实施方式中,所述第一排序指标参数计算单元,被配置为执行根据第一满意率和第二满意率,计算参考值;所述第一满意率为所述查询条件下所述媒体内容触发用户产生所述预设消费行为的概率,所述第二满意率为所述查询条件下用户产生所述预设消费行为的概率;若所述参考值小于或等于预设阈值,则将所述媒体内容对应的第一排序指标参数设置为预设值。
在一示例性的实施方式中,所述搜索结果确定模块,被配置为执行计算第二排序指标参数,所述第二排序指标参数表征所述媒体内容与所述查询条件的相关度;按照所述第二排序指标参数降序的顺序,对所述排序结果进行排序,得到所述搜索结果。
根据本公开实施例的第三方面,提供一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如上述任一实施方式所述的媒体内容搜索方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述任一实施方式所述的媒体内容搜索方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,该计算机程序产品包括计算机指令,该计算机指令存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该电子设备执行上述任一种实施方式中提供的媒体内容搜索方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
本公开实施例提供的媒体内容搜索方法,不仅可以根据查询条件得到媒体内容的第二排序指标参数,该第二排序指标参数体现了媒体内容与查询条件的相符合程度,还可以根据用户行为计算媒体内容的第一排序指标参数,该第一排序指标参数表征在所述查询条件下所述媒体内容触发用户产生预设消费行为的能力,该第一排序指标参数可以根据用户行为的变动进行快速的变动,因此可以灵敏地体现用户群体对于媒体内容的倾向程度,根据第一排序指标参数和第二排序指标参数对得到的媒体内容进行排序,可以使得排序结果既符合查询条件,又与用户群体契合,从而更加符合用户的心理预期,根据这种排序结果得到的搜索结果也更为准确。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种媒体内容搜索方法的应用环境图;
图2是根据一示例性实施例示出的一种媒体内容搜索方法的流程图;
图3是根据一示例性实施例示出的一种媒体内容搜索方法步骤S20的流程图;
图4是根据一示例性实施例示出的一种媒体内容搜索方法步骤S50的流程图;
图5是根据一示例性实施例示出的搜索结果的示意图;
图6是根据一示例性实施例示出的一种媒体内容搜索方法中步骤S41的流程图;
图7是根据一示例性实施例示出的一种媒体内容搜索方法中步骤S411的流程图图;
图8是根据一示例性实施例示出的一种媒体内容搜索方法中步骤S4114的流程图;
图9是根据一示例性实施例示出的一种媒体内容搜索方法中步骤S412的流程图;
图10是根据一示例性实施例示出的一种媒体内容搜索装置的框图;
图11是根据一示例性实施例示出的媒体内容搜索的电子设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
本公开实施例提供媒体内容搜索方案,该方案可以根据后验的用户行为调整查询条件下媒体内容集合中媒体内容的排序结果,根据调整后的排序结果输出搜索结果,这种方案可以根据后验的用户行为及时调整搜索结果,使得搜索结果对用户行为较为敏感,可以根据用户行为的变化适应性变动,更为符合用户的搜索预期。
请参阅图1,其是根据一示例性实施例示出的一种媒体内容搜索方法的应用环境图,该应用环境可以包括终端110、媒体内容搜索服务器120和搜索系统130。图1中所示的媒体内容搜索服务器120和搜索系统130可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,上述媒体内容搜索服务器120和搜索系统130可以是同一个服务器,也可以是不同的服务器。上述终端110和上述媒体内容搜索服务器120之间,以及上述媒体内容搜索服务器120上述搜索系统13之间均可以通过有线网络或者无线网络连接。
其中,上述终端110可以是智能手机、平板电脑、笔记本电脑、台式计算机等,但并不局限于此。终端110中可以运行有由媒体内容搜索服务器120提供后台服务的客户端,该客户端可以输入查询条件,得到并输出该查询条件对应的搜索结果。
上述搜索系统130可以根据查询条件确定第二排序指标参数,该第二排序指标参数表征上述查询条件下的媒体内容集合中的媒体内容与该查询条件的相关度。上述媒体内容搜索服务器120用于获取来自终端110的查询条件,通过与搜索系统130的交互得到查询条件下的媒体内容集合,以及上述媒体内容集合中媒体内容的第二排序指标参数,上述媒体内容搜索服务器120可以进一步确定上述媒体内容集合中媒体内容的第一排序指标参数,该第一排序指标参数表征在上述查询条件下上述媒体内容触发用户产生预设交互行为的能力。根据该第一排序指标参数和第二排序指标参数,可以对上述媒体内容集合中的媒体内容进行排序,根据排序结果输出搜索结果,将上述搜索结果返回至终端110。
图2是根据一示例性实施例示出的一种媒体内容搜索方法的流程图,如图2所示,以媒体内容搜索方法应用于图1所示的媒体内容搜索服务器120中进行说明,包括以下步骤。
在步骤S10中,获取查询条件下的媒体内容集合。
具体地,查询条件可以为查询关键词或者查询关键词组。本公开不对其进行限定。本公开实施例并不限定媒体内容的具体类型,其可以是视频、视频片段、短视频、视频封面,音频、图片、动图等各种多媒体资源。
在步骤S20中,对于上述媒体内容集合中的每个媒体内容,计算上述媒体内容对应的满意度参数,上述满意度参数表征在上述查询条件下上述媒体内容触发用户产生预设消费行为的能力。
本公开实施例并不限定预设消费行为的具体类型,示例性的,其可以是将点赞、长播或评论。在一个示例性的实施方式中,请参考图3,其是根据一示例性实施例示出的一种媒体内容搜索方法步骤S20的流程图。上述计算上述媒体内容对应的满意度参数,包括:
在步骤S21中,获取第一满意率,上述第一满意率为上述查询条件下上述媒体内容触发用户产生上述预设消费行为的概率。
在一个实施例中,可以对于任意一种预设消费行为,均计算上述查询条件下上述媒体内容对应的该种预设消费行为的发生概率,基于该发生概率计算上述第一满意率。以上述预设消费行为包括点赞、长播和评论为例,则上述获取第一满意率包括:获取上述查询条件下上述媒体内容对应的长播率;获取上述查询条件下上述媒体内容对应的点赞率;获取上述查询条件下上述媒体内容对应的关注率;根据上述长播率、上述点赞率和上述关注率,确定上述第一满意率。本公开实施例并不限定根据上述长播率、上述点赞率和上述关注率,确定上述第一满意率的具体方法,示例性的,可以将上述长播率、上述点赞率和上述关注率的加权求和值确定为上述第一满意率,本公开并不限定权值,可以根据实际情况进行设定。
本公开实施例从长播率,点赞率,关注率的角度计算上述第一满意率,使得第一满意率能够反映用户在长播、点赞和关注方面的倾向,提升满意度参数的计算准确度。
在步骤S22中,获取第二满意率,上述第二满意率为上述查询条件下用户产生上述预设消费行为的概率。
本公开中可以对于任意一种上述预设消费行为,均计算上述查询条件下该种预设消费行为的发生概率,基于该发生概率计算上述第二满意率。第二满意率的计算方法与第一满意率基于相同发明构思,在此不再赘述。
在步骤S23中,根据上述第一满意率和上述第二满意率,计算上述满意度参数。
在一个实施例中,可以根据公式计算得到满意度参数,其中,satisfyscore表示满意度参数,satisfy_pq表示第一满意率,satisfy_q表示第二满意率,Γ为第一预设参数,该第一预设参数的值可以根据实际需要进行设定,比如,可以为2。
本公开实施例中通过详述满意度参数的计算方法,可以将用户的各种相关的消费行为纳入考量,得到较为准确的满意度参数,以便于后续根据满意度参数对媒体内容集合中媒体内容进行排序,得到对用户行为敏感的搜索结果。
在步骤S30中,计算上述媒体内容对应的满意度置信度,上述满意度置信度表征上述满意度参数的可靠程度。
在一个示例性的实施例中,可以计算上述媒体内容在第一预设时间内的播放次数;根据上述播放次数计算上述媒体内容对应的满意度置信度。本公开并不限定第一预设时间的长度,可以根据实际需要进行设定。在一个实施例中,上述根据上述播放次数计算上述满意度置信度,包括:获取第一参量和第二参量;将上述播放次数的方根的倒数,确定为第三参量;计算上述第二参量和上述第三参量的乘积,将上述第一参量与上述乘积的差值确定为上述满意度置信度。上述满意度置信度可以被表示为其中,satisfyconfidence表示满意度置信度,play_cnt表示播放次数,Λ表示第二参量,M表示第一参量,该第一参量和第二参量的值均可以根据实际需要进行设定,比如,第一参量可以被设置为1,第二参量可以被设置为0.9。本公开实施例通过详述满意度置信度的计算方法,便于准确确定满意度置信度的具体数值,从而对满意度参数进行准确的可靠性评估。
本公开实施例中可以从播放次数的角度对满意度置信度进行计算,从而准确评估满意度参数的可靠程度,以便于后续根据满意度参数对媒体内容集合中媒体内容进行排序,得到对用户行为敏感的搜索结果。
在步骤S40中,根据上述媒体内容对应的满意度参数和上述媒体内容对应的满意度置信度,对上述媒体内容集合中的媒体内容进行排序。
在一个实施例中,上述根据上述媒体内容对应的满意度参数和上述媒体内容对应的满意度置信度,对上述媒体内容集合中的媒体内容进行排序,包括:
S41.根据上述媒体内容对应的满意度参数和上述媒体内容对应的满意度置信度,确定上述媒体内容对应的第一排序指标参数,上述第一排序指标参数表征在上述查询条件下上述媒体内容触发用户产生预设交互行为的能力。
本公开实施例并不限定该预设交互行为的具体类型,其可以包括预设消费行为,比如点赞、长播、关注,也可以包括点击行为。本公开实施例中第一排序指标参数可以根据用户的行为确定,即随着用户行为产生适应性变动。示例性的,若用户对查询条件1下的媒体内容a频繁点击,则可能导致该查询条件1下媒体内容a的第一排序指标参数升高;若用户对查询条件1下的媒体内容a频繁点赞,评论或转发,则也可能导致该查询条件1下媒体内容a的第一排序指标参数升高;若用户在一段时间内对查询条件1下的媒体内容a不进行任何操作,则可能导致该查询条件1下媒体内容a的第一排序指标参数降低。
S42.按照上述第一排序指标参数降序的顺序,对上述媒体内容集合中的媒体内容进行排序。
本公开实施例按照上述第一排序指标参数降序的顺序,对上述媒体内容集合中的媒体内容进行排序,而第一排序指标参数可以随着用户行为产生适应性变动,从而使得排序结果对用户行为敏感,基于该排序结果确定的搜索结果也能够根据用户行为产生适应性变动,提升搜索系统对用户的适应能力。
在步骤S50中,根据排序结果,确定搜索结果。
本公开实施例提供的媒体内容搜索方法,可以根据满意度参数和满意度置信度对媒体内容进行排序,基于排序结果得到搜索结果,满意度参数和满意度置信度均对于用户消费行为敏感,可以灵敏地从消费行为的角度体现用户群体对于媒体内容的倾向程度,从而使得搜索结果与用户群体的消费行为契合,显著提升消费行为转化率。
在一个实施例中,可以将该排序结果直接确定为上述搜索结果。
在另一个实施例中,请参考图4,其是根据一示例性实施例示出的一种媒体内容搜索方法步骤S50的流程图。上述根据排序结果,确定搜索结果,包括:
在步骤S51中,计算第二排序指标参数,上述第二排序指标参数表征上述媒体内容与上述查询条件的相关度。
在一个实施例中,该第二排序指标参数可以为由搜索系统基于查询条件输出的对媒体内容的评分,该评分从媒体内容与查询条件契合度的角度刻画上述媒体内容。本公开不限定第二排序指标参数的计算方法,示例性的,可以获取媒体内容的标签、热度、内容,类别、摘要、类型中的一种或其组合,根据获取结果对第二排序指标参数进行计算。在一个可行的实施例中,可以将查询条件和媒体内容输入训练好的神经网络,得到上述媒体内容的第二排序指标参数。
在步骤S52中,按照上述第二排序指标参数降序的顺序,对上述排序结果进行排序,得到上述搜索结果。
本公开实施例中上述排序结果中的每个元素可以通过四元组表征,该四元祖可以包括查询条件、媒体内容、第一排序指标参数和第二排序指标参数。其中,查询条件、媒体内容和第二排序指标参数构成的三元组可以由上述搜索系统输出。步骤S51可以使用现有的搜索系统得到第二排序指标参数,也可以根据实际需要设计搜索系统,本公开实施例对此不进行限定。
本公开中可以通过两次排序得到搜索结果,即根据第一排序指标参数对媒体内容进行一次排序,得到排序结果;若排序结果中存在第一排序指标参数相同的媒体内容,则在上述排序结果中,根据第二排序指标参数对上述第一排序指标参数相同的媒体内容进行排序,得到再排序结果,根据该再排序结果确定搜索结果。
示例性的,若媒体内容、第一排序指标参数和第二排序指标参数如表1所示。
表1
媒体内容
第一排序指标参数
第二排序指标参数
A
7
73
B
0
46
C
0
53
D
6
27
E
6
28
对于表1中的各个媒体内容的排序结果为ADEBC,对上述排序结果按照第二排序指标参数进行排序,得到的再排序结果为AEDCB。
本公开实施例中搜索结果基于第一排序指标参数和第二排序指标参数综合得到,其中第二排序指标参数体现了媒体内容本身与查询条件的符合程度,第一排序指标参数体现了用户行为对媒体内容的倾向程度,根据第一排序指标参数和第二排序指标参数确定出的搜索结果既符合查询条件,又与用户群体的行为契合,从而更加符合用户的心理预期也更加准确,从而可以显著提升点击率和消费行为转化率。
在一个实施例中,可以获取上述再排序结果中媒体内容的数量,根据上述媒体内容的数量确定媒体内容参考量N;将上述再排序结果中前N个媒体内容确定为上述搜索结果。
示例性的,可以获取预设的媒体内容的指标数量,将上述指标数量和上述媒体内容的数量中的较小值作为上述媒体内容参考量。本公开不限定该指标数量的具体数值,可以根据实际情况进行设定。
在一个可行的实施例中,上述搜索结果可以是有序的,该搜索结果中的媒体内容的顺序与再排序结果一致。相应的,将上述搜索结果传输至终端110后,终端110可以根据搜索结果将媒体内容关联在预设的显示位置。请参考图5,其是根据一示例性实施例示出的搜索结果的示意图。图5中存在六个显示位置,可以将搜索结果1-6的媒体内容顺序关联在显示位置10-60中。这种搜索结果获取以及显示方法可以使得得到的搜索结果的有序性与搜索结果的显示位置的有序性一致,将排序靠前的媒体内容优先显示在更为醒目的位置,提升媒体内容对应的点击率以及消费行为转化率,本公开中消费行为可以是点赞、评论、长播或者转发,消费行为转化率为消费行为的次数与点击次数的比值。
下面结合附图对本公开实施例进行详细说明。
在一些可行的实施方式中,如图6所示,其是根据一示例性实施例示出的一种媒体内容搜索方法中步骤S41的流程图。其中,上述根据上述媒体内容对应的满意度参数和上述媒体内容对应的满意度置信度,确定上述媒体内容对应的第一排序指标参数,包括:
在步骤S411中,计算上述媒体内容对应的吸引度参数,上述吸引度参数表征上述查询条件下上述媒体内容触发用户产生点击行为的能力。
在一个可行的实施例中,如图7所示,其是根据一示例性实施例示出的一种媒体内容搜索方法中步骤S411的流程图。上述计算上述媒体内容对应的吸引度参数,包括:
在步骤S4111中,根据历史搜索结果,统计上述媒体内容在每个展示位置的展示次数,以及上述媒体内容在全部展示位置的展示总数。
在一个可行的实施例中,可以对于用户每一次的媒体内容搜索行为进行记录,得到搜索日志,上述搜索日志中的每条记录可以被表示为<query,userid,photoid,click,play,like,follow,pos,..,date>,其中,query表示查询条件,userid表示执行搜索的用户标识,photoid表示媒体内容的标识,click表示点击行为,play表示播放行为,like表示收藏行为,follow表示关注行为,pos表示媒体内容显示的位置,date表示搜索日期。
根据搜索日志中的记录,可以统计得到下文计算吸引度参数所需的相关参数,示例性的:
某个展示位置的展示次数(showp):根据媒体内容对预设时间段的搜索日志进行筛选,在筛选结果中统计某个展示位置下展示该媒体内容的总次数,其中,p表示展示位置。
全部展示位置的展示总数(total_show):对各个展示位置的展示次数进行求和,得到展示总数。
每个展示位置对应的第一点击率(ctr_qpp):根据查询条件和媒体内容对预设时间段的搜索日志进行筛选,在筛选结果中统计该展示位置下该媒体内容被点击的概率,其中,ctr表示点击率,q表示查询条件,p表示媒体内容,p表示展示位置。
每个展示位置对应的第二点击率(ctr_qp):根据查询条件对预设时间段的搜索日志进行筛选,在筛选结果中统计该展示位置下发生点击行为的概率,其中,ctr表示点击率,q表示查询条件,p表示展示位置。
本公开不限定预设时间段的长度,可以根据实际需要进行设定。
在步骤S4112中,获取上述每个展示位置对应的第一点击率,上述第一点击率为上述查询条件下上述媒体内容在上述展示位置对应的点击率。
在步骤S4113中,获取上述每个展示位置对应的第二点击率,上述第二点击率为上述查询条件下上述展示位置对应的点击率。
在步骤S4114中,针对每个展示位置,根据上述展示位置对应的第一点击率和第二点击率,计算上述展示位置对应的位置偏差值。
若展示位置靠后,则该展示位置的第二点击率会出现较大的抖动,为了降低由于展示位置的原因产生的抖动对于最终计算得到的吸引力参数产生的影响,本公开中详述对于位置偏差值的计算方法。如图8所示,其是根据一示例性实施例示出的一种媒体内容搜索方法中步骤S4114的流程图,包括:
在步骤S41141中,根据上述展示位置对应的第一点击率和第二点击率计算点击率位置偏移水平值。
具体地,本公开中点击率位置偏移水平值可以根据公式计算得到。
在步骤S41142中,若上述点击率位置偏移水平值小于预设的第一截断阈值,则将上述点击率位置偏移水平值作为上述位置偏差值。
在步骤S41143中,若上述点击率位置偏移水平值大于或等于上述第一截断阈值,则将上述第一截断阈值作为上述位置偏差值。
具体地,本公开中位置偏差值可以被表示为其中,thresa即为第一截断阈值,其具体数值可以根据实际情况进行设置,本公开实施例不予限定。
本公开实施例通过设置第一截断阈值可以对于抖动较大的点击率位置偏移水平值进行截断,降低位置偏移对于吸引度参数的影响,提升吸引度参数的准确度。
在步骤S4115中,针对上述每个展示位置,根据上述展示总数,以及上述每个展示位置对应的第一点击率、展示次数和位置偏差值,计算上述查询条件下上述媒体内容在上述每个展示位置的吸引度。
在步骤S4116中,根据上述查询条件下上述媒体内容在上述每个展示位置的吸引度,得到上述吸引度参数。
具体地,本公开中吸引度参数可以根据公式计算得到,其中,pos表征各个展示位置组成的集合,attractivescore表示吸引度参数。
本公开实施例通过公开具体的吸引度参数的计算方法,可以使得基于吸引度参数得到的第一排序指标参数准确体现媒体内容对用户的吸引能力,从而使得基于该第一排序指标参数得到的最终的搜索结果可以符合用户的吸引度需求。
在步骤S412中,计算上述媒体内容对应的吸引度置信度,上述吸引度置信度表征上述吸引度参数的可靠程度。
在一个可行的实施例中,如图9所示,其是根据一示例性实施例示出的一种媒体内容搜索方法中步骤S412的流程图。上述计算上述媒体内容对应的吸引度置信度,包括:
在步骤S4121中,计算第二预设时间内上述查询条件下上述媒体内容对应的点击率的方差。
本公开实施例并不对第二预设时间进行限定,其可以根据不同的查询条件有所区别,也可以根据实际需要进行设定。
在步骤S4122中,若上述方差大于预设的第二截断阈值,则将上述方差的对数函数值的相反数作为上述吸引度置信度。
在步骤S4123中,若上述方差小于或等于上述第二截断阈值,则将上述第二截断阈值的对数函数值的相反数作为上述吸引度置信度。
具体地,本公开中可以根据公式attractiveconfidence=-log10[mas(stddev(ctr),X]得到吸引度置信度,其中,attractiveconfidence表示吸引度置信度,stddev(ctr)表示上述媒体内容对应的点击率的方差,X表示第二截断阈值,本公开实施例不限定第二截断阈值的具体取值,示例性的,其可以取值0.01。
相关技术中在衡量吸引度参数时并没有充分考虑到用户累积的历史行为,本公开实施例设计得到的吸引度置信度将上述内容纳入考量,通过吸引度置信度来刻画吸引度参数的可靠程度,当用户产生的点击行为越多时吸引度参数的计算结果越准确,可以得到较为精准的吸引度置信度计算结果。
在步骤S413中,根据上述媒体内容对应的吸引度参数、上述媒体内容对应的吸引度置信度、上述媒体内容对应的满意度参数和上述媒体内容对应的满意度置信度,计算上述媒体内容对应的第一排序指标参数。
在一个可行的实施例中,可以将上述媒体内容对应的吸引度参数、上述媒体内容对应的吸引度置信度、上述媒体内容对应的满意度参数和上述媒体内容对应的满意度置信度的乘积作为上述媒体内容对应的第一排序指标参数。
在一个可行的实施例中,还可以根据上述第一满意率和上述第二满意率,计算参考值;若上述参考值小于或等于预设阈值,则直接将上述媒体内容对应的第一排序指标参数设置为预设值。否则,按照本公开实施例上述步骤计算第一排序指标参数。本公开并不对上述预设阈值进行设定,可以根据实际需要进行设定,示例性的,可以为1。本公开中并不对上述预设值进行限制,可以将其设置为0。本公开实施例可以通过计算参考值,在参考值小于或等于预设阈值时直接将第一排序指标参数设定为最小值,提升第一排序指标参数的获取速度。
本公开实施例公开了从吸引度参数、吸引度置信度、满意参数和满意度置信度四个方面计算第一排序指标参数的方案,设置吸引度参数和满意度参数可以使得第一排序指标参数可以准确地反映用户的行为,不仅可以反映用户的点击行为还可以反映用户的消费行为,吸引度置信度和满意度置信度可以对吸引度参数和满意度参数的可靠程度进行评估,从而适应性调整其对于第一排序指标参数的影响力,从而使得第一排序指标参数可以客观准确并且全面的反映用户各种行为表达出的对于媒体内容的倾向,从而可以使得基于第一排序指标参数排序并最终得到的搜索结果较大程度地符合用户预期,提升搜索结果准确性,并且提升点击行为和相关的消费行为的触发率。
图10是根据一示例性实施例示出的一种媒体内容搜索装置的框图。参照图10,该装置包括:
媒体内容集合获取模块10,被配置为执行获取查询条件下的媒体内容集合;
满意度参数计算模块20,被配置为执行对于上述媒体内容集合中的每个媒体内容,计算上述媒体内容对应的满意度参数,上述满意度参数表征在上述查询条件下上述媒体内容触发用户产生预设消费行为的能力;
满意度置信度计算模块30,被配置为执行计算上述媒体内容对应的满意度置信度,上述满意度置信度表征上述满意度参数的可靠程度;
排序模块40,被配置为执行根据上述媒体内容对应的满意度参数和上述媒体内容对应的满意度置信度,对上述媒体内容集合中的媒体内容进行排序;
搜索结果确定模块50,被配置为执行根据排序结果,确定搜索结果。
在一示例性的实施方式中,上述排序模块,包括:
第一排序指标参数获取单元,被配置为执行根据上述媒体内容对应的满意度参数和上述媒体内容对应的满意度置信度,确定上述媒体内容对应的第一排序指标参数,上述第一排序指标参数表征在上述查询条件下上述媒体内容触发用户产生预设交互行为的能力;
排序单元,被配置为执行按照上述第一排序指标参数降序的顺序,对上述媒体内容集合中的媒体内容进行排序。
在一示例性的实施方式中,上述第一排序指标参数获取单元,包括:
吸引度参数计算单元,被配置为执行计算上述媒体内容对应的吸引度参数,上述吸引度参数表征上述查询条件下上述媒体内容触发用户产生点击行为的能力;
吸引度置信度计算单元,被配置为执行计算上述媒体内容对应的吸引度置信度,上述吸引度置信度表征上述吸引度参数的可靠程度;
第一排序指标参数计算单元,被配置为执行根据上述媒体内容对应的吸引度参数、上述媒体内容对应的吸引度置信度、上述媒体内容对应的满意度参数和上述媒体内容对应的满意度置信度,计算上述媒体内容对应的第一排序指标参数。
在一示例性的实施方式中,上述满意度参数计算模块,包括:
第一满意率获取单元,被配置为执行获取第一满意率,上述第一满意率为上述查询条件下上述媒体内容触发用户产生上述预设消费行为的概率;
第二满意率获取单元,被配置为执行获取第二满意率,上述第二满意率为上述查询条件下用户产生上述预设消费行为的概率;
满意度参数计算单元,被配置为执行根据上述第一满意率和上述第二满意率,计算上述满意度参数。
在一示例性的实施方式中,上述满意度置信度计算模块,包括:
播放次数计算单元,被配置为执行计算上述查询条件下上述媒体内容在第一预设时间内的播放次数;
满意度置信度计算单元,被配置为执行根据上述播放次数计算上述满意度置信度。
在一示例性的实施方式中,上述满意度置信度计算单元,被配置为执行获取第一参量和第二参量;将上述播放次数的方根的倒数,确定为第三参量;计算上述第二参量和上述第三参量的乘积,将上述第一参量与上述乘积的差值确定为上述满意度置信度。
在一示例性的实施方式中,上述吸引度参数计算单元,包括:
展示次数确定单元,被配置为执行根据历史搜索结果,统计上述媒体内容在每个展示位置的展示次数,以及上述媒体内容在全部展示位置的展示总数;
第一点击率确定单元,被配置为执行获取上述每个展示位置对应的第一点击率,上述第一点击率为上述查询条件下上述媒体内容在上述展示位置对应的点击率;
第二点击率确定单元,被配置为执行获取上述每个展示位置对应的第二点击率,上述第二点击率为上述查询条件下上述展示位置对应的点击率;
位置偏差值计算单元,被配置为执行针对每个展示位置,根据上述展示位置对应的第一点击率和第二点击率,计算上述展示位置对应的位置偏差值;
吸引度计算单元,被配置为执行针对上述每个展示位置,根据上述展示总数,以及上述每个展示位置对应的第一点击率、展示次数和位置偏差值,计算上述查询条件下上述媒体内容在上述每个展示位置的吸引度;
吸引度参数确定单元,被配置为执行根据上述查询条件下上述媒体内容在上述每个展示位置的吸引度,得到上述吸引度参数。
在一示例性的实施方式中,上述位置偏差值计算单元,被配置为执行根据上述展示位置对应的第一点击率和第二点击率,计算点击率位置偏移水平值;若上述点击率位置偏移水平值小于预设的第一截断阈值,则将上述点击率位置偏移水平值作为上述位置偏差值;若上述点击率位置偏移水平值大于或等于上述第一截断阈值,则将上述第一截断阈值作为上述位置偏差值。
在一示例性的实施方式中,上述吸引度置信度计算单元,被配置为执行计算第二预设时间内上述查询条件下上述媒体内容对应的点击率的方差;若上述方差大于预设的第二截断阈值,则将上述方差的对数函数值的相反数作为上述吸引度置信度;若上述方差小于或等于上述第二截断阈值,则将上述第二截断阈值的对数函数值的相反数作为上述吸引度置信度。
在一示例性的实施方式中,上述第一排序指标参数计算单元,被配置为执行根据上述第一满意率和上述第二满意率,计算参考值;若上述参考值小于或等于预设阈值,则将上述媒体内容对应的第一排序指标参数设置为预设值。
在一示例性的实施方式中,上述搜索结果确定模块,被配置为执行计算第二排序指标参数,上述第二排序指标参数表征上述媒体内容与上述查询条件的相关度;按照上述第二排序指标参数降序的顺序,对上述排序结果进行排序,得到上述搜索结果。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
在示例性实施例中,还提供了一种电子设备,包括处理器;用于存储处理器可执行指令的存储器;其中,处理器被配置为执行存储器上所存放的指令时,实现上述实施例中任一种实施方式中提供的媒体内容搜索方法的步骤。
该电子设备可以终端、服务器或者类似的运算装置,以该电子设备是服务器为例,图11是根据一示例性实施例示出的执行媒体内容搜索方法的电子设备的框图,该电子设备1000可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(Central Processing Units,CPU)1010(处理器1010可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器1030,一个或一个以上存储应用程序1023或数据1022的存储介质1020(例如一个或一个以上海量存储设备)。其中,存储器1030和存储介质1020可以是短暂存储或持久存储。存储在存储介质1020的程序可以包括一个或一个以上模块,每个模块可以包括对电子设备中的一系列指令操作。更进一步地,中央处理器1010可以设置为与存储介质1020通信,在电子设备1000上执行存储介质1020中的一系列指令操作。电子设备1000还可以包括一个或一个以上电源1060,一个或一个以上有线或无线网络接口1050,一个或一个以上输入输出接口1040,和/或,一个或一个以上操作系统1021,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
输入输出接口1040可以用于经由一个网络接收或者发送数据。上述的网络具体实例可包括电子设备1000的通信供应商提供的无线网络。在一个实例中,输入输出接口1040包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个示例性实施例中,输入输出接口100可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
本领域普通技术人员可以理解,图11所示的结构仅为示意,其并不对上述电子设备的结构造成限定。例如,电子设备1000还可包括比图11中所示更多或者更少的组件,或者具有与图11所示不同的配置。
在示例性实施例中,还提供了一种计算机可读存储介质,当计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述实施例中任一媒体内容搜索方法的步骤。
在示例性实施例中,还提供了一种计算机程序产品,该计算机程序产品包括计算机指令,该计算机指令存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该电子设备执行上述任一种实施方式中提供的媒体内容搜索方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
- 上一篇:石墨接头机器人自动装卡簧、装栓机
- 下一篇:物体信息翻译、以及衍生信息获取方法和装置