应用于大数据的话题互动行为安防处理方法及话题服务器

文档序号:7734 发布日期:2021-09-17 浏览:26次 英文

应用于大数据的话题互动行为安防处理方法及话题服务器

技术领域

本申请实施例涉及深度学习和云游戏

技术领域

,具体涉及应用于大数据的话题互动行为安防处理方法及话题服务器。

背景技术

大数据技术具有提高数据处理效率、帮助建立数据思维以及科学决策助力性等优点,已经逐渐在诸多业务领域进行应用。随着互联网的发展,大数据与互动话题的结合能够实现互动话题倾向分析、话题用户意图分析以及热点话题跟踪等。

随着话题规模的不断扩大,话题互动行为的安全性备受关注。为了实现话题互动行为的安全分析,需要预先对不同话题用户的操作行为进行处理,比如预先确定话题用户的操作行为轨迹。但是相关技术在确定操作行为轨迹时存在效率低下的问题,这样会影响后续的话题互动行为安全分析的时效性。

发明内容

有鉴于此,本申请实施例提供了应用于大数据的话题互动行为安防处理方法及话题服务器。

本申请实施例提供了一种应用于大数据的话题互动行为安防处理方法,应用于话题服务器,包括:

在事先生成的场景型话题交互日志中为当前可视化行为记录中的话题行为图谱单元确定对应的待定行为状态单元;

针对当前可视化行为记录中的每一话题行为图谱单元组,话题行为图谱单元组由两个关联话题行为图谱单元构成,通过该话题行为图谱单元组中话题行为图谱单元对应的待定行为状态单元确定该话题行为图谱单元组所对应的待定行为状态单元组;

通过预先完成统计的场景型话题调用信息确定待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹;所述场景型话题调用信息汇总了已被调用的不同行为状态单元之间的操作行为轨迹信息;

通过每一话题行为图谱单元组所对应的待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹,在事先生成的所述场景型话题交互日志中确定出与当前可视化行为记录适配的目标操作行为轨迹。

在一种可独立实施的设计思路下,所述在事先生成的场景型话题交互日志中为当前可视化行为记录中的话题行为图谱单元确定对应的待定行为状态单元,包括:

针对当前可视化行为记录中的每一话题行为图谱单元,在事先生成的所述场景型话题交互日志中确定该话题行为图谱单元对应的寻找区间,通过所述寻找区间在事先生成的所述场景型话题交互日志中确定该话题行为图谱单元对应的待定可视化区域,确定该话题行为图谱单元映射到待定可视化区域上的行为状态映射单元,通过所述行为状态映射单元在事先生成的所述场景型话题交互日志中确定该话题行为图谱单元对应的待定行为状态单元。

在一种可独立实施的设计思路下,在事先生成的所述场景型话题交互日志中确定该话题行为图谱单元对应的寻找区间包括:

在事先生成的所述场景型话题交互日志中获寻到该话题行为图谱单元,并确定以该话题行为图谱单元为热点单元、预设连边数目为约束的目标区间;

将所述目标区间确定为该话题行为图谱单元对应的寻找区间。

在一种可独立实施的设计思路下,所述通过寻找区间在事先生成的所述场景型话题交互日志中确定该话题行为图谱单元对应的待定可视化区域,包括:

在事先生成的所述场景型话题交互日志中确定出涵盖所述寻找区间的第一可视化日志段落;

从预先完成构建的层级性可视化拓扑的原始拓扑单元开始获寻到符合要求的目标末端拓扑单元,所述要求是指:末端拓扑单元对应的可视化区间与所述第一可视化日志段落存在重叠;所述层级性可视化拓扑的原始拓扑单元对应所述场景型话题交互日志的全部可视化区间,所述层级性可视化拓扑中第x层拓扑单元对应所述场景型话题交互日志中的第x层可视化区间,所述场景型话题交互日志中的各层可视化区间是按照预设区间分类策略从所述场景型话题交互日志分类得到的;

从所有目标末端拓扑单元对应的可视化区间内确定出该话题行为图谱单元对应的待定可视化区域;

相应的,所述从所有目标末端拓扑单元对应的可视化区间内确定出该话题行为图谱单元对应的待定可视化区域,包括:

针对每一目标末端拓扑单元,从该目标末端拓扑单元对应的可视化区间内确定出至少一个模板可视化区域;模板可视化区域对应的第二可视化日志段落与所述第一可视化日志段落存在重叠,模板可视化区域对应的第二可视化日志段落是指在所述场景型话题交互日志中定位出的涵盖该模板可视化区域的可视化日志段落;

针对每一模板可视化区域,判断该模板可视化区域是否与所述寻找区间存在重叠,如果是,确定该模板可视化区域为该话题行为图谱单元对应的待定可视化区域;

相应的,所述确定该模板可视化区域为该话题行为图谱单元对应的待定可视化区域进一步包括:

获取该话题行为图谱单元对应的行为传递描述;

确定该模板可视化区域在事先生成的所述场景型话题交互日志中被设置的描述;

判断该话题行为图谱单元对应的行为传递描述与该模板可视化区域被设置的描述之间的量化差异值是否小于或等于设定量化差异值,如果是,确定该模板可视化区域为该话题行为图谱单元对应的待定可视化区域。

在一种可独立实施的设计思路下,所述通过该话题行为图谱单元组中话题行为图谱单元对应的待定行为状态单元确定该话题行为图谱单元组所对应的待定行为状态单元组包括:

针对话题行为图谱单元组中的每一话题行为图谱单元,获取该话题行为图谱单元对应的所有待定行为状态单元;

将话题行为图谱单元组中其中一个话题行为图谱单元对应的每一待定行为状态单元与另一话题行为图谱单元对应的每一待定行为状态单元配对,得到待定行为状态单元组。

在一种可独立实施的设计思路下,所述通过预先完成统计的场景型话题调用信息确定待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹,包括:

针对每一待定行为状态单元组,通过该待定行为状态单元组中的两个待定行为状态单元在预先完成统计的场景型话题调用信息中寻找出目标可视化区域;

通过寻找出的目标可视化区域确定该待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹;

相应的,所述通过该待定行为状态单元组中的两个待定行为状态单元在预先完成统计的场景型话题调用信息中寻找出目标可视化区域,包括:

通过该待定行为状态单元组中的第一待定行为状态单元、第二待定行为状态单元在事先生成的所述场景型话题交互日志中确定第一搜寻辅助单元和第二搜寻辅助单元;第一搜寻辅助单元为第一待定行为状态单元所处的待定可视化区域上与第二待定行为状态单元距离最短的行为状态单元,第二搜寻辅助单元为第二待定行为状态单元所处的待定可视化区域上与第一待定行为状态单元距离最短的行为状态单元,第一待定行为状态单元为:与该待定行为状态单元组对应的话题行为图谱单元组中第一话题行为图谱单元的待定行为状态单元,第二待定行为状态单元为:与该待定行为状态单元组对应的话题行为图谱单元组中第二话题行为图谱单元的待定行为状态单元,在所述当前可视化行为记录中第二话题行为图谱单元与第一话题行为图谱单元关联且位于第一话题行为图谱单元之后;

通过第一搜寻辅助单元和所述第二搜寻辅助单元在预先完成统计的场景型话题调用信息中寻找出目标可视化区域;

相应的,所述通过第一搜寻辅助单元和所述第二搜寻辅助单元在预先完成统计的场景型话题调用信息中寻找出目标可视化区域包括:

将第一指示路径和第二指示路径中的其中一个确定为当前可视化搜寻指示路径;第一指示路径为经由第一搜寻辅助单元至第二搜寻辅助单元的路径描述,第二指示路径为经由第二搜寻辅助单元至第一搜寻辅助单元的路径描述;

将当前可视化搜寻指示路径的查询触发状态单元作为当前行为状态单元,若当前行为状态单元未统计在场景型话题调用信息中,将当前行为状态单元、该当前行为状态单元对应的当前可视化搜寻指示路径汇总在所述场景型话题调用信息中;

在事先生成的所述场景型话题交互日志中获寻到当前行为状态单元的关联行为状态单元,依次访问获寻到的关联行为状态单元;若在所述场景型话题调用信息中汇总了依次访问到的关联行为状态单元,通过场景型话题调用信息中记载的该关联行为状态单元对应的可视化搜寻指示路径寻找出位于当前可视化搜寻指示路径上的可视化区域作为所述目标可视化区域;若在所述场景型话题调用信息中未统计依次访问到的关联行为状态单元,将关联行为状态单元对应的当前可视化搜寻指示路径、当前行为状态单元和关联行为状态单元的可视化区域记录至场景型话题调用信息中;

若依次访问终止时未确定出目标可视化区域,则从当前行为状态单元的所有关联行为状态单元挑选一个行为状态单元作为当前可视化搜寻指示路径的查询触发状态单元;然后将当前可视化搜寻指示路径更新为所述第一指示路径和第二指示路径中的另一个,返回将当前可视化搜寻指示路径的查询触发状态单元作为当前行为状态单元的操作。

在一种可独立实施的设计思路下,所述通过场景型话题调用信息中记载的该关联行为状态单元对应的可视化搜寻指示路径寻找出位于当前可视化搜寻指示路径上的可视化区域作为所述目标可视化区域包括:

对比分析场景型话题调用信息中记载的该关联行为状态单元对应的可视化搜寻指示路径与当前可视化搜寻指示路径;

比对分析结果表征该关联行为状态单元对应的可视化搜寻指示路径与当前可视化搜寻指示路径存在差异时,从所述场景型话题调用信息中获取位于当前可视化搜寻指示路径上的可视化区域作为所述目标可视化区域。

在一种可独立实施的设计思路下,所述从当前行为状态单元的所有关联行为状态单元挑选一个行为状态单元作为当前可视化搜寻指示路径的查询触发状态单元,包括:

针对每一关联行为状态单元,确定该关联行为状态单元对应的操作行为轨迹量化评价,所述操作行为轨迹量化评价为当前可视化搜寻指示路径的查询触发状态单元至该关联行为状态单元的第一行为轨迹量化评价、与该关联行为状态单元至当前可视化搜寻指示路径的查询终止状态单元的第二行为轨迹量化评价的和值;

挑选对应的操作行为轨迹量化评价最低的一个关联行为状态单元;

将挑选出的关联行为状态单元确定为当前可视化搜寻指示路径的查询触发状态单元。

在一种可独立实施的设计思路下,所述通过每一话题行为图谱单元组所对应的待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹,在事先生成的所述场景型话题交互日志中确定出与当前可视化行为记录适配的目标操作行为轨迹,包括:

针对每一话题行为图谱单元组,执行以下步骤:针对该话题行为图谱单元组所对应的每一待定行为状态单元组,将该待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹导入至在先完成训练的AI神经网络,得到该待定行为状态单元组所对应的至少一个设定关键内容可能性的重要程度变量;通过各待定行为状态单元组所对应的至少一个设定关键内容可能性的重要程度变量,从各待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹中挑选一个待定操作行为轨迹;

将所有待定操作行为轨迹按照预设行为轨迹拼接策略进行全局化融合以得到所述目标操作行为轨迹。

本申请实施例还提供了一种话题服务器,包括处理器、通信总线和存储器;所述处理器和所述存储器通过所述通信总线通信,所述处理器从所述存储器中读取计算机程序并运行,以执行上述的方法。

本申请实施例还提供了一种计算机用可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在运行时实现上述的方法。

由此可见,本申请实施例提供了一种应用于大数据的话题互动行为安防处理方法及话题服务器,在确定当前可视化行为记录中的每一话题行为图谱单元组对应的待定行为状态单元组中待定行为状态单元之间的优化操作行为轨迹时,可以通过预先完成统计的场景型话题调用信息来确定,由于场景型话题调用信息汇总了已被调用的不同行为状态单元之间的操作行为轨迹信息,在同一可视化区域被反复调用时,可以无需额外对该可视化区域进行分析处理,能够在一定程度上避免大量的重复性分析处理,进一步地,通过各优化操作行为轨迹确定出与当前可视化行为记录适配的目标操作行为轨迹,能够尽可能减少确定操作行为轨迹所需要耗费的时间,并确保得到的目标操作行为轨迹的准确性和完整性,从而快速、准确地为后续的互动行为安防分析提供分析依据,避免在确定当前可视化行为记录的目标操作行为轨迹过程中耗费过多时间而影响互动行为安防分析的时效性。

在后面的描述中,将部分地陈述其他的特征。在检查后面内容和附图时,本领域的技术人员将部分地发现这些特征,或者可以通过生产或运用了解到这些特征。通过实践或使用后面所述详细示例中列出的方法、工具和组合的各个方面,当前申请中的特征可以被实现和获得。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本申请实施例所提供的一种话题服务器的方框示意图。

图2为本申请实施例所提供的一种应用于大数据的话题互动行为安防处理方法的流程图。

图3为本申请实施例所提供的一种应用于大数据的话题互动行为安防处理装置的框图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本申请的一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。

因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

图1示出了本申请实施例所提供的一种话题服务器10的方框示意图。本申请实施例中的话题服务器10可以为具有数据存储、传输、处理功能的服务端,如图1所示,话题服务器10包括:存储器11、处理器12、通信总线13和应用于大数据的话题互动行为安防处理装置20。

存储器11、处理器12和通信总线13之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件互相之间可以通过一条或多条通讯总线或信号线实现电性连接。存储器11中存储有应用于大数据的话题互动行为安防处理装置20,所述应用于大数据的话题互动行为安防处理装置20包括至少一个可以软件或固件(firmware)的形式储存于所述存储器11中的软件功能模块,所述处理器12通过运行存储在存储器11内的软件程序以及模块,例如本申请实施例中的应用于大数据的话题互动行为安防处理装置20,从而执行各种功能应用以及数据处理,即实现本申请实施例中的应用于大数据的话题互动行为安防处理方法。

其中,所述存储器11可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器11用于存储程序,所述处理器12在接收到执行指令后,执行所述程序。

所述处理器12可能是一种集成电路芯片,具有数据的处理能力。上述的处理器12可以是通用处理器,包括中央处理器 (Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等。可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

通信总线13用于通过网络建立话题服务器10与其他通信终端设备之间的通信连接,实现网络信号及数据的收发操作。上述网络信号可包括无线信号或者有线信号。

可以理解,图1所示的结构仅为示意,话题服务器10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。

本申请实施例还提供了一种计算机用可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在运行时实现上述的方法。

图2示出了本申请实施例所提供的一种应用于大数据的话题互动行为安防处理的流程图。所述方法有关的流程所定义的方法步骤应用于话题服务器10,可以由所述处理器12实现,所述方法包括以下步骤S100-步骤S400所描述的内容。

步骤S100中,在事先生成的场景型话题交互日志中为当前可视化行为记录中的话题行为图谱单元确定对应的待定行为状态单元。

举例而言,场景型话题交互日志是根据大数据话题环境中各话题互动情况的可视化特征创建的,可以涵盖一定可视化区间内的多个可视化区域,不同可视化区域与不同的话题互动情况对应。场景型话题交互日志的可视化区间不限,比如,场景型话题交互日志可以为一个话题社群的场景型话题交互日志、或者话题平台的场景型话题交互日志。

当前可视化行为记录是需要与场景型话题交互日志进行匹配,以确定出对应的操作行为轨迹的可视化行为记录。当前可视化行为记录可以来自用于捕捉用户操作的行为检测线程传输的,比如可以是大数据话题客户端上的行为检测线程传输的大数据话题客户端的动态可视化行为记录,可视化行为记录来源不限于行为检测线程,行为检测目标也不限于大数据话题客户端。

为当前可视化行为记录中的话题行为图谱单元确定对应的待定行为状态单元时,可以在场景型话题交互日志中将话题行为图谱单元向邻居可视化区域进行映射,根据行为状态映射单元来确定该话题行为图谱单元的待定行为状态单元。邻居可视化区域比如可以为与根据话题行为图谱单元确定出的寻找区间存在重叠的可视化区域、或者该寻找区间内的可视化区域等,具体不限于此。

当前可视化行为记录中每一话题行为图谱单元对应的待定行为状态单元的数目可以为一个或多个,具体数目根据寻找区间大小、及可视化区域的疏密程度情况而定。

步骤S200中,针对当前可视化行为记录中的每一话题行为图谱单元组,话题行为图谱单元组由两个关联话题行为图谱单元构成,通过该话题行为图谱单元组中话题行为图谱单元对应的待定行为状态单元确定该话题行为图谱单元组所对应的待定行为状态单元组。

话题行为图谱单元组的数目根据当前可视化行为记录中的话题行为图谱单元数目而定,比如,当前可视化行为记录中话题行为图谱单元数目为num1,话题行为图谱单元组的数目可以为num1-1。当前可视化行为记录中每两个关联话题行为图谱单元构成一对话题行为图谱单元组,举例来说,当前可视化行为记录按照话题行为图谱单元的生成时间先后顺序依次涵盖topic_graph_unit1-topic_graph_unit4这四个话题行为图谱单元,那么构成的话题行为图谱单元组可以为:

(topic_graph_unit1,topic_graph_unit2);

(topic_graph_unit2,topic_graph_unit3);

(topic_graph_unit3、topic_graph_unit4)。

由于每个话题行为图谱单元可以有多个待定行为状态单元,所以针对一对话题行为图谱单元组可以确定出多对待定行为状态单元组。当然,并不排除一对话题行为图谱单元组中每一话题行为图谱单元对应的待定行为状态单元均为一个的情况,在此情况下,则针对该话题行为图谱单元组可以确定出一对待定行为状态单元组。

在本申请实施例中,话题行为图谱单元可以理解为话题互动行为的图谱化节点,关于话题行为图谱单元的节点化处理技术可以参考知识图谱(Knowledge Graph)。进一步地,话题行为图谱单元对应的行为状态单元用于表征话题行为图谱单元的互动行为状态,从某种意义上可以理解为对互动行为状态的映射化和节点化处理。

在一些可选的且可独立实施的设计思路下,步骤S200中,所述通过该话题行为图谱单元组中话题行为图谱单元对应的待定行为状态单元确定该话题行为图谱单元组所对应的待定行为状态单元组,可以包括以下步骤:

S201:针对话题行为图谱单元组中的每一话题行为图谱单元,获取该话题行为图谱单元对应的所有待定行为状态单元;

S202:将话题行为图谱单元组中其中一个话题行为图谱单元对应的每一待定行为状态单元与另一话题行为图谱单元对应的每一待定行为状态单元配对,得到待定行为状态单元组。

如此,得到的待定行为状态单元组包括两个待定行为状态单元,其中一个待定行为状态单元与话题行为图谱单元组中其中一个话题行为图谱单元对应,另一待定行为状态单元与该话题行为图谱单元组中另一个话题行为图谱单元对应。

在实际应用时,可以以一对话题行为图谱单元组中每个话题行为图谱单元对应多个待定行为状态单元为例,比如话题行为图谱单元组为(topic_graph_unit1,topic_graph_unit2)。

其中,话题行为图谱单元topic_graph_unit1对应两个待定行为状态单元behaviour_state_unit1、behaviour_state_unit2,话题行为图谱单元topic_graph_unit2对应两个待定行为状态单元behaviour_state_unit3、behaviour_state_unit4,则针对该话题行为图谱单元组确定出的待定行为状态单元组为四对,包括:

(behaviour_state_unit1,behaviour_state_unit3);

(behaviour_state_unit1,behaviour_state_unit4);

(behaviour_state_unit2,behaviour_state_unit3);

(behaviour_state_unit2,behaviour_state_unit4)。

步骤S300中,通过预先完成统计的场景型话题调用信息确定待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹;所述场景型话题调用信息汇总了已被调用的不同行为状态单元之间的操作行为轨迹信息。

例如,场景型话题调用信息可以是场景型话题访问信息。在一般情况下,即在确定第一对可视化行为记录对所对应的第一对待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹之前,场景型话题调用信息可以理解为空集。在确定优化操作行为轨迹时,可以将调用过的行为状态单元及对应的可视化区域,也就是已被调用的不同行为状态单元之间的操作行为轨迹信息,汇总在场景型话题调用信息中。如此,在遇到重复的、相同的的行为状态单元及对应的可视化区域时,由于场景型话题调用信息中已经汇总了相应的操作行为轨迹信息,所以可以无需额外对该重复的、相同的可视化区域进行分析处理,进而减少确定优化操作行为轨迹所需要耗费的时间和计算机资源。

换言之,通过预先完成统计的场景型话题调用信息确定待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹时,可以先确定场景型话题调用信息中是否已记录相应的操作行为轨迹信息,如果是,可以无需额外分析处理相应的操作行为轨迹信息,如果否,再分析处理操作行为轨迹信息并将分析处理得到的操作行为轨迹信息添加到场景型话题调用信息中。

如此,可以确定出所有待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹,在话题行为图谱单元组对应于多对待定行为状态单元组的前提下,一对话题行为图谱单元组会对应多个优化操作行为轨迹。

步骤S400中,通过每一话题行为图谱单元组所对应的待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹,在事先生成的所述场景型话题交互日志中确定出与当前可视化行为记录适配的目标操作行为轨迹。

在本申请实施例中,目标操作行为轨迹可以用于后续进行互动行为安全防护分析,比如可以通过目标操作行为轨迹快速准确判断互动行为是否异常或者是否存在风险。

每一话题行为图谱单元组所对应的待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹,可以视作该话题行为图谱单元组中一个话题行为图谱单元到另一个话题行为图谱单元的优化操作行为轨迹。在当前可视化行为记录中每两个关联话题行为图谱单元中一个话题行为图谱单元到另一个话题行为图谱单元的优化操作行为轨迹均已被确定的基础上,可以确定当前可视化行为记录适配的目标操作行为轨迹,该目标操作行为轨迹可以视作当前可视化行为记录中起始话题行为图谱单元到终止话题行为图谱单元的优化操作行为轨迹。

在一些示例中,优化操作行为轨迹可以理解为在满足一定特征识别度的前提下,简洁化程度最高的操作行为轨迹。如此,可以提高后续对操作行为轨迹处理的效率。

在另一些示例中,一些话题行为图谱单元组所对应的待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹可能有多个,在此情况下,需要从多个优化操作行为轨迹挑选一条最优的优化操作行为轨迹作为与该话题行为图谱单元组适配的优化操作行为轨迹。

比如,可以计算各待定行为状态单元组对应的定位可能性及变化可能性,并根据各待定行为状态单元组对应的定位可能性及变化可能性从多个优化操作行为轨迹挑选一条优化操作行为轨迹作为与该话题行为图谱单元组适配的优化操作行为轨迹;其中,待定行为状态单元组对应的定位可能性包括:待定行为状态单元组中每一待定行为状态单元的定位可能性,待定行为状态单元的定位可能性即对应的话题行为图谱单元位于待定行为状态单元所在的待定可视化区域的概率;待定行为状态单元组对应的变化可能性包括:行为检测目标从待定行为状态单元组中一个待定行为状态单元所在的待定可视化区域转移到另一个待定行为状态单元所在的待定可视化区域的概率。

上述的选择方式仅是举例,进一步地选择方式不限于此,还可以有其他方式,比如可以对不同的待定行为状态单元组对应的变化可能性配置不同的重要性权值,再根据配置重要性权值后的变化可能性来挑选。

当然,也可能有一些话题行为图谱单元组所对应的待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹只有一个,在此情况下,可以直接将该优化操作行为轨迹作为与该话题行为图谱单元组适配的优化操作行为轨迹。

在确定所有话题行为图谱单元组适配的优化操作行为轨迹后,可以将所有话题行为图谱单元组适配的优化操作行为轨迹进行拼接融合,得到与当前可视化行为记录适配的目标操作行为轨迹。

本申请实施例中,在确定当前可视化行为记录中的每一话题行为图谱单元组对应的待定行为状态单元组中待定行为状态单元之间的优化操作行为轨迹时,可以通过预先完成统计的场景型话题调用信息来确定,由于场景型话题调用信息汇总了已被调用的不同行为状态单元之间的操作行为轨迹信息,在同一可视化区域被反复调用时,可以无需额外对该可视化区域进行分析处理,能够在一定程度上避免大量的重复性分析处理,进一步地,通过各优化操作行为轨迹确定出与当前可视化行为记录适配的目标操作行为轨迹,能够尽可能减少确定操作行为轨迹所需要耗费的时间,并确保得到的目标操作行为轨迹的准确性和完整性。

在一些可独立实施的技术方案中,步骤S100中,所述在事先生成的场景型话题交互日志中为当前可视化行为记录中的话题行为图谱单元确定对应的待定行为状态单元,包括:

S101:针对当前可视化行为记录中的每一话题行为图谱单元,在事先生成的所述场景型话题交互日志中确定该话题行为图谱单元对应的寻找区间,通过所述寻找区间在事先生成的所述场景型话题交互日志中确定该话题行为图谱单元对应的待定可视化区域,确定该话题行为图谱单元映射到待定可视化区域上的行为状态映射单元,通过所述行为状态映射单元在事先生成的所述场景型话题交互日志中确定该话题行为图谱单元对应的待定行为状态单元。

在本申请实施例中,寻找区间可以理解为搜寻范围。

在一些可选的且可独立实施的设计思路下,步骤S101中,在事先生成的所述场景型话题交互日志中确定该话题行为图谱单元对应的寻找区间,可以包括以下步骤:

S1011:在事先生成的所述场景型话题交互日志中获寻到该话题行为图谱单元,并确定以该话题行为图谱单元为热点单元、预设连边数目为约束的目标区间;

S1012:将所述目标区间确定为该话题行为图谱单元对应的寻找区间。

换言之,话题行为图谱单元对应的寻找区间可以为以该话题行为图谱单元为热点单元、预设连边数目为约束的目标区间。预设连边数目可以根据所需的操作行为轨迹精度来确定,当然也可以同时综合确定待定行为状态单元所需的运算资源开销来确定。

当然,上述寻找区间为一种选择性的例子,具体并不限于此。比如寻找区间还可以为图形化区间等,确定寻找区间的方式可以根据所需的寻找区间的实际形状而定。

该话题行为图谱单元对应的寻找区间用于确定该话题行为图谱单元对应的待定可视化区域。

进一步地,热点单元可以理解为原点,预设连边数目为约束可以理解为以预设连边数目对应的长度为半径进行区域围合处理,从而得到目标区间。

在一些可选的且可独立实施的设计思路下,步骤S101中,通过所述寻找区间在事先生成的所述场景型话题交互日志中确定该话题行为图谱单元对应的待定可视化区域,可以包括以下步骤:

步骤S1013中,在事先生成的所述场景型话题交互日志中确定出涵盖所述寻找区间的第一可视化日志段落。

可以在前述的寻找区间的基础上,在事先生成的所述场景型话题交互日志中确定出第一可视化日志段落,该第一可视化日志段落涵盖该寻找区间。

为减少在确定待定可视化区域时的额外资源开销,该第一可视化日志段落可以为涵盖该寻找区间的最小可视化日志段落。当然,此处并不作为限制,第一可视化日志段落可以根据需要来确定,比如还可以是涵盖该寻找区间的、且比最小可视化日志段落稍大一点的可视化日志段落,只要涵盖该寻找区间即可。

步骤S1014中,从预先完成构建的层级性可视化拓扑的原始拓扑单元开始获寻到符合要求的目标末端拓扑单元,所述要求是指:末端拓扑单元对应的可视化区间与所述第一可视化日志段落存在重叠。

在此之前,先按照预设区间分类策略从所述场景型话题交互日志划分多层可视化区间,然后根据场景型话题交互日志被分类得到的各层可视化区间建立层级性可视化拓扑(节点化的树模型或者节点化的树路径)。换言之,场景型话题交互日志被预先划分出了多层可视化区间,并且,层级性可视化拓扑是预先根据场景型话题交互日志被分类得到的各层可视化区间建立的。场景型话题交互日志可以通过以下方式实现划分:确定涵盖该场景型话题交互日志的全部可视化区间的可视化日志段落;将该可视化日志段落划分出N层可视化区间,N大于1。

其中,第1层可视化区间为可视化日志段落中的全部可视化区间、即该场景型话题交互日志的全部可视化区间,第2层可视化区间为将该可视化日志段落进行四等分后的4个可视化区间,第3层可视化区间为将这4个可视化区间中的每一可视化区间进一步进行四等分后的16个可视化区间,以此类推。

例如,场景型话题交互日志的全部可视化区间interval10作为第1层区间;该第1层区间被划分为4个第2层区间,分别为interval11、interval12、interval13和interval14;每个第2层区间又进一步被划分为四个第3层区间,以interval11为例,interval11被划分为interval111、interval112、interval113和interval114这四个第3层区间,其他类似,在此不再列举。如此,场景型话题交互日志被划分为了3层可视化区间。

当然,上述的场景型话题交互日志划分情况只是为了便于理解而举的例子,实际场景型话题交互日志的区间存在差异,比如话题平台、或者一个话题网络等,所以,实际划分情况可以分成更多层。

上述可视化日志段落只是为了便于划分,实际也可以采用其他方式对该场景型话题交互日志的全部可视化区间进行划分,具体划分方式不限。

基于场景型话题交互日志被分类得到的N层可视化区间,可以建立层级性可视化拓扑,其中,层级性可视化拓扑的原始拓扑单元对应所述场景型话题交互日志的全部可视化区间,所述层级性可视化拓扑中第x层拓扑单元对应所述场景型话题交互日志中的第x层可视化区间,x大于或等于1、且小于或等于N。

为了更好地理解层级性可视化拓扑的建立方式,以层级性可视化拓扑为一树模型为例进行说明。层级性可视化拓扑的原始拓扑单元即第1层拓扑单元对应于场景型话题交互日志的全部可视化区间interval10,原始拓扑单元的四个下游拓扑单元即第2层拓扑单元分别对应第2层可视化区间interval11、interval12、interval13和interval14,第2层拓扑单元的下游拓扑单元即第3层末端拓扑单元对应第3层可视化区间,以interval11为例,第2层拓扑单元interval11的四个下游拓扑单元分别对应interval111、interval112、interval113和interval114这四个第3层可视化区间。

层级性可视化拓扑的最后一层拓扑单元为末端拓扑单元,第3层拓扑单元为层级性可视化拓扑的末端拓扑单元,比如分别对应interval111、interval112、interval113和interval114这四个第3层可视化区间的拓扑单元。

在从层级性可视化拓扑中获寻目标末端拓扑单元时,从层级性可视化拓扑的原始拓扑单元开始获寻,自上而下的策略一层一层地依次访问层级性可视化拓扑树的拓扑单元,在依次访问到的拓扑单元对应的可视化区间与第二可视化日志段落存在重叠时,还需继续依次访问该拓扑单元的下游拓扑单元,直至找到以该拓扑单元为原始拓扑单元的层级性可视化局部拓扑树中与第二可视化日志段落存在重叠的末端拓扑单元;在依次访问到的拓扑单元对应的可视化区间与第二可视化日志段落不存在重叠时,就不需要再继续在以该拓扑单元作为原始拓扑单元的层级性可视化局部拓扑树中依次访问了,如此可以大大减少依次访问的拓扑单元。

通过上述依次访问方式(比如可以理解为遍历),可以找出所有对应的可视化区间与第一可视化日志段落存在重叠的末端拓扑单元,这些末端拓扑单元均作为目标末端拓扑单元。话题行为图谱单元的寻找区间分布在所有目标末端拓扑单元对应的可视化区间内。

本实施例中,利用层级性可视化拓扑可以快速找到话题行为图谱单元的寻找区间所在的区域,在一个拓扑单元对应的可视化区间与第二可视化日志段落不存在重叠,该拓扑单元的下游拓扑单元对应的可视化区间就必然不会与该第二可视化日志段落存在重叠,所以以该拓扑单元为原始拓扑单元的层级性可视化局部拓扑树就不需要进行依次访问了,可以减少需与第二可视化日志段落对比分析的可视化区间的数目,由于场景型话题交互日志的整体数据量较大,因此采用上述技术能够节省大量无用的计算资源开销,减少分析耗时。

此外,判断第二可视化日志段落与可视化区间之间是否存在重叠,相比于判断圆形或其他形状的寻找区间与可视化区间之间是否存在重叠而言,判断方式更便捷,可以减少判断时的运算资源开销。

步骤S1015中,从所有目标末端拓扑单元对应的可视化区间内确定出该话题行为图谱单元对应的待定可视化区域。

在确定待定可视化区域时,可以依次访问所有目标末端拓扑单元对应的可视化区间内的所有可视化区域,判断依次访问到的可视化区域是否与寻找区间存在重叠,如果是,则依次访问到的可视化区域为待定可视化区域。

为了减少确定待定可视化区域时的运算资源开销,步骤S1015中,所述从所有目标末端拓扑单元对应的可视化区间内确定出该话题行为图谱单元对应的待定可视化区域,可以包括以下步骤:

S10151:针对每一目标末端拓扑单元,从该目标末端拓扑单元对应的可视化区间内确定出至少一个模板可视化区域;模板可视化区域对应的第二可视化日志段落与所述第一可视化日志段落存在重叠,模板可视化区域对应的第二可视化日志段落是指在所述场景型话题交互日志中定位出的涵盖该模板可视化区域的可视化日志段落;

S10152:针对每一模板可视化区域,判断该模板可视化区域是否与所述寻找区间存在重叠,如果是,确定该模板可视化区域为该话题行为图谱单元对应的待定可视化区域。

在确定模板可视化区域(参考可视化区域)时,可以先确定目标末端拓扑单元对应的可视化区间内每一可视化区域对应的第二可视化日志段落,该第二可视化日志段落可以是但不限于涵盖可视化区域的最小可视化日志段落;接着,针对每个第二可视化日志段落,判断该第二可视化日志段落是否与第一可视化日志段落存在重叠,如果是,则该第二可视化日志段落涵盖的可视化区域为模板可视化区域。

模板可视化区域是通过判断涵盖模板可视化区域的第二可视化日志段落与涵盖寻找区间的第一可视化日志段落是否存在重叠而确定出的,但是第二可视化日志段落与第一可视化日志段落存在重叠不代表模板可视化区域与寻找区间存在重叠。

比如,zoncondition100为寻找区间,寻找区间zoncondition100对应的第一可视化日志段落为journal_section10,Visualization100为一个可视化区域。

进一步地,可视化区域Visualization100对应的第二可视化日志段落为journal_section20,第一可视化日志段落journal_section10与第二可视化日志段落journal_section20存在重叠,所以可视化区域Visualization100为模板可视化区域,但是可视化区域Visualization100与寻找区间zoncondition100其实并不存在重叠。

所以,在找出模板可视化区域的前提下,进一步判断模板与寻找区间是否存在重叠,如果是,确定该模板可视化区域为该话题行为图谱单元对应的待定可视化区域。

如此,可以通过判断可视化日志段落之间是否存在重叠来找出模板可视化区域,再判断模板可视化区域与寻找区间是否存在重叠,由于判断可视化日志段落是否交叉比判断可视化区域与目标区间是否交叉的计算属性小很多,判断可视化日志段落是否交叉时,可以从整体层面减少运算资源开销,提升处理耗时。

现有方式中,在确定话题行为图谱单元相应的待定行为状态单元或待定可视化区域的过程中,要将全部场景型话题中的可视化区域与话题行为图谱单元的寻找区间对比分析,以确定两者是否交叉,由于场景型话题数据量较大,所以涉及较多的无效运算,导致耗费更多的时间。并且,先对寻找区间的最小围合区域与可视化区域的最小围合区域之间进行对比分析,以确定所有第一可视化区域,再从第一可视化区域中进一步确定出与寻找区间交叉的可视化区域,作为模板可视化区域,可以大大减小运算资源开销,进一步减少耗时。

可以直接将该模板可视化区域作为该话题行为图谱单元对应的待定可视化区域。但是,通常来说,不会存在行为检测目标所在可视化区域的描述与行为检测目标的可视化行为记载的描述相反的情况出现。

基于这一情况,可以对模板可视化区域进行优化处理,得到该话题行为图谱单元对应的待定可视化区域。为此,步骤S10152中,所述确定该模板可视化区域为该话题行为图谱单元对应的待定可视化区域进一步包括以下步骤:

S101521:获取该话题行为图谱单元对应的行为传递描述;

S101522:确定该模板可视化区域在事先生成的所述场景型话题交互日志中被设置的描述;

S101523:判断该话题行为图谱单元对应的行为传递描述与该模板可视化区域被设置的描述之间的量化差异值是否小于或等于设定量化差异值,如果是,确定该模板可视化区域为该话题行为图谱单元对应的待定可视化区域。

在一些可能的实施例中,行为检测线程采集的数据除了行为检测目标的话题行为图谱单元(空间域信息)外,还带有行为检测目标在每个话题行为图谱单元处的行为传递描述(行为发展路径或者行为趋势路径),因此,可以从当前可视化行为记载的来源信息中获取该话题行为图谱单元对应的行为传递描述。当然,在描述信息缺失情况下,可使用上一话题行为图谱单元与该话题行为图谱单元、或者该话题行为图谱单元与下一话题行为图谱单元计算出行为传递描述。

场景型话题交互日志中每一可视化区域均被设置了描述,可视化区域被设置的描述即可视化区域的起始单元到终止单元的路径描述。比如,非交互型行为对应的可视化区域的描述即为非交互型行为的路径描述;而交互型行为可以对应两个互逆路径描述的可视化区域,相应的,每个可视化区域的描述为交互型行为中对手方话题互动情况的路径描述。

如果模板可视化区域被设置的描述与话题行为图谱单元对应的行为传递描述之间的量化差异值(比如路径描述差异度)小于或等设定量化差异值,则确定该模板可视化区域为待定可视化区域;否则,认为该模板可视化区域是行为检测目标所处的可视化区域的概率极低,确定该模板可视化区域不为待定可视化区域。

设定量化差异值可以根据需要预设,为避免因话题行为图谱单元异常而量化差异值过大导致遗漏正确可视化区域的问题,可以将设定量化差异值设置地较大,比如在0~1的区间内可以设置为0.9。当然此处仅是举例,并不作为限制。

当话题行为图谱单元对应的寻找区间的约束较大时,会造成模板可视化区域的数目较多,但是,其实正确可视化区域只会有一个,所以对模板可视化区域进行优化处理后,得到更少量的待定可视化区域,后续在找正确可视化区域时,可以避免大量的无效运算处理,进一步减少耗时。

步骤S101中,在找到该话题行为图谱单元对应的待定可视化区域后,可以确定该话题行为图谱单元映射到待定可视化区域上的行为状态映射单元,通过所述行为状态映射单元在事先生成的所述场景型话题交互日志中确定该话题行为图谱单元对应的待定行为状态单元。

该话题行为图谱单元映射到待定可视化区域上的行为状态映射单元,比如可以为话题行为图谱单元到待定可视化区域所对应行为路径上的交点。在此基础上,通过所述行为状态映射单元在事先生成的所述场景型话题交互日志中确定该话题行为图谱单元对应的待定行为状态单元可以包括:

如果行为状态映射单元在待定可视化区域上,将该行为状态映射单元确定为待定行为状态单元;

如果行为状态映射单元不在待定可视化区域上,那么将待定可视化区域上接近该行为状态映射单元的行为状态单元作为待定行为状态单元。

在一些可独立实施的技术方案中,步骤S300中,所述通过预先完成统计的场景型话题调用信息确定待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹,包括:

S301:针对每一待定行为状态单元组,通过该待定行为状态单元组中的两个待定行为状态单元在预先完成统计的场景型话题调用信息中寻找出目标可视化区域;

S302:通过寻找出的目标可视化区域确定该待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹。

当相邻的两个话题行为图谱单元距离较远时,一个话题行为图谱单元对应的待定行为状态单元到下一话题行为图谱单元的待定行为状态单元之间有很多可选的操作行为轨迹,不同操作行为轨迹之间可能有较多重叠的可视化区域,如果对这些可视化区域重复寻找会带来较多的计算耗时。

利用场景型话题调用信息完成目标可视化区域的寻找,这样当寻找重复的可视化区域(即之前已经寻找过的可视化区域)时,场景型话题调用信息中已经汇总了相应的操作行为轨迹信息,此时可以不用额外运算处理,省去重复寻找相同可视化区域带来的计算耗时。

在一些可选的且可独立实施的设计思路下,步骤S301中,所述通过该待定行为状态单元组中的两个待定行为状态单元在预先完成统计的场景型话题调用信息中寻找出目标可视化区域,可以包括以下步骤:

S3011:通过该待定行为状态单元组中的第一待定行为状态单元、第二待定行为状态单元在事先生成的所述场景型话题交互日志中确定第一搜寻辅助单元和第二搜寻辅助单元;第一搜寻辅助单元为第一待定行为状态单元所处的待定可视化区域上与第二待定行为状态单元距离最短的行为状态单元,第二搜寻辅助单元为第二待定行为状态单元所处的待定可视化区域上与第一待定行为状态单元距离最短的行为状态单元,第一待定行为状态单元为:与该待定行为状态单元组对应的话题行为图谱单元组中第一话题行为图谱单元的待定行为状态单元,第二待定行为状态单元为:与该待定行为状态单元组对应的话题行为图谱单元组中第二话题行为图谱单元的待定行为状态单元,在所述当前可视化行为记录中第二话题行为图谱单元与第一话题行为图谱单元关联且位于第一话题行为图谱单元之后;

S3012:通过第一搜寻辅助单元和所述第二搜寻辅助单元在预先完成统计的场景型话题调用信息中寻找出目标可视化区域。

举例来说,假设element1为第一话题行为图谱单元,element2为第二话题行为图谱单元,element2与element1为关联的两个话题行为图谱单元、且element2位于element1之后;pending1为element1的一个待定行为状态单元(第一待定行为状态单元),pending4为element2的一个待定行为状态单元(第二待定行为状态单元),pending1和pending4构成一对待定行为状态单元组;condition2为pending1所处的待定可视化区域condition1condition2上距离pending4最近的行为状态单元,所以将condition2确定为第一搜寻辅助单元;condition7为pending4所处的待定可视化区域condition7condition8上距离pending1最近的行为状态单元,所以将condition7确定为第二搜寻辅助单元。

通过第一搜寻辅助单元condition2与第二搜寻辅助单元condition7在预先完成统计的场景型话题调用信息中寻找出目标可视化区域,目标可视化区域可以是从第一搜寻辅助单元condition2到第二搜寻辅助单元condition7的所有操作行为轨迹中优化操作行为轨迹涵盖的可视化区域。

在一些可选的且可独立实施的设计思路下,步骤S3012中,所述通过第一搜寻辅助单元和所述第二搜寻辅助单元在预先完成统计的场景型话题调用信息中寻找出目标可视化区域,可以包括以下步骤:

S30121:将第一指示路径和第二指示路径中的其中一个确定为当前可视化搜寻指示路径;第一指示路径为经由第一搜寻辅助单元至第二搜寻辅助单元的描述,第二指示路径为经由第二搜寻辅助单元至第一搜寻辅助单元的描述;

S30122:将当前可视化搜寻指示路径的查询触发状态单元作为当前行为状态单元,若当前行为状态单元未统计在场景型话题调用信息中,将当前行为状态单元、该当前行为状态单元对应的当前可视化搜寻指示路径汇总在所述场景型话题调用信息中;

S30123:在事先生成的所述场景型话题交互日志中获寻到当前行为状态单元的关联行为状态单元,依次访问获寻到的关联行为状态单元;若在所述场景型话题调用信息中汇总了依次访问到的关联行为状态单元,通过场景型话题调用信息中记载的该关联行为状态单元对应的可视化搜寻指示路径寻找出位于当前可视化搜寻指示路径上的可视化区域作为所述目标可视化区域;若在所述场景型话题调用信息中未统计依次访问到的关联行为状态单元,将关联行为状态单元对应的当前可视化搜寻指示路径、当前行为状态单元和关联行为状态单元的可视化区域记录至场景型话题调用信息中;

S30124:若依次访问终止时未确定出目标可视化区域,则从当前行为状态单元的所有关联行为状态单元挑选一个行为状态单元作为当前可视化搜寻指示路径的查询触发状态单元;然后将当前可视化搜寻指示路径更新为所述第一指示路径和第二指示路径中的另一个,返回将当前可视化搜寻指示路径的查询触发状态单元作为当前行为状态单元的操作。

举例来说,假设从第一搜寻辅助单元condition2至第二搜寻辅助单元condition7的描述为第一指示路径,从第二搜寻辅助单元condition7至第一搜寻辅助单元condition2的描述为第二指示路径。第一指示路径的查询触发状态单元为第一搜寻辅助单元condition2,第二指示路径的查询触发状态单元为第二搜寻辅助单元condition7。

当前可视化搜寻指示路径可以为第一指示路径或第二指示路径,下面以当前可视化搜寻指示路径为第一指示路径为例展开说明。当然,此处只是开始寻找时将第一指示路径确定为当前可视化搜寻指示路径,在寻找时当前可视化搜寻指示路径可被更新。

当前可视化搜寻指示路径为从第一搜寻辅助单元condition2至第二搜寻辅助单元condition7,所以,当前可视化搜寻指示路径的查询触发状态单元为第一搜寻辅助单元condition2,将该第一搜寻辅助单元condition2作为当前行为状态单元,判断第一搜寻辅助单元condition2是否汇总在场景型话题调用信息中。

此时,第一搜寻辅助单元condition2是首次被调用,未统计在场景型话题调用信息中,所以将该第一搜寻辅助单元condition2、该第一搜寻辅助单元condition2对应的当前可视化搜寻指示路径(第一指示路径)记录至场景型话题调用信息中。

在事先生成的场景型话题交互日志中获寻到第一搜寻辅助单元condition2的关联行为状态单元,分别为condition1、condition3、condition4、condition5,并对关联行为状态单元condition1、condition3、condition4、condition5的依次访问进行依次访问。经过对关联行为状态单元condition1、condition3、condition4、condition5的依次访问,确定关联行为状态单元condition1、condition3、condition4、condition5均未统计在场景型话题调用信息中,并会将关联行为状态单元condition1、condition3、condition4、condition5与对应的当前可视化搜寻指示路径(第一指示路径)记录至场景型话题调用信息中,并将关联行为状态单元condition1至第一搜寻辅助单元condition2的可视化区域condition1condition2、关联行为状态单元condition3至第一搜寻辅助单元condition2的condition3condition2、第一搜寻辅助单元condition2至关联行为状态单元condition4的可视化区域condition2condition4、第一搜寻辅助单元condition2至关联行为状态单元condition5的可视化区域condition2condition5记录至场景型话题调用信息中。

终止对关联行为状态单元condition1、condition3、condition4、condition5的依次访问时,未确定出目标可视化区域,则从第一搜寻辅助单元condition2的所有关联行为状态单元condition1、condition3、condition4、condition5挑选一个行为状态单元作为当前可视化搜寻指示路径(第一指示路径)的查询触发状态单元。

在一些可选的且可独立实施的设计思路下,步骤S30124中,所述从当前行为状态单元的所有关联行为状态单元挑选一个行为状态单元作为当前可视化搜寻指示路径的查询触发状态单元,可以包括以下步骤:针对每一关联行为状态单元,确定该关联行为状态单元对应的操作行为轨迹量化评价,所述操作行为轨迹量化评价为当前可视化搜寻指示路径的查询触发状态单元至该关联行为状态单元的第一行为轨迹量化评价、与该关联行为状态单元至当前可视化搜寻指示路径的查询终止状态单元的第二行为轨迹量化评价的和值;挑选对应的操作行为轨迹量化评价最低的一个关联行为状态单元;将挑选出的关联行为状态单元确定为当前可视化搜寻指示路径的查询触发状态单元。

第一行为轨迹量化评价为当前可视化搜寻指示路径的查询触发状态单元到该关联行为状态单元的操作行为轨迹属性,由于这条操作行为轨迹是已被寻找过,所以可以用操作行为轨迹长度表示操作行为轨迹属性;第二行为轨迹量化评价为该关联行为状态单元到当前可视化搜寻指示路径的查询终止状态单元的操作行为轨迹属性,可以用该关联行为状态单元到当前可视化搜寻指示路径的查询终止状态单元之间的欧几里得度量表示操作行为轨迹属性。

在关联行为状态单元是首次被调用时,还可以将关联行为状态单元对应的操作行为轨迹量化评价记录至场景型话题调用信息中时,因而,对于已汇总在场景型话题调用信息中的关联行为状态单元而言,可以直接从场景型话题调用信息中获取该关联行为状态单元对应的操作行为轨迹量化评价。

继续前述的例子,可以计算第一搜寻辅助单元condition2的所有关联行为状态单元condition1、condition3、condition4、condition5至第二搜寻辅助单元condition7的操作行为轨迹量化评价,从所有关联行为状态单元condition1、condition3、condition4、condition5中挑选行为轨迹量化评价最低的关联行为状态单元作为当前可视化搜寻指示路径(第一指示路径)上的查询触发状态单元,比如挑选关联行为状态单元condition4作为当前可视化搜寻指示路径(第一指示路径)的查询触发状态单元。

然后,将当前可视化搜寻指示路径更新为第二指示路径,返回将当前可视化搜寻指示路径的查询触发状态单元作为当前行为状态单元的操作。

当前可视化搜寻指示路径被更新为第二指示路径,第二指示路径的查询触发状态单元为第二搜寻辅助单元condition7,第二指示路径的查询终止状态单元为第一搜寻辅助单元condition2,将第二搜寻辅助单元condition7作为当前行为状态单元,判断第二搜寻辅助单元condition7是否汇总在场景型话题调用信息中。

此时,第二搜寻辅助单元condition7是首次被调用,未统计在场景型话题调用信息中,所以将该第二搜寻辅助单元condition7、该第二搜寻辅助单元condition7对应的当前可视化搜寻指示路径(第二指示路径)记录至场景型话题调用信息中。

在事先生成的场景型话题交互日志中获寻到第二搜寻辅助单元condition7的关联行为状态单元,分别为condition6、condition8,并对关联行为状态单元condition6、condition8进行依次访问。经过对关联行为状态单元condition6、condition8的依次访问,确定关联行为状态单元condition6、condition8均未统计在场景型话题调用信息中,会将关联行为状态单元condition6、condition8、与对应的当前可视化搜寻指示路径(第二指示路径)记录至场景型话题调用信息中,并将关联行为状态单元condition6至第二搜寻辅助单元condition7的可视化区域condition6condition7、第二搜寻辅助单元condition7至关联行为状态单元condition8的可视化区域condition7condition8记录至场景型话题调用信息中。

在终止依次访问时未确定出目标可视化区域,则从第二搜寻辅助单元condition7的所有关联行为状态单元condition6、condition8挑选一个行为状态单元作为当前可视化搜寻指示路径(第二指示路径)的查询触发状态单元。挑选行为状态单元的方式与前述内容类似,确定关联行为状态单元condition6对应的行为轨迹量化评价,比如为第二搜寻辅助单元condition7至关联行为状态单元condition6的操作行为轨迹长度、与关联行为状态单元condition6至第一搜寻辅助单元condition2之间的欧几里得度量的和值;确定关联行为状态单元condition6对应的行为轨迹量化评价,比如为第二搜寻辅助单元condition7至关联行为状态单元condition8的操作行为轨迹长度(可视化区域condition7condition8的长度)、与关联行为状态单元condition8至第一搜寻辅助单元condition2之间的欧几里得度量的和值。在关联行为状态单元condition6、condition8是首次被调用时,将关联行为状态单元condition6、condition8对应的操作行为轨迹行为轨迹量化评价记录至操作行为轨迹调用信息中。

从所有关联行为状态单元condition6、condition8中挑选行为轨迹量化评价最低的关联行为状态单元作为当前可视化搜寻指示路径(第二指示路径)上的查询触发状态单元,比如,挑选关联行为状态单元condition6作为当前可视化搜寻指示路径(第二指示路径)的查询触发状态单元。

然后,将当前可视化搜寻指示路径更新为第一指示路径,返回将当前可视化搜寻指示路径的查询触发状态单元作为当前行为状态单元的操作。

当前可视化搜寻指示路径又被更新为第一指示路径,第一指示路径的查询触发状态单元为行为状态单元condition4,第一指示路径的查询终止状态单元为第一搜寻辅助单元condition2,将行为状态单元condition4作为当前行为状态单元,判断行为状态单元condition4是否汇总在场景型话题调用信息中。

由于行为状态单元condition4是第二次被调用,所以行为状态单元condition4已经汇总在场景型话题调用信息中,所以不需要重新记录行为状态单元condition4及相关信息至场景型话题调用信息中。

在事先生成的场景型话题交互日志中获寻到行为状态单元condition4的关联行为状态单元,分别为condition2和condition6,并对关联行为状态单元condition2、condition6进行依次访问。由于关联行为状态单元condition2和condition6已被汇总在场景型话题调用信息中,所以在依次访问到关联行为状态单元condition2或condition6时,需通过场景型话题调用信息中记载的该关联行为状态单元对应的可视化搜寻指示路径寻找出位于当前可视化搜寻指示路径上的可视化区域作为所述目标可视化区域。

在一些可选的且可独立实施的设计思路下,步骤S30123中,所述通过场景型话题调用信息中记载的该关联行为状态单元对应的可视化搜寻指示路径寻找出位于当前可视化搜寻指示路径上的可视化区域作为所述目标可视化区域可以包括:

对比分析场景型话题调用信息中记载的该关联行为状态单元对应的可视化搜寻指示路径与当前可视化搜寻指示路径;

比对分析结果表征该关联行为状态单元对应的可视化搜寻指示路径与当前可视化搜寻指示路径存在差异时,从所述场景型话题调用信息中获取位于当前可视化搜寻指示路径上的可视化区域作为所述目标可视化区域。

在一些可选的且可独立实施的设计思路下,在从所述场景型话题调用信息中获取位于当前可视化搜寻指示路径上的可视化区域作为所述目标可视化区域然后,可以终止本次依次访问。当场景型话题调用信息中记载的该关联行为状态单元对应的可视化搜寻指示路径与当前可视化搜寻指示路径相同时,继续依次访问下一个关联行为状态单元,直至当前行为状态单元的所有关联行为状态单元均已被依次访问。

比如依次访问关联行为状态单元condition2和condition6时,是先关联行为状态单元依次访问condition2,再依次访问关联行为状态单元condition6,那么:在依次访问到关联行为状态单元condition2时,确定关联行为状态单元condition2已被汇总在场景型话题调用信息中,且场景型话题调用信息中记载的关联行为状态单元condition2对应的可视化搜寻指示路径(第一指示路径)与当前可视化搜寻指示路径(第一指示路径)相同,所以,可以继续依次访问关联行为状态单元condition6。

在依次访问到关联行为状态单元condition6时,确定关联行为状态单元condition6已被汇总在场景型话题调用信息中,且场景型话题调用信息中记载的关联行为状态单元condition6对应的可视化搜寻指示路径(第二指示路径)与当前可视化搜寻指示路径(第一指示路径)不同,所以,可以从所述场景型话题调用信息中获取位于当前可视化搜寻指示路径上的可视化区域作为所述目标可视化区域,并且终止依次访问。

可以理解的是,由于场景型话题调用信息中汇总了可视化区域condition1condition2、condition3condition2、condition2condition4、condition4condition6、condition6condition7、condition7condition8,所以可以直接从场景型话题调用信息中获取从第一搜寻辅助单元condition2到第二搜寻辅助单元condition7之间的可视化区域、或者说从第一搜寻辅助单元condition7到第二搜寻辅助单元condition3之间的可视化区域,分别为condition2condition4、condition4condition6、condition6condition7。

进一步地,将这些condition2condition4、condition4condition6、condition6condition7作为目标可视化区域。

步骤S302中,通过寻找出的目标可视化区域确定该待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹。

例如,可以将第一待定行为状态单元pending1所在可视化区域condition1condition2,目标可视化区域condition2condition4、condition4condition6、condition6condition7,以及第二待定行为状态单元pending2所在可视化区域condition7condition8依次拼接(两个可视化区域的相同行为状态单元作为拼接点),得到所需的优化操作行为轨迹。

描述的condition2和condition8都是首次被调用的情况,所以在寻找的过程中,所以condition1condition2、condition3condition2、condition2condition4、condition4condition6、condition6condition7、condition7condition8这些可视化区域是首次添加到场景型话题调用信息中,假设后续condition2或condition8第二次被调用(比如针对同一话题行为图谱单元组对应的另一对待定行为状态单元组进行寻找)时,经过相同的可视化区域比如condition2condition4时,与condition2condition4相关的信息比如操作行为轨迹量化评价等便不需要额外运算处理,而是从操作行为轨迹调用信息中获取即可。

通过上述方式,每一对话题行为图谱单元组可以得到num2个优化操作行为轨迹,num2为该话题行为图谱单元组对应的待定行为状态单元组的数目,需要从中挑选一条优化操作行为轨迹作为该话题行为图谱单元组适配的优化操作行为轨迹,从而可以确定当前可视化行为记录适配的目标操作行为轨迹。

在一些可独立实施的技术方案中,步骤S400中,通过每一话题行为图谱单元组所对应的待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹,在事先生成的所述场景型话题交互日志中确定出与当前可视化行为记录适配的目标操作行为轨迹,可以包括:针对每一话题行为图谱单元组,执行以下步骤:针对该话题行为图谱单元组所对应的每一待定行为状态单元组,将该待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹导入至在先完成训练的AI神经网络,得到该待定行为状态单元组所对应的至少一个设定关键内容可能性的重要程度变量;通过各待定行为状态单元组所对应的至少一个设定关键内容可能性的重要程度变量,从各待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹中挑选一个待定操作行为轨迹;将所有待定操作行为轨迹按照预设行为轨迹拼接策略进行全局化融合以得到所述目标操作行为轨迹。

在一些实施例中,一对待定行为状态单元组对应于一组重要程度变量,一组重要程度变量可以包括:第一关键内容可能性的第一重要程度变量,所述第一关键内容可能性用于表示话题行为图谱单元组中两个话题行为图谱单元之间的欧几里得度量与该话题行为图谱单元组所对应的待定行为状态单元组的两个待定行为状态单元之间的操作行为轨迹长度之间的差异情况;第二关键内容可能性的第二重要程度变量,所述第二关键内容可能性用于表示话题行为图谱单元组中一个话题行为图谱单元的行为传递描述与待定行为状态单元组中对应待定行为状态单元所在待定可视化区域被设置的描述之间的差异情况;第三关键内容可能性的第三重要程度变量,所述第三关键内容可能性用于表示当前可视化行为记载的平均行为传递耗时与话题互动时效需求之间的差异情况。

可以理解,根据AI神经网络输出的一组重要程度变量计算对应的待定行为状态单元组中两个待定行为状态单元所在待定可视化区域之间的变化可能性,得到各待定行为状态单元组对应的变化可能性;并根据各待定行为状态单元组所对应的变化可能性和预设定位可能性,从各待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹中挑选一个待定操作行为轨迹。

其中,根据AI神经网络输出的一组重要程度变量计算对应的待定行为状态单元组中两个待定行为状态单元所在待定可视化区域之间的变化可能性,可以包括以下步骤:计算以第一关键内容可能性为底数、AI神经网络输出的一组重要程度变量中第一关键内容可能性的第一重要程度变量为幂数的第一量化值;计算以第二关键内容可能性为底数、AI神经网络输出的一组重要程度变量中第二关键内容可能性的第二重要程度变量为幂数的第二量化值;计算以第三关键内容可能性为底数、AI神经网络输出的一组重要程度变量中第三关键内容可能性的第三重要程度变量为幂数的第三量化值;将所述第一量化值、第二量化值和第三量化值进行加权,得到待定行为状态单元对应的变化可能性。

AI神经网络是预先训练好并保存在服务器中的,在需要时从设备中调用即可。本实施例中,通过AI神经网络得到待定行为状态单元组对应的不同关键内容可能性的重要程度变量,从而计算更合理的变化可能性,应用在质量较差的场景型话题交互日志中时有较好的效果,在应用到话题社群级别的场景时也能保持较优的适配性能。

在一些选择性的且可独立实施的设计思路下,在步骤S400所描述的基础上,该方法还可以包括以下步骤S500所描述的技术方案。

步骤S500:对所述目标操作行为轨迹进行操作行为安全分析,得到安全分析结果,在所述安全分析结果表征所述目标操作行为轨迹存在行为安全风险时,拦截所述目标操作行为轨迹对应的话题用户端的互动操作行为。

在一些选择性的且可独立实施的设计思路下,在步骤S500中,对所述目标操作行为轨迹进行操作行为安全分析,得到安全分析结果,可以包括以下步骤S501-步骤S504所描述的技术方案。

步骤S501:从所述目标操作行为轨迹中获取待进行安全分析的目标轨迹特征描述簇。

步骤S502:对所述目标轨迹特征描述簇中的多个轨迹特征向量分别进行显性意图挖掘和非显性意图挖掘,得到显性意图挖掘结果集和非显性意图挖掘结果集。

步骤S503:通过第一预设修正策略,对所述显性意图挖掘结果集进行第一结果修正处理,得到包括有显性意图的第一轨迹特征描述队列;通过第二预设修正策略,对所述非显性意图挖掘结果集进行第二结果修正处理,得到包括有非显性意图的第二轨迹特征描述队列。

步骤S504:基于所述第一轨迹特征描述队列和所述第二轨迹特征描述队列进行干扰特征过滤,得到所述目标轨迹特征描述簇中与目标意图相匹配的目标轨迹特征描述队列;所述目标意图包括显性意图和非显性意图中的至少一种,所述目标轨迹特征描述队列用于对所述目标轨迹特征描述簇进行安全分析;通过所述目标轨迹特征描述队列对所述目标轨迹特征描述簇进行安全分析,得到所述目标轨迹特征描述簇对应的安全评分。

如此设计,可以将显性意图和非显性意图进行综合考虑,从而保证安全评分的精确性和可信度。进一步地,可以通过安全评分与预设评分的大小关系判断安全分析结果是否表征目标操作行为轨迹存在行为安全风险。若安全评分低于预设评分,则表征所述目标操作行为轨迹存在行为安全风险时。相应的,拦截目标操作行为轨迹对应的话题用户端的互动操作行为。

在一些选择性的且可独立实施的设计思路下,所述对所述目标轨迹特征描述簇中的多个轨迹特征向量分别进行显性意图挖掘和非显性意图挖掘,得到显性意图挖掘结果集和非显性意图挖掘结果集,包括:对所述目标轨迹特征描述簇中的多个轨迹特征向量分别进行显性意图挖掘,得到各个轨迹特征向量中的显性意图挖掘内容、以及各显性意图挖掘内容所对应的初始意图标签;基于各轨迹特征向量中的显性意图挖掘内容和相应的初始意图标签,确定显性意图挖掘结果集;对所述目标轨迹特征描述簇中的多个轨迹特征向量分别进行非显性意图挖掘,得到非显性意图挖掘结果集。

在一些选择性的且可独立实施的设计思路下,所述对所述目标轨迹特征描述簇中的多个轨迹特征向量分别进行非显性意图挖掘,得到非显性意图挖掘结果集,包括:对所述目标轨迹特征向量中的多个轨迹特征向量分别进行主动意图挖掘,得到各轨迹特征向量分别对应的主动意图挖掘信息;对所述目标轨迹特征向量中的多个轨迹特征向量分别进行被动意图挖掘,得到各轨迹特征向量分别对应的被动意图挖掘信息;将对应于相同话题用户端的主动意图挖掘信息和被动意图挖掘信息进行关联;基于所述目标轨迹特征向量中与目标主动意图挖掘信息相关联的被动意图挖掘信息进行非显性意图挖掘处理,得到非显性意图挖掘结果集。

在一些选择性的且可独立实施的设计思路下,所述通过第一预设修正策略,对所述显性意图挖掘结果集进行第一结果修正处理,得到包括有显性意图的第一轨迹特征描述队列,包括:对所述显性意图挖掘结果集中的每个轨迹特征向量分别进行意图标签筛分,得到每个轨迹特征向量各自对应的不重复的意图标签;基于每个轨迹特征向量中与相应不重复的意图标签对应的显性意图挖掘内容的内容量,分别进行挖掘内容清洗处理,得到更新后的显性意图挖掘结果集;对所述更新后的显性意图挖掘结果集进行阶段性清洗,得到多个包括有显性意图的第一备选轨迹特征描述队列;根据各所述第一备选轨迹特征描述队列分别所属的显性类别,对属于相同显性类别的第一备选轨迹特征描述队列进行特征描述优化,得到包括有显性意图的第一轨迹特征描述队列。

综上所述,本申请实施例中,在确定当前可视化行为记录中的每一话题行为图谱单元组对应的待定行为状态单元组中待定行为状态单元之间的优化操作行为轨迹时,可以通过预先完成统计的场景型话题调用信息来确定,由于场景型话题调用信息汇总了已被调用的不同行为状态单元之间的操作行为轨迹信息,在同一可视化区域被反复调用时,可以无需额外对该可视化区域进行分析处理,能够在一定程度上避免大量的重复性分析处理,进一步地,通过各优化操作行为轨迹确定出与当前可视化行为记录适配的目标操作行为轨迹,能够尽可能减少确定操作行为轨迹所需要耗费的时间,并确保得到的目标操作行为轨迹的准确性和完整性,从而快速、准确地为后续的互动行为安防分析提供分析依据,避免在确定当前可视化行为记录的目标操作行为轨迹过程中耗费过多时间而影响互动行为安防分析的时效性。

基于上述同样的发明构思,还提供了一种应用于大数据的话题互动行为安防处理装置20,应用于话题服务器10,所述装置包括:

状态单元确定模块21,用于在事先生成的场景型话题交互日志中为当前可视化行为记录中的话题行为图谱单元确定对应的待定行为状态单元;

单元分组配对模块22,用于针对当前可视化行为记录中的每一话题行为图谱单元组,话题行为图谱单元组由两个关联话题行为图谱单元构成,通过该话题行为图谱单元组中话题行为图谱单元对应的待定行为状态单元确定该话题行为图谱单元组所对应的待定行为状态单元组;

操作轨迹确定模块23,用于通过预先完成统计的场景型话题调用信息确定待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹;所述场景型话题调用信息汇总了已被调用的不同行为状态单元之间的操作行为轨迹信息;

操作轨迹生成模块24,用于通过每一话题行为图谱单元组所对应的待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹,在事先生成的所述场景型话题交互日志中确定出与当前可视化行为记录适配的目标操作行为轨迹。

关于上述功能模块的描述请参阅对图2所示的方法的描述。

以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

完整详细技术资料下载
上一篇:石墨接头机器人自动装卡簧、装栓机
下一篇:基于培养方案的课程知识图谱自动生成方法及系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!