针对大数据的云业务话题信息处理方法及大数据服务器

文档序号:7703 发布日期:2021-09-17 浏览:23次 英文

针对大数据的云业务话题信息处理方法及大数据服务器

技术领域

本申请实施例涉及大数据和云业务

技术领域

,具体涉及针对大数据的云业务话题信息处理方法及大数据服务器。

背景技术

大数据和云计算密不可分。在云业务领域,不同业务客户端通过在线交流、沟通或会话进行业务交互和业务处理。为了提高云业务的服务质量和效率,通常需要对不同业务客户端的业务需求进行挖掘。然而在实际中,不同业务客户端可能会参与多个话题讨论或者会话交流,而如何高效地实现不同话题下的会话需求分析是现目前需要攻克的一个技术问题。

发明内容

有鉴于此,本申请实施例提供了针对大数据的云业务话题信息处理方法及大数据服务器。

本申请实施例提供了一种针对大数据的云业务话题信息处理方法,应用于大数据服务器,包括:

获取第一社群业务会话信息和第二社群业务会话信息,其中,所述第一社群业务会话信息为第一业务会话主题描述,所述第二社群业务会话信息为第二业务会话主题描述;

以及获取不同话题场景下所述第一业务会话主题描述之间的第一特征调整指示、不同话题场景下所述第二业务会话主题描述之间的第二特征调整指示、以及设定话题场景下所述第一业务会话主题描述和第二业务会话主题描述之间的第三特征调整指示;

通过所述第一特征调整指示、第二特征调整指示和第三特征调整指示,对所述第一社群业务会话信息和第二社群业务会话信息进行会话需求绑定。

本申请实施例还提供了一种大数据服务器,包括处理器、通信总线和存储器;所述处理器和所述存储器通过所述通信总线通信,所述处理器从所述存储器中读取计算机程序并运行,以执行上述的方法。

本申请实施例还提供了一种计算机用可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在运行时实现上述的方法。

由此可见,本申请实施例提供了一种针对大数据的云业务话题信息处理方法及大数据服务器,上述方案,在实现不同会话主题的第一社群业务会话信息和第二社群业务会话信息之间的会话需求绑定的过程中,通过获取不同话题场景下同一业务会话主题描述之间的特征调整指示以及设定话题场景下不同业务会话主题描述之间的特征调整指示,使得可以将第一社群业务会话信息与同一会话主题下的设定话题场景进行会话需求绑定,再与设定话题场景的另一会话主题的社群业务会话信息进行会话需求绑定,然后通过第二特征调整指示与第二社群业务会话信息进行会话需求绑定,通过上述路径化的会话需求绑定方式,可实现不同会话主题的第一社群业务会话信息和第二社群业务会话信息之间的会话需求绑定,而且,不论进行哪种话题场景下不同会话主题的社群业务会话信息之间的会话需求绑定,都可以仅需进行在设定话题场景下不同会话主题的社群业务会话信息之间的一次会话需求绑定,从而提高会话需求绑定结果的准确性和效率。

附图说明

图1为本申请实施例所提供的一种大数据服务器的方框示意图。

图2为本申请实施例所提供的一种针对大数据的云业务话题信息处理方法的流程图。

图3为本申请实施例所提供的一种针对大数据的云业务话题信息处理装置的框图。

具体实施方式

图1示出了本申请实施例所提供的一种大数据服务器10的方框示意图。本申请实施例中的大数据服务器10可以为具有数据存储、传输、处理功能的服务端,如图1所示,大数据服务器10包括:存储器11、处理器12、通信总线13和针对大数据的云业务话题信息处理装置20。

存储器11、处理器12和通信总线13之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件互相之间可以通过一条或多条通讯总线或信号线实现电性连接。存储器11中存储有针对大数据的云业务话题信息处理装置20,所述针对大数据的云业务话题信息处理装置20包括至少一个可以软件或固件(firmware)的形式储存于所述存储器11中的软件功能模块,所述处理器12通过运行存储在存储器11内的软件程序以及模块,例如本申请实施例中的针对大数据的云业务话题信息处理装置20,从而执行各种功能应用以及数据处理,即实现本申请实施例中的针对大数据的云业务话题信息处理方法。

其中,所述存储器11可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器11用于存储程序,所述处理器12在接收到执行指令后,执行所述程序。

所述处理器12可能是一种集成电路芯片,具有数据的处理能力。上述的处理器12可以是通用处理器,包括中央处理器 (Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等。可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

通信总线13用于通过网络建立大数据服务器10与其他通信终端设备之间的通信连接,实现网络信号及数据的收发操作。上述网络信号可包括无线信号或者有线信号。

可以理解,图1所示的结构仅为示意,大数据服务器10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。

本申请实施例还提供了一种计算机用可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在运行时实现上述的方法。

图2示出了本申请实施例所提供的一种针对大数据的云业务话题信息处理的流程图。所述方法有关的流程所定义的方法步骤应用于大数据服务器10,可以由所述处理器12实现,所述方法包括以下Step210-Step230所描述的内容。

Step210,大数据服务器获取第一社群业务会话信息和第二社群业务会话信息。

在本申请实施例中,所述第一社群业务会话信息为第一业务会话主题描述,所述第二社群业务会话信息为第二业务会话主题描述。换言之,第一社群业务会话信息对应于第一会话主题,第二社群业务会话信息对应于第二会话主题,第一会话主题和第二会话主题之间存在差异。进一步地,社群业务会话信息可以理解为不同社群用户之间的交流互动信息,包括但不限于文本信息、语音信息或者图形化信息。

在上述内容的基础上,业务会话主题描述可以用于表征不同社群业务会话信息在相应的会话主题下的关键信息或者特征描述,比如可以通过特征向量或者特征图的形式进行表达。

Step220,大数据服务器获取不同话题场景下所述第一业务会话主题描述之间的第一特征调整指示、不同话题场景下所述第二业务会话主题描述之间的第二特征调整指示、以及设定话题场景下所述第一业务会话主题描述和第二业务会话主题描述之间的第三特征调整指示。

在本申请实施例中,话题场景可以是业务会话板块,比如办公板块、教育板块、购物板块或者其他板块。进一步地,特征调整指示用于对不同的业务会话主题描述进行调整、变换或者映射,从而实现相关会话需求的挖掘和分析,比如实现不同话题场景下的会话需求的绑定,从而尽可能挖掘社群用户或者业务用户的跨话题场景需求,确保会话需求挖掘的深度的丰富程度。

比如,在一些可能的实施例中,所述第一特征调整指示和第二特征调整指示皆为基于所述不同话题场景下的社群业务会话信息之间的会话热度数据和至少一个会话状态的量化特征得到的。

又比如,在上述实施例的基础上,所述第一社群业务会话信息的已激活话题场景为第一话题场景,所述第二社群业务会话信息的已激活话题场景为第二话题场景;所述第一特征调整指示为通过所述第一话题场景和第一设定话题场景得到的所述第一业务会话主题描述的特征调整指示,所述第二特征调整指示为通过所述第二话题场景和第二设定话题场景得到的所述第二业务会话主题描述的特征调整指示,所述第三特征调整指示为所述第一设定话题场景下所述第一业务会话主题描述与第二设定话题场景下所述第二业务会话主题描述之间的特征调整指示。

在本申请实施例中,会话状态可以包括激活状态、暂停状态或者终止状态等一系列的状态,基于此,会话状态的量化特征可以理解为偏移量或者偏差量。会话热度数据用于表征会话的热门程度。

在上述实施例的基础上,Step220中所描述的获取不同话题场景下所述第一业务会话主题描述之间的第一特征调整指示,或获取不同话题场景下所述第二业务会话主题描述之间的第二特征调整指示,可以包括以下Step221-Step224所描述的内容。

Step221,以第一话题场景为目标话题场景、第一设定话题场景为目标设定话题场景、第一业务会话主题描述为目标业务会话主题描述、第一特征调整指示为目标特征调整指示,或者,以第二话题场景为目标话题场景、第二设定话题场景为目标设定话题场景、第二业务会话主题描述为目标业务会话主题描述、第二特征调整指示为目标特征调整指示。

Step222,从样本话题场景集合中挑选得到至少一个第一样本话题场景,其中,所述第一样本话题场景与所述目标话题场景的量化标签之差异度小于设定差异阈值。

例如,样本话题场景集合可以理解为参考话题场景集合。进一步地,量化标签之差异度可以理解为不同话题场景的关键词标签之间的差异,也可以理解为不同话题场景之间的区分度和区分情况。

Step223,对于每个所述第一样本话题场景,获取所述第一样本话题场景与目标设定话题场景之间所述目标业务会话主题描述的第一特征调整信息。

在本申请实施例中,所述第一样本话题场景与目标设定话题场景之间所述目标业务会话主题描述的第一特征调整信息用于表征在所述第一样本话题场景下以及在目标设定话题场景下,目标业务会话主题描述的变换情况或者调整情况。

在一些可独立实施的技术方案中,Step223所描述的获取所述第一样本话题场景与目标设定话题场景之间所述目标业务会话主题描述的第一特征调整信息,可以包括Step2231-Step2233所描述的技术方案。

Step2231,将第一样本话题场景、目标设定话题场景、以及所述样本话题场景集合中位于所述第一样本话题场景与所述目标设定话题场景之间的样本话题场景,作为第二样本话题场景。

例如,样本话题场景可以理解为在时序层面上位位于所述第一样本话题场景与所述目标设定话题场景之间的话题场景。

Step2231,通过每连续所述第二样本话题场景下的所述目标业务会话主题描述之间的第一样本特征调整指示,得到第二样本特征调整指示;其中,所述第二样本特征调整指示为所述第一样本话题场景与目标设定话题场景之间所述目标业务会话主题描述的特征调整指示。

举例而言,每连续所述第二样本话题场景下的所述目标业务会话主题描述之间的第一样本特征调整指示可以理解为每相邻所述第二样本话题场景下的所述目标业务会话主题描述之间的第一样本特征调整指示。

在一些可独立实施的技术方案中,Step2231所描述的通过每连续所述第二样本话题场景下的所述目标业务会话主题描述之间的第一样本特征调整指示,得到第二样本特征调整指示,可以包括Step22311和Step22312。

Step22311,若所述目标业务会话主题描述为第一业务会话主题描述,则将所述第二样本话题场景按照场景规模升序顺序进行整理,若所述目标业务会话主题描述为第二业务会话主题描述,则将所述第二样本话题场景按照场景规模降序顺序进行整理。

在本申请实施例中,场景规模可以通过话题场景中的话题参与对象确定,比如话题参与对象越多则场景规模越大,话题参与对象越少则场景规模越小。

Step22312,将排序下每连续所述第二样本话题场景对应的所述第一样本特征调整指示进行融合,得到所述第二样本特征调整指示。

在本申请实施例中,所述连续第二样本话题场景对应的所述第一样本特征调整指示为由所述连续第二样本话题场景中的在先的一个第二样本话题场景到在后的一个第二样本话题场景下目标业务会话主题描述的特征调整指示。

如此,通过Step22311和Step22312,能够完整地确定出第二样本特征调整指示,避免第二样本特征调整指示出现部分缺失。

Step2231,基于所述第二样本特征调整指示,得到所述第一特征调整信息。

可以理解,通过确定第二样本特征调整指示,能够确保话题场景与业务会话主题描述之间的高相关性,进而确保通过第二样本特征调整指示确定出的第一特征调整信息的可用性。

Step224,基于所述第一特征调整信息,得到所述目标特征调整指示。

在一些可能的实施例中,所述至少一个第一样本话题场景为所述样本话题场景集合中与所述目标话题场景的场景相似度最高且不为所述目标话题场景的两个样本话题场景;和/或,所述样本话题场景集合中每连续两个样本话题场景之间的话题场景差异度小于或等于设定话题场景差异阈值;和/或,在所述目标特征调整指示为第一特征调整指示的前提下,所述第一特征调整信息为由所述第一样本话题场景和第一设定话题场景所确定的所述第一业务会话主题描述的特征调整信息,在所述目标特征调整指示为第二特征调整指示的前提下,所述第一特征调整信息为由所述第二设定话题场景以及第一样本话题场景所确定的所述第二业务会话主题描述的特征调整信息。在本申请实施例中,与上述的量化标签之差异度不同,话题场景差异度可以通过场景特征或者场景描述确定。

在一些可能的实施例中,Step224所描述的基于所述第一特征调整信息,得到所述目标特征调整指示,可以包括以下内容:基于所述第一特征调整信息,得到所述目标话题场景与目标设定话题场景之间目标业务会话主题描述的第二特征调整信息,其中,所述第一特征调整信息和第二特征调整信息皆涵盖会话热度数据和量化特征;通过所述第二特征调整信息,得到所述目标特征调整指示。

如此设计,通过传递式的特征调整指示确定方式,能够确保目标特征调整指示的准确性。

在一些可能的实施例中,所述第一样本话题场景可以为两个。基于此,上述步骤所描述的基于所述第一特征调整信息,得到所述目标话题场景与目标设定话题场景之间目标业务会话主题描述的第二特征调整信息,可以包括以下Step2241-Step2243所描述的技术方案。

Step2241,获取所述目标话题场景与冷门样本话题场景之间的第一话题场景差异度以及所述两个第一样本话题场景之间的第二话题场景差异度。

其中,所述冷门样本话题场景为所述两个第一样本话题场景中的不存在热度标签的话题场景。

Step2242,通过所述第一特征调整信息中的会话热度数据、所述第一话题场景差异度以及所述第二话题场景差异度,得到第二特征调整信息中的会话热度数据。

Step2243,通过所述第一特征调整信息中的量化特征、所述第一话题场景差异度以及所述第二话题场景差异度,得到第二特征调整信息中的量化特征。

如此设计,在确定第二特征调整信息中的会话热度数据以及量化特征时,能够交叉地基于第一特征调整信息中的会话热度数据、所述第一话题场景差异度以及所述第二话题场景差异度以及第一特征调整信息中的量化特征、所述第一话题场景差异度以及所述第二话题场景差异度确定,从而确保第二特征调整信息的会话热度数据和第二特征调整信息的量化特征之间的强相关性,进而确保第二特征调整信息的质量。

在一些可能的实施例中,所述两个第一样本话题场景的第一特征调整信息包括热门的第一样本话题场景的第一会话热度数据和第一量化特征,以及冷门的第一样本话题场景的第二会话热度数据和第二量化特征。

在上述内容的基础上,Step2242所描述的通过所述第一特征调整信息中的会话热度数据、所述第一话题场景差异度以及所述第二话题场景差异度,得到第二特征调整信息中的会话热度数据,可以包括:根据所述第一话题场景差异度与热度差异值的加权结果与所述第二话题场景差异度之间的运算结果,以及所述第二会话热度数据,得到所述第二特征调整信息中的会话热度数据,其中,所述热度差异值为所述第一会话热度数据和第二会话热度数据之差。

其中,所述第一话题场景差异度与热度差异值的加权结果与所述第二话题场景差异度之间的运算结果可以是所述第一话题场景差异度与热度差异值的加权结果与所述第二话题场景差异度之间的商值,进一步地,通过将该商值与第二会话热度数据进行相加,能够得到所述第二特征调整信息中的会话热度数据。

进一步地,Step2243所描述的通过所述第一特征调整信息中的量化特征、所述第一话题场景差异度以及所述第二话题场景差异度,得到第二特征调整信息中的量化特征,可以包括以下内容:根据所述第一话题场景差异度与特征差异度的加权结果与所述第二话题场景差异度之间的运算结果以及所述第二量化特征,得到第二特征调整信息中的量化特征,其中,所述特征差异度为所述第一量化特征和第二量化特征之差。

比如,可以确定所述第一话题场景差异度与特征差异度的乘积作为所述第一话题场景差异度与特征差异度的加权结果,然后确定所述第一话题场景差异度与特征差异度的加权结果与第二话题场景差异度之间的商值作为所述第一话题场景差异度与特征差异度的加权结果与第二话题场景差异度之间运算结果,进而将所述第一话题场景差异度与特征差异度的加权结果与所述第二话题场景差异度之间的运算结果和第二量化特征相加,从而得到第二量化特征。

可以理解的是,通过上述内容,能够通过线性计算方式准确得到第二特征调整信息中的会话热度数据和量化特征。

在本申请实施例中,通过上述内容,能够考虑不同话题场景下的业务会话主题描述的适配情况,从而确保目标特征调整指示的准确性和场景适配性。

在另外的一些实施例中,Step220所描述的获取设定话题场景下所述第一业务会话主题描述和第二业务会话主题描述之间的第三特征调整指示,可以包括:获取所述第一设定话题场景下的第三社群业务会话信息和所述第二设定话题场景下的第四社群业务会话信息;确定所述第三社群业务会话信息和第四社群业务会话信息中的多个主题描述配对结果;通过所述多个主题描述配对结果,得到所述第三特征调整指示。

在本申请实施例中,所述第三社群业务会话信息为第一业务会话主题描述,所述第四社群业务会话信息为第二业务会话主题描述,进一步地,所述主题描述配对结果是通过设定配对策略配(设定匹配算法)对得到的,或者是基于业务会话客户端分别在所述第三社群业务会话信息和第四社群业务会话信息中选定的描述片段确定的。进一步地,业务会话客户端可以理解为社群用户。描述片段可以理解为部分社群业务会话信息。

Step230,大数据服务器通过所述第一特征调整指示、第二特征调整指示和第三特征调整指示,对所述第一社群业务会话信息和第二社群业务会话信息进行会话需求绑定。

在本申请实施例中,通过进行会话需求绑定,能够实现不同社群业务会话信息的业务需求匹配和关联,从而实现尽可能大范围的业务需求或者会话需求挖掘和分析。基于此,Step230所描述的通过所述第一特征调整指示、第二特征调整指示和第三特征调整指示,对所述第一社群业务会话信息和第二社群业务会话信息进行会话需求绑定,可以包括以下内容:将所述第一特征调整指示、第二特征调整指示以及第三特征调整指示融合,作为所述第一社群业务会话信息与第二社群业务会话信息之间的会话需求绑定指示。

示例性的,比如可以将所述第一特征调整指示、所述第二特征调整指示以及所述第三特征调整指示进行全局层面的融合整体,从而得到所述第一社群业务会话信息与第二社群业务会话信息之间的会话需求绑定指示,这样可以通过会话需求绑定指示对所述第一社群业务会话信息与第二社群业务会话信息的局部会话需求或者片段化会话需求进行绑定或者配对,从而得到针对于同一业务会话客户端在不同话题场景或者不同会话主题下的会话需求或者业务需求。这样能够实现不同话题场景下的会话需求的绑定,从而尽可能挖掘社群用户或者业务用户的跨话题场景需求,确保会话需求挖掘的深度的丰富程度。

在一些选择性且可独立实施的技术方案中,在确定出所述第一社群业务会话信息与第二社群业务会话信息之间的会话需求绑定指示之后,该方法还可以包括:基于所述会话需求绑定指示对所述第一社群业务会话信息与第二社群业务会话信息进行会话需求绑定,得到全局化需求绑定结果。

在一些选择性且可独立实施的技术方案中,在得到全局化需求绑定结果之后,所述方法还包括:根据所述全局化需求绑定结果进行话题互动安全检测,在检测到所述全局化需求绑定结果对应的业务会话客户端触发话题互动安检机制(比如预先设置的安检触发条件或者安检触发规则)时,确定与业务会话客户端对应的会话操作行为轨迹信息,并通过所述会话操作行为轨迹信息进行话题互动安全分析。

在一些选择性且可独立实施的技术方案中,确定与业务会话客户端对应的会话操作行为轨迹信息,可以包括以下内容:在事先生成的场景型话题交互日志中为当前可视化行为记录中的话题行为图谱单元确定对应的待定行为状态单元;针对当前可视化行为记录中的每一话题行为图谱单元组,话题行为图谱单元组由两个关联话题行为图谱单元构成,通过该话题行为图谱单元组中话题行为图谱单元对应的待定行为状态单元确定该话题行为图谱单元组所对应的待定行为状态单元组;通过预先完成统计的场景型话题调用信息确定待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹;所述场景型话题调用信息汇总了已被调用的不同行为状态单元之间的操作行为轨迹信息;通过每一话题行为图谱单元组所对应的待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹,在事先生成的所述场景型话题交互日志中确定出与当前可视化行为记录适配的目标操作行为轨迹。

在一些选择性且可独立实施的技术方案中,确定与业务会话客户端对应的会话操作行为轨迹信息,进一步可以通过以下实施方式实现。

步骤S100中,在事先生成的场景型话题交互日志中为当前可视化行为记录中的话题行为图谱单元确定对应的待定行为状态单元。

举例而言,场景型话题交互日志是根据大数据话题环境中各话题互动情况的可视化特征创建的,可以涵盖一定可视化区间内的多个可视化区域,不同可视化区域与不同的话题互动情况对应。场景型话题交互日志的可视化区间不限,比如,场景型话题交互日志可以为一个话题社群的场景型话题交互日志、或者话题平台的场景型话题交互日志。

当前可视化行为记录是需要与场景型话题交互日志进行匹配,以确定出对应的操作行为轨迹的可视化行为记录。当前可视化行为记录可以来自用于捕捉用户操作的行为检测线程传输的,比如可以是业务会话客户端上的行为检测线程传输的业务会话客户端的动态可视化行为记录,可视化行为记录来源不限于行为检测线程,行为检测目标也不限于业务会话客户端。

为当前可视化行为记录中的话题行为图谱单元确定对应的待定行为状态单元时,可以在场景型话题交互日志中将话题行为图谱单元向邻居可视化区域进行映射,根据行为状态映射单元来确定该话题行为图谱单元的待定行为状态单元。邻居可视化区域比如可以为与根据话题行为图谱单元确定出的寻找区间存在重叠的可视化区域、或者该寻找区间内的可视化区域等,具体不限于此。

当前可视化行为记录中每一话题行为图谱单元对应的待定行为状态单元的数目可以为一个或多个,具体数目根据寻找区间大小、及可视化区域的疏密程度情况而定。

步骤S200中,针对当前可视化行为记录中的每一话题行为图谱单元组,话题行为图谱单元组由两个关联话题行为图谱单元构成,通过该话题行为图谱单元组中话题行为图谱单元对应的待定行为状态单元确定该话题行为图谱单元组所对应的待定行为状态单元组。

话题行为图谱单元组的数目根据当前可视化行为记录中的话题行为图谱单元数目而定,比如,当前可视化行为记录中话题行为图谱单元数目为num1,话题行为图谱单元组的数目可以为num1-1。当前可视化行为记录中每两个关联话题行为图谱单元构成一对话题行为图谱单元组,举例来说,当前可视化行为记录按照话题行为图谱单元的生成时间先后顺序依次涵盖topic_graph_unit1-topic_graph_unit4这四个话题行为图谱单元,那么构成的话题行为图谱单元组可以为:

(topic_graph_unit1,topic_graph_unit2);

(topic_graph_unit2,topic_graph_unit3);

(topic_graph_unit3、topic_graph_unit4)。

由于每个话题行为图谱单元可以有多个待定行为状态单元,所以针对一对话题行为图谱单元组可以确定出多对待定行为状态单元组。当然,并不排除一对话题行为图谱单元组中每一话题行为图谱单元对应的待定行为状态单元均为一个的情况,在此情况下,则针对该话题行为图谱单元组可以确定出一对待定行为状态单元组。

在本申请实施例中,话题行为图谱单元可以理解为话题互动行为的图谱化节点,关于话题行为图谱单元的节点化处理技术可以参考知识图谱(Knowledge Graph)。进一步地,话题行为图谱单元对应的行为状态单元用于表征话题行为图谱单元的互动行为状态,从某种意义上可以理解为对互动行为状态的映射化和节点化处理。

在一些可选的且可独立实施的设计思路下,步骤S200中,所述通过该话题行为图谱单元组中话题行为图谱单元对应的待定行为状态单元确定该话题行为图谱单元组所对应的待定行为状态单元组,可以包括以下步骤:

S201:针对话题行为图谱单元组中的每一话题行为图谱单元,获取该话题行为图谱单元对应的所有待定行为状态单元;

S202:将话题行为图谱单元组中其中一个话题行为图谱单元对应的每一待定行为状态单元与另一话题行为图谱单元对应的每一待定行为状态单元配对,得到待定行为状态单元组。

如此,得到的待定行为状态单元组包括两个待定行为状态单元,其中一个待定行为状态单元与话题行为图谱单元组中其中一个话题行为图谱单元对应,另一待定行为状态单元与该话题行为图谱单元组中另一个话题行为图谱单元对应。

在实际应用时,可以以一对话题行为图谱单元组中每个话题行为图谱单元对应多个待定行为状态单元为例,比如话题行为图谱单元组为(topic_graph_unit1,topic_graph_unit2)。

其中,话题行为图谱单元topic_graph_unit1对应两个待定行为状态单元behaviour_state_unit1、behaviour_state_unit2,话题行为图谱单元topic_graph_unit2对应两个待定行为状态单元behaviour_state_unit3、behaviour_state_unit4,则针对该话题行为图谱单元组确定出的待定行为状态单元组为四对,包括:

(behaviour_state_unit1,behaviour_state_unit3);

(behaviour_state_unit1,behaviour_state_unit4);

(behaviour_state_unit2,behaviour_state_unit3);

(behaviour_state_unit2,behaviour_state_unit4)。

步骤S300中,通过预先完成统计的场景型话题调用信息确定待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹;所述场景型话题调用信息汇总了已被调用的不同行为状态单元之间的操作行为轨迹信息。

例如,场景型话题调用信息可以是场景型话题访问信息。在一般情况下,即在确定第一对可视化行为记录对所对应的第一对待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹之前,场景型话题调用信息可以理解为空集。在确定优化操作行为轨迹时,可以将调用过的行为状态单元及对应的可视化区域,也就是已被调用的不同行为状态单元之间的操作行为轨迹信息,汇总在场景型话题调用信息中。如此,在遇到重复的、相同的的行为状态单元及对应的可视化区域时,由于场景型话题调用信息中已经汇总了相应的操作行为轨迹信息,所以可以无需额外对该重复的、相同的可视化区域进行分析处理,进而减少确定优化操作行为轨迹所需要耗费的时间和计算机资源。

换言之,通过预先完成统计的场景型话题调用信息确定待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹时,可以先确定场景型话题调用信息中是否已记录相应的操作行为轨迹信息,如果是,可以无需额外分析处理相应的操作行为轨迹信息,如果否,再分析处理操作行为轨迹信息并将分析处理得到的操作行为轨迹信息添加到场景型话题调用信息中。

如此,可以确定出所有待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹,在话题行为图谱单元组对应于多对待定行为状态单元组的前提下,一对话题行为图谱单元组会对应多个优化操作行为轨迹。

步骤S400中,通过每一话题行为图谱单元组所对应的待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹,在事先生成的所述场景型话题交互日志中确定出与当前可视化行为记录适配的目标操作行为轨迹。

在本申请实施例中,目标操作行为轨迹可以用于后续进行互动行为安全防护分析,比如可以通过目标操作行为轨迹快速准确判断互动行为是否异常或者是否存在风险。

每一话题行为图谱单元组所对应的待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹,可以视作该话题行为图谱单元组中一个话题行为图谱单元到另一个话题行为图谱单元的优化操作行为轨迹。在当前可视化行为记录中每两个关联话题行为图谱单元中一个话题行为图谱单元到另一个话题行为图谱单元的优化操作行为轨迹均已被确定的基础上,可以确定当前可视化行为记录适配的目标操作行为轨迹,该目标操作行为轨迹可以视作当前可视化行为记录中起始话题行为图谱单元到终止话题行为图谱单元的优化操作行为轨迹。

在一些示例中,优化操作行为轨迹可以理解为在满足一定特征识别度的前提下,简洁化程度最高的操作行为轨迹。如此,可以提高后续对操作行为轨迹处理的效率。

在另一些示例中,一些话题行为图谱单元组所对应的待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹可能有多个,在此情况下,需要从多个优化操作行为轨迹挑选一条最优的优化操作行为轨迹作为与该话题行为图谱单元组适配的优化操作行为轨迹。

比如,可以计算各待定行为状态单元组对应的定位可能性及变化可能性,并根据各待定行为状态单元组对应的定位可能性及变化可能性从多个优化操作行为轨迹挑选一条优化操作行为轨迹作为与该话题行为图谱单元组适配的优化操作行为轨迹;其中,待定行为状态单元组对应的定位可能性包括:待定行为状态单元组中每一待定行为状态单元的定位可能性,待定行为状态单元的定位可能性即对应的话题行为图谱单元位于待定行为状态单元所在的待定可视化区域的概率;待定行为状态单元组对应的变化可能性包括:行为检测目标从待定行为状态单元组中一个待定行为状态单元所在的待定可视化区域转移到另一个待定行为状态单元所在的待定可视化区域的概率。

上述的选择方式仅是举例,进一步地选择方式不限于此,还可以有其他方式,比如可以对不同的待定行为状态单元组对应的变化可能性配置不同的重要性权值,再根据配置重要性权值后的变化可能性来挑选。

当然,也可能有一些话题行为图谱单元组所对应的待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹只有一个,在此情况下,可以直接将该优化操作行为轨迹作为与该话题行为图谱单元组适配的优化操作行为轨迹。

在确定所有话题行为图谱单元组适配的优化操作行为轨迹后,可以将所有话题行为图谱单元组适配的优化操作行为轨迹进行拼接融合,得到与当前可视化行为记录适配的目标操作行为轨迹。

本申请实施例中,在确定当前可视化行为记录中的每一话题行为图谱单元组对应的待定行为状态单元组中待定行为状态单元之间的优化操作行为轨迹时,可以通过预先完成统计的场景型话题调用信息来确定,由于场景型话题调用信息汇总了已被调用的不同行为状态单元之间的操作行为轨迹信息,在同一可视化区域被反复调用时,可以无需额外对该可视化区域进行分析处理,能够在一定程度上避免大量的重复性分析处理,进一步地,通过各优化操作行为轨迹确定出与当前可视化行为记录适配的目标操作行为轨迹,能够尽可能减少确定操作行为轨迹所需要耗费的时间,并确保得到的目标操作行为轨迹的准确性和完整性。

在一些可独立实施的技术方案中,步骤S100中,所述在事先生成的场景型话题交互日志中为当前可视化行为记录中的话题行为图谱单元确定对应的待定行为状态单元,包括:

S101:针对当前可视化行为记录中的每一话题行为图谱单元,在事先生成的所述场景型话题交互日志中确定该话题行为图谱单元对应的寻找区间,通过所述寻找区间在事先生成的所述场景型话题交互日志中确定该话题行为图谱单元对应的待定可视化区域,确定该话题行为图谱单元映射到待定可视化区域上的行为状态映射单元,通过所述行为状态映射单元在事先生成的所述场景型话题交互日志中确定该话题行为图谱单元对应的待定行为状态单元。

在本申请实施例中,寻找区间可以理解为搜寻范围。

在一些可选的且可独立实施的设计思路下,步骤S101中,在事先生成的所述场景型话题交互日志中确定该话题行为图谱单元对应的寻找区间,可以包括以下步骤:

S1011:在事先生成的所述场景型话题交互日志中获寻到该话题行为图谱单元,并确定以该话题行为图谱单元为热点单元、预设连边数目为约束的目标区间;

S1012:将所述目标区间确定为该话题行为图谱单元对应的寻找区间。

换言之,话题行为图谱单元对应的寻找区间可以为以该话题行为图谱单元为热点单元、预设连边数目为约束的目标区间。预设连边数目可以根据所需的操作行为轨迹精度来确定,当然也可以同时综合确定待定行为状态单元所需的运算资源开销来确定。

当然,上述寻找区间为一种选择性的例子,具体并不限于此。比如寻找区间还可以为图形化区间等,确定寻找区间的方式可以根据所需的寻找区间的实际形状而定。

该话题行为图谱单元对应的寻找区间用于确定该话题行为图谱单元对应的待定可视化区域。

进一步地,热点单元可以理解为原点,预设连边数目为约束可以理解为以预设连边数目对应的长度为半径进行区域围合处理,从而得到目标区间。

在一些可选的且可独立实施的设计思路下,步骤S101中,通过所述寻找区间在事先生成的所述场景型话题交互日志中确定该话题行为图谱单元对应的待定可视化区域,可以包括以下步骤:

步骤S1013中,在事先生成的所述场景型话题交互日志中确定出涵盖所述寻找区间的第一可视化日志段落。

可以在前述的寻找区间的基础上,在事先生成的所述场景型话题交互日志中确定出第一可视化日志段落,该第一可视化日志段落涵盖该寻找区间。

为减少在确定待定可视化区域时的额外资源开销,该第一可视化日志段落可以为涵盖该寻找区间的最小可视化日志段落。当然,此处并不作为限制,第一可视化日志段落可以根据需要来确定,比如还可以是涵盖该寻找区间的、且比最小可视化日志段落稍大一点的可视化日志段落,只要涵盖该寻找区间即可。

步骤S1014中,从预先完成构建的层级性可视化拓扑的原始拓扑单元开始获寻到符合要求的目标末端拓扑单元,所述要求是指:末端拓扑单元对应的可视化区间与所述第一可视化日志段落存在重叠。

在此之前,先按照预设区间分类策略从所述场景型话题交互日志划分多层可视化区间,然后根据场景型话题交互日志被分类得到的各层可视化区间建立层级性可视化拓扑(节点化的树模型或者节点化的树路径)。换言之,场景型话题交互日志被预先划分出了多层可视化区间,并且,层级性可视化拓扑是预先根据场景型话题交互日志被分类得到的各层可视化区间建立的。场景型话题交互日志可以通过以下方式实现划分:确定涵盖该场景型话题交互日志的全部可视化区间的可视化日志段落;将该可视化日志段落划分出N层可视化区间,N大于1。

其中,第1层可视化区间为可视化日志段落中的全部可视化区间、即该场景型话题交互日志的全部可视化区间,第2层可视化区间为将该可视化日志段落进行四等分后的4个可视化区间,第3层可视化区间为将这4个可视化区间中的每一可视化区间进一步进行四等分后的16个可视化区间,以此类推。

例如,场景型话题交互日志的全部可视化区间interval10作为第1层区间;该第1层区间被划分为4个第2层区间,分别为interval11、interval12、interval13和interval14;每个第2层区间又进一步被划分为四个第3层区间,以interval11为例,interval11被划分为interval111、interval112、interval113和interval114这四个第3层区间,其他类似,在此不再列举。如此,场景型话题交互日志被划分为了3层可视化区间。

当然,上述的场景型话题交互日志划分情况只是为了便于理解而举的例子,实际场景型话题交互日志的区间存在差异,比如话题平台、或者一个话题网络等,所以,实际划分情况可以分成更多层。

上述可视化日志段落只是为了便于划分,实际也可以采用其他方式对该场景型话题交互日志的全部可视化区间进行划分,具体划分方式不限。

基于场景型话题交互日志被分类得到的N层可视化区间,可以建立层级性可视化拓扑,其中,层级性可视化拓扑的原始拓扑单元对应所述场景型话题交互日志的全部可视化区间,所述层级性可视化拓扑中第x层拓扑单元对应所述场景型话题交互日志中的第x层可视化区间,x大于或等于1、且小于或等于N。

为了更好地理解层级性可视化拓扑的建立方式,以层级性可视化拓扑为一树模型为例进行说明。层级性可视化拓扑的原始拓扑单元即第1层拓扑单元对应于场景型话题交互日志的全部可视化区间interval10,原始拓扑单元的四个下游拓扑单元即第2层拓扑单元分别对应第2层可视化区间interval11、interval12、interval13和interval14,第2层拓扑单元的下游拓扑单元即第3层末端拓扑单元对应第3层可视化区间,以interval11为例,第2层拓扑单元interval11的四个下游拓扑单元分别对应interval111、interval112、interval113和interval114这四个第3层可视化区间。

层级性可视化拓扑的最后一层拓扑单元为末端拓扑单元,第3层拓扑单元为层级性可视化拓扑的末端拓扑单元,比如分别对应interval111、interval112、interval113和interval114这四个第3层可视化区间的拓扑单元。

在从层级性可视化拓扑中获寻目标末端拓扑单元时,从层级性可视化拓扑的原始拓扑单元开始获寻,自上而下的策略一层一层地依次访问层级性可视化拓扑树的拓扑单元,在依次访问到的拓扑单元对应的可视化区间与第二可视化日志段落存在重叠时,还需继续依次访问该拓扑单元的下游拓扑单元,直至找到以该拓扑单元为原始拓扑单元的层级性可视化局部拓扑树中与第二可视化日志段落存在重叠的末端拓扑单元;在依次访问到的拓扑单元对应的可视化区间与第二可视化日志段落不存在重叠时,就不需要再继续在以该拓扑单元作为原始拓扑单元的层级性可视化局部拓扑树中依次访问了,如此可以大大减少依次访问的拓扑单元。

通过上述依次访问方式(比如可以理解为遍历),可以找出所有对应的可视化区间与第一可视化日志段落存在重叠的末端拓扑单元,这些末端拓扑单元均作为目标末端拓扑单元。话题行为图谱单元的寻找区间分布在所有目标末端拓扑单元对应的可视化区间内。

本实施例中,利用层级性可视化拓扑可以快速找到话题行为图谱单元的寻找区间所在的区域,在一个拓扑单元对应的可视化区间与第二可视化日志段落不存在重叠,该拓扑单元的下游拓扑单元对应的可视化区间就必然不会与该第二可视化日志段落存在重叠,所以以该拓扑单元为原始拓扑单元的层级性可视化局部拓扑树就不需要进行依次访问了,可以减少需与第二可视化日志段落对比分析的可视化区间的数目,由于场景型话题交互日志的整体数据量较大,因此采用上述技术能够节省大量无用的计算资源开销,减少分析耗时。

此外,判断第二可视化日志段落与可视化区间之间是否存在重叠,相比于判断圆形或其他形状的寻找区间与可视化区间之间是否存在重叠而言,判断方式更便捷,可以减少判断时的运算资源开销。

步骤S1015中,从所有目标末端拓扑单元对应的可视化区间内确定出该话题行为图谱单元对应的待定可视化区域。

在确定待定可视化区域时,可以依次访问所有目标末端拓扑单元对应的可视化区间内的所有可视化区域,判断依次访问到的可视化区域是否与寻找区间存在重叠,如果是,则依次访问到的可视化区域为待定可视化区域。

为了减少确定待定可视化区域时的运算资源开销,步骤S1015中,所述从所有目标末端拓扑单元对应的可视化区间内确定出该话题行为图谱单元对应的待定可视化区域,可以包括以下步骤:

S10151:针对每一目标末端拓扑单元,从该目标末端拓扑单元对应的可视化区间内确定出至少一个模板可视化区域;模板可视化区域对应的第二可视化日志段落与所述第一可视化日志段落存在重叠,模板可视化区域对应的第二可视化日志段落是指在所述场景型话题交互日志中定位出的涵盖该模板可视化区域的可视化日志段落;

S10152:针对每一模板可视化区域,判断该模板可视化区域是否与所述寻找区间存在重叠,如果是,确定该模板可视化区域为该话题行为图谱单元对应的待定可视化区域。

在确定模板可视化区域(参考可视化区域)时,可以先确定目标末端拓扑单元对应的可视化区间内每一可视化区域对应的第二可视化日志段落,该第二可视化日志段落可以是但不限于涵盖可视化区域的最小可视化日志段落;接着,针对每个第二可视化日志段落,判断该第二可视化日志段落是否与第一可视化日志段落存在重叠,如果是,则该第二可视化日志段落涵盖的可视化区域为模板可视化区域。

模板可视化区域是通过判断涵盖模板可视化区域的第二可视化日志段落与涵盖寻找区间的第一可视化日志段落是否存在重叠而确定出的,但是第二可视化日志段落与第一可视化日志段落存在重叠不代表模板可视化区域与寻找区间存在重叠。

比如,zoncondition100为寻找区间,寻找区间zoncondition100对应的第一可视化日志段落为journal_section10,Visualization100为一个可视化区域。

进一步地,可视化区域Visualization100对应的第二可视化日志段落为journal_section20,第一可视化日志段落journal_section10与第二可视化日志段落journal_section20存在重叠,所以可视化区域Visualization100为模板可视化区域,但是可视化区域Visualization100与寻找区间zoncondition100其实并不存在重叠。

所以,在找出模板可视化区域的前提下,进一步判断模板与寻找区间是否存在重叠,如果是,确定该模板可视化区域为该话题行为图谱单元对应的待定可视化区域。

如此,可以通过判断可视化日志段落之间是否存在重叠来找出模板可视化区域,再判断模板可视化区域与寻找区间是否存在重叠,由于判断可视化日志段落是否交叉比判断可视化区域与目标区间是否交叉的计算属性小很多,判断可视化日志段落是否交叉时,可以从整体层面减少运算资源开销,提升处理耗时。

现有方式中,在确定话题行为图谱单元相应的待定行为状态单元或待定可视化区域的过程中,要将全部场景型话题中的可视化区域与话题行为图谱单元的寻找区间对比分析,以确定两者是否交叉,由于场景型话题数据量较大,所以涉及较多的无效运算,导致耗费更多的时间。并且,先对寻找区间的最小围合区域与可视化区域的最小围合区域之间进行对比分析,以确定所有第一可视化区域,再从第一可视化区域中进一步确定出与寻找区间交叉的可视化区域,作为模板可视化区域,可以大大减小运算资源开销,进一步减少耗时。

可以直接将该模板可视化区域作为该话题行为图谱单元对应的待定可视化区域。但是,通常来说,不会存在行为检测目标所在可视化区域的描述与行为检测目标的可视化行为记载的描述相反的情况出现。

基于这一情况,可以对模板可视化区域进行优化处理,得到该话题行为图谱单元对应的待定可视化区域。为此,步骤S10152中,所述确定该模板可视化区域为该话题行为图谱单元对应的待定可视化区域进一步包括以下步骤:

S101521:获取该话题行为图谱单元对应的行为传递描述;

S101522:确定该模板可视化区域在事先生成的所述场景型话题交互日志中被设置的描述;

S101523:判断该话题行为图谱单元对应的行为传递描述与该模板可视化区域被设置的描述之间的量化差异值是否小于或等于设定量化差异值,如果是,确定该模板可视化区域为该话题行为图谱单元对应的待定可视化区域。

在一些可能的实施例中,行为检测线程采集的数据除了行为检测目标的话题行为图谱单元(空间域信息)外,还带有行为检测目标在每个话题行为图谱单元处的行为传递描述(行为发展路径或者行为趋势路径),因此,可以从当前可视化行为记载的来源信息中获取该话题行为图谱单元对应的行为传递描述。当然,在描述信息缺失情况下,可使用上一话题行为图谱单元与该话题行为图谱单元、或者该话题行为图谱单元与下一话题行为图谱单元计算出行为传递描述。

场景型话题交互日志中每一可视化区域均被设置了描述,可视化区域被设置的描述即可视化区域的起始单元到终止单元的路径描述。比如,非交互型行为对应的可视化区域的描述即为非交互型行为的路径描述;而交互型行为可以对应两个互逆路径描述的可视化区域,相应的,每个可视化区域的描述为交互型行为中对手方话题互动情况的路径描述。

如果模板可视化区域被设置的描述与话题行为图谱单元对应的行为传递描述之间的量化差异值(比如路径描述差异度)小于或等设定量化差异值,则确定该模板可视化区域为待定可视化区域;否则,认为该模板可视化区域是行为检测目标所处的可视化区域的概率极低,确定该模板可视化区域不为待定可视化区域。

设定量化差异值可以根据需要预设,为避免因话题行为图谱单元异常而量化差异值过大导致遗漏正确可视化区域的问题,可以将设定量化差异值设置地较大,比如在0~1的区间内可以设置为0.9。当然此处仅是举例,并不作为限制。

当话题行为图谱单元对应的寻找区间的约束较大时,会造成模板可视化区域的数目较多,但是,其实正确可视化区域只会有一个,所以对模板可视化区域进行优化处理后,得到更少量的待定可视化区域,后续在找正确可视化区域时,可以避免大量的无效运算处理,进一步减少耗时。

步骤S101中,在找到该话题行为图谱单元对应的待定可视化区域后,可以确定该话题行为图谱单元映射到待定可视化区域上的行为状态映射单元,通过所述行为状态映射单元在事先生成的所述场景型话题交互日志中确定该话题行为图谱单元对应的待定行为状态单元。

该话题行为图谱单元映射到待定可视化区域上的行为状态映射单元,比如可以为话题行为图谱单元到待定可视化区域所对应行为路径上的交点。在此基础上,通过所述行为状态映射单元在事先生成的所述场景型话题交互日志中确定该话题行为图谱单元对应的待定行为状态单元可以包括:

如果行为状态映射单元在待定可视化区域上,将该行为状态映射单元确定为待定行为状态单元;

如果行为状态映射单元不在待定可视化区域上,那么将待定可视化区域上接近该行为状态映射单元的行为状态单元作为待定行为状态单元。

在一些可独立实施的技术方案中,步骤S300中,所述通过预先完成统计的场景型话题调用信息确定待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹,包括:

S301:针对每一待定行为状态单元组,通过该待定行为状态单元组中的两个待定行为状态单元在预先完成统计的场景型话题调用信息中寻找出目标可视化区域;

S302:通过寻找出的目标可视化区域确定该待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹。

当相邻的两个话题行为图谱单元距离较远时,一个话题行为图谱单元对应的待定行为状态单元到下一话题行为图谱单元的待定行为状态单元之间有很多可选的操作行为轨迹,不同操作行为轨迹之间可能有较多重叠的可视化区域,如果对这些可视化区域重复寻找会带来较多的计算耗时。

利用场景型话题调用信息完成目标可视化区域的寻找,这样当寻找重复的可视化区域(即之前已经寻找过的可视化区域)时,场景型话题调用信息中已经汇总了相应的操作行为轨迹信息,此时可以不用额外运算处理,省去重复寻找相同可视化区域带来的计算耗时。

在一些可选的且可独立实施的设计思路下,步骤S301中,所述通过该待定行为状态单元组中的两个待定行为状态单元在预先完成统计的场景型话题调用信息中寻找出目标可视化区域,可以包括以下步骤:

S3011:通过该待定行为状态单元组中的第一待定行为状态单元、第二待定行为状态单元在事先生成的所述场景型话题交互日志中确定第一搜寻辅助单元和第二搜寻辅助单元;第一搜寻辅助单元为第一待定行为状态单元所处的待定可视化区域上与第二待定行为状态单元距离最短的行为状态单元,第二搜寻辅助单元为第二待定行为状态单元所处的待定可视化区域上与第一待定行为状态单元距离最短的行为状态单元,第一待定行为状态单元为:与该待定行为状态单元组对应的话题行为图谱单元组中第一话题行为图谱单元的待定行为状态单元,第二待定行为状态单元为:与该待定行为状态单元组对应的话题行为图谱单元组中第二话题行为图谱单元的待定行为状态单元,在所述当前可视化行为记录中第二话题行为图谱单元与第一话题行为图谱单元关联且位于第一话题行为图谱单元之后;

S3012:通过第一搜寻辅助单元和所述第二搜寻辅助单元在预先完成统计的场景型话题调用信息中寻找出目标可视化区域。

举例来说,假设element1为第一话题行为图谱单元,element2为第二话题行为图谱单元,element2与element1为关联的两个话题行为图谱单元、且element2位于element1之后;pending1为element1的一个待定行为状态单元(第一待定行为状态单元),pending4为element2的一个待定行为状态单元(第二待定行为状态单元),pending1和pending4构成一对待定行为状态单元组;condition2为pending1所处的待定可视化区域condition1condition2上距离pending4最近的行为状态单元,所以将condition2确定为第一搜寻辅助单元;condition7为pending4所处的待定可视化区域condition7condition8上距离pending1最近的行为状态单元,所以将condition7确定为第二搜寻辅助单元。

通过第一搜寻辅助单元condition2与第二搜寻辅助单元condition7在预先完成统计的场景型话题调用信息中寻找出目标可视化区域,目标可视化区域可以是从第一搜寻辅助单元condition2到第二搜寻辅助单元condition7的所有操作行为轨迹中优化操作行为轨迹涵盖的可视化区域。

在一些可选的且可独立实施的设计思路下,步骤S3012中,所述通过第一搜寻辅助单元和所述第二搜寻辅助单元在预先完成统计的场景型话题调用信息中寻找出目标可视化区域,可以包括以下步骤:

S30121:将第一指示路径和第二指示路径中的其中一个确定为当前可视化搜寻指示路径;第一指示路径为经由第一搜寻辅助单元至第二搜寻辅助单元的描述,第二指示路径为经由第二搜寻辅助单元至第一搜寻辅助单元的描述;

S30122:将当前可视化搜寻指示路径的查询触发状态单元作为当前行为状态单元,若当前行为状态单元未统计在场景型话题调用信息中,将当前行为状态单元、该当前行为状态单元对应的当前可视化搜寻指示路径汇总在所述场景型话题调用信息中;

S30123:在事先生成的所述场景型话题交互日志中获寻到当前行为状态单元的关联行为状态单元,依次访问获寻到的关联行为状态单元;若在所述场景型话题调用信息中汇总了依次访问到的关联行为状态单元,通过场景型话题调用信息中记载的该关联行为状态单元对应的可视化搜寻指示路径寻找出位于当前可视化搜寻指示路径上的可视化区域作为所述目标可视化区域;若在所述场景型话题调用信息中未统计依次访问到的关联行为状态单元,将关联行为状态单元对应的当前可视化搜寻指示路径、当前行为状态单元和关联行为状态单元的可视化区域记录至场景型话题调用信息中;

S30124:若依次访问终止时未确定出目标可视化区域,则从当前行为状态单元的所有关联行为状态单元挑选一个行为状态单元作为当前可视化搜寻指示路径的查询触发状态单元;然后将当前可视化搜寻指示路径更新为所述第一指示路径和第二指示路径中的另一个,返回将当前可视化搜寻指示路径的查询触发状态单元作为当前行为状态单元的操作。

举例来说,假设从第一搜寻辅助单元condition2至第二搜寻辅助单元condition7的描述为第一指示路径,从第二搜寻辅助单元condition7至第一搜寻辅助单元condition2的描述为第二指示路径。第一指示路径的查询触发状态单元为第一搜寻辅助单元condition2,第二指示路径的查询触发状态单元为第二搜寻辅助单元condition7。

当前可视化搜寻指示路径可以为第一指示路径或第二指示路径,下面以当前可视化搜寻指示路径为第一指示路径为例展开说明。当然,此处只是开始寻找时将第一指示路径确定为当前可视化搜寻指示路径,在寻找时当前可视化搜寻指示路径可被更新。

当前可视化搜寻指示路径为从第一搜寻辅助单元condition2至第二搜寻辅助单元condition7,所以,当前可视化搜寻指示路径的查询触发状态单元为第一搜寻辅助单元condition2,将该第一搜寻辅助单元condition2作为当前行为状态单元,判断第一搜寻辅助单元condition2是否汇总在场景型话题调用信息中。

此时,第一搜寻辅助单元condition2是首次被调用,未统计在场景型话题调用信息中,所以将该第一搜寻辅助单元condition2、该第一搜寻辅助单元condition2对应的当前可视化搜寻指示路径(第一指示路径)记录至场景型话题调用信息中。

在事先生成的场景型话题交互日志中获寻到第一搜寻辅助单元condition2的关联行为状态单元,分别为condition1、condition3、condition4、condition5,并对关联行为状态单元condition1、condition3、condition4、condition5的依次访问进行依次访问。经过对关联行为状态单元condition1、condition3、condition4、condition5的依次访问,确定关联行为状态单元condition1、condition3、condition4、condition5均未统计在场景型话题调用信息中,并会将关联行为状态单元condition1、condition3、condition4、condition5与对应的当前可视化搜寻指示路径(第一指示路径)记录至场景型话题调用信息中,并将关联行为状态单元condition1至第一搜寻辅助单元condition2的可视化区域condition1condition2、关联行为状态单元condition3至第一搜寻辅助单元condition2的condition3condition2、第一搜寻辅助单元condition2至关联行为状态单元condition4的可视化区域condition2condition4、第一搜寻辅助单元condition2至关联行为状态单元condition5的可视化区域condition2condition5记录至场景型话题调用信息中。

终止对关联行为状态单元condition1、condition3、condition4、condition5的依次访问时,未确定出目标可视化区域,则从第一搜寻辅助单元condition2的所有关联行为状态单元condition1、condition3、condition4、condition5挑选一个行为状态单元作为当前可视化搜寻指示路径(第一指示路径)的查询触发状态单元。

在一些可选的且可独立实施的设计思路下,步骤S30124中,所述从当前行为状态单元的所有关联行为状态单元挑选一个行为状态单元作为当前可视化搜寻指示路径的查询触发状态单元,可以包括以下步骤:针对每一关联行为状态单元,确定该关联行为状态单元对应的操作行为轨迹量化评价,所述操作行为轨迹量化评价为当前可视化搜寻指示路径的查询触发状态单元至该关联行为状态单元的第一行为轨迹量化评价、与该关联行为状态单元至当前可视化搜寻指示路径的查询终止状态单元的第二行为轨迹量化评价的和值;挑选对应的操作行为轨迹量化评价最低的一个关联行为状态单元;将挑选出的关联行为状态单元确定为当前可视化搜寻指示路径的查询触发状态单元。

第一行为轨迹量化评价为当前可视化搜寻指示路径的查询触发状态单元到该关联行为状态单元的操作行为轨迹属性,由于这条操作行为轨迹是已被寻找过,所以可以用操作行为轨迹长度表示操作行为轨迹属性;第二行为轨迹量化评价为该关联行为状态单元到当前可视化搜寻指示路径的查询终止状态单元的操作行为轨迹属性,可以用该关联行为状态单元到当前可视化搜寻指示路径的查询终止状态单元之间的欧几里得度量表示操作行为轨迹属性。

在关联行为状态单元是首次被调用时,还可以将关联行为状态单元对应的操作行为轨迹量化评价记录至场景型话题调用信息中时,因而,对于已汇总在场景型话题调用信息中的关联行为状态单元而言,可以直接从场景型话题调用信息中获取该关联行为状态单元对应的操作行为轨迹量化评价。

继续前述的例子,可以计算第一搜寻辅助单元condition2的所有关联行为状态单元condition1、condition3、condition4、condition5至第二搜寻辅助单元condition7的操作行为轨迹量化评价,从所有关联行为状态单元condition1、condition3、condition4、condition5中挑选行为轨迹量化评价最低的关联行为状态单元作为当前可视化搜寻指示路径(第一指示路径)上的查询触发状态单元,比如挑选关联行为状态单元condition4作为当前可视化搜寻指示路径(第一指示路径)的查询触发状态单元。

然后,将当前可视化搜寻指示路径更新为第二指示路径,返回将当前可视化搜寻指示路径的查询触发状态单元作为当前行为状态单元的操作。

当前可视化搜寻指示路径被更新为第二指示路径,第二指示路径的查询触发状态单元为第二搜寻辅助单元condition7,第二指示路径的查询终止状态单元为第一搜寻辅助单元condition2,将第二搜寻辅助单元condition7作为当前行为状态单元,判断第二搜寻辅助单元condition7是否汇总在场景型话题调用信息中。

此时,第二搜寻辅助单元condition7是首次被调用,未统计在场景型话题调用信息中,所以将该第二搜寻辅助单元condition7、该第二搜寻辅助单元condition7对应的当前可视化搜寻指示路径(第二指示路径)记录至场景型话题调用信息中。

在事先生成的场景型话题交互日志中获寻到第二搜寻辅助单元condition7的关联行为状态单元,分别为condition6、condition8,并对关联行为状态单元condition6、condition8进行依次访问。经过对关联行为状态单元condition6、condition8的依次访问,确定关联行为状态单元condition6、condition8均未统计在场景型话题调用信息中,会将关联行为状态单元condition6、condition8、与对应的当前可视化搜寻指示路径(第二指示路径)记录至场景型话题调用信息中,并将关联行为状态单元condition6至第二搜寻辅助单元condition7的可视化区域condition6condition7、第二搜寻辅助单元condition7至关联行为状态单元condition8的可视化区域condition7condition8记录至场景型话题调用信息中。

在终止依次访问时未确定出目标可视化区域,则从第二搜寻辅助单元condition7的所有关联行为状态单元condition6、condition8挑选一个行为状态单元作为当前可视化搜寻指示路径(第二指示路径)的查询触发状态单元。挑选行为状态单元的方式与前述内容类似,确定关联行为状态单元condition6对应的行为轨迹量化评价,比如为第二搜寻辅助单元condition7至关联行为状态单元condition6的操作行为轨迹长度、与关联行为状态单元condition6至第一搜寻辅助单元condition2之间的欧几里得度量的和值;确定关联行为状态单元condition6对应的行为轨迹量化评价,比如为第二搜寻辅助单元condition7至关联行为状态单元condition8的操作行为轨迹长度(可视化区域condition7condition8的长度)、与关联行为状态单元condition8至第一搜寻辅助单元condition2之间的欧几里得度量的和值。在关联行为状态单元condition6、condition8是首次被调用时,将关联行为状态单元condition6、condition8对应的操作行为轨迹行为轨迹量化评价记录至操作行为轨迹调用信息中。

从所有关联行为状态单元condition6、condition8中挑选行为轨迹量化评价最低的关联行为状态单元作为当前可视化搜寻指示路径(第二指示路径)上的查询触发状态单元,比如,挑选关联行为状态单元condition6作为当前可视化搜寻指示路径(第二指示路径)的查询触发状态单元。

然后,将当前可视化搜寻指示路径更新为第一指示路径,返回将当前可视化搜寻指示路径的查询触发状态单元作为当前行为状态单元的操作。

当前可视化搜寻指示路径又被更新为第一指示路径,第一指示路径的查询触发状态单元为行为状态单元condition4,第一指示路径的查询终止状态单元为第一搜寻辅助单元condition2,将行为状态单元condition4作为当前行为状态单元,判断行为状态单元condition4是否汇总在场景型话题调用信息中。

由于行为状态单元condition4是第二次被调用,所以行为状态单元condition4已经汇总在场景型话题调用信息中,所以不需要重新记录行为状态单元condition4及相关信息至场景型话题调用信息中。

在事先生成的场景型话题交互日志中获寻到行为状态单元condition4的关联行为状态单元,分别为condition2和condition6,并对关联行为状态单元condition2、condition6进行依次访问。由于关联行为状态单元condition2和condition6已被汇总在场景型话题调用信息中,所以在依次访问到关联行为状态单元condition2或condition6时,需通过场景型话题调用信息中记载的该关联行为状态单元对应的可视化搜寻指示路径寻找出位于当前可视化搜寻指示路径上的可视化区域作为所述目标可视化区域。

在一些可选的且可独立实施的设计思路下,步骤S30123中,所述通过场景型话题调用信息中记载的该关联行为状态单元对应的可视化搜寻指示路径寻找出位于当前可视化搜寻指示路径上的可视化区域作为所述目标可视化区域可以包括:

对比分析场景型话题调用信息中记载的该关联行为状态单元对应的可视化搜寻指示路径与当前可视化搜寻指示路径;

比对分析结果表征该关联行为状态单元对应的可视化搜寻指示路径与当前可视化搜寻指示路径存在差异时,从所述场景型话题调用信息中获取位于当前可视化搜寻指示路径上的可视化区域作为所述目标可视化区域。

在一些可选的且可独立实施的设计思路下,在从所述场景型话题调用信息中获取位于当前可视化搜寻指示路径上的可视化区域作为所述目标可视化区域然后,可以终止本次依次访问。当场景型话题调用信息中记载的该关联行为状态单元对应的可视化搜寻指示路径与当前可视化搜寻指示路径相同时,继续依次访问下一个关联行为状态单元,直至当前行为状态单元的所有关联行为状态单元均已被依次访问。

比如依次访问关联行为状态单元condition2和condition6时,是先关联行为状态单元依次访问condition2,再依次访问关联行为状态单元condition6,那么:在依次访问到关联行为状态单元condition2时,确定关联行为状态单元condition2已被汇总在场景型话题调用信息中,且场景型话题调用信息中记载的关联行为状态单元condition2对应的可视化搜寻指示路径(第一指示路径)与当前可视化搜寻指示路径(第一指示路径)相同,所以,可以继续依次访问关联行为状态单元condition6。

在依次访问到关联行为状态单元condition6时,确定关联行为状态单元condition6已被汇总在场景型话题调用信息中,且场景型话题调用信息中记载的关联行为状态单元condition6对应的可视化搜寻指示路径(第二指示路径)与当前可视化搜寻指示路径(第一指示路径)不同,所以,可以从所述场景型话题调用信息中获取位于当前可视化搜寻指示路径上的可视化区域作为所述目标可视化区域,并且终止依次访问。

可以理解的是,由于场景型话题调用信息中汇总了可视化区域condition1condition2、condition3condition2、condition2condition4、condition4condition6、condition6condition7、condition7condition8,所以可以直接从场景型话题调用信息中获取从第一搜寻辅助单元condition2到第二搜寻辅助单元condition7之间的可视化区域、或者说从第一搜寻辅助单元condition7到第二搜寻辅助单元condition3之间的可视化区域,分别为condition2condition4、condition4condition6、condition6condition7。

进一步地,将这些condition2condition4、condition4condition6、condition6condition7作为目标可视化区域。

步骤S302中,通过寻找出的目标可视化区域确定该待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹。

例如,可以将第一待定行为状态单元pending1所在可视化区域condition1condition2,目标可视化区域condition2condition4、condition4condition6、condition6condition7,以及第二待定行为状态单元pending2所在可视化区域condition7condition8依次拼接(两个可视化区域的相同行为状态单元作为拼接点),得到所需的优化操作行为轨迹。

描述的condition2和condition8都是首次被调用的情况,所以在寻找的过程中,所以condition1condition2、condition3condition2、condition2condition4、condition4condition6、condition6condition7、condition7condition8这些可视化区域是首次添加到场景型话题调用信息中,假设后续condition2或condition8第二次被调用(比如针对同一话题行为图谱单元组对应的另一对待定行为状态单元组进行寻找)时,经过相同的可视化区域比如condition2condition4时,与condition2condition4相关的信息比如操作行为轨迹量化评价等便不需要额外运算处理,而是从操作行为轨迹调用信息中获取即可。

通过上述方式,每一对话题行为图谱单元组可以得到num2个优化操作行为轨迹,num2为该话题行为图谱单元组对应的待定行为状态单元组的数目,需要从中挑选一条优化操作行为轨迹作为该话题行为图谱单元组适配的优化操作行为轨迹,从而可以确定当前可视化行为记录适配的目标操作行为轨迹。

在一些可独立实施的技术方案中,步骤S400中,通过每一话题行为图谱单元组所对应的待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹,在事先生成的所述场景型话题交互日志中确定出与当前可视化行为记录适配的目标操作行为轨迹,可以包括:针对每一话题行为图谱单元组,执行以下步骤:针对该话题行为图谱单元组所对应的每一待定行为状态单元组,将该待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹导入至在先完成训练的AI神经网络,得到该待定行为状态单元组所对应的至少一个设定关键内容可能性的重要程度变量;通过各待定行为状态单元组所对应的至少一个设定关键内容可能性的重要程度变量,从各待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹中挑选一个待定操作行为轨迹;将所有待定操作行为轨迹按照预设行为轨迹拼接策略进行全局化融合以得到所述目标操作行为轨迹。

在一些实施例中,一对待定行为状态单元组对应于一组重要程度变量,一组重要程度变量可以包括:第一关键内容可能性的第一重要程度变量,所述第一关键内容可能性用于表示话题行为图谱单元组中两个话题行为图谱单元之间的欧几里得度量与该话题行为图谱单元组所对应的待定行为状态单元组的两个待定行为状态单元之间的操作行为轨迹长度之间的差异情况;第二关键内容可能性的第二重要程度变量,所述第二关键内容可能性用于表示话题行为图谱单元组中一个话题行为图谱单元的行为传递描述与待定行为状态单元组中对应待定行为状态单元所在待定可视化区域被设置的描述之间的差异情况;第三关键内容可能性的第三重要程度变量,所述第三关键内容可能性用于表示当前可视化行为记载的平均行为传递耗时与话题互动时效需求之间的差异情况。

可以理解,根据AI神经网络输出的一组重要程度变量计算对应的待定行为状态单元组中两个待定行为状态单元所在待定可视化区域之间的变化可能性,得到各待定行为状态单元组对应的变化可能性;并根据各待定行为状态单元组所对应的变化可能性和预设定位可能性,从各待定行为状态单元组中两个待定行为状态单元之间的优化操作行为轨迹中挑选一个待定操作行为轨迹。

其中,根据AI神经网络输出的一组重要程度变量计算对应的待定行为状态单元组中两个待定行为状态单元所在待定可视化区域之间的变化可能性,可以包括以下步骤:计算以第一关键内容可能性为底数、AI神经网络输出的一组重要程度变量中第一关键内容可能性的第一重要程度变量为幂数的第一量化值;计算以第二关键内容可能性为底数、AI神经网络输出的一组重要程度变量中第二关键内容可能性的第二重要程度变量为幂数的第二量化值;计算以第三关键内容可能性为底数、AI神经网络输出的一组重要程度变量中第三关键内容可能性的第三重要程度变量为幂数的第三量化值;将所述第一量化值、第二量化值和第三量化值进行加权,得到待定行为状态单元对应的变化可能性。

AI神经网络是预先训练好并保存在服务器中的,在需要时从设备中调用即可。本实施例中,通过AI神经网络得到待定行为状态单元组对应的不同关键内容可能性的重要程度变量,从而计算更合理的变化可能性,应用在质量较差的场景型话题交互日志中时有较好的效果,在应用到话题社群级别的场景时也能保持较优的适配性能。

可以理解的是,在确定当前可视化行为记录中的每一话题行为图谱单元组对应的待定行为状态单元组中待定行为状态单元之间的优化操作行为轨迹时,可以通过预先完成统计的场景型话题调用信息来确定,由于场景型话题调用信息汇总了已被调用的不同行为状态单元之间的操作行为轨迹信息,在同一可视化区域被反复调用时,可以无需额外对该可视化区域进行分析处理,能够在一定程度上避免大量的重复性分析处理,进一步地,通过各优化操作行为轨迹确定出与当前可视化行为记录适配的目标操作行为轨迹,能够尽可能减少确定操作行为轨迹所需要耗费的时间,并确保得到的目标操作行为轨迹的准确性和完整性,从而快速、准确地为后续的互动行为安防分析提供分析依据,避免在确定当前可视化行为记录的目标操作行为轨迹过程中耗费过多时间而影响互动行为安防分析的时效性。

基于上述同样的发明构思,还提供了一种针对大数据的云业务话题信息处理装置20,应用于大数据服务器10,所述装置包括:

信息获取模块21,用于获取第一社群业务会话信息和第二社群业务会话信息,其中,所述第一社群业务会话信息为第一业务会话主题描述,所述第二社群业务会话信息为第二业务会话主题描述;

指示获取模块22,用于以及获取不同话题场景下所述第一业务会话主题描述之间的第一特征调整指示、不同话题场景下所述第二业务会话主题描述之间的第二特征调整指示、以及设定话题场景下所述第一业务会话主题描述和第二业务会话主题描述之间的第三特征调整指示;

需求绑定模块23,用于通过所述第一特征调整指示、第二特征调整指示和第三特征调整指示,对所述第一社群业务会话信息和第二社群业务会话信息进行会话需求绑定。

关于上述功能模块的描述请参阅对图2所示的方法的描述。

综上,上述方案,在实现不同会话主题的第一社群业务会话信息和第二社群业务会话信息之间的会话需求绑定的过程中,通过获取不同话题场景下同一业务会话主题描述之间的特征调整指示以及设定话题场景下不同业务会话主题描述之间的特征调整指示,使得可以将第一社群业务会话信息与同一会话主题下的设定话题场景进行会话需求绑定,再与设定话题场景的另一会话主题的社群业务会话信息进行会话需求绑定,然后通过第二特征调整指示与第二社群业务会话信息进行会话需求绑定,通过上述路径化的会话需求绑定方式,可实现不同会话主题的第一社群业务会话信息和第二社群业务会话信息之间的会话需求绑定,而且,不论进行哪种话题场景下不同会话主题的社群业务会话信息之间的会话需求绑定,都可以仅需进行在设定话题场景下不同会话主题的社群业务会话信息之间的一次会话需求绑定,从而提高会话需求绑定结果的准确性和效率。

以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

完整详细技术资料下载
上一篇:石墨接头机器人自动装卡簧、装栓机
下一篇:员工合作关系强度量化方法、系统、计算机和存储介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!