一种挖掘符号网络中最大有符号θ团的方法

文档序号:9163 发布日期:2021-09-17 浏览:49次 英文

一种挖掘符号网络中最大有符号θ团的方法

技术领域

本发明涉及多媒体符号网络

技术领域

,尤其涉及一种挖掘符号网络中最大有符号θ团的方法。

背景技术

在现实生活中,人们的生活离不开社交网络,例如微博、脸书、推特之类的社交网络在我们生活中起到了至关重要的作用。随着因特网和万维网技术的迅速发展,研究者对社交网络的研究兴趣不断增长,他们已经对挖掘社交网络中的稠密子图付出了极大的贡献。目前研究中已经提出了许多稠密子图模型,如k核、k桁架和团等。这些模型在蛋白质结构预测、纠错代码、网络拓扑分析、计算机视觉、组合拍卖中起到了极大的作用。但是在现有研究中,大多数研究只考虑无符号社交网络,即将所有的关系视为正向关系,将所有的用户都当做朋友。然而,用户之间的交互涉及积极(例如朋友)和消极(例如敌人)的联系。在大型社交网络中,积极关系和消极关系都应该存在,如果忽略了消极关系,则可能无法正确挖掘有符号网络中的稠密子图。对于θ团,它对稠密子图中每个顶点的正负邻居的数量设置了约束,以确保该顶点拥有的正邻居数量一定大于负邻居的数量。而挖掘有符号网络中的最大有符号θ团,可以帮助我们更加清晰的认识社交网络中最重要的特征,同时对维护有符号网络起到了极大的帮助。然而在现有的研究中,已有的对于在符号网络中挖掘最大有符号θ团的效率并不高。

发明内容

对于符号网络,用户与用户之间会存在朋友和敌对的关系,而用户之间的关系会显著影响符号网络的稳定性。本发明根据符号网络提出一种新的模型,即最大有符号θ团,它满足四个条件:其中的任意一个顶点的正邻居数与负邻居数之差需大于等于θ;是极大的,即任何它的超图都不是有符号θ团;点数是最多的;是一个团,即团中的每一对顶点都是相邻的。

考虑到θ团的属性,本发明提出新的修剪策略,从而更有效地缩减候选集的大小。与此同时,本发明结合新的修剪策略开发了高效的MSCD算法,从而能够在大型符号网络上快速挖掘最大有符号θ团。

本发明的目的是通过以下技术方案实现的:一种挖掘符号网络中最大有符号θ团的方法,该方法包括:

通过三种修剪策略过滤图G中不必要的点和边,包括:

引理1:基于顶点的修剪规则:对于有符号θ团中的顶点u,需满足u的正邻居数量大于等于θ;

引理2:基于边的修剪规则:对于有符号θ团S中的两个顶点u和v,它们相连的边(u,v)为正边,则该边至少被包含在(θ-1)个正三角形中,所述正三角形为三条边均为正边的三角形;

引理3:基于边的修剪规则:对于有符号θ团S中的两个顶点u和v,它们相连的边(u,v)为负边,则该边至少被包含在(θ+1)个负三角形中,所述负三角形为两条边为正边,另一条边为负边的三角形;

通过最大化有符号θ团贪心启发算法在大型符号网络上迅速挖掘最大有符号θ团,包括:

步骤一,根据引理1过滤图G中不满足条件的顶点,得到新的图G';

步骤二,根据引理2判断图G'中正边所在的正三角形的数量,根据引理3判断图G'中负边所在的负三角形的数量,将不满足条件的边从图G'中删去,从而得到新的图A;

步骤三,移除图A中孤立的点;

步骤四,使用着色算法贪心地将图A中的点着色;

步骤五,在步骤四着色后的图A中,根据递归算法找到最大有符号θ团MaxC,即待挖掘的符号网络子图。

进一步地,所述步骤四包括:迭代地从图A中选择邻居数量最大的顶点并为其分配颜色,如果当前选择的顶点与有颜色的顶点相邻,为其分配一种与其相邻顶点不同的颜色。

进一步地,所述步骤五中,调用递归算法寻找分支中是否存在有符号θ团,递归算法接收两个输入参数{S,C},其中S是临时结果集,初始为空集,C是待加入S的候选点集,初始为图A,并初始化最终结果MaxC为空集,递归算法的具体实现过程包括以下子步骤:

(a)如果集合S中点的数量与C中着色的点的颜色种类数量之和小于|MaxC|+1和θ+1的最大值,则返回0,并执行步骤(d),否则执行(b),其中,|MaxC|表示MaxC中顶点的数量;

(b)如果C为空集,则对于S中任意的点u,如果它的正邻居数量与负邻居数量之差大于等于θ,则将MaxC更新为S,并返回1,否则返回0,并执行步骤(d);

(c)如果C不为空集,对于S中的某点u,如果u的正邻居数量与u的正邻居着色的点的颜色种类数量之和小于u的负邻居数量与θ之和,则返回0,并执行步骤(d);

(d)设置flag为0,将C中的每个点根据其拥有的邻居数量进行升序排序,在完成升序排序后,依次遍历排序后的点;对于遍历的点v,将输入参数S更新为在S中加入点v,将输入参数C更新为点v在C中的邻居集合,并返回执行步骤(a)-(c),将flag更新为当前flag值与返回结果相加,并将v从C中移除,执行步骤(e)-(f);

(e)若flag等于0,则对于S中任意的点u,如果u的正邻居数量与负邻居数量之差小于θ,则返回1,并执行步骤(d),否则执行步骤(f);

(f)若S中点的数量大于|MaxC|,则将MaxC更新为S,并返回1,否则返回0,并执行步骤(d)。

本发明还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述挖掘符号网络中最大有符号θ团的方法中的步骤。

本发明还提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述挖掘符号网络中最大有符号θ团的方法中的步骤。

本发明的有益效果为:对于符号网络,用户与用户之间会存在朋友和敌对的关系,而用户之间的关系会显著影响符号网络的稳定性。本发明根据符号网络提出了一种新的模型,即最大有符号θ团,它满足四个条件:其中的任意一个顶点的正邻居数与负邻居数之差需大于等于θ;是极大的,即任何它的超图都不是有符号θ团;点数是最多的;是一个团,即团中的每一对顶点都是相邻的。考虑到θ团的属性,本发明提出新的修剪策略,从而更有效地缩减候选集的大小。与此同时,本发明结合新的修剪策略开发了高效的MSCD算法,从而能够在大型符号网络上快速挖掘最大有符号θ团。因此,本发明提出的挖掘符号网络中最大有符号θ团的方法的应用对稠密子图的挖掘及符号网络间关系的稳定性的预测有着极大的效益。

附图说明

图1是本发明实施例提供的一种挖掘符号网络中最大有符号θ团的方法流程图;

图2是本发明实施例提供的原始符号网络的示意图;

图3是本发明实施例提供的根据原始符号网络挖掘的最大有符号θ团的示意图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。

本申请提出的一种挖掘符号网络中最大有符号θ团的方法,该方法包括三种新颖的修剪策略和高效的挖掘符号网络中最大有符号θ团的算法(MSCD算法)。下面详细说每部分的实现过程。

三种新颖的修剪策略是指过滤图G中不必要的点和边,从而显著缩减搜索空间,具体包括以下内容:

引理1:基于顶点的修剪规则:对于有符号θ团中的顶点u,需满足u的正邻居数量大于等于θ;

证明:根据最大有符号θ团的定义,其中的任意一个顶点的正邻居数与负邻居数之差需大于等于θ,所以任意一个顶点的正邻居数一定大于等于θ。引理得证。

引理2:基于边的修剪规则:对于有符号θ团S中的两个顶点u和v,它们相连的边(u,v)为正边,则该边至少被包含在(θ-1)个正三角形中,所述正三角形为三条边均为正边的三角形;

为方便证明,我们将点u在有符号θ团S中的正邻居数量记为dS+(u),负邻居数量记为dS-(u),同时将S中的顶点数记为|S|。

证明:由于S是有符号θ团,我们可以得到dS+(u)+dS-(u)+1=|S|,并且dS+(u)-dS-(u)≥θ。因此,我们可以得到dS+(u)≥(|S|+θ-1)/2。同时,我们将S'定义为S中除去点u和v。对于顶点u,u在S'的正邻居数dS'+(u)等于dS+(u)–1;对于顶点v,v在S'的负邻居数dS'-(v)为|S|-1-dS+(v)。包含边(u,v)的最小正三角形的数量出现在极端情况下,即S'中v的负邻居被S'中u的正邻居覆盖。因此,未被v的负邻居覆盖的u的正邻居是它们共同的正邻居,即它们形成正三角形,则包含边(u,v)的正三角形个数不小于dS'+(u)-dS'-(v)。所以,在S中包含边(u,v)的正三角形的个数需大于等于dS'+(u)-dS'-(v)。而dS'+(u)-dS'-(v)等于(dS+(u)–1)–(|S|-1-dS+(v))。同样地,(dS+(u)–1)–(|S|-1-dS+(v))等于dS+(u)+dS+(v)-|S|,而dS+(u)+dS+(v)-|S|又大于等于2×(|S|+θ-1)/2-|S|,2×(|S|+θ-1)/2-|S|与θ-1相等。引理得证。

引理3:基于边的修剪规则:对于有符号θ团S中的两个顶点u和v,它们相连的边(u,v)为负边,则该边至少被包含在(θ+1)个负三角形中,所述负三角形为两条边为正边,另一条边为负边的三角形;

证明:与引理2证明方法类似,由于S是有符号θ团,我们可以得到dS+(u)=dS+(v)≥(θ+|S|-1)/2。同时,我们将S'定义为S中除去点u和v。对于顶点u,u在S'的正邻居数dS'+(u)等于dS+(u)。对于顶点v,v在S'的负邻居数dS'-(v)为dS-(v)-1。而dS-(v)-1等于|S|-dS+(v)–2。而包含边(u,v)的负三角形的个数需大于等于dS'+(u)-dS'-(v)。所以,在S中包含边(u,v)的负三角形的个数需大于等于dS+(u)–(|S|-2-dS+(v))。而dS+(u)–(|S|-2-dS+(v))大于等于2×(|S|+θ-1)/2-|S|+2。同样地,2×(|S|+θ-1)/2-|S|+2与θ+1相等。引理得证。

高效的挖掘符号网络中最大有符号θ团的算法(MSCD算法),基于以上三种新颖的修剪策略,如图1所示,具体包括以下步骤:

步骤一,根据引理1过滤图G中不满足条件的顶点,得到新的图G'。

步骤二,根据引理2判断图G'中正边所在的正三角形的数量,根据引理3判断图G'中负边所在的负三角形的数量,将不满足条件的边从图G'中删去,从而得到新的图A。

步骤三,移除图A中孤立的点。

步骤四,使用着色算法贪心地将图A中的点着色;具体地:迭代地从图A中选择邻居数量最大的顶点并为其分配颜色,如果当前选择的顶点与有颜色的顶点相邻,为其分配一种与其相邻顶点不同的颜色。

步骤五,在步骤四着色后的图A中,根据递归算法找到最大有符号θ团MaxC,即待挖掘的符号网络子图。具体地,调用递归算法寻找分支中是否存在有符号θ团,递归算法接收两个输入参数{S,C},其中S是临时结果集,初始为空集,C是待加入S的候选点集,初始为图A,并初始化最终结果MaxC为空集,递归算法的具体实现如下:

(a)如果集合S中点的数量与C中着色的点的颜色种类数量之和小于|MaxC|+1和θ+1的最大值,则返回0,并执行步骤(d),否则执行(b),其中,|MaxC|表示MaxC中顶点的数量;

(b)如果C为空集,则对于S中任意的点u,如果它的正邻居数量与负邻居数量之差大于等于θ,则将MaxC更新为S,并返回1,否则返回0,并执行步骤(d);

(c)如果C不为空集,对于S中的某点u,如果u的正邻居数量与u的正邻居着色的点的颜色种类数量之和小于u的负邻居数量与θ之和,则返回0,并执行步骤(d);

(d)设置flag为0,将C中的每个点根据其拥有的邻居数量进行升序排序,在完成升序排序后,依次遍历排序后的点;对于遍历的点v,将输入参数S更新为在S中加入点v,将输入参数C更新为点v在C中的邻居集合,并返回执行步骤(a)-(c),将flag更新为当前flag值与返回结果相加,并将v从C中移除,执行步骤(e)-(f);

(e)若flag等于0,则对于S中任意的点u,如果u的正邻居数量与负邻居数量之差小于θ,则返回1,并执行步骤(d),否则执行步骤(f);

(f)若S中点的数量大于|MaxC|,则将MaxC更新为S,并返回1,否则返回0,并执行步骤(d)。

图2是本发明实施例提供的原始符号网络的示意图,其中实线表示两个顶点之间为朋友关系,虚线表示两个顶点之间为敌人关系。若输入的θ为2,则根据本发明实施例提供的根据原始符号网络挖掘的最大有符号θ团为{点1,点2,点3,点4,点5},如图3所示。

此外,本发明在八个真实世界的社交网络上进行了广泛的实验,以评估所提出方法的有效性和高效性。为了评估所提出方法的性能,我们通过改变参数θ进行实验。本发明用算法消耗时间来衡量所提出方法的高效性。对于每个设置,本发明运行10次并取平均值。所有程序均在标准的c++中实现,所有实验均在配备Intel i5-9600KF 3.7GHz CPU和64GBRAM主内存的PC上进行。实验表明,本发明提出的方法比基础的贪心算法快118倍。

在一个实施例中,提出了一种计算机设备,包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行上述各实施例中一种挖掘符号网络中最大有符号θ团的方法中的步骤。

在一个实施例中,提出了一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述各实施例中一种挖掘符号网络中最大有符号θ团的方法中的步骤。其中,存储介质可以为非易失性存储介质。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁盘或光盘等。

以上所述仅是本发明的优选实施方式,虽然本发明已以较佳实施例披露如上,然而并非用以限定本发明。任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何的简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。

完整详细技术资料下载
上一篇:石墨接头机器人自动装卡簧、装栓机
下一篇:一种基于智能事件处理的集控站设备监控系统及控制方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!