一种基于场景特征的动态ip定位聚类方法
技术领域
本发明涉及IP定位领域,具体而言,涉及了一种基于场景特征的动态IP定位聚类方法。
背景技术
IP定位技术,是通过设备的IP地址来确定其地理位置的技术手段。超高精度的IP定位技术应用领域非常广泛,政府部门通过该服务可以对人民的网络行为进行社区粒度的舆情分析,从而充分地了解民意,做出更加利国利民的政策;安全部门通过该服务能够获取网络攻击的源目标位置,提升网络安全防御能力;商业端的在线支付通过该服务可以实现用户异地登录预警,提升交易的安全性。根据IP的区域性分布特性,IP可分为动态和静态分布两种状态。静态IP,在一个固定时间段内,该类IP将固定在一个地方使用;如,学校使用的IP,这些IP将长时间在学校范围内使用。动态IP,在一段时间内,动态地分布在一个或多个相邻区域且被共享使用;如,住宅用IP,在若干个相邻小区范围内共享使用。
现在IP定位产品大多是将IP定位到具体的地理位置,将IP与经纬度做绑定。一般定位精度有定到国家、省份、城市,甚至是街道。但是这种单点IP定位方式并不能客观反映一些IP真实的地理位置。从动态IP的分配使用方面分析可知,对移动网络、住宅用户、WLAN等典型NET端口转换的IP,传统的单点定位方式容易造成定位偏差大,不能客观地反映动态IP的真实位置。
发明内容
为了解决背景技术中所存在的问题,本发明提出了一种基于场景特征的动态IP定位聚类方法。
一种基于场景特征的动态IP定位聚类方法,包括
步骤1、获取一段时间内多个数据源的IP位置分布情况,形成IP历史基准点数据;
步骤2、基于获取到的IP历史基准点数据,根据静态IP和动态IP分布特征,筛选出动态IP的历史基准点数据;
步骤3、使用聚类算法对历史基准点数据进行聚类,实现对动态IP的定位。
基于上述,步骤1中,通过分布式网络爬虫技术和人工采集的方式,获取一段时间内的IP地理位置分布情况,形成IP历史基准点数据。
基于上述,步骤2中,首先,分析动态IP和静态IP的分布特征,动态IP基准点数据的地理分布特征为单个IP的历史位置分布分散,所在C块下的不同IP历史位置分布相似,相邻C块的历史位置分布相似;静态IP基准点数据的地理分布特征为单个IP的历史位置分布集中,所在C块下不同IP的历史位置分布距离较远;其次,基于获取到的IP历史基准点数据,根据静态IP和动态IP分布特征,筛选出符合动态IP基准点数据的地理分布特征。
基于上述,步骤3中,针对一个或若干个基准点地理位置分布相似的IP块,使用基于密度的DBSCAN聚类方法对它们的历史基准点数据进行聚类,聚类结果以一个中心位置的经度、纬度和对应的半径表示,从而得到动态IP的中心点和聚类边界,实现对动态IP的定位。
本发明相对现有技术具有突出的实质性特点和显著的进步,具体的说,本发明通过基于动态IP在一段时间内的历史分布情况,使用聚类算法进行聚类,得出动态IP真实位置的分布范围,形成一个中心位置的经度、纬度和对应的半径,实现对动态IP的定位,解决了IP定位产品无法对多动态IP进行准确定位的问题。
附图说明
图1是一个动态IP块的历史基准点分布情况和聚类结果图。
在图1中,1)倒水滴状的点表示历史准点数据;2)圆圈表示聚类结果。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种基于场景特征的动态IP定位聚类方法,以对一个动态IP块的处理为例进行说明。
步骤1、获取一段时间内多个数据源的IP位置分布情况,形成IP历史准点数据。
通过分布式网络爬虫技术和人工采集的方式,获取一段时间内的IP地理位置分布情况,得到了如图1中倒水滴状的点所示的地理位置分布情况。
步骤2、基于获取到的IP历史基准点数据,根据静态IP和动态IP分布特征,筛选出动态IP的历史基准点数据。
基于图1中IP块下历史基准点数据的分布特征,将该IP作为动态IP筛选出来。
步骤3、使用聚类算法对历史基准点数据进行聚类,实现对动态IP的定位。
针对图1中所示的动态IP块,使用基于密度的DBSCAN聚类方法对它们的历史基准点数据进行聚类,聚类结果以一个中心位置的经度、纬度和对应的半径表示,如图1中的圈所示的聚类结果,实现对动态IP的定位。对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。