一种基于ip历史位置的静态ip楼宇级定位方法
技术领域
本发明涉及IP定位领域,具体而言,涉及了一种基于IP历史位置的静态IP楼宇级定位方法。
背景技术
近年来,IP地址定位技术受到越来越多的关注,目前在互联网行业基于位置的服务已经成为趋势,基于地理位置的网络应用层出不穷,IP地址定位已广泛应用于网络安全、在线安全支付、大数据分析、反欺诈风控、大数据征信等领域。高精准IP地址定位技术在互联网领域中越来越重要。许多研究机构和学者已围绕如何提升IP地址定位技术的定位精度、应用场景等不同问题进行了系统的研究。
目前,IP定位产品大多是将IP定位到宽泛或具体的地理位置,定位精度有国家、省份、城市或者是街道,针对静态IP而言还无法做到楼宇级别的定位,存在数据陈旧、定位颗粒度粗糙(大多仅能达到城市级别)等问题。
发明内容
为了解决背景技术中所存在的问题,本发明提出了一种基于IP历史位置的静态IP楼宇级定位方法。
一种基于IP历史位置的静态IP楼宇级定位方法,包括
步骤1、利用大数据处理技术,采集并清洗IP的历史基准点数据;
步骤2、筛选静态IP的历史基准点数据;
步骤3、使用聚类算法对IP的历史基准点数据进行聚类处理,实现对静态IP的定位。
基于上述,步骤1中,利用大数据处理技术,搭建分布式的数据采集平台,对不同的数据源采用定制化的采集策略,采集至少包括WHOIS类型、主机名类型、移动APP类型和网站WEB类型的历史基准点数据。
基于上述,步骤1中,根据数据特征的来源,设定特定的清洗规则,对初始采集的历史基准点数据进行清洗过滤,以得到有效的基准点数据。
基于上述,步骤2中,从清洗得到的历史基准点数据中,根据历史基准点数据的分布特征,筛选应用场景为静态IP类型的历史位置数据;静态IP类型的应用场景至少包括学校单位和企业专线。
基于上述,步骤3中,针对每个IP,使用以距离远近来聚类的聚类算法,对每个IP的历史基准点数据进行聚类,聚类结果以一个中心位置的经度、纬度和对应的半径表示,实现对静态IP的楼宇级定位。
基于上述,所述聚类算法至少包括K-MEANS算法、DBSCAN算法和均值飘逸聚类算法中一种或多种。
本发明相对现有技术具有突出的实质性特点和显著的进步,具体的说,本发明结合IP的网络特征和地理特征,使用聚类算法对静态IP的历史位置信息进行聚类,形成一个中心位置的经度、纬度和对应的半径,实现对静态IP的楼宇级的定位。
附图说明
图1是本发明一个实例的静态单IP的历史基准点分布和聚类结果示意图。
图中,1)倒水滴状的点表示历史基准点数据;2)圆圈表示聚类结果。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种基于IP历史位置的静态IP楼宇级定位方法,以对一个静态IP的处理为例进行说明。
步骤1、利用大数据处理技术,采集并清洗IP的历史基准点数据。
首先,利用大数据处理技术,搭建基于高效的、分布式的数据采集平台,对不同的数据源采用定制化的采集策略,采集WHOIS类型、主机名类型、移动APP类型和网站WEB类型等类型的基准点数据。针对指定的IP,利用大数据处理技术,采集其对应的WHOIS数据和相关的WEB数据,并通过地图服务将WHOIS数据和WEB数据中的地理位置信息转换成经纬度信息,形成WHOIS类型和WEB类型的历史基准点数据;同时,从采集到的APP类型数据中,提取该IP的历史位置数据,形成APP类型的历史基准点数据。
其次,针对得到的历史基准点数据,根据不同来源的数据特征,使用特定的清洗规则,对初始的基准点数据进行清洗过滤,得到指定IP的有效基准点数据。例如,对于WHOIS类型基准点,根据IP注册机构的类型、地域、历史信息变动次数以及登记的时间等指标,确定WHOIS基准点的可用度,选取在注册机构类型、地域、历史信息变动次数和登记时间方面满足要求的基准点。
步骤2、筛选静态IP的历史基准点数据。
从清洗得到的历史基准点数据中,根据历史基准点的分布特征,筛选应用场景为静态IP类型的历史位置数据。静态IP类型的应用场景包含学校单位和企业专线等,其基准点的地理分布特征表现为:单个IP历史基准点集中,相邻IP段甚至一个IP段中不同IP的历史基准点地理分布相对独立。根据静态IP单个IP历史基准点集中的特征如图1中的基准点分布情况,筛选静态IP。
步骤3、使用聚类算法对历史基准点数据进行聚类,实现对静态IP的定位。
针对该静态IP,使用DBSCAN聚类算法对其历史基准点数据进行聚类,聚类结果以一个中心位置的经度、纬度和对应的半径表示,实现对静态IP的楼宇级定位。在其他实施例中还可以采用K-MEANS算法、DBSCAN算法和均值飘逸聚类算法等聚类算法。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。