一种公共交通重点区域识别方法、装置及电子设备
技术领域
本发明涉及交通分析
技术领域
,具体而言,涉及一种公共交通重点区域识别方法、装置及电子设备。背景技术
随着城市发展规模的不断壮大,需要对城市公交线路进行合理规划以增加人们出行的便利性。为此,需要对城市的交通运行状态进行评价以便于对公交线路进行规划调整。但是,现有技术中,对公交线路的评价往往仅针对某一条公交线路的运行状态,难以反映高出行需求区域的公交状态。
发明内容
本发明解决的问题是如何识别高出行需求区域的交通状态。
为解决上述问题,本发明提供一种公共交通重点区域识别方法,包括:获取在客流聚集区域内采集到的出行链信息,其中,所述出行链信息包括多重出行方式的行程信息;依据不同的出行方式对所述出行链信息内的所述行程信息进行分类提取,获得各出行方式的出行指标;获取所有所述出行指标的权重值,基于所述权重值对各出行方式的所述出行指标进行加权求和获得综合出行指数;当所述综合出行指数满足预设条件时将所述客流聚集区域认定为重点区域。
可选地,所述获取客流聚集区域内采集到的出行链信息包括:获取设定区域内的总出行需求信息和楼宇位置信息;依据所述总出行需求信息和所述楼宇位置信息获得单个楼宇的需求量;以单个楼宇为样本、楼宇经纬度为聚类特征,通过层次聚类算法获得客流聚集的建筑群;将所述客流聚集的建筑群作为所述客流聚集区域。
可选地,所述获取客流聚集区域内采集到的出行链信息还包括:获取所述客流聚集的建筑群内的一个楼宇的需求量信息中的一个需求信息,其中,所述需求信息包括出行轨迹数据和出行方式;依据所述出行轨迹数据中轨迹点的分布情况获得出行目的地;将楼宇的位置作为起始位置、所述出行目的地作为为终点位置获得OD位置;将所述OD位置、所述出行方式进行集合获得所述出行链信息。
可选地,所述依据不同的出行方式对所述出行链信息内的行程信息进行分类提取,获得各出行方式的出行指标包括:获取所述出行链信息的OD位置;对所述OD位置进行公交线网导航,获得换乘次数、步行距离和公交出行时间;将所述换乘次数、所述步行距离和所述公交出行时间作为所述出行指标。
可选地,依据不同的出行方式对所述出行链信息内的行程信息进行分类提取,获得各出行方式的出行指标还包括:对所述OD位置进行驾驶导航,获得驾车出行时间,依据所述驾车出行时间、所述公交时间,获得公交/驾驶时耗比;将所述公交/驾驶时耗比作为所述出行指标。
可选地,所述获取所有所述出行指标的权重值包括:获取自适应更新模型、初始指标权重值和校正综合出行指数;将所述初始指标权重值输入所述自适应更新模型,以所述校正综合出行指数作为所述自适应更新模型的输出变量训练所述初始指标权重值;将训练后的所述初始指标权重值作为所述权重值。
可选地,所述自适应更新模型为线性回归模型。
可选地,所述获取所有所述出行指标的权重值,基于所述权重值对各出行方式的出行指标进行加权求和获得综合出行指数包括:基于所述权重值和各出行方式的出行指标按照下式确定所述综合出行指数:
;
其中,zone score 为综合出行指数,i为出行指标类别;Wi为第i种出行指标的权重值;Valuei为第i种出行指标。
与现有技术相比,本发明所述的公共交通重点区域识别方法具有的有益效果是:
本发明通过获取在客流聚集区域内采集到的出行链信息,避免了对区域内所有出行链信息进行获取,降低了片区内出行链信息的提取难度;通过所述综合出行指数可以以多个角度综合反映所述客流聚集区域的公共交通便捷程度,实现了对高出行需求区域的公交状态的识别,与现有技术仅通过公交线路的拥堵程度反映交通便捷情况的方式相比,对区域内的公共交通便捷情况的反映更为准确;而且通过当所述综合出行指数大于设定值时将所述客流聚集区域识别为重点区域,可以实现对交通便捷程度低的客流聚集区域进行识别,为公交网路优化提供准确的地点。
本发明还提供一种公共交通重点区域识别装置,包括:获取模块,用于获取在客流聚集区域内采集到的出行链信息和所有所述出行指标的权重值,其中,所述出行链信息包括多种出行方式的行程信息;分析模块,用于依据不同的出行方式对所述出行链信息内的所述行程信息进行分类提取,获得各出行方式的出行指标;确定模块,用于基于所述权重值对各出行方式的出行指标进行加权求和获得综合出行指数;判断模块,用于当所述综合出行指数满足预设条件时,将所述设定区域认定为重点区域。所述公交重点区域识别装置具有所述公共交通重点区域识别方法具有的有益效果,在此不再赘述。
本发明还提供一种电子设备,包括存储有计算机程序的计算机可读存储介质和处理器,当所述计算机程序被所述处理器独取并运行时,实现如上所述的公共交通重点区域识别方法。所述电子设备具有所述公共交通重点区域识别具有的有益效果,在此不再赘述。
附图说明
图1为本发明实施例中的公共交通重点区域识别方法的流程框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
在本说明书的描述中,参考术语“实施例”、“一个实施例”和“一个实施方式”等的描述意指结合该实施例或实施方式描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示实施方式中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实施方式。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或实施方式以合适的方式结合。
本发明一实施例的一种公共交通重点区域识别方法,如图1所示,包括如下步骤:
S1,获取在客流聚集区域内采集到的出行链信息,所述出行链信息包括多种出行方式的行程信息;
S2,依据不同的出行方式对所述出行链信息内的所述行程信息进行分类提取,获得各出行方式的出行指标;
S3,获取所有所述出行指标的权重值,基于所述权重值对各出行方式的所述出行指标进行加权求和获得综合出行指数;
S4,当所述综合出行指数满足预设条件时将所述客流聚集区域识别为重点区域。
具体地,在S1中,所述客流聚集区域指的是客流高发生量或高吸收量的区域,所述出行链信息指的是用户采用一种或多种出行方式在一定时间范围内,完成从起始点到目的的出行过程,所述出行方式包括公交车出行、地铁出行、出租车出行、共享单车出行或网约车出行中的至少一种。在本实施方式中,根据出行方式的不同,出行链信息的获取来源也可能不同,例如,在一些实施方式中,居民可能选择驾车出行,这时,出行链信息可以来源于汽车上安装的行车记录仪或GPS导航仪等。
在本实施方式中,可以将城市划成多个片区,以片区为单位,采集该片区内的出行链信息,所述出行链信息可以通过手机信令数据、公交刷卡数据、出行导航数据、共享单车出行数据或打车数据等方式进行获取,通过对手机信令数据、公交刷卡数据、出行导航数据、共享单车出行数据或打车数据进行计算可以获取各小区的总出行需求量,以该总出行需求量较高的区域作为所述客流聚集区域。在其它的实施方式中,所述客流聚集区域还可以通过交通数据库或对卫星图像进行识别获得。由此,通过获取客流聚集区域内的出行链信息,可以降低片区内出行链信息的提取难度。
可选地,获取客流聚集区域内的采集到的出行链信息包括:获取设定区域内的总出行需求量和楼宇位置信息;依据所述出行需求量和所述楼宇位置信息获得单个楼宇的需求量;以单个楼宇为样本、楼宇经纬度为聚类特征,通过层次聚类算法获得客流聚集的建筑群;以所述客流聚集的建筑群作为所述客流聚集区域。
具体地,在获取设定区域内的总出行需求量和楼宇位置信息的步骤中,所述设定区域指的是将城市划分成多个片区中的任意一个片区。所述总出行需求量包括区域出行发生量和区域出行吸引量。所述区域出行发生量指的是从该片区出发,出行到其它区域的需求量之和。所述区域出行吸引量指的是从其它区域出发,出行到该区域的需求量之和。所述需求量之和可以通过对手机信令数据、公交刷卡数据、出行导航数据、共享单车出行数据或打车数据进行计算获得。所述楼宇位置信息可以通过对卫星图像进行识别获得或通过预设的数据库进行获取。所述楼宇位置信息包括楼宇的位置、类型和开发量信息。
在依据所述总出行需求量和所述楼宇位置信息获得单个楼宇的需求量的步骤中,将所述总出行需求量按楼宇的类型信息分别分配至单个楼宇上。以区域出行发生量为例,在相同类型的楼宇中,区域出行发生量的乘客的数量在各个楼宇的分布与建筑开发量呈正相关的关系。这里,可以将区域出行发生量为口径,按楼宇开发量等比分配到每栋楼宇。具体地,可以通过式(1)获得所述单个楼宇的需求量。
;(1)
式中,为单个楼宇的需求量;为片区内的总需求量,为单个楼宇开发量,为片区内的楼宇总开发量。
在其它的实施方式中,还可以以区域出行吸引量为口径,按楼宇开发量等比分配到每栋楼宇以获得单个楼宇的需求量。由此,通过将总需求量分为区域出行发生量和区域出行吸引量可以提高对片区出行需求的识别精度。
在以单个楼宇的需求量为样本、楼宇经纬度为聚类特征,通过层次聚类算法获得客流聚集的建筑群的步骤中,所述以单个楼宇的需求量为样本可以包括单个楼宇的总出行需求量、单个楼宇的出行发生量或单个楼宇的区域出行吸引量。所述楼宇经纬度可以通过卫星图像进行识别获取或通过获取预设数据库信息进行获取。以单个楼宇的需求量为一个样本,以所有楼宇的需求量作为样本集合,以所述样本集合和聚类数目作为输入所述层次聚类算法以获得客流聚集的建筑群。例如,将所述样本集合中的所有的样本归为一个类簇c,在同一个类簇c中计算两两样本之间的距离,设定距离判别式对样本之间的距离进行判别找到簇间平均距离样本a和簇间最近距离样本b;将样本a和样本b分别分配到不同的两个类簇(c1、c2)中,计算原类簇c中剩余的其它样本点和样本a,b的距离,设定距离阈值,如果其它样本点和样本a,b的距离满足设定距离阈值,则将样本点归到新的类簇中实现样本的聚类。所述距离阈值介于300m~600m之间,具体地,所述距离阈值可以为:300m、400m、500m或600m。
由此,通过以单个楼宇为样本、楼宇经纬度为聚类特征,通过层次聚类算法获得客流聚集的建筑群,可以使需求量的分析的精度达到楼宇级别,从而提高了交通重点区域的识别的精度,使后续对该区域的公交的优化更具针对性,提高效率。
可选地,通过层次聚类算法获得客流聚集的建筑群还包括,设定评估方程作为聚类评价指标,所述评估方程为:
metrics=;(2)
式中,i为聚类后所有簇中的一个簇;为第i个簇的总需求;:为第i个簇的总开发量。
由此,通过设定所述评估方程,对所述层次聚类算法输出的样本类簇进行评价,可以保证聚类后的每一个簇都能满足一定的出行需求量。
可选地,所述通过层次聚类算法获得客流聚集的建筑群还包括采用网格交叉验证算法迭代求解最优的聚类层次算法参数。所述网格交叉验证算法指的是,在所有候选的参数选择中,通过循环遍历,尝试每一种可能性,表现最好的参数就是最终的结果。例如,在所述层次聚类算法中,聚类阈值有4种参数,距离判别参数有3种参数,则把所有的聚类阈值和距离判别参数列出来,可以表示成一个3*4的表格,在表格里面的每个网格进行遍历、搜索获得最优的参数。由此,通过网络交叉验证算法的设置可以对所述层次聚类算法进行优化,增加所述层次聚类算法的适应性。
可选地,获取在客流聚集区域内采集到的出行链信息还包括:
获取所述客流聚集的建筑群内的一个楼宇的需求量信息中的一个需求信息,所述需求信息由居民的移动终端(例如手机)中进行获取,所述需求信息包括出行轨迹数据和出行方式,其中,所述轨迹数据可以由移动终端的GPS数据获得,所述出行方式可以依据移动终端的nfc刷卡信息或APP信息获得,例如,在居民出行中,当需要将出行方式更改为共享单车出行时,可以通过获取共享单车app的行程数据进行获取。根据所述出行轨迹数据内的轨迹点的分布情况可以获得居民长时间驻留的活动地点,以所述楼宇的位置为起点,居民长时间驻留的活动地点为终点获得所述OD位置,将所述OD位置、所述出行方式进行集合可以获得所述出行链信息。在其它的一些实施方式中,所述出行链信息可以为居民的出行行为的信息的集合,例如所述出行链信息还可以包括出行时间和出行路程。
具体地,在S2中,依据不同的出行方式对所述出行链信息内的所述行程信息进行分类提取,获得各出行方式的出行指标。可以采用预设的出行特征选择模型对所述出行链信息进行出行特征捕捉提取得到不同出行方式的行程信息。例如,在一条出行链中,居民从住所出发步行至公交站点,从公交站点乘坐公交车到地铁站转乘地铁,从地铁出来后骑行共享单车到目的地。通过出行特征提取模型对所述出行链信息进行特征提取可以获得居民出行的OD位置(即起始点位置和终点位置),公交出行方式的公交出行时间、整个行程的步行时间、步行距离、地铁出行方式的地铁出行时间、共享单车出行方式的共享单车骑行时间、共享单车骑行距离等出行指标。通过依据不同的出行方式对出行链信息内的行程信息进行分类提取,可以有效地获得各种出行方式的出行指标,通过对出行指标进行分析可以知道该地区的交通运行情况。例如,在一种实施方式中,可以通过获取公交的出行时间和出行距离,将出行距离和出行时间的比值作为出行指标可以反映出该区域居民的公交出行便捷程度。
可选地,所述出行指标包括:步行距离、公交出行时间、公交/驾驶时耗比、绕行次数、换乘次数、大于1km的共享单车出行量、小于5km出租车出行量或市民投诉量中的至少一种。
具体地,所述换乘次数指的是从出行到目的地,需要换乘的次数,所述换乘包括公交转公交的次数或从公交转地铁。所述步行距离指的是,从出行到目的地需要的步行距离。所述公交/驾驶时耗比指的是,从起始点到目的地,采用公交或地铁出行需要的时间和驾驶小车需要的时间的比值。所述绕行次数指一次出行中OD位置的实际行使距离和OD位置的直线距离,这里OD位置指的是起始位置和目标位置。所述大于1km的共享单车出行量指的是,从出行到目的地,骑行共享单车的路程大于1km的出行量。所述小于5km出租车出行量指的是,从出行到目的地,出租车路程大于1km的出行量。所述投诉量指的是每种出行方式中的所给出的不良评价。例如,可以通过在获取手机APP上的出行评价信息,以获得所述投诉量。由此,通过获取不同出行方式的所述出行指标,通过不同出行方式的所述出行指标来整体反映客流聚集区域的出行便捷程度,与仅通过公交线路的拥堵程度反映交通便捷情况的方式相比,更为准确。
可选地,所述出行指标还包括客流聚集区域内的总出行量和服务不佳出行量。所述总出行量为所有所述出行链之和,所述服务不佳出行量指的是换乘次数超过1次、绕行次数超过1.6、步行距离超过1km的出行链的数量之和。
可选地,所述依据不同的出行方式对所述出行链信息内的行程信息进行分类提取,获得各出行方式的出行指标包括:获取出行链中的OD位置;对所述OD位置进行公交线网导航,获得换乘次数、步行距离和公交出行时间,将所述换乘次数、所述步行距离和所述公交出行时间作为所述出行指标。
具体地,所述OD位置指的是出行的起始点位置和目的点位置,将所述OD位置输入所述公交线网导航系统进行导航,通过对公交导航路线的信息进行提取可以获得:从起始地到目的地的换乘次数、步行距离和公交出行时间。例如,在一条出行链信息中,用户从居住地出发坐公交,但由于用户过于疲劳而在公交上坐过站,然后又通过坐过公交车回到目的地,导致出行距离和出行时间的延长,而在整个出行链信息中,起始点位置和目的点位置是固定不变的,将起始点位置和目的点的位置输入公交导航系统内,可以获得真实的出行轨迹和出行时间。
由此,通过从出行链信息上提取OD位置,通过将所述OD位置输入所述公交线网导航系统进行导航,可以获得公交线网的实际出行轨迹,防止由搭错车、坐过站等因素导致换乘次数的增多或出行时间的延长,提高了容错率,增加了对区域公交便捷程度的识别准确度。
可选地,在所述将所述换乘次数、所述步行距离和所述公交出行时间作为所述出行指标之后还包括:对所述OD位置进行驾驶导航,获得驾车出行时间,依据所述驾车出行时间、所述公交出行时间,获得所述公交/驾驶时耗比。在本实施方式中,将所述OD位置输入所述小汽车驾驶导航系统进行导航,通过对小汽车驾驶导航路线的信息进行提取,可以获得驾驶出行的行程距离和小汽车行程时间,然后将所述公交车出行时间和所述小汽车出行时间的比值作作为所述出行指标。例如,在一条出行链信息中,通过公交车导航系统对所述OD位置进行导航可以获得公交出行的行程时间为30min,通过小汽车驾驶导航系统对所述OD位置进行导航可以获得小汽车出行的行程时间为20min,这时公交/驾驶时耗比为1.5。
由此,通过对所述OD位置进行驾驶导航,可以获得小汽车出行的出行时间,依据所述驾车出行时间、所述公交出行时间,获得所述公交/驾驶时耗比,可以通过所述公交/驾驶时耗比可以准确地反映出公交线路的实际绕行距离,从而增加了对区域公交便捷程度的识别准确度。
可选地,依据不同的出行方式对所述出行链信息内的行程信息进行分类提取,获得各出行方式的出行指标还包括:提取出行链信息中的获取出租车和/或共享单车的行程信息;对所述出租车和/或共享单车的行程信息进行分析获得大于1km出行距离的共享单车出行量和/或小于5km出行距离出租车出行量。具体地,通过获取出行链信息中的共享单车行程信息,采集共享单车的实时GPS数据,还原出共享单车的出行信息,对所述共享单车的出行信息进行分析可以获得客流聚集区域内的共享单车出行量,提取共享单车出行行程大于1km的共享单车出行量可以获得大于1Km的共享单车出行量出行指标。通过获取出行链信息中的出租车行程信息,采集出租车的实时GPS数据,还原出出租车的出行信息,对所述出租车的出行信息进行分析可以获得客流聚集区域内的出租车出行量,提取出租车出行行程大于5km的出租车出行量可以获得所述出租车出行行程大于5Km的出租车出行量出行指标。
由此,通过对所述大于1km出行距离的共享单车出行量和/或小于5km出行距离出租车出行量作为出行指标,可以将该部分的出行需求作为公交或地铁的竞争需求,一方面,可以提高对所述客流聚集区域中的公交便捷程度的识别准确度,另一方面,可以发展公交线网以替代大于1km出行距离的共享单车出行和/或小于5km出行距离出租车出行的需求,可以为该客流聚集区域中的公交线网优化提供方向。
具体地,在S3中,获取所有所述出行指标的权重值,基于所述权重值对各出行方式的出行指标进行加权求和获得综合出行指数。具体地,所述出行指标包括所述客流聚集区域内的总出行量、片区服务不佳出行量、出行时耗比、换乘次数、绕行系数、步行距离、大于1km自行车出行量、小于5km出租车出行量和投诉数量。所述权重值依据不同指标对所述客流聚集区域的交通便捷的影响程度获得。例如,在一种实施方式中,所述总出行量的权重值为1.35,所述片区服务不佳出行量的权重值为1.87,所述出行时耗比的权重值为1.01,所述换乘次数的权重值为1.20,所述绕行系数的权重值为0.84、所述步行距离的权重值为0.99,所述大于1km自行车出行量的权重值为0.81,所述小于5km出租车出行量的权重值为0.66,所述投诉数量的权重值为0.59。依据不同的所述出行指标的权重值,对不同的所述出行指标进行加权求和获得所述综合出行指数。由此,通过所述权重值的设置,可以依据所述权重值和不同的出行指标确定所述综合出行指数。
可选地,所述获取各出行方式的出行指标的权重值,基于所述权重值对各出行方式的出行指标进行加权求和处理获得综合出行指数包括:基于所述权重值对各出行方式的出行指标按照式(3)确定所述综合出行指数:
;(3)
其中,zone score 为综合出行指数,i为出行指标类别;Wi为第i种出行指标的权重值;Valuei为第i种出行指标。
可选地,获取所有所述出行指标的权重值,基于所述权重值对各出行方式的出行指标进行加权求和获得综合出行指数包括:获取自适应更新模型;将所述初始指标权重值输入所述自适应更新模型,以所述校正综合出行指数作为所述自适应更新模型的输出变量训练所述初始指标权重值;将训练后的所述初始指标权重值作为所述权重值。具体地,所述综合校正指数由同一城市内不同客流聚集区域的综合出行指数与实际公共交通便捷程度的符合程度而确定。或者可以通过专家校正的方式确定所述校正综合出行指数。在本实施方式中,将所有所述出行指标在求和前进行等权处理,即,所有所述出行指数的初始权重值相等。在本实施方式中,定期对所述权重值进行训练,将训练后的所述权重值对所述出行指标进行求和以定期更新所述综合出行指数。
可选地,所述自适应更新模型为:
(4)
式中,i为指标类别,value为指标数值, 为校正综合出行指数, 为指标权重值。在其它的实施方式中,所述自适应更新模型还可以为线性回归模型。
由此通过所述自适应更新模型对所述权重值进行自适应更新,可以优化所述权重值,使所述综合出行指数更为符合实际的公交出行便捷程度。
具体地,在S4中,当所述综合出行指数满足预设条件时将所述客流聚集区域认定为重点区域。例如,所述预设条件可以为设定值,当所述综合出行指数大于设定值时将所述客流聚集区域认定为重点区域,所述设定值可以由所述客流聚集区域的总需求出行量而定。例如,在一种实施方式中,当所述客流聚集区域内的总需求量为2万时,所述设定值介于18万和30万之间,具体地,所述设定值可以为18万、20万、23万、25万或30万。
这样设置的好处在于,通过获取客流聚集区域内的出行链信息,避免了对区域内所有出行链信息进行获取,降低了区域内出行链信息的提取难度;通过所述综合出行指数可以从多个角度综合反映所述客流聚集区域的公共交通便捷程度,实现了对高出行需求区域的公交状态的识别,与现有技术中仅通过公交线路的拥堵程度反映交通便捷情况的方式相比,对区域内的公共交通便捷情况的反映更为准确,通过当所述综合出行指数大于设定值时将所述客流聚集区域识别为重点区域,可以实现了对交通便捷程度低的客流聚集区域进行识别,为公交网路优化提供准确的地点。
本发明的另一实施例提供一种公共交通重点区域识别装置,包括:
获取模块,用于获取在客流聚集区域内采集到的各种出行方式的出行链信息和所有所述出行指标的权重值,其中,所述出行链信息包括多种出行方式的行程信息;
分析模块,用于依据不同的出行方式对所述出行链信息内的行程信息进行分类提取,获得各出行方式的出行指标;
确定模块,用于基于所述权重值对各出行方式的所述出行指标进行加权求和获得综合出行指数;
判断模块,用于当所述综合出行指数满足预设条件时将所述设定区域认定为重点区域。
本发明的另一实施例提供一种电子设备,包括存储有计算机程序的计算机可读存储介质和处理器,当所述计算机程序被所述处理器独取并运行时,实现如上所述的公共交通重点区域识别方法。
虽然本公开披露如上,但本公开的保护范围并非仅限于此。本领域技术人员在不脱离本公开的精神和范围的前提下,可进行各种变更与修改,这些变更与修改均将落入本发明的保护范围。
- 上一篇:石墨接头机器人自动装卡簧、装栓机
- 下一篇:一种基于自学习的通讯成功率预测方法及装置