一种基于贝叶斯网络的交通路网动态预测方法及系统
技术领域
本发明涉及城市交通
技术领域
,特别是涉及一种基于贝叶斯网络的交通路网动态预测方法及系统。背景技术
随着经济的快速发展和城镇化进程的推进,我国机动车保有量呈现快速增长趋势。不断增加的车辆数量,使得城市交通拥堵现象日益严重。交通拥堵产生的本质是交通通行能力需求量和供给量的不平衡,为改善拥堵现状,一方面可以通过加强基础道路的建设增加交通通行能力的供给量,另一方面可以采取相关的车辆限制措施减少交通通行能力的需求量,通过增加供给量和减少需求量两个方向来平衡需求量和供给量。在大城市有限的土地空间限制下,进行城市基础道路建设具有一定难度。尽管世界各大城市都在不断投入资金进行城市交通基础设施建设,但从目前的结果来看,城市交通基础设施建设的速度远远落后于城市交通通行能力需求量的增长。在经过多方面尝试之后,越来越多的研究机构和政府部门把治理交通拥堵的希望放在了采取合理的交通控制方法方向上,希望通过用更加合理的资源调配方法来解决交通拥堵。
合理的调配资源就要对交通系统有更加清晰准确的认识,需要交通管理部门在调配中及时发现可能造成交通拥堵的交通流变化,识别城市路网中的容易发生交通拥堵的脆弱路段,在有限的交通调控投入下保证调控收益最大化。针对以上这些交通控制的需求,迫切需要更加智能高效的交通控制系统,智慧交通系统(Intelligent Traffic System,简称ITS)应运而生。智慧交通系统在2008 年由IBM首次提出,希望能够运用先进信息、通信、传感、控制及计算机技术在城市路网乃至更大的范围内建立起实时、高效、准确的综合交通控制系统。智慧交通系统一经提出就受到世界各国的广泛关注。
准确的交通流预测是智慧交通系统感知交通系统运行状态、制定短时交通管制措施、发挥交通基础设施效能、提升交通系统运行效率的关键所在。道路的短时交通流预测是智慧交通系统研究的核心部分之一。短时交通流是人、车、路相互作用的复杂系统,并且系统的各个部分相互作用、相互耦合,呈现出高度的非线性,时变性和不确定性,增大了短时交通流预测的难度。
发明内容
基于此,本发明的目的是提供一种基于贝叶斯网络的交通路网动态预测方法及系统,提高城市交通路网预测的精度。
为实现上述目的,本发明提供了如下方案:
一种基于贝叶斯网络的交通路网动态预测方法,包括:
采集预测范围内设定时间的交通路网的车流信息,形成预测范围内每个路段的交通状态量的时间序列;所述预测范围为需要预测的交通路网的范围;
对所述时间序列进行相关性分析,确定训练集;
通过所述训练集对贝叶斯网络结构进行训练,得到预测模型;
基于所述预测模型对预测范围内不同时延下各路段进行预测,得到不同时刻各路段的预测结果;所述预测结果为各路段的交通状态量;
根据所述预测结果,确定不同时延下交通路网中可预测的路段,得到最大连通子团;
确定所述最大连通子团的相变时刻,为交通路网的可预测时延;
基于所述交通路网的可预测时延,确定交通路网动态预测结果。
可选地,所述对所述时间序列进行相关性分析,确定训练集,具体包括:
基于所述时间序列,计算不同时间延迟下预测目标路段和预测范围内所有路段的皮尔逊相关性系数;
选取皮尔逊相关性系数大于设定阈值的时间序列为训练集。
可选地,所述基于所述预测模型对预测范围内不同时延下各路段进行预测,得到不同时刻各路段的预测结果,具体包括:
计算不同延迟下各路段的预测联合矩阵,所述预测联合矩阵由所述预测模型的父代结构和子代结构确定;所述父代结构为训练集,所述子代结构为预测结果;
确定各所述预测联合矩阵的最优分布数;
分别将各所述预测联合矩阵和所述最优分布数输入到混合高斯分布模型中,计算得到不同延迟下的预测结果。
可选地,所述确定各所述预测联合矩阵的最优分布数,具体包括:
计算各所述预测联合矩阵的不同分布数的赤池信息量;
选取赤池信息量最小的分布数作为最优分布数。
本发明还提供了一种基于贝叶斯网络的交通路网动态预测系统,包括:
采集模块,用于采集预测范围内设定时间的交通路网的车流信息,形成预测范围内每个路段的交通状态量的时间序列;所述预测范围为需要预测的交通路网的范围;
训练集确定模块,用于对所述时间序列进行相关性分析,确定训练集;
训练模块,用于通过所述训练集对贝叶斯网络结构进行训练,得到预测模型;
预测模块,用于基于所述预测模型对预测范围内不同时延下各路段进行预测,得到不同时刻各路段的预测结果;所述预测结果为各路段的交通状态量;
最大连通子团确定模块,用于根据所述预测结果,确定不同时延下交通路网中可预测的路段,得到最大连通子团;
相变时刻确定模块,用于确定所述最大连通子团的相变时刻,为交通路网的可预测时延;
交通路网动态预测结果确定模块,用于基于所述交通路网的可预测时延,确定交通路网动态预测结果。
可选地,所述训练集确定模块具体包括:
皮尔逊相关性系数计算单元,用于基于所述时间序列,计算不同时间延迟下预测目标路段和预测范围内所有路段的皮尔逊相关性系数;
选取单元,用于选取皮尔逊相关性系数大于设定阈值的时间序列为训练集。
可选地,所述预测模块具体包括:
预测联合矩阵计算单元,用于计算不同延迟下各路段的预测联合矩阵,所述预测联合矩阵由所述预测模型的父代结构和子代结构确定;所述父代结构为训练集,所述子代结构为预测结果;
最优分布数确定单元,用于确定各所述预测联合矩阵的最优分布数;
输入单元,用于分别将各所述预测联合矩阵和所述最优分布数输入到混合高斯分布模型中,计算得到不同延迟下的预测结果。
可选地,所述最优分布数确定单元具体包括:
赤池信息量计算子单元,用于计算各所述预测联合矩阵的不同分布数的赤池信息量;
选取子单元,用于选取赤池信息量最小的分布数作为最优分布数。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明基于相关性分析在路网全部范围内筛选贝叶斯网络预测模型的父代,可以更好的在预测范围内筛选相关关系更强的父代,将路网中的长距离相关关系也纳入父代选择范围内,使贝叶斯网络的子代父代结构在时空上具有更好的解释性。其次,本发明采用了求解最大连通子团的算法找到了路网在随着时间延迟不断减小的过程中预测路网最大连通子团的相变点,挖掘出路网最优的可预测时间延迟,为城市交通路网整体预测提供了一个优化后的最佳可预测时间延迟。本发明所提出的预测路网最大连通子团的相变点,可以有效的解决在城市交通路网中预测车流信息选择提前预测时长的问题,使得能够对于城市交通路网预测有一个更为精准的把握,给城市交通路网预测提供了更好的参照指标。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例基于贝叶斯网络的交通路网动态预测方法的流程图;
图2为预测最大子团精度曲线变化示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种基于贝叶斯网络的交通路网动态预测方法及系统,提高城市交通路网预测的精度。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,一种基于贝叶斯网络的交通路网动态预测方法包括以下步骤:
步骤101:采集预测范围内设定时间的交通路网的车流信息,形成预测范围内每个路段的交通状态量的时间序列;所述预测范围为需要预测的交通路网的范围。
采集预测范围内一段时间的交通网络路段的车流信息,包括车流速度、车流密度、车流流量。其具体内容包括:
(1)确定需要预测的交通网络的范围:统计需要预测的交通网络的经纬度范围,以及其中的路段数量,路段之间的拓扑结构以及路段的道路信息,包括路段长度、道路等级以及路段起始点的经纬度坐标。
(2)采集预测范围内一段时间的交通网络路段的车流信息,形成预测范围内每个路段的交通状态量的时间序列:
对(1)中的每一个路段,采集一定时间内的车流信息,包括车流速度,车流密度以及车流流量,对有缺失的路段进行数据补偿,具体的补偿方法在交通领域已有公知技术和文献支持,此处不再赘述。补偿后形成每一个路段每一个车流信息量的相同长度的时间序列。
步骤102:对所述时间序列进行相关性分析,确定训练集。具体的:基于所述时间序列,计算不同时间延迟下预测目标路段和预测范围内所有路段的皮尔逊相关性系数;选取皮尔逊相关性系数大于设定阈值的时间序列为训练集。
(1)进行相关性分析:皮尔逊相关性系数是用来衡量两个变量之间的相关程度。首先选择一个合适的时间延迟,对于短时预测可以选择10个时间步长作为时间延迟。对于每一个路段的每一个车流信息的时间序列,取t0作为需要预测的时间点,t0时刻需要预测的路段c1的时间序列记为则有t0-n时刻某一个路段ck的时间序列为计算预测目标路段和预测区域内所有路段在不同时间延迟下的皮尔逊相关性系数。
(2)确定预测模型的贝叶斯网络结构:根据(1)中得到的皮尔逊相关性系数,确定一个合适的阈值筛选出贝叶斯网络的父代,确定贝叶斯网络子代和父代的结构关系。
这里“父代”是指贝叶斯网络模型中需要筛选出作为输入信息的路网过去时间段的一些路段的时间序列,“子代”是指贝叶斯网络模型中作为预测目标的路网中的一个路段。为方便计算,一般一个路段只选取至多不超过30个父代,不同的路段父代数量可以不同,但需要均高于给定阈值。给定的阈值由具体区域计算出的皮尔逊相关性系数实际情况确定,一般不低于0.3。根据给定的父代数量限制和给定的阈值限制确定出每个子代的父代数量、父代位置以及每个父代出现的时间,形成预测模型的贝叶斯网络子代和父代的结构。
步骤103:通过所述训练集对贝叶斯网络结构进行训练,得到预测模型。
步骤104:基于所述预测模型对预测范围内不同时延下各路段进行预测,得到不同时刻各路段的预测结果;所述预测结果为各路段的交通状态量。具体包括:
步骤1041:计算不同延迟下各路段的预测联合矩阵,所述预测联合矩阵由所述预测模型的父代结构和子代结构确定;所述父代结构为训练集,所述子代结构为预测结果;
步骤1042:确定各所述预测联合矩阵的最优分布数;
步骤1043:分别将各所述预测联合矩阵和所述最优分布数输入到混合高斯分布模型中,计算得到不同延迟下的预测结果。
原理如下:
(1)预测路段中每一个路段:首先,根据步骤102中得到的贝叶斯网络子代父代结构,将父代的时间序列与子代的时间序列写成形成预测联合矩阵,这里,针对每一个需要预测的子代,因为在不同的时间延迟下多次预测的需要,需要把父代按着预测时间延迟由早到晚进行排列,形成十个预测矩阵,在形成最早预测时间延迟的联合矩阵时,只把具有最早的预测时间延迟的父代和子代写入联合矩阵,在形成之后的预测时间延迟下的联合矩阵时,依次加入其他预测时间延迟的父代,形成十个父代依次增多的预测联合矩阵;其次,针对每一个预测联合矩阵,需要确定该预测联合矩阵进行混合高斯分布拟合的分布数,分布数的确定原则如下:针对每一个预测联合矩阵,计算不同分布数下父代子代预测联合矩阵的赤池信息量(AIC),这里,不同的分布数一般指1到10,时间序列的长度作为观测数目,分布数作为参数数目,计算不同分布数的赤池信息量,选取赤池信息量最小的分布数作为最优分布数;最后,将得到的预测联合矩阵和最优分布数输入到混合高斯分布拟合模型中,得到拟合后的子代父代多维联合分布。
根据拟合后得到子代父代的多维联合分布,可以根据贝叶斯原理,可以通过联合概率分布以及父代的概率分布写出在子代的条件概率分布:
通过此公式可以得到子代的条件概率分布,输入子代的父代信息作为先验条件,取条件概率的期望即为在此条件下目标子代的预测值,即可计算得到预测目标值。
(2)得到不同预测时间延迟下该路段的预测结果:针对每一个路段,得到了不同延迟下的预测矩阵,分别将每个预测矩阵和最优分布数输入到混合高斯分布模型中,计算得到不同延迟下的预测结果,对比真实结果得到该预测时间延迟下的预测精度,把预测精度按时间延迟排序并画出预测精度曲线。
步骤105:根据所述预测结果,确定不同时延下交通路网中可预测的路段,得到最大连通子团。
(1)确定不同预测时延下路网中可预测的路段,在不同的预测时间延迟下求解路网最大子团:根据步骤104,得到整个路网每一个路段在不同时间延迟下的预测结果,部分路段父代出现较早,在较早时刻就有预测结果,部分路段父代出现较晚,在比较晚的时刻才有预测结果,针对每一个不同预测时间延迟下的路网,将有预测结果的路段标记为可预测路段,没有预测结果的路段标记为不可预测的路段,并将不可预测路段在此时间延迟下的路网中删去,在删去不可预测节点的路网中利用求解最大连通子团算法寻找到此预测时间延迟下的路网最大连通子团。
这里的“删去”是指在此预测时延下的路网拓扑结构中删去不可预测路段以及所有连边均为不可预测路段的节点,“最大连通子团”是指在删去网络中一定节点后,剩余仍能保持互相到达的连通节点集合。
步骤106:确定所述最大连通子团的相变时刻,为交通路网的可预测时延。
步骤107:基于所述交通路网的可预测时延,确定交通路网动态预测结果。
找到路段最大子团的相变时刻,确定路网整体的可预测时延,得到路网的预测结果:求解完不同预测时延下的路网最大连通子团,与预测时刻t0时刻的最大连通子团进行对比计算精度,得到不同预测时延下路网最大连通子团的预测精度,根据预测时延的变化绘制路网最大连通子团的预测曲线(如图2所示),在曲线中找到路网最大子团预测精度相变的时刻点,作为路网整体可预测相变的起始点,得到路网整体的可预测时延,路网整体可预测时延以及路网最大连通子团的预测变化曲线作为路网的预测结果。
本发明还提供了一种基于贝叶斯网络的交通路网动态预测系统,包括:
采集模块,用于采集预测范围内设定时间的交通路网的车流信息,形成预测范围内每个路段的交通状态量的时间序列;所述预测范围为需要预测的交通路网的范围;
训练集确定模块,用于对所述时间序列进行相关性分析,确定训练集;
训练模块,用于通过所述训练集对贝叶斯网络结构进行训练,得到预测模型;
预测模块,用于基于所述预测模型对预测范围内不同时延下各路段进行预测,得到不同时刻各路段的预测结果;所述预测结果为各路段的交通状态量;
最大连通子团确定模块,用于根据所述预测结果,确定不同时延下交通路网中可预测的路段,得到最大连通子团;
相变时刻确定模块,用于确定所述最大连通子团的相变时刻,为交通路网的可预测时延;
交通路网动态预测结果确定模块,用于基于所述交通路网的可预测时延,确定交通路网动态预测结果。
其中,所述训练集确定模块具体包括:
皮尔逊相关性系数计算单元,用于基于所述时间序列,计算不同时间延迟下预测目标路段和预测范围内所有路段的皮尔逊相关性系数;
选取单元,用于选取皮尔逊相关性系数大于设定阈值的时间序列为训练集。
其中,所述预测模块具体包括:
预测联合矩阵计算单元,用于计算不同延迟下各路段的预测联合矩阵,所述预测联合矩阵由所述预测模型的父代结构和子代结构确定;所述父代结构为训练集,所述子代结构为预测结果;
最优分布数确定单元,用于确定各所述预测联合矩阵的最优分布数;
输入单元,用于分别将各所述预测联合矩阵和所述最优分布数输入到混合高斯分布模型中,计算得到不同延迟下的预测结果。
其中,所述最优分布数确定单元具体包括:
赤池信息量计算子单元,用于计算各所述预测联合矩阵的不同分布数的赤池信息量;
选取子单元,用于选取赤池信息量最小的分布数作为最优分布数。
本发明以贝叶斯网络和求解最大连通子团算法为基础,旨在通过贝叶斯网络建立起交通路网预测模型对交通路网进行预测,同时运用求解最大连通子团算法在不同预测时延的交通路网上求解该时刻路网最大子团,进而得到路网整体的可预测时间延迟,从而解决城市交通路网预测选择时间延迟的问题,得到最优的路网提前预测时长,提升城市路网整体的可预测性。本发明的优点在于:首先,经典的城市路网贝叶斯网络预测方法选择历史数据主要选择距离预测目标较近的路段以及相应路段的历史信息作为输入信息训练预测模型,这样每一个路段的可预测时延均是一致,这样的方法没有考虑到不同的路段在时间和空间维度上的影响力可能不同,不具有很好的物理层面的解释性和不同路段之间的差异性,更忽略了交通网络中的长距离相关关系。而本发明基于相关性分析在路网全部范围内筛选贝叶斯网络预测模型的父代,可以更好的在预测范围内筛选相关关系更强的父代,将路网中的长距离相关关系也纳入父代选择范围内,使贝叶斯网络的子代父代结构在时空上具有更好的解释性。其次,本发明采用了求解最大连通子团的算法找到了路网在随着时间延迟不断减小的过程中预测路网最大连通子团的相变点,挖掘出路网最优的可预测时间延迟,为城市交通路网整体预测提供了一个优化后的最佳可预测时间延迟。尤其是本文所提出的预测路网最大连通子团的相变点,可以有效的解决在城市交通路网中预测车流信息选择提前预测时长的问题,使得能够对于城市交通路网预测有一个更为精准的把握,给城市交通路网预测提供了更好的参照指标。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
- 上一篇:石墨接头机器人自动装卡簧、装栓机
- 下一篇:基于智慧城市的城市交通数据采集方法及系统