一种基于控制信息的适用长时间预测的交通特征预测方法及系统
技术领域
本发明涉及智慧交通
技术领域
,尤其涉及一种基于控制信息的适 用长时间预测的交通特征预测方法及系统。背景技术
交通特征预测是一个经典的时间序列预测问题,根据历史交通状 况观测值来预测未来的交通状况。交通特征预测的准确性,影响交通 信号控制、交通导航等各方面应用。准确的交通预测可以增加交通决 策的有效性,从而更好地减少交通拥堵。然而,现有的交通特征预测 方法仍存在缺陷,具体表现为:1)在长时间的交通特征预测上效果 不容乐观,原因在于交通特征具有复杂的时空关系,且长时间预测的 误差会在每一步被放大;2)预测多从时间相关性、空间相关性等角 度,以往的相关研究通常从时间相关性或空间相关性角度,构建预测 交通特征与历史交通特征与相近区域交通特征之间的关系,忽略了控 制信息对交通特征预测值的影响。为了有效解决以上问题,设计一种 基于控制信息的适用长时间预测的交通特征预测方法及系统是很有 必要的。
发明内容
本发明为克服上述的不足之处,目的在于提供一种基于控制信息 的适用长时间预测的交通特征预测方法及系统,本发明将控制信息引 入交通特征预测中,分别处理交通速度、路网结构和交通控制数据; 并将上述数据分别送入神经网络,得到空间嵌入、时间嵌入和控制嵌 入,组合成综合嵌入;通过基于时空注意力机制模块的编码器、数据 转换模块和基于时空注意力机制模块的解码器,最终得到预测的交通 速度值。本发明提高了信控路网速度预测的有效性,能够更好地建模 动态的空间相关性和非线性的时间相关性,同时可以避免了误差累 积,以缓解误差传播效应,从而提高长时交通流预测性能,解决了适 用于长时间的交通预测的问题。
本发明是通过以下技术方案达到上述目的:一种基于控制信息的 适用长时间预测的交通特征预测方法,包括如下步骤:
(1)数据预处理模块获取交通第一特征、交通第二特征和交通第三 特征,并将其处理成时空数据嵌入模块的输入;其中所述的交通第一 特征为交通运行产生的具有时变性的特征数据,包括但不限于:交通 速度、流量、占有率、排队长度、拥堵指数;所述的交通第二特征为 交通运行所在环境的具有短时不变性的特征数据,包括但不限于:路 网结构、POI分布、交通基础设施分布;所述的交通第三特征为控制 交通运行产生的具有时变性的特征数据,包括但不限于:交通控制数 据、交通诱导数据、交通限行数据;
(2)时空数据嵌入模块将步骤(1)处理过的交通第一特征、交通第 二特征和交通第三特征分别送入神经网络,得到空间嵌入、时间嵌入 和控制嵌入,并将空间嵌入、时间嵌入和控制嵌入组合成综合嵌入;
(3)利用基于时空注意力机制模块的编码器处理编码步骤(2)得到 的综合嵌入;
(4)数据转换模块利用转移注意力机制,转换被编码的综合嵌入作 为解码器的输入;
(5)利用时空注意力机制模块的解码器处理解码步骤(4)中数据转 换模块的输出,得到最终预测的交通特征。
作为优选,所述步骤(1)具体包括以下步骤:
(1.1)利用交通第二特征数据构建连接图;其中交通第二特征以路 网结构数据为例,将城市道路网的拓扑转换为有权重的有向连接图G =(V,E,A),其中V为节点的集合,代表实际路网中的路段,是有 限集,|V|=N,即实际路网中路段的个数为N;E为边的集合,代表 实际路网中的路段之间的连接性,把路段间车流能流动的方向,作为 边的方向;A∈RN×N表示有权重的邻接矩阵,其中,表示节点vi到 节点vj的权重;具体地,利用高斯权重模型计算邻接矩阵的权重,用 阈值可有效控制邻接矩阵的稠密性;
其中,为节点vi到节点vj的距离,用节点vi和节点vj代表的路段 的长度的和的一半近似替代;σ为所有距离值的标准差,ε为阈值用 来控制邻接矩阵的稀疏度,设定为0.1;
(1.2)将交通第一特征数据归一化;其中交通第一特征数据以交通 速度数据为例,具体处理流程为:将t时刻原始的交通数据速度表示 为Xt∈RN×C,其中N为节点个数,C为节点特征数,此处取1,仅包含 路段速度特征;取2,路段速度和路段流量;取3,包含路段速度、 路段流量和路段密度;最后用Z-score方法、max-min法对Xt进行归 一化;
(1.3)将交通第三特征数据匹配到路段,换算成周期指数和绿信比 指数,并进行离散化处理,处理成独热编码;其中交通第三特征以控 制数据为例,控制数据指路口的周期、绿信比数据,将控制数据匹配 到路段具体为:结合路网结构数据,将路段的下游路口的周期作为该 路段的周期,将该路段车辆能进入路口的相位的绿信比和作为路段的 绿信比;然后计算周期指数为路段周期与历史路段最大周期的比值, 计算绿信比指数为路段绿信比与历史最大绿信比的比值;并按照对应 表对周期指数和绿信比指数做离散化处理。
作为优选,所述步骤(2)具体如下:
(2.1)生成空间嵌入,具体为:将步骤(1.1)构建的连接图利用 DeepWalk、node2Vec、GraphSAGE中的任意一种方法学习顶点的向量 表示;并将这些向量送入一个两层的全连接神经网络,得到空间嵌入, 表示为
(2.2)生成时间嵌入,具体为:将步骤(1.2)中交通速度数据对应 的每一个时间编码成一个向量;分别将时间按照一周七天和每天的时 间作为时间步编码为R7和RT的独热编码,并将它们拼接成R7+T的向 量;其中T取值按小时值计算可取24,按分钟值就算可取1440;并 将上述向量送入一个两层及两层以上的全连接神经网络、循环神经网 络、深度信念网络等神经网络,转换成一个D维度向量,即为时间嵌 入,表示为其中P表示输入的历史时间步数, Q表示需要预测的输出的时间步数;
(2.3)生成控制嵌入,具体为:将步骤(1.3)得到的离散化的周期 指数和绿信比指数分别处理R10的独热编码,并将它们拼接成R20的向 量;并将每条控制数据对应的一个向量汇总后送入一个两层及两层以 上的全连接神经网络、循环神经网络、深度信念网络等神经网络,得 到控制嵌入,表示为
(2.4)合成综合嵌入,具体的,融合上述的空间嵌入和时间嵌入和 控制嵌入合成综合嵌入;对于在时间步tj节点vi,综合嵌入被定义为 或α、β和γ分别为可训练的权重; 因此包含了P+Q个时间步的N个节点的综合嵌入被表示为 E∈R(P+Q)×N×D;其中综合嵌入同时包含了时间、空间和控制信息。
作为优选,所述步骤(3)利用时空注意力机制模块处理编码步 骤(2)得到的综合嵌入时,在进入编码器之前,步骤(1.2)中归一 化后的速度数据X∈RP×N×C,通过全连接层被转换为H(0)∈RP×N×D;之后 H(0)通过L层时空注意力机制模块的编码器,得到一个H(L)∈RP×N×D的 输出;其中时空注意力机制模块是由一个门控融合器将时间注意力机 制和空间注意力机制融合组成;将第l层时空注意力模块的输入表示 为H(l-1),其中在时间步tj的节点vi的隐藏状态表示为将第l层 时空注意力模块中的空间注意力机制和时间注意力机制输出分别表 示为和
作为优选,所述的空间注意力机制去自适应的掌握这种路网中不 同路段交通特征之间的关系,其核心是动态地在不同的时间步设置不 同的权重连接到不同的节点;其中在时间步tj的节点vi,计算所有节 点的加权和为:
其中,V表示所有节点的集合,是表示节点v对节点vi重要性 的注意力得分,注意力得分总和为1,即为在第l层 时空注意力机制模块中在时间步tj的节点vi的输入,为在第l层 时空注意力机制模块中在时间步tj的节点vi经过空间注意力机制的输 出。
作为优选,所述的注意力得分计算具体为:在一个特定的时间步, 当前的交通状态和道路网络结构同时会影响传感器之间的关系;考虑 了交通特征和图结构和控制信息去学习整个注意力得分,尤其是将综 合嵌入与隐藏状态连接起来,并且应用了缩放点积法去计算节点v和 节点vi之间的关联性:
其中,表示在时间步tj节点vi的综合嵌入,||表示拼接操作,<·,·> 表示内积法,2D表示的维度;然后用softmax激活函数对归一化:
特别地,为了使学习过程更加的稳定,将空间注意力机制升级为多头 注意力机制;即设定K个并行的注意力机制,设定K套不同的可学习 方程:
其中,和表示第k头空间注意力机制的三个不 同的非线性方程,最终能够输出d=D/K维度向量;非线性方程的形 式为:
f(x)=ReLU(xW+b)
其中W和b分别为可训练的参数,ReLU为激活函数。
作为优选,所述的时间注意力机制是为了自适应地建模同个节点 不同时间步间的非线性关系;该时间相关性在不用时间步间不断变 动,并同时受交通状态和相关时间和控制状态等因素的影响;因此利 用包含了三者信息的综合嵌入结合隐藏状态,并且应用了多头注意力 机制去计算时间注意力得分;其中对于节点vi,时间步tj和t的相关 性定义如下:
其中,表示第k头时间注意力机制中时间步tj与时间步t之间的 关联性,表示第k头注意力机制中时间步t对时间步tj的重要性 的注意力得分;代表第k头时间注意力机制中两个不 同的可学习的非线性方程,非线性方程的形式与空间注意力中的相 同;代表了tj时间步之前所有时间步的集合;得到了注意力得分 后,在tj时间步的顶点vi的隐藏状态可以根据下式更新:
其中,表示第k头时间注意力机制中一个非线性方程,形 式与空间注意力中的相同;上述三个公式中的可学习的参数在并行计 算时,在所有节点和时间步间是共享的。
作为优选,所述门控融合器的作用是自适应地融合时间和空间的 表示,或融合时间、空间、控制的表示;在第l层时空注意力机制模 块,时间和空间注意力机制的输出分别表示为和融合方式 如下:
其中,Wz,1∈RD×D、Wz,2∈RD×D和bz∈RD为可学习的参数,⊙表示点 乘法,σ(·)表示sigmoid激活函数,z表示门;H(l)为第l层时空注 意力机制模块的输出;这个门控融合器可以自适应地控制每一个顶点 和每一个时间步的时空依赖性的比重。
作为优选,所述步骤(4)的数据转换模块建模了每个未来时间 步和历史时间步的直接关系,从而转换被编码的交通特征至生成未来 表示作为解码器的输入;具体为,转化被编码的特征H(L)∈RP×N×D去生 成未来的序列表示H(L+1)∈RQ×N×D;对于每个节点vi,预测时间步 tj(tj=tP+1,…,tP+Q)和历史时间步t(t=t1,…,tP)的关系通过综合嵌入进行 测量:
其中,表示第k头时间注意力机制中预测时间步tj与历史时间步t 之间的关联性,表示第k头注意力机制中历史时间步t对预测时 间步tj的重要性的注意力得分;代表第k头转移注意 力机制中两个不同的可学习的非线性方程,非线性方程的形式与空间 注意力中的相同;然后使用注意力得分自适应地选择历史P个 时间步的相关特征,将编码的交通特征转换为解码器的输入:
表示第k头时间注意力机制中一个非线性方程,形式与空 间注意力中的相同;为节点vi,历史时间步t,在l层的输入,为转换后,节点vi,在预测时间步tj的输出的向量表示;上述三式中, 所有节点和时间步的可训练参数可以并行计算,并共享。
作为优选,所述步骤(5)中数据转换模块的输出为H(L+1)∈RQ×N×D, 时空注意力机制模块的解码器包含了L层时空注意力机制模块,输出 H(2L+1)∈RQ×N×D;最后全连接层产出Q个时间步的提前预测值
一种基于控制信息的适用长时间预测的交通特征预测系统,包括 数据预处理模块、时空数据嵌入模块、时空注意力机制模块、数据转 换模块;所述的数据预处理模块用于获取交通第一特征、交通第二特 征和交通第三特征,并将其处理成时空数据嵌入模块的输入;所述的 时空数据嵌入模块将交通第一特征、交通第二特征和交通第三特征分 别送入神经网络,得到空间嵌入、时间嵌入和控制嵌入,并将空间嵌 入、时间嵌入和控制嵌入组合成综合嵌入;所述的数据转换模块用于 转换被编码的综合嵌入作为解码器的输入;所述的时空注意力机制模 块包括编码器和解码器,其中时空注意力机制模块的编码器用于处理编码时空数据嵌入模块输出的综合嵌入;时空注意力机制模块的解码 器用于处理解码数据转换模块的输出,得到最终预测的交通特征。
本发明的有益效果在于:(1)本发明引入交通控制信息,并将控 制信息按照特定处理,与交通速度和路网结构信息相结合,使控制信 息对交通特征的影响被有效捕捉,提高了信控路网速度预测的有效 性;(2)本发明提出了一种时空注意力机制,能够更好地建模动态的 空间相关性和非线性的时间相关性,并设计了一个门控融合器,来自 适应地融合时空注意力机制提取的信息;(3)本发明设计了一种数据 转换模块,将历史交通特征转移到未来表征,建模历史时间步和未来 时间步之间的直接关系,避免了误差累积,以缓解误差传播效应,从 而提高长时交通流预测性能,解决了适用于长时间的交通预测的问 题。
附图说明
图1是本发明的系统示意图;
图2是本发明的方法流程示意图;
图3是本发明实施例的空间注意力机制捕捉随时间变换的节点间的 关系示意图;
图4是本发明实施例的时间注意力机制捕捉随时间变换的节点间的 关系示意图。
具体实施方式
下面结合具体实施例对本发明进行进一步描述,但本发明的保护 范围并不仅限于此:
实施例:如图1所示,一种基于控制信息的适用长时间预测的交 通特征预测系统,包括数据预处理模块、时空数据嵌入模块、时空注 意力机制模块、数据转换模块;所述的数据预处理模块用于获取交通 第一特征、交通第二特征和交通第三特征,并将其处理成时空数据嵌 入模块的输入;所述的时空数据嵌入模块将交通第一特征、交通第二 特征和交通第三特征分别送入神经网络,得到空间嵌入、时间嵌入和 控制嵌入,并将空间嵌入、时间嵌入和控制嵌入组合成综合嵌入;所 述的数据转换模块用于转换被编码的综合嵌入作为解码器的输入;所 述的时空注意力机制模块包括编码器和解码器,其中时空注意力机制 模块的编码器用于处理编码时空数据嵌入模块输出的综合嵌入;时空 注意力机制模块的解码器用于处理解码数据转换模块的输出,得到最 终预测的交通特征。
如图2所示,一种基于控制信息的适用长时间预测的交通特征预 测方法,包括如下步骤:
S1、数据预处理模块:获取交通第一特征(交通运行产生的具有 时变性的特征数据,包括但不限于:交通速度、流量、占有率、排队 长度、拥堵指数)、交通第二特征(交通运行所在环境的具有短时不 变性的特征数据,包括但不限于:路网结构、POI分布、交通基础设 施分布)和交通第三特征(控制交通运行产生的具有时变性的特征数 据,包括但不限于:交通控制数据、交通诱导数据、交通限行数据), 并将其处理成时空数据嵌入模块的输入。具体包括以下步骤:
S1.1利用交通第二特征数据构建连接图。其中,所述的交通第 二特征以路网结构为例说明如下:路网结构数据包括但不限于实际路 网中路口间的连接关系,连接路口的路段的长度等,可从各地图网站 和政府机构获取。数据样例如下表1所示:
表1
进一步,利用路网结构数据构建连接图。将城市道路网的拓扑转 换为有权重的有向连接图G=(V,E,A),其中V为节点的集合,代 表实际路网中的路段,是有限集,|V|=N,即实际路网中路段的个 数为N;E为边的集合,代表实际路网中的路段之间的连接性,把路 段间车流能流动的方向,作为边的方向。A∈RN×N表示有权重的邻接 矩阵,其中,表示节点vi到节点vj的权重。具体地,利用高斯权 重模型计算邻接矩阵的权重,用阈值可有效控制邻接矩阵的稠密性。
其中,为节点vi到节点vj的距离,用节点vi和节点vj代表的路段 的长度的和的一半近似替代。σ为所有距离值的标准差,ε为阈值用 来控制邻接矩阵的稀疏度,设定为0.1。
S1.2将交通第一特征数据归一化。其中以交通速度为例说明: 交通速度数据指基于移动检测技术或断面检测技术获取的路段交通 速度数据,包括但不限于路段编号、时间和速度。数据样例如下表2 所示:
路段编号
时间
速度
14L020980T0
2021-03-12 09:02:00
30
14L020979T0
2021-03-12 09:03:00
40
14L020978T0
2021-03-12 09:04:00
35
14L020977T0
2021-03-12 09:05:00
36
表2
具体处理流程为:将t时刻原始的交通数据速度表示为Xt∈RN×C, 其中N为节点个数,C为节点特征数,此处取1,仅包含路段速度特 征;取2,路段速度和路段流量;取3,包含路段速度、路段流量和 路段密度。然后用Z-score方法、max-min法对Xt进行归一化。
S1.3将交通第三特征数据匹配到路段,换算成周期指数和绿信 比指数,然后进行离散化处理。其中,交通第三特征以控制数据为例 说明:所述的控制数据指路口的周期、绿信比等数据。数据样例如下
表3所示:
路口编号
时间
周期
相位
绿信比(%)
8ebc4b70778540
2021-03-12 09:02:00
180
A
40
8ebc4b70778540
2021-03-12 09:03:00
180
A
38
8ebc4b70778540
2021-03-12 09:04:00
180
A
38
8ebc4b70778540
2021-03-12 09:05:00
180
A
37
表3
将控制数据匹配到路段具体为:结合路网结构数据,将路段的下 游路口的周期作为该路段的周期,将该路段车辆能进入路口的相位的 绿信比和作为路段的绿信比。然后,计算周期指数为路段周期与历史 路段最大周期的比值,计算绿信比指数为路段绿信比与历史最大绿信 比的比值。得到的数据样例如下表4所示:
表4
然后,按照对应表对周期指数和绿信比指数做离散化处理,对应表如 下表5所示:
表5
S2、时空数据嵌入模块:将上一步处理过的交通第一特征、交通 第二特征和交通第三特征分别送入神经网络,得到空间嵌入、时间嵌 入和控制嵌入,最后将三者组合成综合嵌入。具体包括以下步骤:
S2.1生成空间嵌入。具体为:将S1.1构建的连接图利用 DeepWalk、node2Vec、GraphSAGE等方法学习顶点的向量表示。然后, 将这些向量送入一个两层的全连接神经网络,得到空间嵌入,表示为
S2.2生成时间嵌入。具体为:将S1.2中交通速度数据对应的每 一个时间编码成一个向量。分别将时间按照一周七天和每天的时间作 为时间步编码为R7和RT(T取值按小时值计算可取24,按分钟值就 算可取1440)的独热编码,并将它们拼接成R7+T的向量。例如,2021-03-12 09:02:00为周五,星期值编码为7维向量([0000100]), 时间值按一天有24小时编码为24维向量 ([000000000100000000000000]),将二者拼接为31维向量([0000100000000000100000000000000])。然后,将上述向量送入一 个两层及两层以上的全连接神经网络、循环神经网络、深度信念网络 等神经网络,转换成一个D维度向量,即为时间嵌入,表示为其中P表示输入的历史时间步数,Q表示需 要预测的输出的时间步数。
S2.3生成控制嵌入。具体为:将S1.3得到的离散化的周期指数 和绿信比指数分别处理R10的独热编码,并将它们拼接成R20的向量。 例如,上述离散化的周期指数取值为(0.5,1.5,2.5,3.5,4.5,5.5,6.5,7.5,8.5,9.5),则转换的独热编码 分别为([0000000000],[1000000000],[0100000000], [00100000000],[0001000000],[0000100000],[0000010000], [0000001000],[0000000100],[0000000010])。若周期指数得到的 独热编码为[1000000000],绿信比指数得到的独热编码为 [0000100000],则拼接成的向量为[10000000000000100000]。然后, 将这些向量(每条控制数据对应一个向量)送入一个两层及两层以上 的全连接神经网络、循环神经网络、深度信念网络等神经网络,得到 控制嵌入,表示为
S2.4合成综合嵌入。具体为:融合上述的空间嵌入和时间嵌入 和控制嵌入合成综合嵌入。对于在时间步tj节点vi,综合嵌入被定义 为或α、β和γ分别为可训练的权 重。因此包含了P+Q个时间步的N个节点的综合嵌入被表示为 E∈R(P+Q)×N×D。综合嵌入同时包含了时间、空间和控制信息。
S3、基于时空注意力机制模块的编码器:利用时空注意力机制模 块处理编码上一步得到的综合嵌入;具体如下:
利用时空注意力机制模块处理编码上一步得到的综合嵌入。在进 入编码器之前,S1.2中归一化后的速度数据X∈RP×N×C,通过全连接 层被转换为H(0)∈RP×N×D。之后,H(0)通过L层时空注意力机制模块的 编码器,得到一个H(L)∈RP×N×D的输出。
时空注意力模块是由一个门控融合器将时间注意力机制和空间 注意力机制融合组成。将第l层时空注意力模块的输入表示为H(l-1), 其中在时间步tj的节点vi的隐藏状态表示为将第l层时空注意 力模块中的空间注意力机制和时间注意力机制输出分别表示为和
空间注意力机制是为了捕捉空间相关性。空间相关性是指一条道 路(或路段)的交通状态是受到其他道路(或路段)影响,这些因素 是高度动态的,并且随着时间变化。为了建模这样的特性,本发明设 计了一个空间注意力机制去自适应的掌握这种路网中不同路段交通 特征之间的关系。其核心是去动态地在不同的时间步设置不同的权重 连接到不同的节点,如图3所示。
在时间步tj的节点vi,计算所有节点的加权和为:
其中,V表示所有节点的集合,是表示节点v对节点vi重要性 的注意力得分,注意力得分总和为1,即为在第l层 时空注意力机制模块中在时间步tj的节点vi的输入,为在第l层 时空注意力机制模块中在时间步tj的节点vi经过空间注意力机制的输 出。
进一步,注意力得分计算如下,在一个特定的时间步,当前的交 通状态和道路网络结构同时会影响传感器之间的关系。比如,一条道 路上的拥堵可能会影响他的相邻道路的交通状态。受到这种组织启 发,同时考虑了交通特征和图结构和控制信息去学习整个注意力得 分。尤其是,将综合嵌入与隐藏状态连接起来,并且应用了缩放点积 法去计算节点v和节点vi之间的关联性:
其中,表示在时间步tj节点vi的综合嵌入,||表示拼接操作, <·,·>表示内积法,2D表示的维度。然后用softmax激活函数 对归一化:
特别地,为了使学习过程更加的稳定,将空间注意力机制升级为 多头注意力机制。就是说,设定K个并行的注意力机制,设定K套不 同的可学习方程:
其中,和表示第k头空间注意力机制的三 个不同的非线性方程,最终能够输出d=D/K维度向量。非线性方程 的形式为:
f(x)=ReLU(xW+b)
其中W和b分别为可训练的参数,ReLU为激活函数。
进一步,所述时间注意力机制是为了自适应地建模同个节点不同 时间步间的非线性关系。该时间相关性在不用时间步间不断变动,并 同时受交通状态和相关时间和控制状态等因素的影响。因此,本发明 利用包含了三者信息的综合嵌入结合隐藏状态,并且应用了多头注意 力机制去计算时间注意力得分,如图4所示。
对于节点vi,时间步tj和t的相关性定义如下:
其中,表示第k头时间注意力机制中时间步tj与时间步t之 间的关联性,表示第k头注意力机制中时间步t对时间步tj的重 要性的注意力得分。代表第k头时间注意力机制中两 个不同的可学习的非线性方程,非线性方程的形式与上述提到的空间 注意力中的相同。代表了tj时间步之前所有时间步的集合,即只考 虑早于目标步的时间步间的因果关系。得到了注意力得分后,在tj时间步的顶点vi的隐藏状态可以根据下式更新:
其中,表示第k头时间注意力机制中一个非线性方程,形 式与上述提到的空间注意力中的相同。上述三式中的可学习的参数在 并行计算时,在所有节点和时间步间是共享的。
进一步,所述的门控融合器的作用是自适应地融合时间和空间的 表示,或融合时间、空间、控制的表示。在第l层时空注意力机制模 块,时间和空间注意力机制的输出分别表示为和融合方式 如下:
其中,Wz,1∈RD×D、Wz,2∈RD×D和bz∈RD为可学习的参数,⊙表示点 乘法,σ(·)表示sigmoid激活函数,z表示门。H(l)为第l层时空注 意力机制模块的输出。这个门控融合器可以自适应地控制每一个顶点 和每一个时间步的时空依赖性的比重。
S4、数据转换模块:转换被编码的综合嵌入作为解码器的输入。 具体为:利用转移注意力机制,转换被编码的综合嵌入作为解码器的 输入。为了减少长期预测中不同预测时间步下的误差传播,本发明在 解码器和编码器之间增加了一个数据转换模块。它建模了每个未来时 间步和历史时间步的直接关系,从而转换被编码的交通特征至生成未 来表示作为解码器的输入。具体为,转化被编码的特征H(L)∈RP×N×D去 生成未来的序列表示H(L+1)∈RQ ×N×D。对于每个节点vi,预测时间步 tj(tj=tP+1,…,tP+Q)和历史时间步t(t=t1,…,tP)的关系通过综合嵌入进行 测量。
其中,表示第k头时间注意力机制中预测时间步tj与历史时 间步t之间的关联性,表示第k头注意力机制中历史时间步t对 预测时间步tj的重要性的注意力得分。代表第k头转 移注意力机制中两个不同的可学习的非线性方程,非线性方程的形式 与上述提到的空间注意力中的相同。然后,使用注意力得分自 适应地选择历史P个时间步的相关特征,将编码的交通特征转换为解 码器的输入:
表示第k头时间注意力机制中一个非线性方程,形式与上 述提到的空间注意力中的相同。为节点vi,历史时间步t,在l 层的输入,为转换后,节点vi,在预测时间步tj的输出的向量表 示。上述三式中,所有节点和时间步的可训练参数可以并行计算,并 共享。
S5、基于时空注意力机制模块的解码器:利用时空注意力机制模 块处理解码上一步数据转换模块的输出,得到最终预测的交通特征。 其中数据转换模块的输出为H(L+1)∈RQ ×N×D。解码器包含了L层时空注 意力机制模块,输出H(2L+1)∈RQ×N×D。最后,全连接层产出Q个时间步 的提前预测值
综上所述,本发明将控制信息引入交通特征预测中,分别处理交 通速度、路网结构和交通控制数据;并将上述数据分别送入神经网络, 得到空间嵌入、时间嵌入和控制嵌入,组合成综合嵌入;通过基于时 空注意力机制模块的编码器、数据转换模块和基于时空注意力机制模 块的解码器,最终得到预测的交通速度值。其有益效果主要表现在:
(一)以往的相关研究通常从时间相关性或空间相关性角度,构 建预测交通特征与历史交通特征与相近区域交通特征之间的关系,忽 略了控制信息对交通特征预测值的影响。本发明引入交通控制信息, 并将控制信息按照特定处理,与交通速度和路网结构信息相结合,使 控制信息对交通特征的影响被有效捕捉,提高了信控路网速度预测的 有效性。路网中,信号控制路口控制路口车辆通行,正常情况下,路 口车辆正常通行,如果有信号控制,会阻断车辆直接进入下一个路段, 绿灯时长的变化也会影响上下游之间速度、流量等相关性。在时间上, 控制的阻断也影响上一个时刻和下一个时刻的速度、流量的相关性, 控制信息作为嵌入引入,来计算时间和空间的注意力得分,是对这种 影响的刻画,作为除了空间信息和时间信息外的补充。
(二)提出了一种时空注意力机制,能够更好地建模动态的空间 相关性和非线性的时间相关性,并设计了一个门控融合器,来自适应 地融合时空注意力机制提取的信息。
(三)设计了一种数据转换模块,将历史交通特征转移到未来表 征,建模历史时间步和未来时间步之间的直接关系,避免了误差累积, 以缓解误差传播效应,从而提高长时交通流预测性能,解决了适用于 长时间的交通预测的问题。
以上的所述乃是本发明的具体实施例及所运用的技术原理,若依 本发明的构想所作的改变,其所产生的功能作用仍未超出说明书及附 图所涵盖的精神时,仍应属本发明的保护范围。
- 上一篇:石墨接头机器人自动装卡簧、装栓机
- 下一篇:一种景区游客流量预测方法及装置