基于时空卷积网络的机动车尾气遥测数据的多重补全方法
技术领域
本发明属于数据处理领域,特别涉及了一种基于时空卷积网络的机动车尾气遥测数据的多重补全方法及系统。
背景技术
随着城市机动车保有量增加,造成机动车尾气排放量的激增,即城市尾气排放所造成的自然和环境问题也日益严重,进而带来一个重大的社会问题,因此机动车排气污染监控工作面临着严峻的风险。机动车尾气排放产生的温室气体,是城市空气污染的主要源头,同时会对人体健康造成一定危害。尤其是老旧的排放未达标和机动车问题造成的尾气排放超标的机动车会产生大量对大气环境有害的气体,有必要进行对超标尾气排放有效的监管。
虽然国内遥测技术已经开始普及,但是考虑到遥测设备的复杂性、现场环境干扰,容易造成采集到的机动车尾气排放数据缺失,而缺失的数据会造成我们后续分析尾气排放等问题带来源头上的失真。现有的数据值数据补全,大多采用均值、众数或者中位数方法,或者采用回归方式对单个缺失数据进行补全,这些方法只是粗略的对缺失值部分进行了填充或者只是的单个数据的补全,无法给多重的缺失数据集进行有效填充。同时检测区域各个遥测点之间存在着地理联系和遥测数据的时间依赖性,没有考虑这些因素来补全数据会造成巨大的补全误差。因此,现有尾气排放浓度缺失数据补全的方法不能有效的进行对尾气排放缺失数据进行补全。
发明内容
为了解决上述技术问题,克服现有技术的不足。本发明提供一种基于时空卷积网络的机动车尾气遥测数据的多重补全方法及系统。基于检测区域的各个遥测设备点之间存在空间依赖性和时间依赖性,本发明引入了路网空间拓扑结构信息和尾气排放数据时间段内的周期时间段内的尾气排放数据对缺失数据浓度的影响,使得本发明能够获得对机动车尾气排放浓度缺失数据集更好的补全效果。
本发明技术解决方案为:一种基于时空卷积网络的机动车尾气遥测数据的多重补全方法,包括:
步骤S1:获取检测区域路网遥测点拓扑结构信息和路网中遥测设备遥测的机动车尾气排放浓度多重缺失数据,并进行处理,分别构建空间路网的拓扑结构图数据和机动车尾气排放浓度时间序列数据;
步骤S2:将所述空间路网的拓扑结构图数据和机动车尾气排放浓度时间序列数据输入到时空图卷积网络进行补全,所述的时空图卷积网络包括自注意力机制时空图卷积网络和改进型最近邻算法,所述的空间路网的拓扑结构图数据输入到所述自注意力机制时空图卷积网络得到路网的时空特征结果,所述的时空特征结果用于改进型最近邻算法中对机动车尾气排放浓度时间序列缺失数据进行多重缺失数据补全,得到最终完整的机动车尾气排放浓度时间序列数据。
本发明与现有技术相比,具有以下优点:
1、本发明提供的基于时空卷积网络的机动车尾气遥测数据的多重补全方法及系统是基于检测区域遥测设备拓扑结构和一定时间段内的尾气排放时间序列数据。选择检测区域的拓扑结构信息来提取其中的时空特征;然后联合时空特征来处理尾气时间序列数据时间轴上的多个时间间隔周期(每小时、每日、每周)组建成尾气排放的时间序列缺失数据进行数据补全,提升了补全结果准确率。
2、本发明提供的基于时空卷积网络的机动车尾气遥测数据的多重补全方法及系统,可以补全遥测机动车尾气排放浓度缺失数据。首次使用时空图卷积和自注意力机制来提取空间和时间依赖性,生成带有权重的时空特征,而且基于时空特征结果使用改进型最近邻方法进行尾气排放浓度数据补全。
附图说明
图1为本发明实施例中一种基于时空卷积网络的机动车尾气遥测数据的多重补全方法的流程图;
图2为本发明实施例中一种基于时空卷积网络的机动车尾气遥测数据的多重补全方法中步骤S1:获取检测区域路网遥测点拓扑结构信息和路网中遥测设备遥测的机动车尾气排放浓度多重缺失数据,并进行处理,分别构建空间路网的拓扑结构图数据和机动车尾气排放浓度时间序列数据的流程图;
图3为本发明实施例中基于时空卷积网络的机动车尾气遥测数据的多重补全方法中步骤S2:所述空间路网的拓扑结构图数据和机动车尾气排放浓度时间序列数据输入到时空图卷积网络进行补全,其中,所述时空图卷积网络包括:自注意力机制时空图卷积网络和改进型最近邻算法;将所述空间路网的拓扑结构图数据输入到所述自注意力机制时空图卷积网络得到路网的时空特征结果,将所述时空特征结果用于所述改进型最近邻算法中对机动车尾气排放浓度时间序列缺失数据进行多重缺失数据补全,得到最终完整的机动车尾气排放浓度时间序列数据的流程图;
图4为本发明实施例中一种基于时空卷积网络的机动车尾气遥测数据的多重补全方法中步骤S21:将空间路网的拓扑结构图数据,输入自注意力机制时空图卷积网络,得到空间路网的自注意力时空图卷积的时空特征权重的流程图;
图5为本发明实施例中时空卷积网络的结构图;
图6为本发明实施例中一种基于时空卷积网络的机动车尾气遥测数据的多重补全系统的结构框图。
具体实施方式
本发明提供了一种基于时空卷积网络的机动车尾气遥测数据的多重补全方法及系统,可以补全路网中遥测设备遥测机动车尾气排放浓度的缺失数据。首次使用时空图卷积和自注意力机制来提取路网拓扑结构的空间和时间依赖性,生成带有权重的时空特征,而且基于时空特征应用于改进型最近邻方法进行尾气排放浓度数据补全。
为了使本发明的目的、技术方案及优点更加清楚,以下通过具体实施,并结合附图,对本发明进一步详细说明。
实施例一
如图1所示,本发明实施例提供的一种基于时空卷积网络的机动车尾气遥测数据的多重补全方法,包括下述步骤:
步骤S1:获取检测区域路网遥测点拓扑结构信息和路网中遥测设备遥测的机动车尾气排放浓度多重缺失数据,并进行处理,分别构建空间路网的拓扑结构图数据和机动车尾气排放浓度时间序列数据;
步骤S2:将空间路网的拓扑结构图数据和机动车尾气排放浓度时间序列数据输入到时空图卷积网络进行补全,其中,时空图卷积网络包括:自注意力机制时空图卷积网络和改进型最近邻算法;将空间路网的拓扑结构图数据输入到所述自注意力机制时空图卷积网络得到路网的时空特征结果,将时空特征结果用于改进型最近邻算法中对机动车尾气排放浓度时间序列缺失数据进行多重缺失数据补全,得到最终完整的机动车尾气排放浓度时间序列数据。
本发明提供的基于时空卷积网络的机动车尾气遥测数据的多重补全方法是检测区域路网拓扑结构的时空依赖性。不仅使用检测区域路网拓扑结构的空间依赖性,同时还考虑到了时间依赖性对尾气排放浓度的数据补全。通过采用路网拓扑的时空信息新颖的方式来补全缺失的机动车尾气排放数据。
如图2所示,在一个实施例中,上述步骤S1:获取检测区域路网遥测点拓扑结构信息和路网中遥测设备遥测的机动车尾气排放浓度多重缺失数据,并进行处理,分别构建空间路网的拓扑结构图数据和机动车尾气排放浓度时间序列数据,包括:
步骤S11:获取检测区域空间路网遥测点拓扑结构信息,构建路网的空间拓扑结构图数据;
步骤S12:采集路网中遥测设备遥测的机动车尾气排放浓度多重缺失数据,构建多时间周期的尾气浓度排放时间序列输入数据。
在一个实施例中,上述步骤S11:获取检测区域空间路网遥测点拓扑结构信息,构建路网的空间拓扑结构图数据,包括:
步骤S111:获取检测区域路网遥感检测节点中在地图中的经纬度和检测点之间的近似距离,其中遥感检测节点的个数为N,节点vi和vj之间的地理位置距离为li,j,其中i,j∈N;
其中,本发明实施例的遥感检测节点的个数为N为114个。
步骤S112:构建空间路网的拓扑结构图数据,根据路网遥感检测节点拓扑图定义空间路网的拓扑结构图G=(V,E,A),其中,G为无向图;V为机动车尾气排放遥感检测节点集,|V|=N为节点个数,E为遥测点的边集,表示节点的连通性,A∈RN×N为图G的权重邻接矩阵,其空间权重邻接矩阵A元素数学表达式为:
其中link(i,j)表示节点vi和vj之间的道路连接。当link(i,j)=1时,表示节点vi和vj之间存在道路连接;参数θ表示控制加权邻接矩阵的尺寸和稀疏性。
在一个实施例中,上述步骤S12:采集路网中遥测设备遥测的机动车尾气排放浓度多重缺失数据,构建多时间周期的尾气浓度排放时间序列输入数据,包括:
采集路网中遥测设备遥测的机动车尾气排放浓度多重缺失数据,构建多时间周期的尾气浓度排放时间序列输入数据,具体包括:
步骤S121:获取并构建机动车尾气浓度数据的每小时时间序列
步骤S122:获取并构建机动车尾气浓度数据的每日时间序列
步骤S123:获取并构建机动车尾气浓度数据的每周时间序列
其中,根据尾气遥感监测系统收集到机动车尾气浓度数据在时刻t的排放浓度为Xt;机动车尾气浓度数据按照Tp小时内进行累加,本发明实施例中,选取Tp=0.5小时,因此,每天机动车尾气排放浓度数据个数为个;lh、ld和lw分别为沿时间轴分别截取每小时、每日和每周的序列片段的长度,为Tp的整数倍;举例来说,假设目标预测时间间隔是周五的时间间隔内一帧(例如10:00-10:30),则每小时时间间隔长度lh=3表示时间间隔前三次间隔的3帧;每日时间间隔长度ld=3表示周四、周三、周二相同时间间隔的3帧;每周周期时间间隔长度lw=3表示过去三周内每星期五相同时间间隔的3帧;d和w分别为1天和1周。
步骤S124:根据上述3组时间周期序列,构建多时间周期的尾气浓度排放时间序列输入数据为T={Xh,Xd,Xw}。
如图3所示,在一个实施例中,上述步骤S2:将空间路网的拓扑结构图数据和机动车尾气排放浓度时间序列数据输入到时空图卷积网络进行补全,其中,时空图卷积网络包括:自注意力机制时空图卷积网络和改进型最近邻算法;将空间路网的拓扑结构图数据输入到自注意力机制时空图卷积网络得到路网的时空特征结果,将时空特征结果用于改进型最近邻算法中对机动车尾气排放浓度时间序列缺失数据进行多重缺失数据补全,得到最终完整的机动车尾气排放浓度时间序列数据,包括:
步骤S21:将空间路网的拓扑结构图数据,输入卷积神经网络进行训练,并加入注意力特征机制,得到空间路网的自注意力时空图卷积的时空特征权重;
步骤S22:将自注意力时空图卷积的时空特征权重和机动车尾气排放浓度时间序列缺失数据输入到改进型最近邻算法中,得到最终完整的机动车尾气排放浓度时间序列数据。
本发明公开的时空图卷积网络由两个部分构成,自注意力机制时空图卷积网络和改进型最近邻算法。将空间路网的拓扑结构图数据输入到自注意力机制时空图卷积网络得到空间路网的时空特征结果,上述得到的空间路网的时空特征结果应用于改进型最近邻算法中对机动车尾气排放浓度时间序列缺失数据进行多重缺失数据补全,得到最终完整的机动车尾气排放浓度时间序列数据。
如图4所示,在一个实施例中,上述步骤S21:将空间路网的拓扑结构图数据,输入卷积神经网络进行训练,并加入注意力特征机制,得到空间路网的自注意力时空图卷积的时空特征权重,包括:
步骤S211:将空间路网拓扑结构图G=(V,E,A)由图变换到谱域以实现图卷积,使用卷积核gθ对图G进行卷积操作即为空间图卷积,采用切比雪夫多项式近似展开得到空间图卷积结果H,其数学表达式如公式(2)所示:
其中,*G表示卷积操作,为k(k∈K)时的K阶切比雪夫多项式系数;x表示输入图G的权重邻接矩阵A;λmax表示矩阵A的拉普拉斯矩阵的最大特征值,IN为矩阵A的单位矩阵,且图G的拉普拉斯矩阵规范化形式切比雪夫多项式的递归定义:Tk(x)=2xTk-1(x)-Tk-2(x),其中,T0(x)=1,T1(x)=x。
经过多次实验,本发明实施例采用的K=3切比雪夫多项式,可获得较佳结果。本发明对切比雪夫多项式阶数不做具体限制,可根据实际需求决定使用何种阶数的切比雪夫多项式。
步骤S212:将空间图卷积结果H,使用自注意力机制方法,根据下述公式(3)计算自注意力机制赋予空间图卷积结果的权重系数α,并计算得到注意力时间特征结果HAtt=α·H;
其中,Hi,j表示H的第i个遥测设备遥测的第j个值,h为机动车遥测尾气排放时间序列数据集中的采集的小时周期数,d为采集的天数,w采集的周数。
步骤S213:将注意力时间特征结果HAtt,经过至少一层的时间卷积神经网络计算,输出得到时空特征结果为其中包含的元素
如图5展示了本发明实施例中的时空卷积网络的结构示意图。经过多次实验,本发明实施例采用的2层卷积神经网络,可获得较佳结果。本发明对卷积神经网络不做具体限制,可根据实际需求决定使用何种结构的卷积神经网络。
在本步骤中,由于多种角度的时间依赖性特征之间存在重要性区别,因此使用注意力机制,通过赋予时间特征结果权重系数,最后得到注意力时间特征结果XAtt。
在一个实施例中,上述步骤S22中改进型最近邻算法,具体包括:
步骤S221:对于含有缺失值的尾气排放数据集以及时空特征结果给定改进型最近邻参数k,将T、和k输入改进型最近邻算法;
步骤S222:以缺失值xi,j为中心,其中i∈N,j∈(h+d+w),构造根结点,根结点对应于包含缺失尾气排放数据T的的N×(h+d+w)空间的超矩形区域;将时空特征结果中的距离数据表中数值从小到大排序得到排序数组Array,从数组Array中按序依次取出k个值,并将k个值取出的时空特征结果hi,j与对应的机动车尾气排放数据xi,j,根据下述公式(4),进行求和取平均得到所在位置的尾气排放浓度的缺失值
步骤S223:重复步骤S222,最终得到缺失值补全过完整的多重缺失值尾气排放数据集
经过多次实验,本发明实施例采用的最近邻参数k=8,可获得较佳结果。本发明对最近邻参数取值不做具体限制,可根据实际需求决定使用值的最近邻参数。
实施例二
如图6所示,基于时空卷积网络的机动车尾气遥测数据的多重补全系统,其特征在于,包括下述模块:
构建空间路网数据和尾气排放数据模块31,用于获取检测区域路网遥测点拓扑结构信息和路网中遥测设备遥测的机动车尾气排放浓度多重缺失数据,并进行处理,分别构建空间路网的拓扑结构图数据和机动车尾气排放浓度时间序列数据;
时空图卷积网络模块32,用于将空间路网的拓扑结构图数据和机动车尾气排放浓度时间序列数据输入到时空图卷积网络进行补全,其中,时空图卷积网络包括:自注意力机制时空图卷积网络和改进型最近邻算法;将空间路网的拓扑结构图数据输入到自注意力机制时空图卷积网络得到路网的时空特征结果,将时空特征结果用于所述改进型最近邻算法中对机动车尾气排放浓度时间序列缺失数据进行多重缺失数据补全,得到最终完整的机动车尾气排放浓度时间序列数据。
提供以上实施例仅仅是为了描述本发明的目的,而并非要限制本发明的范围。本发明的范围由所附权利要求限定。不脱离本发明的精神和原理而做出的各种等同替换和修改,均应涵盖在本发明的范围之内。
- 上一篇:石墨接头机器人自动装卡簧、装栓机
- 下一篇:一种变电站指示灯状态识别方法