一种基于时间维特征增强的川西野火风险预警方法
技术领域
本发明属于遥感
技术领域
,涉及基于时间维特征增强的川西野火风险预警方法。背景技术
在对生态系统塑造的过程中野火扮演着重要的角色,它可以有益于生态系统发展如:促进植被新老演替以及提升生态系统的抗虫害能力等。然而它也会造成土壤侵蚀、退化以及温室气体的排放等负面影响。野火的扑灭也相当危险,在2019年3月30日,四川省凉山州木里县突发森林大火,火场总过火面积约20公顷,遇难人数达31人。2019年7月8日起澳大利亚丛林野火开始肆虐,澳洲有超过1200万公顷土地过火,大约10亿野生动物在大火中丧命,在这场灾难中,33人不幸死亡,2500余间房屋被烧毁。在2020年3月30日,四川省西昌市也突发森林大火,火灾过火面积1000余公顷,毁坏面积为80余公顷,遇难人数达19人。面对着如此惨痛的损失,野火风险预警是迫在眉睫的。
近年来,随着遥感技术、计算机、机器学习等领域的高速发展及应用的普及,遥感结合机器学习算法的方法在火险预警领域发展速度飞快,面对近几年肆虐的大范围火灾造成的经济损失和人员伤亡,我们亟需一套能大范围、高精度和高分辨率预警的方法体系。构建一系列可以运用的大范围、高精度和高时空分辨率的野火预警模型,一方面可以为相关的决策部门提供科学决策支持,从而实现防范于未然,从源头上控制火灾的发生,有助于生态系统的环境保护;另一方面,可以为野火预警及其相关领域的研究提供依据,进而不断提升野火预警的效果。
针对于目前的关于野火风险预警的研究主要还是针对模型的选择以及因子的选择上着手,而这些研究未能考虑到因子的时间维特征在野火数据集构建方法的重要性。仅仅对火灾当时当地的场景进行复原,这种火灾数据集构建的方法虽然简单且高效,但是会存在诸多问题。因为森林草原火灾的爆发需要长时间的干旱条件使得可燃物处于可以燃烧的条件,单一只从火灾发生当天的因子信息无法表征一个完整的火灾场景,没有火灾发生前诱发因子的长时间序列信息,模型很难学习到火灾发生的具体时空场景,继而无法对野火进行精确的预警。
发明内容
本发明旨在提供一种通过对野火诱发因子的时间维特征进行特征增强,考虑火灾像元和非火灾像元的时间维特征的异质性来进行川西野火风险预警的模型。
本发明技术方案为一种基于时间维特征增强的川西野火风险预警方法,该方法包括:
步骤1:采集目标区域的遥感图像,获取遥感图像每个像元的可燃物含水率、生物量、人文因子、高程、坡度、坡向、风速、温度、降雨量、相对湿度和土地覆盖特征,和这些特征对应的火灾数据;
步骤2:对步骤1获得的数据中的可燃物含水率、风速、温度、降雨量、相对湿度进行时间维特征增强;分别计算出遥感图像中属于森林的像元和属于草原的像元;
I:对属于森林的像元进行如下时间维特征增强;
一、对可燃物含水率进行时间维特征增强;
(1)提取非线性时滞特征;
其中,constant是一个常量,Xi为时间序列为i的特征值,N为时序长度,C为计算得到的非线性时滞特征;
将某个目标像元一段时间内的可燃物含水率作为X,将其输入公式1得到非线性时滞特征,记为CFMC;
(2)提取绝对熵特征;
其中,AE为计算得到的绝对熵特征,Xi为时间序列为i的特征值;
将某个目标像元一段时间内的可燃物含水率值作为X,将其输入公式2得到绝对熵特征,记为AEFMC;
(3)提取CWT特征;
其中,CWT为针对时间序列的Ricker连续小波变换的结果,D为小波函数的宽度参数,X为输入特征的时间序列特征;
将某个目标像元一段时间内的可燃物含水率值作为X,将其输入公式3得到CWT特征,记为CWTFMC;
(4)提取低值统计数的个数;
CB=count(X<constant) 公式4
其中,CB为指计算统计时间序列的低于阈值的个数,constant是一个常量,X为输入特征的时间序列值;
将某个目标像元一段时间内的可燃物含水率值作为X,将其输入公式4得到低值统计数征,记为CBFMC;
(5)提取分位数特征;
Q=Quantile(X,constant) 公式5
其中,Q为时间序列X的constant%分位数,constant是一个常量,X为输入特征的时间序列值;
将某个目标像元一段时间内的可燃物含水率值作为X,将其输入公式5得到分位数特征记为QFMC;
二、针对风速进行时间维特征增强;
(1)采用公式3的方法提取风速的CWT特征,记为CWTWS;
(2)提取高值统计数;
CA=count(X>constant) 公式6
其中,CA为指计算统计时间序列的高于阈值的个数,constant是一个常量,X为输入特征的时间序列值;
将某个目标像元一段时间内的风速值作为X,将其输入公式6得到高值统计数,记为CAWS;
(3)采用公式1的方法提取风速的非线性时滞特征,得到CWS;
(4)提取值统计数;
VC=count(X==constant) 公式7
其中,VC为指计算统计时间序列的等于恒定值的个数,constant是一个常量,X为输入特征的时间序列值;
将某个目标像元一段时间内的风速值作为X,将其输入公式7得到值统计数,记为VCWS;
(5)提取范围统计数;
RC=count(constant_low<X<constant_up) 公式8
其中,RC为指计算统计时间序列规定范围内的个数,constant_low和constant_up是常量,X为输入特征的时间序列值;
将某个目标像元一段时间内的风速值作为X,将其输入公式8得到范围统计数,记为RCWS;
三、针对温度进行时间维特征增强;
(1)采用公式3的方法提取温度的的CWT特征,得到CWTT;
(2)采用公式5的方法对温度进行分位数处理,得到QT;
(3)提取分组熵特征;
其中,BE为计算得到的分组熵特征,P是样本百分比,nums是分组个数,X为输入特征的时间序列值;
将某个目标像元一段时间内的温度值作为X,将其输入公式9得到分组熵特征,记为BET;
(4)采用公式2的方法对温度进行绝对熵处理,得到AET;
(5)采用公式4的方法对温度进行低值统计数处理,得到CBT;
四、针对降雨量进行特征提取;
(1)采用公式5的方法对降雨量进行分位数处理,得到QRainfall;
(2)采用公式4的方法对降雨量进行低值统计数处理,得到CBRainfall;
(3)采用公式8的方法对降雨量进行范围统计数处理,得到RCRainfall;
(4)采用公式1的方法对降雨量进行非线性时滞处理,得到CRainfall;
(5)采用公式9的方法对降雨量进行分组熵处理,得到BERainfall;
五、针对相对湿度进行特征提取:
(1)采用公式3的方法对相对湿度进行小波变换处理,得到CWTRH;
(2)采用公式6的方法对相对湿度进行高值统计数处理,得到CARH;
(3)采用公式5的方法对相对湿度进行分位数处理,得到QRH;
(4)采用公式2的方法对相对湿度进行绝对熵处理,得到AERH;
(5)采用公式9的方法对相对湿度进行分组熵处理,得到BERH;
II:对属于草原的像元进行如下时间维特征增强;
一、针对可燃物含水率进行特征提取:
(1)采用公式5的方法对可燃物含水率进行分位数处理,得到QFMC;
(2)采用公式1的方法对可燃物含水率进行非线性时滞处理,得到CFMC;
(3)采用公式8的方法对可燃物含水率进行范围统计数处理,得到RCFMC;
(4)采用公式9的方法对可燃物含水率进行分组熵处理,得到BEFMC;
(5)采用公式2的方法对可燃物含水率进行绝对熵处理,得到AEFMC;
二、针对WS进行特征提取:
(1)采用公式4的方法对WS进行低值统计数处理,得到CBWS;
(2)采用公式5的方法对WS进行分位数处理,得到QWS;
(3)采用公式9的方法对WS进行分组熵处理,得到BEWS;
(4)采用公式1的方法对WS进行非线性时滞处理,得到CWS;
(5)采用公式6的方法对WS进行高值统计数处理,得到CAWS;
三、针对T进行特征提取:
(1)采用公式1的方法对T进行非线性时滞处理,得到CT;
(2)采用公式3的方法对T进行小波变换处理,得到CWTT;
(3)采用公式7的方法对T进行值统计数处理,得到VCT;
(4)采用公式6的方法对T进行高值统计数处理,得到CAT;
(5)采用公式4的方法对T进行低值统计数处理,得到CBT;
四、针对Rainfall进行特征提取:
(1)采用公式9的方法对Rainfall进行分组熵处理,得到BERainfall;
(2)采用公式7的方法对Rainfall进行值统计数处理,得到VCRainfall;
(3)采用公式3的方法对Rainfall进行小波变换处理,得到CWTRainfall;
(4)采用公式5的方法对Rainfall进行分位数处理,得到QRainfall;
(5)采用公式2的方法对Rainfall进行绝对熵处理,得到AERainfall;
五、针对RH进行特征提取:
(1)采用公式2的方法对RH进行绝对熵处理,得到AERH;
(2)采用公式6的方法对RH进行高值统计数处理,得到CARH;
(3)采用公式7的方法对RH进行值统计数处理,得到VCRH;
(4)采用公式4的方法对RH进行低值统计数处理,得到CBRH;
(5)采用公式1的方法对RH进行非线性时滞处理,得到CRH;
步骤3:针对森林像元和草原像元各训练一个XGBoost模型;XGBoost模型的输入为:步骤2获取的可燃物含水率、风速、温度、降雨量、相对湿度时间维特征增强后的数据和步骤1余下的生物量、人文因子、高程、坡度、坡向、土地覆盖特征,输出为特征对应的像元是否着火;
步骤4:是实时监测过程中,首先区分像元是森林像元还是草原像元,获取对应的特征,然后采用对应的XGBoost模型进行火灾预警。
本发明的有益效果:本发明提出一种基于时间维特征增强的川西野火风险预警模型。是一种通过对野火诱发因子的时间维特征进行增强,在此基础之上结合皮尔逊相关系数针对每个因子选取最相关的五个特征,最终加入野火历史数据库,从而提高了数据库内因子的时间尺度上的异质性,进而提高模型的野火预警精度。
附图说明
图1为四川省川西研究区各因子图。图中(a)展示了川西区域各因子(从左至右,从上至下分别是坡向、高程、坡度、FFL、土地覆盖、可燃物含水率。(b)展示了降雨量、相对湿度、温度、风速、与道路的距离以及与居民点的距离的具体情况。
图2为四川省川西研究区示意图。图中标注了历史的火点信息,以及川西区域的地形情况以及森林草地的分布情况。图中展示了川西区域的具体组成部分:阿坝藏族羌族自治州、甘孜藏族自治州、凉山彝族自治州以及攀枝花市。
图3为XGBoost模型的ROC曲线示意图。左图针对是否添加时间维特征和不同的地物类型展现了测试集的ROC情况;右图针对是否添加时间维特征和不同的地物类型展现了训练集的ROC情况。
图4为川西区域野火风险示意图。(a)为添加了因子时间维特征增强的火灾季川西火灾风险的展示图;(c)为添加了因子时间维特征增强的非火灾季川西火灾风险的展示图;(b)为未添加了因子时间维特征增强的火灾季川西火灾风险的展示图;(d)为未添加了因子时间维特征增强的非火灾季川西火灾风险的展示图。
图5为泸山和乔瓦镇野火风险时序图。(a)图为添加了时间维特征增强的西昌市泸山火险长时间序列图;(b)图为未添加时间维特征增强的西昌市泸山火险长时间序列图;(c)图为添加了时间维特征增强的木里县乔瓦镇火险长时间序列图;(d)图为未添加时间维特征增强的木里县乔瓦镇火险长时间序列图。
具体实施方式
下面结合附图对本发明做进一步的说明。
(1)数据准备和数据库构建
火灾发生的诱导因子有很多,如可燃物含水率、FFL(生物量)等参数。本发明本发明首先采集了目标区域的遥感图像,并获取出每个像元的可燃物含水率、FFL、人文因子、高程、坡度、坡向、风速、温度、降雨量、相对湿度和土地覆盖特征,其中人文因子的通过道路网以及居民点的图像进行欧式距离缓冲区变化得到。川西区域的坡向、高程、坡度、FFL、土地覆盖、可燃物含水率共6个因子展示(见图1(a)),降雨量、相对湿度、温度、风速、与道路的欧式距离以及与居民点的欧式距离展示(见图1(b))。通过历史火灾产品MCD64A1提取火灾像元以及非火灾像元,构造野火历史数据库。进而获取所有野火历史数据库内的火灾像元和非火灾像元同一时刻以及历史时刻、同一地点的所有诱发因子的值,并将其加入至野火历史数据库。选取川西作为研究区,主要原因是从历史火点上看,四川90%的火点都集中在川西区域(见图2),而且川西区域的气候多变、地形复杂导致其野火风险预警难度高,可以检验模型的真实可行性以及效果;
(2)时间维特征增强
通过已构建的野火历史数据库,以16天为时间窗口,将可燃物含水率、风速、温度、降雨量、相对湿度共五个因子进行时间维特征增强;
分别计算出遥感图像中属于森林的像元和属于草原的像元,对属于森林的像元中的可燃物含水率、风速、温度、降雨量、相对湿度进行特征提取,提取方法为:
一、针对可燃物含水率进行特征提取:
(1)对可燃物含水率进行C特征处理,将某个目标像元16天范围内的可燃物含水率值作为X,将其输入公式1(其中N=16,constant=1)得到CFMC;
其中,C(非线性时滞)为时间序列中非线性的一种度量,用以描述其时间序列的非线性特征,constant是一个常量,X为因子时间序列的值;
(2)对可燃物含水率进行AE特征处理,将某个目标像元16天范围内的可燃物含水率值作为X,将其输入公式2(其中N=16)得到AEFMC;
其中,AE(绝对熵)为时间序列的绝对能量,用以描述其时间窗口内因子的平方和;X为因子时间序列的值;
(3)对可燃物含水率进行CWT特征处理,将某个目标像元16天范围内的可燃物含水率值作为X,将其输入公式3(其中D=5)得到CWTFMC。
其中,CWT(小波变换)为指计算针对时间序列的Ricker连续小波变换的结果,D为小波函数的宽度参数,X为因子时间序列的值。
(4)对可燃物含水率进行CB特征处理,将某个目标像元16天范围内的可燃物含水率值作为X,将其输入公式4(其中constant=120)得到CBFMC。
CB=count(X<constant) (4)
其中,CB(低值统计数)为指计算统计时间序列的低于某个值的个数,constant是一个常量,X为因子时间序列的值。
(5)对可燃物含水率进行Q特征处理,将某个目标像元16天范围内的可燃物含水率值作为X,将其输入公式5(其中constant=72)得到QFMC。
Q=Quantile(X,constant) (5)
其中,Q(分位数)为时间序列X的constant%分位数,constant是一个常量,X为因子时间序列的值。
二、针对风速(WS)进行特征提取:
(1)采用公式3的方法(其中D=9)对WS进行小波变换处理,得到CWTWS。
(2)对WS进行CA特征处理,将某个目标像元16天范围内的WS值作为X,将其输入公式6(其中constant=3.2)得到CAWS。
CA=count(X>constant) (6)
其中,CA(高值统计数)为指计算统计时间序列的高于某个值的个数,constant是一个常量,X为因子时间序列的值。
(3)采用公式1的方法(其中N=16,constant=3)对WS进行非线性时滞处理,得到CWS。
(4)对WS进行VC特征处理,将某个目标像元16天范围内的WS值作为X,将其输入公式7(其中constant=0)得到VCWS。
VC=count(X==constant) (7)
其中,VC(值统计数)为指计算统计时间序列的等于某个值的个数,constant是一个常量,X为因子时间序列的值。
(5)对WS进行RC特征处理,将某个目标像元16天范围内的WS值作为X,将其输入公式8(其中constant_low=-1,constant_up=1)得到RCWS。
RC=count(constant_low<X<constant_up) (8)
其中,RC(范围统计数)为指计算统计时间序列的等于某个值的个数,constant是一个常量,X为因子时间序列的值。
三、针对温度(T)进行特征提取:
(1)采用公式3的方法(其中D=4)对T进行小波变换处理,得到CWTT。
(2)采用公式5的方法(其中constant=27)对T进行分位数处理,得到QT。
(3)对T进行BE特征处理,将某个目标像元16天范围内的T值作为X,将其输入公式9(其中nums=16)得到BET。
其中,BE(分组熵)即:把整个时间序列按值均分成nums个分组,然后把每个值放进相应的分组中,然后求熵,P是样本百分比,nums是分组个数,X为因子时间序列的值。
(4)采用公式2的方法(其中N=16)对T进行绝对熵处理,得到AET。
(5)采用公式4的方法(其中constant=300)对T进行低值统计数处理,得到CBT。
四、针对降雨量(Rainfall)进行特征提取:
(1)采用公式5的方法(其中constant=62)对Rainfall进行分位数处理,得到QRainfall。
(2)采用公式4的方法(其中constant=1)对Rainfall进行低值统计数处理,得到CBRainfall。
(3)采用公式8的方法(其中constant_low=0,constant_up=1)对Rainfall进行范围统计数处理,得到RCRainfall。
(4)采用公式1的方法(其中N=16,constant=3)对Rainfall进行非线性时滞处理,得到CRainfall。
(5)采用公式9的方法(其中nums=16)对Rainfall进行分组熵处理,得到BERainfall。
五、针对相对湿度(RH)进行特征提取:
(1)采用公式3的方法(其中D=2)对RH进行小波变换处理,得到CWTRH。
(2)采用公式6的方法(其中constant=68)对RH进行高值统计数处理,得到CARH。
(3)采用公式5的方法(其中constant=48)对RH进行分位数处理,得到QRH。
(4)采用公式2的方法(其中N=16)对RH进行绝对熵处理,得到AERH。
(5)采用公式9的方法(其中nums=16)对RH进行分组熵处理,得到BERH。
对属于草原的像元中的可燃物含水率、风速、温度、降雨量、相对湿度进行特征提取,提取方法为:
一、针对可燃物含水率进行特征提取:
(1)采用公式5的方法(其中constant=37)对可燃物含水率进行分位数处理,得到QFMC。
(2)采用公式1的方法(其中N=16,constant=2)对可燃物含水率进行非线性时滞处理,得到CFMC。
(3)采用公式8的方法(其中constant_low=200,constant_up=240)对可燃物含水率进行范围统计数处理,得到RCFMC。
(4)采用公式9的方法(其中nums=16)对可燃物含水率进行分组熵处理,得到BEFMC。
(5)采用公式2的方法(其中N=16)对可燃物含水率进行绝对熵处理,得到AEFMC。
二、针对WS进行特征提取:
(1)采用公式4的方法(其中constant=1.8)对WS进行低值统计数处理,得到CBWS。
(2)采用公式5的方法(其中constant=81)对WS进行分位数处理,得到QWS。
(3)采用公式9的方法(其中nums=16)对WS进行分组熵处理,得到BEWS。
(4)采用公式1的方法(其中N=16,constant=2)对WS进行非线性时滞处理,得到CWS。
(5)采用公式6的方法(其中constant=3.8)对WS进行高值统计数处理,得到CAWS。
三、针对T进行特征提取:
(1)采用公式1的方法(其中N=16,constant=0)对T进行非线性时滞处理,得到CT。
(2)采用公式3的方法(其中D=4)对T进行小波变换处理,得到CWTT。
(3)采用公式7的方法(其中constant=287)对T进行值统计数处理,得到VCT。
(4)采用公式6的方法(其中constant=302)对T进行高值统计数处理,得到CAT。
(5)采用公式4的方法(其中constant=290)对T进行低值统计数处理,得到CBT。
四、针对Rainfall进行特征提取:
(1)采用公式9的方法(其中nums=16)对Rainfall进行分组熵处理,得到BERainfall。
(2)采用公式7的方法(其中constant=0)对Rainfall进行值统计数处理,得到VCRainfall。
(3)采用公式3的方法(其中D=1)对Rainfall进行小波变换处理,得到CWTRainfall。
(4)采用公式5的方法(其中constant=44)对Rainfall进行分位数处理,得到QRainfall。
(5)采用公式2的方法(其中N=16)对Rainfall进行绝对熵处理,得到AERainfall。
五、针对RH进行特征提取:
(1)采用公式2的方法(其中N=16)对RH进行绝对熵处理,得到AERH。
(2)采用公式6的方法(其中constant=53)对RH进行高值统计数处理,得到CARH。
(3)采用公式7的方法(其中constant=47)对RH进行值统计数处理,得到VCRH。
(4)采用公式4的方法(其中constant=50)对RH进行低值统计数处理,得到CBRH。
(5)采用公式1的方法(其中N=16,constant=4)对RH进行非线性时滞处理,得到CRH。
(3)模型训练以及调参
经过一系列模型的比较最终选取了XGBoost模型,将野火历史数据库分成经过时间维特征增强的数据库以及未经过时间维特征增强的数据库。将其输入至模型中,并使用网格搜索和交叉验证的方法选取最优参数,最佳的模型参数如下:silent=0、learning_rate=0.3、min_child_weight=1、max_depth=6、gamma=0、subsample=1、max_delta_step=0、colsample_bytree=1、reg_lambda=1、n_estimators=200、seed=1000。
(4)模型结果对比分析
最后对模型进行对比和分析,首先比较了XGBoost模型的ROC曲线和AUC值(见图3)。很明显可以从图(a)分析出,添加了时间维特征增强的草原模型和森林模型的测试集AUC值已经达到了0.99和0.98,而未添加时间维特征增强的草原模型和森林模型的测试集AUC值达到了0.99和0.95。无论是是否添加时间维特征增强,其训练集精度基本都保持较为接近的状态。但是根据图(b)分析出,添加了时间维特征增强的草原模型和森林模型的训练集AUC值已经达到了0.96和0.94,而未添加时间维特征增强的草原模型和森林模型的训练集AUC值达到了0.92和0.88。添加了时间维特征增强的草原和森林模型仍然保持较高的AUC值,但是未添加时间维特征增强的草原和森林模型却变化十分明显。所以使用了时间维特征增强的模型更加的鲁棒。
其次是针对川西区域其模型的结果分析(见图4),图(a)展示了添加了时间维特征增强的2020年3月30日的川西风险图,图(b)展示了未添加时间维特征增强的2020年3月30日的川西风险图,从图(a)与图(b)的比较可以分析出添加了时间维特征增强的川西风险图,风险展示更加精准,而且成片的高风险区域较少,虚警区域更少,在这一天发生了西昌和木里火灾,虽然两图的两个区域的火险在该天都表现高风险,但是图(b)的虚警区域过多,整个凉山州和攀枝花市区域都表现出高风险,过于失真。图(c)展示了添加了时间维特征增强的2020年6月1日的川西风险图,图(d)展示了未添加时间维特征增强的2020年6月1日的川西风险图,进入六月份即进入四川的雨季,火险应该大幅下降或者接近于0,从图(c)与图(d)的比较可以分析出添加了时间维特征增强的川西风险图的风险更接近于事实,而且大部分区域处于低风险,对于未添加时间维特征增强的川西风险图,其风险较高,而且其攀枝花市甚至处于中高风险,这对火险的判断是错误的。
最后是根据今年木里和西昌火灾事件对增加了时间维的模型和未增加时间维的模型进行比较(见图5)。图(a)展示了添加了时间维特征增强的西昌市泸山区域(即2020年西昌市火灾区域)的火险长时间序列的变化情况,图(b)展示了未添加时间维特征增强的西昌市泸山区域的火险长时间序列的变化情况。图(c)展示了添加了时间维特征增强的木里县乔瓦镇区域(即2020年木里县火灾区域)的火险长时间序列的变化情况,图(d)展示了未添加时间维特征增强的木里县乔瓦镇区域的火险长时间序列的变化情况。从火灾季火灾发生的机理上分析,火灾风险应该处于波动上升的变化状态,但从两图的对比中可以发现,图(a)和图(c)一直处于波动且稳定上升的状态,因为川西的火灾季主要集中在一至三月,三月的火灾次数最多,自然火灾风险要高一些,但是图(b)和图(d)却一直处于高值而且几乎无波动,这样的火险预警是错误且失真的,很容易造成错误的火险预报。
从结果分析可以得出,添加了时间维特征增强的模型更加符合事实且更加适用于川西地区,较未添加时间维特征增强的模型更加鲁棒。