一种基于序列前向选择的红外光谱在线快速识别分析方法

文档序号:6039 发布日期:2021-09-17 浏览:85次 英文

一种基于序列前向选择的红外光谱在线快速识别分析方法

技术领域

本发明涉及红外光谱分析领域,特别涉及到一种红外光谱在线快速识别分析方法。

背景技术

红外光谱分析技术是对红外活性待测物质的定量定性信息进行非接触式、在线快速无损检测。红外光谱定性分析是采用已知标准参考光谱集对测量的未知样品种类进行判断识别,而红外光谱实时在线快速准确识别分析方法是傅里叶变换红外光谱技术应用于未知危险气体泄露预警监测的关键。传统的FTIR定性识别分析方法一般在小尺度的标准光谱数据库中采用谱库检索的方式进行识别分析,例如混合匹配校正、点积运算等方法,然而这些方法无法对光谱吸收成分较多或者干扰较多情况下的光谱进行在线快速识别分析。鉴于人工神经网络算法具有较强的拟合能力和抗干扰能力,ANN算法在光谱定性分析方法中得到大量的应用,但随着光谱数据库的扩增,ANN训练模型所需的时间和样本量也随之增加,其无法满足于在线识别分析的应用需求。为此,对红外光谱的在线快速准确识别是红外光谱技术应用于预警检测中的一个关键技术难题。

发明内容

本发明目的是为了提供一种基于序列前向选择方法的红外光谱在线快速准确识别分析方法,结合光谱的自动基线校正方法,形成未知待测样品的红外光谱实时在线、快速准确的定性分析方法,识别出待测样品的种类。

本发明的技术方案为:一种基于序列前向选择的红外光谱在线快速识别分析方法,包括以下步骤:

(A)用傅里叶变换红外光谱仪采集多种混合气体的红外光谱,再经过光谱的预处理得到实际测量的吸光度光谱,并根据实际测量的吸光度光谱的特征进行相应的数据库准备;

(B)采用自动基线校正方法对上述吸光度光谱的基线进行校正,得到基线校正后的吸光度光谱Ybc

(C)利用序列前向选择方法和AIC准则对测量光谱Ybc进行变量选择,第一次筛选得到的成分变量集合,利用数据库中与变量对应的标准光谱数据建立吸光度矩阵Km×n,其中m为光谱数据长度,n为选择变量个数;

(D)根据朗伯比尔定律,利用线性最小二乘方法拟合计算第一次筛选得到的成分变量集合中的变量所对应的浓度,根据实际中气体成分浓度大于0的物理特征,将浓度小于0的变量予以剔除,并循环该步骤直到所有的变量对应的浓度数值均大于0时停止,得到第二次筛选变量集合S和此时各成分的浓度矩阵CS,然后仅执行步骤E,或者,依次执行步骤E、步骤F两个步骤;

(E)进行第三次筛选,具体如下:计算KS*CS得到第二次筛选变量集合S对应的吸光度光谱矩阵YS,其中,KS为第二次筛选变量集合S对应的标准吸光度光谱,根据吸光度矩阵YS与基线校正后的吸光度光谱Ybc之间的方向夹角的实际物理意义,令YS与Ybc方向夹角的余弦值为TC,TC值用来衡量Ys与Ybc的方向夹角特性,如果此值越大,则表明Ys中对应的成分在目标光谱中的占比越大,属于目标成分的概率越大,基于此特性,对第二次筛选的变量集合S中各变量对应的TC值进行阈值判断,如果TC值大于设定的阈值T,则第三次筛选得到成分变量集F;反之,如果TC值小于设定的阈值T,则识别出测量光谱中不包含任何气体种类,结束计算;

(F)联合成分变量集F对应光谱中的多波段信息与实测光谱对应的特征信息,对干扰成分变量进行剔除,第四次筛选得到最终目标成分变量,得到测量光谱中的气体种类,结束计算。

进一步的,所述步骤(B)中,利用自动基线校正算法对实测光谱的基线进行在线校正,为光谱的在线识别分析提供准确数据。

进一步的,所述步骤(E)中按照如下步骤进行第三次筛选:

(E1)、利用公式计算步骤(E)中YS与基线校正后的吸光度光谱Ybc的方向夹角的余弦值;预先设置的阈值T,如果TC>T,保留当前变量对应的成分,反之,剔除当前变量对应的成分,如果所有TC均小于T,则判断输出无目标气体成分,并保留TC所有变量对应的成分。

进一步的,所述步骤(D)之后,如果仅执行步骤(E),则以(E)步骤执行的第三次筛选的结果作为最终目标成分变量,得到测量光谱中的气体种类,结束计算。

进一步的,所述步骤(F)联合成分变量F对应光谱中的多波段信息与实测光谱对应的特征信息,对干扰成分变量进行剔除,第四次筛选得到最终目标成分变量,具体如下:

(F1)、利用F变量所对应的光谱中强吸收的光谱信息,与当前基线校正光谱Ybc进行相关性分析,利用变量集F中的多波段吸收光谱特征,将F中同组份不同波段的光谱信息和实测光谱在此波段的光谱进行特征分析,剔除特征信息量弱于阈值的成分变量,从而完成进一步剔除集合F中的干扰组分,实现准确选择目标气体成分。

有益效果:

(1)本发明利用红外光谱自动基线校正算法对实时测量的光谱的基线进行了在线自动校正,为红外光谱的在线识别分析算法提供了数据支持;

(2)采用序列前向选择方法和AIC准则对光谱数据特征变量进行了第一次选择,因此,变量选择速度快。

(3)本发明根据气体浓度大于0的实际物理含义对第一选择变量进行了第二次筛选;并结合选择变量和基线校正后的吸光度光谱的方向夹角的物理特征,用方向夹角的余弦值TC为判断标准进行第三次变量筛选,该步骤能够有效剔除大多数情况下的干扰成分变量;

(4)然后利用第三次筛选后的变量的多波段信息和实测光谱值之间的特征信息分析,对变量进行了第四次筛选,其优点是更准确,能够精练第三次筛选的变量集,令识别准确率更高,最终得到了识别气体成分信息。

附图说明

图1为一种基于序列前向选择的红外光谱在线快速识别分析方法流程图;

图2为2800cm-1~3200cm-1波段的丙烷气体的测量吸光度谱、基线校正后的吸光度光谱以及拟合的基线;

图3(a)为序列前向选择和AIC准则对校正光谱的变量进行第一次选择,第一次选择的拟合光谱和基线校正后的吸光度光谱以及对应的变量成分浓度结果;

图3(b)为序列前向选择和AIC准则对校正光谱的变量进行第一次选择,第一次选择后的变量成分名称;

图4(a)为经过循环剔除浓度小于0的变量操作后,第二次变量选择后的拟合光谱和基线校正后的吸光度光谱以及对应的变量成分浓度结果;

图4(b)为经过循环剔除浓度小于0的变量操作后,第二次变量选择后的变量成分名称;

图5(a)为经过TC阈值筛选后,第三次变量选择后的拟合光谱和基线校正后的吸光度光谱以及对应的变量成分浓度结果;

图5(b)为经过TC阈值筛选后,第三次变量选择后的变量成分名称;

图6(a)为经过变量多波段信息特征筛选后,第四次变量选择后最终的拟合光谱和基线校正后的吸光度光谱以及对应的变量成分浓度结果;

图6(b)为经过变量多波段信息特征筛选后,第四次变量选择后最终的变量成分名称。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅为本发明的一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域的普通技术人员在不付出创造性劳动的前提下所获得的所有其他实施例,都属于本发明的保护范围。

根据本发明的实施例,本发明一种基于序列前向选择的红外光谱在线快速识别分析方法,如图1所示,包括如下步骤:

(A)用傅里叶变换红外光谱仪采集红外光谱,不限于光谱仪器的形式和波数分辨率,再经过光谱的预处理得到实际测量的吸光度光谱,波数范围不限。并根据测量光谱的特征进行相应的数据库准备;

(B)采用自动基线校正方法对上述吸光度光谱的基线进行校正,得到基线校正后的测量光谱Ybc

(C)利用序列前向选择方法和AIC准则对光谱Ybc进行变量选择,第一次筛选得到的成分变量集合,利用数据库中与变量对应的标准光谱数据建立吸光度矩阵Km×n(其中m为光谱数据长度,n为选择变量个数);

(D)根据朗伯比尔定律,计算初步选择变量对应的浓度大小,对浓度小于0的变量予以剔除,并循环该步骤直到所有的变量对应的浓度数值均大于0时停止,得到第二次筛选变量合S和此时各成分的浓度矩阵CS,并进入下一步;

(E)计算KS*CS得到变量S对应的吸光度光谱矩阵YS,KS为筛选变量S对应的标准吸光度光谱,令YS与基线校正后的吸光度光谱Ybc方向夹角的余弦值,定义并对变量集合S中个变量对应的TC值大小进行阈值判断,如果TC大于阈值T,则第三次筛选得到成分变量集F,并进入下一步,反之,则识别出测量光谱中不包含任何气体种类,结束计算。

(F)联合成分变量F对应光谱中的多波段信息与实测光谱对应的特征信息,对干扰成分变量进行剔除,第四次筛选得到最终目标成分变量,得到测量光谱中的气体种类,结束计算。

具体的,所述步骤(E)中按照如下步骤进行第三次筛选:

(E1)、利用公式计算步骤(E)中YS与基线校正后的吸光度光谱Ybc的方向夹角的余弦值;预先设置的阈值T,如果TC>T,保留当前变量对应的成分,反之,剔除当前变量对应的成分,如果所有TC均小于T,则判断输出无目标气体成分,并保留TC所有变量对应的成分。

具体的,所述步骤(F)联合成分变量F对应光谱中的多波段信息与实测光谱对应的特征信息,对干扰成分变量进行剔除,第四次筛选得到最终目标成分变量,具体如下:

(F1)、利用F变量所对应的光谱中强吸收的光谱信息,与当前基线校正光谱Ybc进行相关性分析,利用变量集F中的多波段吸收光谱特征,将F中同组份不同波段的光谱信息和实测光谱在此波段的光谱进行特征分析,剔除特征信息量弱于阈值的成分变量,从而完成进一步剔除集合F中的干扰组分,实现准确选择目标气体成分。

根据本发明的一个实施例,采用本发明的方法进行实际测试,具体实施步骤如下:

(1)将丙烷标准气体混合通入红外光谱仪的气体吸收池中,用傅里叶变换红外光谱仪采集得到C3H8气体成分的吸收光谱数据,获取一定波段范围内丙烷气体的实际吸收光谱数据,这里光谱波段为2800cm-1~3200cm-1波段。并利用自动基线校正方法对测量的吸收光谱的基线进行校正,原始测量光谱(即图2中的原始光谱)和基线校正后的吸光度光谱(即图2中的校准后光谱)如图2所示;

(2)采用序列前向选择方法和AIC准则对校正后的吸光度光谱进行变量选择,第一次选择出73种成分,并计算的得到对应成分的浓度结果如图3(a)-(b)所示;图3(a)为第一次选择的73种成分的拟合光谱和基线校正后吸光度光谱以及对应的变量成分浓度结果;图3(b)为第一次选择后的73种成分的变量成分名称;

(3)然后循环剔除73种成分中对应浓度小于0的变量,第二次选择出10种气体成分,对应的气体成分和浓度以及拟合效果如图4(a)-(b)所示;图4(a)为经过循环剔除浓度小于0的变量操作后,第二次变量选择后的拟合光谱和基线校正后吸光度光谱以及对应的变量成分浓度结果;图4(b)为经过循环剔除浓度小于0的变量操作后,第二次变量选择后的变量成分名称;

(4)然后利用设定阈值为0.1,对TS中的变量进行筛选,第三次选择出2种气体成分,对应的气体成分和浓度以及拟合效果如图5(a)-(b)所示;图5(a)为经过TC阈值筛选后,第三次变量选择后的拟合光谱和基线校正后吸光度光谱以及对应的变量成分浓度结果;图5(b)为经过TC阈值筛选后,第三次变量选择后的变量成分名称;

(5)最终利用变量的多波段信息和实际测量光谱的特征,对干扰成分进行了第四次剔除,最终得到了识别气体成分和浓度结果以及最终拟合效果如图6(a)-(b)所示。图6(a)为经过变量多波段信息特征筛选后,第四次变量选择后最终的拟合光谱和基线校正后吸光度光谱以及对应的变量成分浓度结果;图6(b)为经过变量多波段信息特征筛选后,第四次变量选择后最终的变量成分名称。

整个光谱定性识别过程在win10平台运行,采用matlab R2018ab编码实现,在跨越400cm-1区间的光谱的识别所用时间仅需0.71秒。由此可以得出本方法能够在很短的时间内准确在线识别出待测气体成分。

为了测试本方法实际的红外光谱定性识别能力,分别进行了多成分和单组份相关实验,表明该方法能够对红外光谱进行多成分在线快速准确识别。

尽管本发明的实施步骤已公开如上,但其不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种光谱处理的领域,对于熟悉本领域的人员而言,可以容易的实现其他的修改,因此在不背离权利要求及等同范围限定的一般概念下,本发明不限于特定的细节和这里所展示与描述的图例。

除说明书所述的技术特征外,均为本专业技术人员的已知技术。

完整详细技术资料下载
上一篇:石墨接头机器人自动装卡簧、装栓机
下一篇:一种水质pH值光学检测方法及装置

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!