细颗粒物对不同报道次序下法定传染病影响的评估方法
技术领域
本发明涉及传染病研究
技术领域
,尤其涉及一种细颗粒物对不同报道次序下法定传染病影响的评估方法。背景技术
随着经济发展和生活水平的提高,工业和交通的排放以及自然现象导致空气污染水平不断上升,空气污染特别是环境细颗粒物PM2.5已经成为一个备受关注的公共卫生问题。金等人对韩国法定传染病发病率与气候、空气污染和医院水平之间的关系进行探讨发现空气污染与传染病发病率(细菌性痢疾、梅毒、肺结核等)呈强烈的相关性。You等人采用泊松线性回归的方法对北京市和中国香港特别行政区室外PM2.5浓度和肺结核(Tuberculosis,TB)季节性关系进行了研究,发现冬季PM2.5浓度每增加10μg/m3,在下一个春季和夏季TB病例数将增加3%,且TB的季节波动性在老人和儿童中更为突出。Mahara等人采用空间回归方法对北京地区2013~2014年空气污染物与猩红热发病率之间关系进行了分析,发现空气污染因子能够提高猩红热的发病率。现有研究也表明PM2.5污染浓度的差异性所导致健康效应出现差异,其机理可能与PM的组分及含量、作用路径及其环境变化如温度间存在复杂的交互作用。近年来,国内外学者研究了空气污染与各种类传染病发生发展情况,却鲜有探究PM2.5与不同报道次序下法定传染病发病和死亡情况的关联关系。
法定传染病的报道次序是在一定周期内按报告病例数多少对传染病的排序,通常排序靠前的疾病会引起更多的重视和关注,而开展对不同报道次序下疾病对健康的影响则可以提升对排序靠后的疾病的重视,对于控制传染病具有极大意义。
基于上述内容,为了研究PM2.5对不同报道次序下法定传染病的影响,有必要提供一种细颗粒物对不同报道次序下法定传染病影响的评估方法。
发明内容
本发明的目的是提供一种细颗粒物对不同报道次序下法定传染病影响的评估方法。
为解决上述技术问题,本发明采用的技术方案是:
一种细颗粒物对不同报道次序下法定传染病影响的评估方法,其包括如下步骤:
S1,提取目标城市在研究周期内公开的法定传染病数据,所述法定传染病数据包括法定传染病种类数、感染人数和死亡人数;
S2,获取目标城市在对应法定传染病期间PM2.5的平均浓度数据,定义疾病报道日当天PM2.5浓度为即刻浓度PM-0day、报道日之前7天和15天内的日均PM2.5浓度为短期平均浓度PM-7day和PM-15day、距报道日之前30天内的日均PM2.5浓度为中期平均浓度PM-30day、距报道日之前60天内的日均PM2.5 浓度为长期平均浓度PM-60day;
S3,将法定传染病数据与PM2.5的平均浓度数据进行数据关联,合成目标数据集;
S4,对目标数据集进行相关性分析,以确定PM2.5浓度和法定传染病之间的相关关系,并筛选出相关性显著变量;
S5,利用相关性显著变量构建法定传染病在不同报道次序下的贝叶斯回归模型,所述贝叶斯回归模型的参数预测变量为感染数量,预测因子为PM2.5浓度和不同报道次序的传染病名称及其二者的交互因子;
S6,基于贝叶斯回归模型提取各种传染病名称下PM2.5浓度和感染人数变量间的边际效应曲线,并根据边际效应曲线评估不同报道次序下PM2.5浓度和患病数量间的量化关系。
可选地,所述S4在对目标数据集进行相关性分析时,是利用Pearson相关系数来实现的;
相关系数r为:
公式(1)中,r为X与Y的相关系数,X为PM-0day、PM-7day、PM-15day、 PM-30day和PM-60day,Y为法定传染病种类数、感染人数和死亡人数,N为目标数据集的数据集样本总量;相关性显著变量是指r>0.05的变量。
可选地,所述贝叶斯回归模型的数据分布为泊松分布,迭代次数为2000,发散跃迁参数为0.99,最大迭代深度为15。
可选地,所述边际效应曲线的PM2.5边际效应模型计算通过贝叶斯回归模型中对不同浓度下的PM2.5均值预测得来,患病数和PM2.5浓度的边际效应置信水平为95%。
本发明的有益效果是:
通过提取目标城市的法定传染病数据和相对应的PM2.5即刻-短期-中期-长期平均浓度数据,并利用贝叶斯回归模型探究不同报道次序下PM2.5的滞后效应与法定传染病的交互效应及其响应关系,提供了一种PM2.5对不同报道次序下法定传染病影响的评估方法,通过该方法可以了解法定传染病的发病特征及流行强度,为政府部门制定传染病防控措施提供科学依据,为人们健康出行提供参考意见。
附图说明
图1是本发明的流程图。
图2是不同时间尺度PM2.5浓度与法定传染病参数之间的Pearson相关性分析结果示意图。
图3是报告数排名前五名与后五名的疾病感染数及致死数变化分析结果示意图。
图4是不同报道次序下法定传染病数量与PM2.5浓度的交互效应示意图:图4中的A图-E图为报道次序结果示意图。
具体实施方式
下面将结合附图和实施例对本发明作进一步地详细描述。
如图1所示,本实施例中的细颗粒物对不同报道次序下法定传染病影响的评估方法,其包括如下步骤:
S1,提取目标城市在研究周期内公开的法定传染病数据,所述法定传染病数据包括法定传染病种类数、感染人数和死亡人数。
例如,当目标城市为北京时,可以从北京市疾病控制中心 (http://www.bjcdc.org/)法定传染病疫情周报提取法定传染病数据。研究周期可以根据需要选取,例如可以选取2008~2019报道的法定传染病共计583期周数据作为法定传染病数据。以周发病率作为传染病的统计标准,资料整理显示:近十年发病率较高的法定传染病分别为:细菌性痢疾(Diarrhea)、流行性感冒 (Flu)、淋病(Gonorrhea)、甲型H1N1流感(H1N1_Flu)、病毒性肝炎(HBV)、丙肝(HCV)、乙肝(Hepatitis_B)、手足口病(HFMD)、猩红热(Scarlet_fever)、肺结核(TB)、梅毒(Syphilis)以及其他感染性腹泻病(Others),为便于研究,可以选取报道次序前五类作为研究对象。
S2,获取目标城市在对应法定传染病期间PM2.5的平均浓度数据,定义疾病报道日当天PM2.5浓度为即刻浓度PM-0day、报道日之前7天和15天内的日均PM2.5浓度为短期平均浓度PM-7day和PM-15day、距报道日之前30天内的日均PM2.5浓度为中期平均浓度PM-30day、距报道日之前60天内的日均PM2.5 浓度为长期平均浓度PM-60day。
仍以目标城市为北京为例,可以结合北京市环境监测中心 (http://www.bjshjjc.com/)获取对应法定传染病期间PM2.5的平均浓度数据。
S3,将法定传染病数据与PM2.5的平均浓度数据进行数据关联,合成目标数据集。
S4,对目标数据集进行相关性分析,以确定PM2.5浓度和法定传染病之间的相关关系,并筛选出相关性显著变量。
评估法定传染病累积感染人数与累积致死数与其报道次序的关系,考虑到报道次序与法定传染病累积感染数与累积致死数可能不是一一对应关系,因此,本发明实施例通过对目标数据集进行相关性分析,来确定不同报道次序下法定传染病与PM2.5是否存在关系。
可选地,所述S4在对目标数据集进行相关性分析时,是利用Pearson相关系数来实现的;
相关系数r为:
公式(1)中,r为X与Y的相关系数,X为PM-0day、PM-7day、PM-15day、 PM-30day和PM-60day,Y为法定传染病种类数、感染人数和死亡人数,N为目标数据集的数据集样本总量;相关性显著变量是指r>0.05的变量。
不同时间尺度PM2.5浓度与法定传染病参数的Pearson相关性分析结果如图 2所示,分析结果显示法定传染病种类数与PM2.5在各个时间尺度上均具有较强显著的负相关性(r0day=-0.26,r7day=-0.23,r15day=-0.26,r30day=-0.34, r60day=-0.43,p<0.05),且时间尺度越大,相关性越强。法定传染病报告种类数与即刻-短期-中期-长期PM2.5浓度均呈负相关;总感染人数指标和死亡人数指标间存在极显著的正相关关系(0.82,p<0.01),总感染人数仅和长期PM2.5 平均浓度存在显著的负相关关系(r=-0.17,p<0.05),与中短期PM2.5平均浓度的相关性不显著;死亡人数指标则与不同时间尺度下PM2.5平均浓度间的关联性不显著。分析结果揭示PM2.5浓度对法定传染病种类数具有累积效应,累积效应时间越长,二者间的相关性越显著。
S5,利用相关性显著变量构建法定传染病在不同报道次序下的贝叶斯回归模型,所述贝叶斯回归模型的参数预测变量为感染数量,预测因子为PM2.5浓度和不同报道次序的传染病名称及其二者的交互因子。
其中,可以基于R语言brm包利用相关性显著变量构建贝叶斯回归模型。
可选地,所述贝叶斯回归模型的数据分布为泊松分布,迭代次数为2000,发散跃迁参数为0.99,最大迭代深度为15,以保证贝叶斯回归模型能够选择适合的样本量,避免后验样本产生偏差。
S6,基于贝叶斯回归模型提取各种传染病名称下PM2.5浓度和感染人数变量间的边际效应曲线,并根据边际效应曲线评估不同报道次序下PM2.5浓度和患病数量间的量化关系。
其中,可以使用ggeffects包中condition_effect函数提取各种传染病名称下PM2.5浓度和感染人数变量间的边际效应曲线。边际效应曲线可以揭示PM2.5 滞后效应与法定传染病交互作用的边际效应。
可选地,所述边际效应曲线的PM2.5边际效应模型计算通过贝叶斯回归模型中对不同浓度下的PM2.5均值预测得来,患病数和PM2.5浓度的边际效应置信水平为95%。
图3是报告数排名前五名与后五名的疾病感染数及致死数变化分析结果示意图,其揭示了传染病感染及致死情况统计。由图3可得,研究期间病毒性肝炎造成的感染人数最多(~18000人),且致死人数也相对较多(>10人);其次是猩红热(感染人数约为15000人,致死人数不足7人);细菌性痢疾次之(感染约14000人,致死人数多于7人);甲型H1N1、梅毒和乙肝则致感染人数相对最低,其致死人数也最低。此外,结果还揭示第二报道次序的病毒性肝炎造成的感染人数最多(>18000人)且致死人数也相对最多(>10人),而首要次序的流行感冒造成的感染人数仅为5000人左右,但其致死人数不足5人;处于第五报道次序猩红热和细菌性痢疾造成的累积感染人数也相对较多(约为14000 和13000人)。研究结果表明感染人数和报道次序的对应关系仅在单独报道中成立,但在一段期间内传染病累积感染数与累积致死数与其报道次序不存在严格对应关系,提示不论报道次序如何,各传染病均需要引起足够重视。
图4为不同报道次序下法定传染病数量与PM2.5浓度的交互效应,法定传染病数量与PM2.5浓度的交互效应见图4。贝叶斯回归模型的边际效应基于贝叶斯回归模型结果呈现了PM2.5梯度浓度下与病患数的变化关系及其显著的趋势变化特征(P<0.001)。在不同报道次序下,各法定传染病患病数量随PM2.5 浓度变化的过程揭示了手足口病和肺结核作为首要报道次序时,其患病数随 PM2.5浓度升高有显著下降趋势(P<0.001),当PM2.5浓度约为20μg/m3轻度污染时,其患病数为13人(95%CI:11.358,14.671),而细菌性痢疾和流行性感冒则受PM2.5浓度影响相对较小(图4中的A图),PM2.5浓度约为20μg/m3轻度污染时,患病数数约为10人(95%CI:8.620,13.132);细菌性痢疾作为第二报道次序时,其患病数随PM2.5浓度升高而有极显著上升趋势(P<0.001)(图 4中的B图),当PM2.5浓度在140~160μg/m3重度污染时,因细菌性痢疾造成的患病数在12人以上(95%CI:10.985,13.244);当作为第三或第四报道次序的传染病时,其患病数随PM2.5浓度升高反而有明显下降趋势(P<0.001)(图4 中的C图和D图),其患病数在10人以下(95%CI:8.663,12.840)而作为第五报道次序时,其患病人数随PM2.5浓度变化趋势又与作为首要报道次序时相类似(图4中的E图),患病人数达17人以上(95%CI:14.651,20.850)。此外,肺结核和细菌性痢疾被作为首要传染病出现的次数相对较多,病毒性肝炎次之,手足口病和甲型H1N1流感相对较少,但随PM2.5浓度变化趋势也不同,第一报道次序时,手足口病有明显下降趋势,且下降幅度较大。这些结果揭示了在不同报道次序各传染病患病数与PM2.5浓度梯度间存在明显的差异性,即各法定传染病与PM2.5浓度变化间的交互效应会随不同报道次序而存在不同的响应。
本发明实施例通过提取目标城市的法定传染病数据和相对应的PM2.5即刻- 短期-中期-长期平均浓度,并利用贝叶斯回归模型探究不同报道次序下PM2.5 的滞后效应与法定传染病的交互效应及其响应关系,可以了解法定传染病的发病特征及流行强度,为政府部门制定传染病防控措施提供科学依据,为人们健康出行提供参考意见。
可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。