Osahs识别方法、模型、模型建立方法、及装置
技术领域
本申请涉及睡眠呼吸识别技术,尤其涉及一种OSAHS识别方法、模型、模型建立方法、及装置。
背景技术
阻塞性睡眠呼吸暂停低通气综合征(obstructive sleep apnea hypopneasyndrome,OSAHS)是指患者在睡眠过程中反复出现呼吸暂停和低通气,临床上可表现为打鼾,且鼾声不规律,患者自觉憋气,甚至反复被憋醒,常伴有夜尿增多,晨起头痛、头晕和口咽干燥等一系列症候群。近年来,OSAHS的发病特点呈现向年轻化、非肥胖人群发展的趋势,已成为影响人类睡眠质量的主要疾病之一。目前,临床上诊断OSHAS仍然以多导睡眠图(PSG)为主要手段,但PSG检查要求患者在特定的睡眠实验室佩戴相应的设备,检查条件严格,患者依从性和普及性尚有待提高。
发明内容
鉴于上述问题,本申请旨在提出一种OSAHS识别方法、模型、模型建立方法、及装置。
本申请的OSAHS识别方法,其包括:
将受试者的原始血压数据通过数据准备模块进行异常值处理和缺失值插补得到经处理的血压数据;
经处理的血压数据被送至特征提取模块,提取出模型输入量,所述模型输入量包括下列输入量中的至少一些:
1)日均舒张压;
2)夜均收缩压;
3)夜均舒张压;
4)夜间收缩压下降率;
5)夜间舒张压下降率;
6)夜间平均压下降率;
7)血压节律形态;
8)24h收缩压负荷;
9)24h舒张压负荷;
10)日间收缩压负荷;
11)日间舒张压负荷;
12)夜间收缩压上面积;
13)夜间收缩压下面积;
14)夜间收缩压上升最大高度;
15)夜间收缩压下降最大深度;
16)夜间收缩压T2持续时间;
17)夜间收缩压K1斜率;
18)夜间收缩压波动;
19)夜间收缩压H1高度;
20)夜间舒张压上面积;
21)夜间舒张压下面积;
22)夜间舒张压上升最大高度;
23)夜间舒张压下降最大深度;
24)夜间舒张压K1斜率;
25)夜间舒张压波动;
26)夜间舒张压H1高度;
27)夜间平均压上面积;
28)夜间平均压下面积;
29)夜间平均压上升最大高度;
30)夜间平均压下降最大深度;
31)夜间平均压波动;
32)夜间平均压H1高度;
33)早晨收缩压上面积;
34)早晨收缩压上升时间;
35)早晨收缩压上升最大高度;
36)早晨舒张压上面积;
37)早晨舒张压上升最大高度;
38)早晨平均压上面积;
39)早晨平均压上升最大高度;
40)归一化的夜间收缩压T2持续时间;
将所述模型输入量输入到OSAHS识别模型,所述识别模型为Logistic回归模型;
所述识别模型根据所述输入量计算得到OSAHS风险评分;根据计算所得的风险评分与预定的阈值进行比较,确定该受试者是否患有OSAHS。
优选地,所述识别模型的截距为1.35454232;
所述识别模型对应于各模型输入量的系数为:
1.1)对应于日均舒张压的系数为0.171825933;
2.1)对应于夜均收缩压的系数为0.760051681;
3.1)对应于夜均舒张压的系数为-0.301094165;
4.1)对应于夜间收缩压下降率的系数为-1.703366483;
5.1)对应于夜间舒张压下降率的系数为0.569433975:
6.1)对应于夜间平均压下降率的系数为-0.122854502:
7.1)对应于血压节律形态的系数为-1.260220152;
8.1)对应于24h收缩压负荷的系数为-0.325585879;
9.1)对应于24h舒张压负荷的系数为0.374904589;
10.1)对应于日间收缩压负荷的系数为-0.804455162;
11.1)对应于日间舒张压负荷的系数为0.232331651;
12.1)对应于夜间收缩压上面积的系数为0.476055269;
13.1)对应于夜间收缩压下面积的系数为-1.23184605;
14.1)对应于夜间收缩压上升最大高度的系数为0.406756655;
15.1)对应于夜间收缩压下降最大深度的系数为0.317857477;
16.1)对应于夜间收缩压T2持续时间的系数为0.073568283;
17.1)对应于夜间收缩压K1斜率的系数为0.635679204;
18.1)对应于夜间收缩压波动的系数为-0.217943708;
19.1)对应于夜间收缩压H1高度的系数为0.37952764;
20.1)对应于夜间舒张压上面积的系数为-0.00338707;
21.1)对应于夜间舒张压下面积的系数为-0.062813725;
22.1)对应于夜间舒张压上升最大高度的系数为0.136287799;
23.1)对应于夜间舒张压下降最大深度的系数为0.429297414;
24.1)对应于夜间舒张压K1斜率的系数为-0.45107689;
25.1)对应于夜间舒张压波动的系数为-0.083821896;
26.1)对应于夜间舒张压H1高度的系数为0.299561695;
27.1)对应于夜间平均压上面积的系数为0.206504969;
28.1)对应于夜间平均压下面积的系数为0.014999594;
29.1)对应于夜间平均压上升最大高度的系数为-0.281755104;
30.1)对应于夜间平均压下降最大深度的系数为0.157846579;
31.1)对应于夜间平均压波动的系数为0.551148676;
32.1)对应于夜间平均压H1高度的系数为0.249326376;
33.1)对应于早晨收缩压上面积的系数为0.440745049;
34.1)对应于早晨收缩压上升时间的系数为-0.174874368;
35.1)对应于早晨收缩压上升最大高度的系数为-0.33988987;
36.1)对应于早晨舒张压上面积的系数为-0.598357033;
37.1)对应于早晨舒张压上升最大高度的系数为0.41503691;
38.1)对应于早晨平均压上面积的系数为-0.416355472;
39.1)对应于早晨平均压上升最大高度的系数为0.283126115;
40.1)对应于归一化的夜间收缩压T2持续时间的系数为-0.296675777。
优选地,所述阈值为0.5;
若计算所得的风险评分大于阈值,判断受试者患有OSAHS的风险大;若计算所得的风险评分大于阈值,判断受试者患有OSAHS的风险小。
本申请的建立OSAHS识别模型的方法,其中,所述识别模型基于Logistic回归模型;
将所述识别模型的输入量设定为包括下列输入量中的至少一些:
1)日均舒张压;
2)夜均收缩压;
3)夜均舒张压;
4)夜间收缩压下降率;
5)夜间舒张压下降率;
6)夜间平均压下降率;
7)血压节律形态;
8)24h收缩压负荷;
9)24h舒张压负荷;
10)日间收缩压负荷;
11)日间舒张压负荷;
12)夜间收缩压上面积;
13)夜间收缩压下面积;
14)夜间收缩压上升最大高度;
15)夜间收缩压下降最大深度;
16)夜间收缩压T2持续时间;
17)夜间收缩压K1斜率;
18)夜间收缩压波动;
19)夜间收缩压H1高度;
20)夜间舒张压上面积;
21)夜间舒张压下面积;
22)夜间舒张压上升最大高度;
23)夜间舒张压下降最大深度;
24)夜间舒张压K1斜率;
25)夜间舒张压波动;
26)夜间舒张压H1高度;
27)夜间平均压上面积;
28)夜间平均压下面积;
29)夜间平均压上升最大高度;
30)夜间平均压下降最大深度;
31)夜间平均压波动;
32)夜间平均压H1高度;
33)早晨收缩压上面积;
34)早晨收缩压上升时间;
35)早晨收缩压上升最大高度;
36)早晨舒张压上面积;
37)早晨舒张压上升最大高度;
38)早晨平均压上面积;
39)早晨平均压上升最大高度;
40)归一化的夜间收缩压T2持续时间;
将所述识别模型对应于各模型输入量的系数设定为:
1.1)对应于日均舒张压的系数为0.171825933;
2.1)对应于夜均收缩压的系数为0.760051681;
3.1)对应于夜均舒张压的系数为-0.301094165;
4.1)对应于夜间收缩压下降率的系数为-1.703366483;
5.1)对应于夜间舒张压下降率的系数为0.569433975:
6.1)对应于夜间平均压下降率的系数为-0.122854502:
7.1)对应于血压节律形态的系数为-1.260220152;
8.1)对应于24h收缩压负荷的系数为-0.325585879;
9.1)对应于24h舒张压负荷的系数为0.374904589;
10.1)对应于日间收缩压负荷的系数为-0.804455162;
11.1)对应于日间舒张压负荷的系数为0.232331651;
12.1)对应于夜间收缩压上面积的系数为0.476055269;
13.1)对应于夜间收缩压下面积的系数为-1.23184605;
14.1)对应于夜间收缩压上升最大高度的系数为0.406756655;
15.1)对应于夜间收缩压下降最大深度的系数为0.317857477;
16.1)对应于夜间收缩压T2持续时间的系数为0.073568283;
17.1)对应于夜间收缩压K1斜率的系数为0.635679204;
18.1)对应于夜间收缩压波动的系数为-0.217943708;
19.1)对应于夜间收缩压H1高度的系数为0.37952764;
20.1)对应于夜间舒张压上面积的系数为-0.00338707;
21.1)对应于夜间舒张压下面积的系数为-0.062813725;
22.1)对应于夜间舒张压上升最大高度的系数为0.136287799;
23.1)对应于夜间舒张压下降最大深度的系数为0.429297414;
24.1)对应于夜间舒张压K1斜率的系数为-0.45107689;
25.1)对应于夜间舒张压波动的系数为-0.083821896;
26.1)对应于夜间舒张压H1高度的系数为0.299561695;
27.1)对应于夜间平均压上面积的系数为0.206504969;
28.1)对应于夜间平均压下面积的系数为0.014999594;
29.1)对应于夜间平均压上升最大高度的系数为-0.281755104;
30.1)对应于夜间平均压下降最大深度的系数为0.157846579;
31.1)对应于夜间平均压波动的系数为0.551148676;
32.1)对应于夜间平均压H1高度的系数为0.249326376;
33.1)对应于早晨收缩压上面积的系数为0.440745049;
34.1)对应于早晨收缩压上升时间的系数为-0.174874368;
35.1)对应于早晨收缩压上升最大高度的系数为-0.33988987;
36.1)对应于早晨舒张压上面积的系数为-0.598357033;
37.1)对应于早晨舒张压上升最大高度的系数为0.41503691;
38.1)对应于早晨平均压上面积的系数为-0.416355472;
39.1)对应于早晨平均压上升最大高度的系数为0.283126115;
40.1)对应于归一化的夜间收缩压T2持续时间的系数为-0.296675777;
将所述识别模型的截距设定为1.35454232。
本申请的OSAHS识别装置,其包括:数据准备单元、特征提取单元、识别模型单元;
数据准备单元对受试者的原始血压数据进行异常值处理和缺失值插,补得到经处理的血压数据;
特征提取单元自所述经处理的血压数据中提取出模型输入量,所述模型输入量包括下列输入量中的至少一些:
1)日均舒张压;
2)夜均收缩压;
3)夜均舒张压;
4)夜间收缩压下降率;
5)夜间舒张压下降率;
6)夜间平均压下降率;
7)血压节律形态;
8)24h收缩压负荷;
9)24h舒张压负荷;
10)日间收缩压负荷;
11)日间舒张压负荷;
12)夜间收缩压上面积;
13)夜间收缩压下面积;
14)夜间收缩压上升最大高度;
15)夜间收缩压下降最大深度;
16)夜间收缩压T2持续时间;
17)夜间收缩压K1斜率;
18)夜间收缩压波动;
19)夜间收缩压H1高度;
20)夜间舒张压上面积;
21)夜间舒张压下面积;
22)夜间舒张压上升最大高度;
23)夜间舒张压下降最大深度;
24)夜间舒张压K1斜率;
25)夜间舒张压波动;
26)夜间舒张压H1高度;
27)夜间平均压上面积;
28)夜间平均压下面积;
29)夜间平均压上升最大高度;
30)夜间平均压下降最大深度;
31)夜间平均压波动;
32)夜间平均压H1高度;
33)早晨收缩压上面积;
34)早晨收缩压上升时间;
35)早晨收缩压上升最大高度;
36)早晨舒张压上面积;
37)早晨舒张压上升最大高度;
38)早晨平均压上面积;
39)早晨平均压上升最大高度;
40)归一化的夜间收缩压T2持续时间;
识别模型单元包括识别模型,所述识别模型为Logistic回归模型,其根据所述输入量计算得到该受试者的OSAHS风险评分;根据计算所得的风险评分与预定的阈值进行比较,确定该受试者是否患有阻塞性睡眠呼吸暂停综合征。
优选地,所述数据准备单元、特征提取单元、识别模型单元为配置为执行对应功能的计算装置。
优选地,所述识别模型的截距为1.3545424232;
所述识别模型对应于各模型输入量的系数为:
1.1)对应于日均舒张压的系数为0.171825933;
2.1)对应于夜均收缩压的系数为0.760051681;
3.1)对应于夜均舒张压的系数为-0.301094165;
4.1)对应于夜间收缩压下降率的系数为-1.703366483;
5.1)对应于夜间舒张压下降率的系数为0.569433975:
6.1)对应于夜间平均压下降率的系数为-0.122854502:
7.1)对应于血压节律形态的系数为-1.260220152;
8.1)对应于24h收缩压负荷的系数为-0.325585879;
9.1)对应于24h舒张压负荷的系数为0.374904589;
10.1)对应于日间收缩压负荷的系数为-0.804455162;
11.1)对应于日间舒张压负荷的系数为0.232331651;
12.1)对应于夜间收缩压上面积的系数为0.476055269;
13.1)对应于夜间收缩压下面积的系数为-1.23184605;
14.1)对应于夜间收缩压上升最大高度的系数为0.406756655;
15.1)对应于夜间收缩压下降最大深度的系数为0.317857477;
16.1)对应于夜间收缩压T2持续时间的系数为0.073568283;
17.1)对应于夜间收缩压K1斜率的系数为0.635679204;
18.1)对应于夜间收缩压波动的系数为-0.217943708;
19.1)对应于夜间收缩压H1高度的系数为0.37952764;
20.1)对应于夜间舒张压上面积的系数为-0.00338707;
21.1)对应于夜间舒张压下面积的系数为-0.062813725;
22.1)对应于夜间舒张压上升最大高度的系数为0.136287799;
23.1)对应于夜间舒张压下降最大深度的系数为0.429297414;
24.1)对应于夜间舒张压K1斜率的系数为-0.45107689;
25.1)对应于夜间舒张压波动的系数为-0.083821896;
26.1)对应于夜间舒张压H1高度的系数为0.299561695;
27.1)对应于夜间平均压上面积的系数为0.206504969;
28.1)对应于夜间平均压下面积的系数为0.014999594;
29.1)对应于夜间平均压上升最大高度的系数为-0.281755104;
30.1)对应于夜间平均压下降最大深度的系数为0.157846579;
31.1)对应于夜间平均压波动的系数为0.551148676;
32.1)对应于夜间平均压H1高度的系数为0.249326376;
33.1)对应于早晨收缩压上面积的系数为0.440745049;
34.1)对应于早晨收缩压上升时间的系数为-0.174874368;
35.1)对应于早晨收缩压上升最大高度的系数为-0.33988987;
36.1)对应于早晨舒张压上面积的系数为-0.598357033;
37.1)对应于早晨舒张压上升最大高度的系数为0.41503691;
38.1)对应于早晨平均压上面积的系数为-0.416355472;
39.1)对应于早晨平均压上升最大高度的系数为0.283126115;
40.1)对应于归一化的夜间收缩压T2持续时间的系数为-0.296675777。
优选地,所述阈值为0.5;
若计算所得的风险评分大于阈值,判断受试者患OSAHS的风险大;若计算所得的风险评分大于阈值,判断受试者患有OSAHS的风险小。
本申请的OSAHS识别模型,其中,所述识别模型基于Logistic回归模型;
所述识别模型的输入量包括下列输入量中的至少一些:
1)日均舒张压;
2)夜均收缩压;
3)夜均舒张压;
4)夜间收缩压下降率;
5)夜间舒张压下降率;
6)夜间平均压下降率;
7)血压节律形态;
8)24h收缩压负荷;
9)24h舒张压负荷;
10)日间收缩压负荷;
11)日间舒张压负荷;
12)夜间收缩压上面积;
13)夜间收缩压下面积;
14)夜间收缩压上升最大高度;
15)夜间收缩压下降最大深度;
16)夜间收缩压T2持续时间;
17)夜间收缩压K1斜率;
18)夜间收缩压波动;
19)夜间收缩压H1高度;
20)夜间舒张压上面积;
21)夜间舒张压下面积;
22)夜间舒张压上升最大高度;
23)夜间舒张压下降最大深度;
24)夜间舒张压K1斜率;
25)夜间舒张压波动;
26)夜间舒张压H1高度;
27)夜间平均压上面积;
28)夜间平均压下面积;
29)夜间平均压上升最大高度;
30)夜间平均压下降最大深度;
31)夜间平均压波动;
32)夜间平均压H1高度;
33)早晨收缩压上面积;
34)早晨收缩压上升时间;
35)早晨收缩压上升最大高度;
36)早晨舒张压上面积;
37)早晨舒张压上升最大高度;
38)早晨平均压上面积;
39)早晨平均压上升最大高度;
40)归一化的夜间收缩压T2持续时间;
所述识别模型对应于各模型输入量的系数:
1.1)对应于日均舒张压的系数为0.171825933;
2.1)对应于夜均收缩压的系数为0.760051681;
3.1)对应于夜均舒张压的系数为-0.301094165;
4.1)对应于夜间收缩压下降率的系数为-1.703366483;
5.1)对应于夜间舒张压下降率的系数为0.569433975:
6.1)对应于夜间平均压下降率的系数为-0.122854502:
7.1)对应于血压节律形态的系数为-1.260220152;
8.1)对应于24h收缩压负荷的系数为-0.325585879;
9.1)对应于24h舒张压负荷的系数为0.374904589;
10.1)对应于日间收缩压负荷的系数为-0.804455162;
11.1)对应于日间舒张压负荷的系数为0.232331651;
12.1)对应于夜间收缩压上面积的系数为0.476055269;
13.1)对应于夜间收缩压下面积的系数为-1.23184605;
14.1)对应于夜间收缩压上升最大高度的系数为0.406756655;
15.1)对应于夜间收缩压下降最大深度的系数为0.317857477;
16.1)对应于夜间收缩压T2持续时间的系数为0.073568283;
17.1)对应于夜间收缩压K1斜率的系数为0.635679204;
18.1)对应于夜间收缩压波动的系数为-0.217943708;
19.1)对应于夜间收缩压H1高度的系数为0.37952764;
20.1)对应于夜间舒张压上面积的系数为-0.00338707;
21.1)对应于夜间舒张压下面积的系数为-0.062813725;
22.1)对应于夜间舒张压上升最大高度的系数为0.136287799;
23.1)对应于夜间舒张压下降最大深度的系数为0.429297414;
24.1)对应于夜间舒张压K1斜率的系数为-0.45107689;
25.1)对应于夜间舒张压波动的系数为-0.083821896;
26.1)对应于夜间舒张压H1高度的系数为0.299561695;
27.1)对应于夜间平均压上面积的系数为0.206504969;
28.1)对应于夜间平均压下面积的系数为0.014999594;
29.1)对应于夜间平均压上升最大高度的系数为-0.281755104;
30.1)对应于夜间平均压下降最大深度的系数为0.157846579;
31.1)对应于夜间平均压波动的系数为0.551148676;
32.1)对应于夜间平均压H1高度的系数为0.249326376;
33.1)对应于早晨收缩压上面积的系数为0.440745049;
34.1)对应于早晨收缩压上升时间的系数为-0.174874368;
35.1)对应于早晨收缩压上升最大高度的系数为-0.33988987;
36.1)对应于早晨舒张压上面积的系数为-0.598357033;
37.1)对应于早晨舒张压上升最大高度的系数为0.41503691;
38.1)对应于早晨平均压上面积的系数为-0.416355472;
39.1)对应于早晨平均压上升最大高度的系数为0.283126115;
40.1)对应于归一化的夜间收缩压T2持续时间的系数为-0.296675777;
所述识别模型的截距为1.35454232。
本发明提出的OSAHS识别方法、模型、模型建立方法、及装置,基于动态血压特征工作,其创新点在于使用了针对OSAHS血压变化的新特征,集成了当前较为热门的机器学习技术手段,以大量临床数据为依托,为一线临床医生在OSAHS疾病诊疗中提供能辅助诊断依据。
附图说明
图1为识别系统设计示意图;
图2为动态血压原始数据;
图3为数据准备模块处理后的数据;
图4为提取的动态血压特征数据;
图5为24小时动态血压数据的特征提取计算图;
图6为混淆矩阵;
图7a为受试者工作特性曲线;
图7b为精确率/召回率曲线;
图8为Logistics回归模型系数对照表;
图9为血压上升计算指标示意图;
图10为血压下降计算指标示意图;
图11为特征提取的流程图。
具体实施方式
下面,对照附图对本申请进行详细说明。
一、系统设计
数据准备模块,主要实现动态血压数据的采集、转换和处理功能。包括3个子模块,分别是①数据集创建模块:从动态血压监测设备中读取血压数据原始,并进行文件格式转换和数据存储;②异常值处理模块:用于对原始血压数据中异常值进行检测,并使用相应方法进行处理;③缺失值插补模块:对原始血压数据中缺失的值进行检测,并按照相应方法进行插补。
特征提取模块,使用针对先期开发的针对OSAHS血压特点的特征提取算法,实现对动态血压新特征的提取工作。包括4个子模块,分别是①定义特征规则模块:通过调整特征提取算法的超参数进行规则修改,使得特征提取更全面;②提取算法选择模块:可选择一般特征提取算法(统计描述特征)、自定义特征提取算法(新特征),分别实现不同类型特征的提取;③提取特征模块:批量载入数据准备模块处理后的血压数据,并进行特征提取,保存特征数据至文件;④特征预处理模块:对所提取的特征进行预处理,包括异常值处理、缺失值插补等,做好数据分析的准备。本模块使用的特征规则如下所述:
区分夜间血压先上升、夜间血压先下降和晨峰血压三类,对收缩压、舒张压或平均动脉压分别定义涵盖时间、幅度、变化率、面积、波动计数等在内的5种20个指标。以H(t)表示动态血压在t时刻的函数,血压值单位为毫米汞柱(mmHg),时间单位为小时(h),入睡时间记作t0,对应血压值Vn为“夜间血压基线“;次日晨峰时间记作tm0,对应血压值Vm为“晨峰血压基线”。血压上升的有效阈值记作Hup,血压下降的有效阈值记作Hdn,一般认为血压阈值波动超过10mmHg有临床意义。
1.夜间血压先上升的情况
(1)夜间血压上升有效高度Hn:第1个高于基线血压的值,图9中Hn表示
Hn=H(t)-Vn
有效的Hn应满足条件Hn≥Hup;其对应的时间点记作tnh。
(2)夜间血压上升最大高度Hmax:夜间血压超过基线的最大值,即:
Hmax=max[H(t)-Vn]
(3)夜间血压上升持续时间T1n:从基线上升至Hn所用的时间,即:
T1n=Tnh-t0
(4)夜间血压上升斜率UpSlopen:上升高度Hn与上升持续时间T1n的比值,即:
UpSlopen=Hn/T1n
(5)夜间血压波动频次N:基线以上血压值个数,图9中紫色箭头所示点的个数
(6)夜间血压基线上面积Sup:图9中红色阴影部分面积,表示血压增高的程度,其值等于血压曲线H(t)>Vn部分在该段时间内的积分,即:
其中ti1和ti2需通过插值的方法求得。
(7)夜间血压基线下面积Sdn:图10中绿色阴影部分面积,表示血压降低的程度,其值等于血压曲线H(t)<Vn部分在该段时间内的积分,即:
其中tx和ti需通过插值的方法求得。
2.夜间血压先下降的情况
(8)夜间血压下降有效高度Hn:第1个低于基线血压的值,图10中Hn表示
Hn=|H(t)-Vn|
有效的Hn应满足条件Hn≥HdnmmHg;其对应的时间点记作tnh
(9)夜间血压下降最大深度Hdip:夜间血压低于基线最大值,即:
Hdip=-max[|H(t)-Vn|]
(10)夜间血压下降持续时间T1n:从基线下降至Hn所用的时间,即:
T1n=tnh-t0
(11)夜间血压下降斜率DnSlopen1:下降高度Hn与上升持续时间T1n比值的相反数,即:
DnSlopen1=-Hn/T1n
(12)夜间血压二次上升持续时间T2n:从-Hn上升至-Hx所用的时间,其中Hx≥-Hn+10,即:
T2n=tx-tnh
(13)夜间血压二次上升斜率UpSlopen1:上升高度Hn或小于Hn的某个Hx与上升持续时间T2n的比值,即:
UpSlopen2=Hn/T2n
(14)夜间血压波动频次N:第1个有效下降Hn点作为临时基线,临时基线以上且高于Hup血压值的个数,图10中紫色箭头所示点的个数。
3.晨峰血压变化的情况
(15)晨峰血压上升最大高度Hm:晨峰血压超过基线的最大值,即:
Hm=max[Hm(t)-Vm]
其对应的时间点记作tmh
(16)晨峰血压上升持续时间T1m:从基线上升至Hm所用的时间,即:
T1m=tmh-tm0(17)晨峰血压上升斜率UpSlopem:上升高度Hm与上升持续时间T1m的比值,即:
UpSlopem=Hm/T1m
(18)晨峰血压下降持续时间T2m:从Hm将至基线或某个Hxm(txm)所用的时间,即:
T2m=txm-tmh
图10中txm=ti3,ti3需插值求得。
(19)晨峰血压下降斜率DnSlopem:下降高度Hxm与下降持续时间T2m比值的相反数,即:
DnSlopem=-Hxm/T2m
(20)晨峰血压基线上面积Smup:图9中tm0时间以后红色阴影部分面积,表示血压增高的程度,其值等于血压曲线Hm(t)>Vm部分在该段时间内的积分,即:
其中ti3需通过插值的方法求得。
探索性分析模块,实现对特征数据的统计分析功能。包括3个子模块:①统计推断分析:对特征指标进行统计描述,并对分组特征进行假设检验,描述差异性情况以及统计显著性等;②结果可视化:以统计图、统计表的形式对1中的数据进行可视化,直观展示统计分析的结果,为建模分型做准备;③结果解释模块:对有统计学差异的特征进行解释,给出统计学差异与临床意义之间的关联;对无统计学差异但又较为关注的特征分析其无差异的可能原因。
建模分析模块:使用机器学习方法对提取的特征数据进行分析,以是否为OSAHS患者作二分类问题分析,选择相应的模型进行训练、测试和评估,并得出相应结论。包括8个子模块:①数据集分割:将数据划分为训练集、验证集和测试集合,确定划分比例;②模型选择:选择合适的机器学习模型,医学研究一般使用Logistic回归模型,本系统设计默认使用该模型,但也可提供其他模型供用户使用;③特征选择:使用模型对所提取特征进行选择,本系统默认使用递归特征选择与用户指定相结合的方法;④训练模型:使用训练集训练模型,使用验证集进行超参数调整,以获得更好的模型,本系统采用K折交叉验证的方法实现;⑤测试模型:将测试集输入已训练好的模型,得到测试结果;⑥评估模型:评估原则是模型在验证集和测试集均有较好表现,既要防止过拟合问题,又要保证模型的泛化性能;⑦结果可视化:使用可视化的方法观察模型结果,混淆矩阵、精确率/召回率曲线(P-R curve)以及受试者工作特性曲线(ROC curve)被用于观察模型性能;⑧结果解释:评价总体分类情况,对误分类原因进行分析,决定是否有改进模型的必要。
模型持久化模块,用于更新模型数据集,更新模型参数。包括4个子模块:①保存模型参数:对已训练好的模型参数(包括已调优的超参数)进行保存;②保存训练数据集:对获得良好模型的数据集进行保存,以便后期更新模型;③更新训练数据集:该模块帮助用户扩大训练数据集;④更新模型参数:该模块帮助用户在更新后的数据集上重新训练模型并保存。
临床应用模块,用于单个输入病例的数据分析,在已训练好的模型上预测分析单个病例患OSAHS疾病的风险大小。包括5个子模块:①加载模型:载入已训练好的模型,准备疾病风险预测;②选择病例数据:选择需要评估预测的病例数据;③输入模型:将病例数据输入模型进行分析计算;④显示模型分析结果:模型分析后将给出OSAHS风险(概率,默认阈值为0.5),大于0.5为高风险,提示较大可能患OSAHS,小于0.5为低风险,提示较大可能未患OSAHS;⑤得出疾病诊疗结论:在风险大小基础上,综合患者人口学特征(性别、年龄、身高、体重等)、主诉、病史等因素,为患者给出可能性诊断结果,或建议患者行进一步检查以确诊OSAHS。
方法的效果
数据介绍:本发明所使用的验证数据集来自Physionet网站,为公开数据,总数为249例,其中经PSG确诊的OSAHS患者115例,随机匹配非OSA患者134例,将上述数据分成两组,OSAHS组(病例组)由115例OSAHS患者组成,非OSAHS组(对照组)由134例患者组成。
数据分析的基本流程:按照图1所示的识别系统设计给出的示意图进行,初次使用时,从数据准备模块至临床应用模块,逐个模块执行,直至系统给出训练好的模型,并能给出单个病例患OSAHS风险大小为止;模型训练好以后,用户将主要使用“数据准备——特征提取——临床应用”三个模块即能实现疾病风险评估预测。
本系统使用的原始血压数据格式如图2所示,文件为awp格式,其为24小时动态血压监测(Ambulatory Blood Pressure Monitoring,ABPM)数据。
经数据准备模块处理后的血压数据格式如图3所示,文件为csv格式。其中,Num为编号;TestPoint为采集时间点,单位为分钟;SBP为收缩压;DBP为舒张压;MBP为平均压;PPD为脉压差;PHR为心率。
举例说明
经特征提取模块处理后的特征数据如图4所示,图5显示了某病例的特征提取计算图。
经建模分析模块处理后的模型测试情况,选择Logistic回归模型,图6给出混淆矩阵,0-非OSAHS组,1-OSAHS组,模型预测准确率为84.09%,精确率为94.7%,召回率为75%,F1得分为83.7%;图7a显示受试者工作特性曲线(ROC),曲线下面积AUC=0.85;图7b显示精确率/召回率曲线(P-R),曲线下面积AP=0.91。
经模型持久化模块处理后,保存了模型参数,以Logistic回归为例,其系数如图8所示。
图8中,1)日均舒张压、2)夜均收缩压、3)夜均舒张压、7)血压节律形态、8)24h收缩压负荷、9)24h舒张压负荷、10)日间收缩压负荷、11)日间舒张压负荷,为现有生理参数指标。4)夜间收缩压下降率、5)夜间舒张压下降率、6)夜间平均压下降率通过(11)夜间血压下降斜率得到;12)夜间收缩压上面积由(6)夜间血压基线上面积得到;13)夜间收缩压下面积由(7)夜间血压基线下面积得到;14)夜间收缩压上升最大高度由(2)夜间血压上升最大高度得到;15)夜间收缩压下降最大深度由(9)夜间血压下降最大深度得到;16)夜间收缩压T2持续时间由(12)夜间血压二次上升持续时间得到;17)夜间收缩压K1斜率由(4)夜间血压上升斜率或(11)夜间血压下降斜率得到;18)夜间收缩压波动由(5)夜间血压波动频次或(14)夜间血压波动频次得到;19)夜间收缩压H1高度由(1)夜间血压上升有效高度或(8)夜间血压下降有效高度得到;20)夜间舒张压上面积由(6)夜间血压基线上面积得到;21)夜间舒张压下面积由(7)夜间血压基线下面积得到;22)夜间舒张压上升最大高度由(2)夜间血压上升最大高度得到;23)夜间舒张压下降最大深度由(9)夜间血压下降最大深度得到;24)夜间舒张压K1斜率由(4)夜间血压上升斜率或(11)夜间血压下降斜率得到;25)夜间舒张压波动由(5)夜间血压波动频次或(14)夜间血压波动频次得到;26)夜间舒张压H1高度由(1)夜间血压上升有效高度或(8)夜间血压下降有效高度得到;27)夜间平均压上面积由(6)夜间血压基线上面积得到;28)夜间平均压下面积由(7)夜间血压基线下面积得到;29)夜间平均压上升最大高度由(2)夜间血压上升最大高度得到;30)夜间平均压下降最大深度由(9)夜间血压下降最大深度得到;31)夜间平均压波动由(5)夜间血压波动频次或(14)夜间血压波动频次得到;32)夜间平均压H1高度由(1)夜间血压上升有效高度或(8)夜间血压下降有效高度得到;33)早晨收缩压上面积由(20)晨峰血压基线上面积得到;34)早晨收缩压上升时间由(16)晨峰血压上升持续时间得到;35)早晨收缩压上升最大高度由(15)晨峰血压上升最大高度得到;36)早晨舒张压上面积由(20)晨峰血压基线上面积得到;37)早晨舒张压上升最大高度由(15)晨峰血压上升最大高度得到;38)早晨平均压上面积由(20)晨峰血压基线上面积得到;39)早晨平均压上升最大高度由(15)晨峰血压上升最大高度得到;40)归一化的夜间收缩压T2持续时间由(12)夜间血压二次上升持续时间归一化后得到。
本申请的OSAHS识别装置为在计算设备(例如计算机、智能手机、平板电脑等)上加载运行本申请所提出的识别模型或识别方法的装置,数据准备单元、特征提取单元、识别模型单元均为加载了对应功能模块或程序的计算设备所对应的功能单元。
经上述模块处理后,该OSAHS风险识别系统已具备评估单个病例患病风险的功能,随机选择1名未在系统中使用的患者的数据执行临床应用模块,得出该病例患OSAHS的风险评分小于0.5,提示其为OSAHS患者,该病例实际经PSG已确诊OSAHS,说明该系统提示的患病风险具有与实际诊断一致的结果。
除非另有定义,本申请中使用的所有技术和/或科学术语具有与由本发明所涉及的领域的普通技术人员通常理解的相同含义。本申请中提到的材料、方法和实施例仅为说明性的,而非限制性的。
虽然已结合具体实施方式对本发明进行了描述,在本申请的发明主旨下,本领域的技术人员可以进行适当的替换、修改和变化,这种替换、修改和变化仍属于本申请的保护范围。