新冠肺炎重症化预测模型、系统及其建立方法、预测方法
技术领域
本发明涉及医疗
技术领域
,尤其涉及新冠肺炎重症化预测模型、系统及其建立方法、预测方法。背景技术
新型肺炎的病原被鉴定为新型β冠状病毒,目前被命名为严重急性呼吸系统综合症冠状病毒2(SARS-CoV-2),与SARS-CoV有着相似的系统发育相似性。SARS-CoV-2感染已被世界卫生组织(WHO)命名为2019年冠状病毒病(COVID-19),即:新型冠状肺炎。
COVID-19现在已成为世界范围内的重要公共卫生问题。估计COVID-19的总体致死率约为1-2.3%,与西班牙流感(2-3%)相似,远高于季节性流感(0.1%)。根据世卫组织,COVID-19的严重程度分为轻型、普通型、重症和危重症。在中国疾病预防控制中心的72 314例病例报道研究中,约81%的COVID-19病例定义为轻度;COVID-19病例中有14%为重型病例,其中5%为危重型病例。住院COVID-19病例的整体医院死亡率约为15%至20%,但在需要入住ICU重症监护病房危重症患者中死亡率高达40-49%。因此,评估COVID-19患者疾病进展的危险因素很重要。尽早发现可能发生重症风险的COVID-19患者对于选择最佳治疗方案和降低死亡率尤其重要。
现有的研究表明,COVID-19患者的血液学和免疫学检查存在一定的异常。研究提示,年龄较大,序贯器官功能衰竭评估(SOFA)得分高,d-二聚体大于1μg/mL,淋巴细胞减少和冠状动脉疾病史增加了COVID-19患者的死亡风险。
目前,临床上治疗新冠肺炎患者(COVID-19)的主要挑战之一是预测疾病的严重程度。
一些预测评分模型已用于预测COVID-19患者和其他疾病的预后。但是,预测COVID-19患者从轻型/普通型发展到重症的相关的危险因素仍然有限,需要进一步研究。
发明内容
本申请为了解决上述技术问题提供新冠肺炎重症化预测模型、系统及其建立方法、预测方法。
本申请通过下述技术方案实现:
一种新冠肺炎重症化预测模型,所述预测模型为根据新冠肺炎患者的肺部疾病、年龄、免疫球蛋白M、CD16+/CD56+NK细胞、谷草转氨酶得到的进展风险评分计算模型,以预测从轻型/普通型进展到重型新冠肺炎的风险。
进一步的,所述进展风险评分计算模型为:
所述进展风险评分计算模型为:
PAINT评分=α1*β1+α2*β2+α3*β3+α4*β4+α5*β5
其中,α1、α2、α3、α4、α5为分别为五个预测因子与对应阈值比较的判别值,β1、β2、β3、β4、β5为五个预测因子对应的风险比数值,IgM指免疫球蛋白M,AST指谷草转氨酶。
新冠肺炎重症化预测模型的建立方法,包括以下步骤:
S1,收集新冠肺炎患者的临床相关指标,包括人口学信息、基础疾病史、临床表现和生化指标;
S2,通过COX回归模型分析人口学、基础疾病史、临床表现、生化指标对从轻型/普通型进展到重型的预测能力,筛选出与疾病相关度高的预测因子,并计算出每个预测因子的阈值和风险比数值;
S3,基于预设公式,根据预测因子及对应的阈值、风险比数值,得到预测模型。
进一步的,步骤S1中,收集自患者的人口学信息包括年龄、性别;
基础疾病史包括既往高血压、糖尿病、心血管疾病、肺部疾病和肝脏疾病;
临床表现包括发烧、咳嗽、呼吸困难、胸痛、心绞痛、疲劳、肌痛、头痛、呕吐、和腹泻;
生化指标包括白细胞WBC、中性粒细胞计数NEU、淋巴细胞计数LYM、血红蛋白HGB、血小板计数PLT、凝血酶原时间PT、D-二聚体、谷丙转氨酶ALT、谷草转氨酶AST、γ-谷氨酰转肽酶GGT、白蛋白ALB、总胆红素TBIL、直接胆红素DBIL、尿酸UA、肌酐Cr、肌酸激酶CK、乳酸脱氢酶LDH、脑利钠肽BNP、降钙素原PCT、c反应蛋白CRP、中性粒细胞/淋巴细胞比NLR和SARS-CoV2 RNA测试。
进一步,步骤S2具体包括:
S2.1,通过单因素COX风险模型回归,将临床相关指标首先利用COX单因素回归进行风险比计算;临床相关指标包括人口学信息、基础疾病史、临床表现和生化指标;
S2.2,通过多因素COX风险模型回归,将S2.1中单因素COX回归结果中P<0.05的因子纳入COX多因素回归模型,继而各因子间形成相互校正。通过步骤S2可筛选出与疾病最相关的预测因子,并为每个预测因子计算输出β回归系数,将β回归系数作为预测因子对应的风险比数值,进而建立包含多个预测因子的预测模型。
COX多因素回归模型结果提示在模型自动校正多种因素后,输出了最关键的五个预测因子,分别为:肺部疾病、年龄、IgM、CD16+/CD56+NK细胞、AST;这五个影响因子具备最好的预测COVID-19患者从轻症/普通到重症的进展的能力。
进一步,通过曲线下面积ROC计算,得出每个预测因子的阈值(临界值),即有无肺部疾病,年龄≥75岁,IgM≤0.84,CD16+/CD56+NK细胞≤116.5和AST≥25。
利用上述结果,利用阈值(临界值)判定下的有肺部疾病历史,年龄≥75岁,IgM≤0.84,CD16+/CD56+NK细胞≤116.5和AST≥25,合并每个风险因素所对应的β回归系数(依次为2.4174、1.3594、1.8399、1.2246、1.5182)。
优选地,肺部疾病、年龄、IgM、CD16+/CD56+NK细胞、AST相对应的临界值依次为:有肺部疾病史、75岁、0.84、116.5、25。
新冠肺炎重症化的预测方法,基于所述的新冠肺炎重症化预测模型,所述新冠肺炎重症化的预测方法包括以下步骤:
步骤1,将新冠肺炎患者的人口学信息、基础疾病史、临床表现和生化指标输入所述的新冠肺炎重症化预测模型;
步骤2,新冠肺炎重症化预测模型进行预测,输出被测患者从轻型/普通型到重型新冠肺炎的进展风险评分。
进一步的,新冠肺炎重症化的预测方法还包括步骤3,将步骤2获得的进展风险评分与临界值比较,并根据比较结果将患者划分到轻型/普通型组或者进展为重症组。
一种新冠肺炎重症化预测系统,包括:
预测模块,包括所述的新冠肺炎重症化预测模型;
数据输入模块,用于将新冠肺炎患者的人口学信息、临床表现和生化指标输入所述的新冠肺炎重症化预测模型;
预测输出模块,用于根据新冠肺炎重症化预测模型,输出被测患者从轻型/普通型到重型新冠肺炎的进展风险评分。
与现有技术相比,本申请具有以下有益效果:
本发明有助于识别高进展风险的轻型/普通型患者,利于提高重症患者的诊治成功率。
附图说明
此处所说明的附图用来提供对本申请实施方式的进一步理解,构成本申请的一部分,并不构成对本发明实施方式的限定。
图1是新冠肺炎重症化预测模型的建立方法的流程图;
图2是PAINT评分模型建立的统计分析的流程图;
图3是5个优选独立危险因素的风险比森林图;
图4中a是有无肺部疾病指标的模型稳定性检测结果,b是年龄指标的模型稳定性检测结果,c是IgM指标的模型稳定性检测结果,d是CD16+/CD56+NK细胞指标的模型稳定性检测结果,e是AST指标的模型稳定性检测结果;
图5是预测因子肺部疾病的生存分析图,其中a是生存率分析图,b是对应a图时间点中的危险人数分析图,c是对应a图时间点中的删失人数分析图;
图6是预测因子年龄的生存分析图,其中a是生存率分析图,b是对应a图时间点中的危险人数分析图,c是对应a图时间点中的删失人数分析图;
图7是预测因子IgM的生存分析图,其中a是生存率分析图,b是对应a图时间点中的危险人数分析图,c是对应a图时间点中的删失人数分析图;
图8是预测因子CD16+/CD56+NK细胞的生存分析图,其中a是生存率分析图,b是对应a图时间点中的危险人数分析图,c是对应a图时间点中的删失人数分析图;
图9是预测因子AST的生存分析图,其中a是生存率分析图,b是对应a图时间点中的危险人数分析图,c是对应a图时间点中的删失人数分析图;
图10中a是主成分分析(PCA)的权重图;
图10中b是主成分分析(PCA)的矢量计算图;
图11是PAINT评分的生存分析图,其中a是生存率分析图,b是对应a图时间点中的危险人数分析图,c是对应a图时间点中的删失人数分析图;
图12是PAINT评分与现有的qSOFA评分和CURB-65比较图;
图13中a是PAINT评分的一致性指数图,b是PAINT评分的1000次内部抽样验证图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述。显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。
因此,以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施方式及实施方式中的特征可以相互组合。需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
实施例1
天然杀伤(NK)细胞是对病毒感染有反应的先天淋巴细胞,可能与COVID-19疾病的严重程度有关。因此,本实施例根据基于NK细胞的临床表现及其他四个优选相关因子,建立轻型/普通型COVID-19进展到重症的预测模型,以下简称PAINT评分模型。本实施例总共纳入来自中国两个医疗中心的239例COVID-19住院患者。使用Cox比例风险模型和Kaplan-Meier方法分析了变量的预后效果,包括各医院的电子病历的临床数据和实验室检查结果。本申请建立的PAINT评分模型,以帮助预测从轻型/普通型到重型COVID-19的进展风险。调整多种混杂因素后,年龄≥75岁、IgM≤0.84、CD16+/CD56+NK细胞≤116.5、谷草转氨酶≥25和具有肺部疾病史五个优选因素是进展为重型COVID-19的独立影响因子。基于这五个因素,建立了预测评分模型。通过验证,该预测评分模型显示出较高的预测值(C指数=0.91,0.902±0.021,p<0.001)。本发明的预测评分模型有助于识别具有高进展风险的轻型/普通型COVID-19患者,提高高风险重症患者的诊治成功率。
如图1、图2所示,本发明的预测评分模型的建立方法,步骤包括:
S1,收集新冠肺炎患者的人口学信息、基础疾病史、临床表现和生化指标。
本实施例从中国两个医疗中心招募了COVID-19患者进行研究,总共包括239名COVID-19患者。在本队列中,轻型/普通型病例为216(90.38%)例,重型病例为23(9.62%)例。表1列出了研究人群的人口统计学和临床基线特征,中位年龄为58岁(范围:26-90岁),男性为58.20%(139/239例)。中位数最高温度为38℃(范围36.0-41.0)。
表1:研究人群的人口统计学和临床基线特征表
S2,通过COX回归模型分析人口学、基础疾病史、临床表现和生化指标对从轻型/普通型进展到重型的预测能力,筛选出与疾病相关度高的预测因子,并计算出每个预测因子的风险比数值。具体如下:
在比较入院时的人口统计学数据时,进展为重型的是男性患者和年龄较大和呼吸窘迫的患者(所有均P<0.05,表1)。所有病人的临床表现主要表现如下:发烧77.8%(186/239),咳嗽60.3%(144/239),痰液23.8%(57/239),呼吸窘迫10.5%(25/239),胸痛4.6%(11/239),心悸4.2%(11/239),疲劳28.5%(68/239),肌肉疼痛9.2%(22/239),头痛5.0%(12/239),呕吐1.7%(4/239)和腹泻18.0%(43/239)。
然后,进一步总结研究人群的临床特征,如表2所示。在比较有进展和无进展的重型病例之间COVID-19的生化指标时,发现中性粒细胞、淋巴细胞、中性粒细胞/淋巴细胞比值、谷草转氨酶、总胆红素、直接胆红素、肌酐、血糖、血钠、凝血时间、肌红蛋白、CD3+T细胞、CD4+T细胞、CD8+T细胞、CD19+T细胞、CD16+/CD56+NK细胞和IgM,均有明显统计学差异(所有均P<0.05)。
表2:实验室检测和临床基线特征表
表2中:快速器官衰竭评分,qSOFA;IgA,免疫球蛋白A;IgG,免疫球蛋白G;IgM,免疫球蛋白M;IgE,免疫球蛋白E。
如图2所示,为探索从轻型/普通型进展到重型COVID-19病例的危险因素,本实施例比较了轻型/普通型病例与重型病例之间的人口统计学、基础疾病史、临床数据和生化指标。进一步,使用单变量和多变量COX回归模型,通过各个因素间风险校正,利用输出风险比(ORs)的结果预测各因素间与疾病的直接发生概率倍数关系,如图3所示。结果显示,年龄≥75岁(ORs=3.92,95%CI 1.61-9.73,P=0.003),有既往肺部疾病史(ORs=11.20,95%CI2.50-49.70,P=0.001),IgM(ORs=6.31,95%CI 1.99-19.60,P=0.002),CD16+/CD56+NK细胞(ORs=3.40,95%CI 1.31-9.13,P=0.014)和AST(ORs=4.60,95%CI 1.31-16.00,P=0.018))这五个因素具有显着差异,见表3。本实施例将这个5个独立危险因素作为预测从轻型/普通型病例发展为重症病例的预测因子,如图3所示。同时,在研究人群中COX多因素回归分析结果显示优选的5个因子与COVID-19疾病的进展显著相关。
表3:单因素多因素COX回归分析结果表
在此基础上,如图2所示,本实施例还使用了global Schoenfeld检验的Cox诊断偏差和cox比例风险模型拟合来评估这五个独立的危险因素导致从从轻型/普通型进展到重型为严重病例的预测能力。如图4所示,图4中每个红色点排布于两虚线中,靠近中心实线,说明诊断模型稳定性良好。结果显示,这5个危险因素导致从从轻型/普通型进展到重型为严重病例的预测效能良好。
通过曲线下面积ROC计算,得出每个因子的阈值(临界值),即有无肺部疾病,年龄≥75岁,IgM≤0.84,CD16+/CD56+NK细胞≤116.5和AST≥25。进一步,Kaplan-Meier生存曲线分析分别显示了按有肺部疾病史,年龄≥75岁,IgM≤0.84,CD16+/CD56+NK细胞≤116.5和AST≥25的COVID-19患者的生存曲线存在显着差异,如图5-图9所示。
S3,基于预设公式,构建轻型/普通型进展到重型的PAINT评分模型。
其中,预设公式为:
上式中,αi为预测因子与对应临界值比较的判别值,取0或1,βi为预测因子的风险比数值,n为自然数。
根据统计分析结果,本实施例将包括肺部疾病,年龄,IgM,CD16+/CD56+NK细胞和AST在内的危险因素参与COVID-19患者从轻度/中度病例到重度病例进展的预测评分的制定,构建了轻型/普通型进展到重型的PAINT评分模型,如下所示:
PAINT评分=α1*2.4174+α2*1.3594+α3*1.8399+α4*1.2246+α5*1.5182
如图10a所示,本实施例进一步采用PCA主成分分析,探索5个预测因子在模型中占的比重,从而帮助临床决策者判定因子权重。如图10b所示,显示了每个预测因子贡献的权重,提示IgM和AST异常对于患者的预后最差。
为了证明上述PAINT评分模型能够发现较重的患者进行早期临床治疗的能力,本实施例还使用ROC曲线来找到最佳的临界值。获得评分的临界值(阈值)为14.687分,将PAINT评分与临界值进行大小比较,可将患者分为轻型/普通型非进展组和进展重症组,并通过Kaplan-Meier生存曲线分析确认了结果(P=0.001,如图11所示)。
对于PAINT评分小于临界值的患者,划进轻型/普通型组,而PAINT评分大于或等于临界值的患者,则划进进展为重症组。根据不同的组别,进行针对性的治疗,利于提高重症患者的诊治成功率。
本实施例进一步采用了C指数(C-Index)分析,以评估上述PAINT评分模型在预测COVID-19患者从轻度/中度病例到重度病例的进展中的功效。将PAINT评分与qSOFA和CURB-65(意识错乱,尿毒症,呼吸频率,BP,年龄>65岁)评分进行了比较。如图12所示,用于预测从轻度/中度病例进展到重度病例的PAINT评分模型的C指数(0.902±0.021)明显优于qSOFA(0.534±0.027)和CURB-65(0.561±0.058)。
此外,本实施例还将上述PAINT评分模型与5个独立的危险因素(肺部疾病,年龄,IgM,CD16+/CD56+NK细胞和AST)进行了比较。结果表明,PAINT评分可能适合预测轻型/普通型进展到重型,PAINT评分明显优于有肺部疾病史(0.543±0.034)、年龄≥75岁(0.639±0.052)、IgM≤0.84(0.683±0.044)、CD16+/CD56+NK细胞≤116.5(0.647±0.050)和谷草转氨酶≥25(0.716±0.036),见表4。
表4:C-index判定预测效应:从轻症到重症
变量
预测能力判定(C-Index)
P值
PAINT评分
0.902±0.021
qSOFA评分
0.534±0.027
p<0.001
CURB-65评分
0.561±0.058
p<0.001
肺部疾病(有)
0.543±0.034
p<0.001
年龄
0.639±0.052
p<0.001
IgM抗体
0.683±0.044
p<0.001
CD16<sup>+</sup>/CD56<sup>+</sup>NK cell
0.647±0.050
p<0.001
谷草转氨酶
0.716±0.036
p<0.001
表4中,qSOFA为快速器官衰竭评分。
此外,为了对本发明PAINT评分模型的能力进行内部验证,本实施例还进行了一致性指数分析,以评估对PAINT评分的区分度,在本实施例的PAINT评分中观察到的辨别力优于qSOFA和CURB-65评分。此外,本实施例执行了1000次bootstrap内部验证,验证结果表明,本发明的预测的PAINT得分也显示出更好的辨别力,如图13所示。
基于上述新冠肺炎重症化预测模型,本发明公开了新冠肺炎重症化的预测方法,包括以下步骤:
步骤1,将新冠肺炎患者的人口学信息、基础疾病史、临床表现和生化指标输入所述的新冠肺炎重症化预测模型;
步骤2,新冠肺炎重症化预测模型进行预测,输出被测患者从轻型/普通型到重型新冠肺炎的进展风险评分。
步骤3,将步骤2获得的进展风险评分与临界值比较,并根据比较结果将患者划分到轻型/普通型组或者进展为重症组。
基于上述预测模型和预测方法,本发明了还公开了一种新冠肺炎重症化预测系统,包括:
预测模块,包括所述的新冠肺炎重症化预测模型;
数据输入模块,用于将新冠肺炎患者的人口学信息、临床表现和生化指标输入所述的新冠肺炎重症化预测模型;
预测输出模块,用于根据新冠肺炎重症化预测模型,输出被测患者从轻型/普通型到重型新冠肺炎的进展风险评分。
以上所述的具体实施方式,对本申请的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。