摘要
背景2019冠状病毒病(COVID-19)的爆发使全球医疗资源紧张,并造成大量死亡。
客观的开发并验证基于临床特征的新型冠状病毒肺炎患者入院严重程度风险评估和分诊的机器学习模型。
方法725例患者被用于训练和验证模型。这包括2019年12月23日至2020年2月13日来自中国武汉的299名COVID-19住院患者的回顾性队列,以及2020年2月20日至2020年3月21日来自中国、意大利和比利时8个中心的426名患者的5个队列。主要结局是在住院期间出现严重或危重疾病。使用接受者工作特征曲线(AUC)下的面积和来自混淆矩阵的度量来量化模型性能。
结果在回顾性队列中,中位年龄为50岁,137例(45.8%)为男性。在五个试验队列中,中位年龄为62岁,236例(55.4%)为男性。该模型在5个队列中进行了前瞻性验证,auc在0.84 ~ 0.93之间,准确性在74.4% ~ 87.5%之间,敏感性在75.0% ~ 96.9%之间,特异性在55.0% ~ 88.0%之间,其中大部分表现优于肺炎严重程度指数。低、中、高危概率的分界值分别为0.21和0.80。在线计算器可以在www.covid19risk.ai。
结论机器学习模型、nomogram和在线计算器可能有助于获取COVID-19患者中重症和危重症的发病情况,并在入院时进行分诊。
摘要
一个国际认可的模型、nomogram和在线计算器,用于入院时COVID-19患者的严重程度风险评估和分诊https://bit.ly/2BQfXFs
简介
2019年12月,一种新型冠状病毒,严重急性呼吸综合征-冠状病毒-2 (SARS-CoV-2;早前被命名为2019-nCoV),出现在中国武汉[1].由SARS-CoV-2引起的疾病被命名为2019冠状病毒病(COVID-19)。截至2020年5月15日,全球已报告超过449万例COVID-19患者,超过30万例患者死亡[2].新冠肺炎疫情已发展成为全球大流行[3.].
在COVID-19患者中,约80%表现为轻症,症状通常在两周内消失[4].然而,大约20%的患者可能会继续,需要住院治疗和增加医疗支持。重症患者死亡率约为13.4% [4].因此,对患者进行定量、非主观的风险评估对于患者管理和医疗资源配置极为重要。对大部分非重症患者,可在家庭或流动医院进行一般隔离和对症治疗;对重症患者,需加强护理,快速转入重症监护病房。既往研究总结了COVID-19重症患者的临床和影像学特征,但不同变量的预后价值尚不明确[5,6].
几种临床常用的评分系统(如。序贯器官衰竭评估评分;迷糊,尿素,呼吸频率,血压,65岁;急性生理和慢性健康评估,等。)可以应用于分诊问题,尽管每种方法都有自己的问题和局限性,例如需要在入院时难以获得的实验室变量[7].肺炎严重程度指数(PSI)引人注目,因为它被用于评估社区获得性肺炎成年患者的严重程度和死亡率的概率,并有助于住院管理[8].
利用机器学习可能会找到更好的解决方案,机器学习是人工智能的一个分支,它从过去的数据中学习,以建立一个预测模型[9].近年来,机器学习已发展成为一种有用的工具,用于分析来自医疗记录或图像的大量数据[10].以前的建模研究侧重于预测COVID-19的潜在国际传播[11].
因此,我们的目标是开发并验证基于COVID-19患者入院时的临床、实验室和放射学变量的预后机器学习模型,用于住院期间的严重程度风险评估,并将其与作为代表性临床评估方法的PSI进行比较。我们的目标是开发一个具有不同数据集的多因素决策支持系统,以促进入院时患者的风险预测和分类(家庭或移动医院隔离,住院或ICU)。
方法
病人
机构审查委员会批准了这项研究(2020-71),该研究遵循了诊断准确性研究报告标准声明[12],并放弃了书面知情同意的要求。2019年12月23日至2020年2月13日,来自中国武汉市中心医院的299名成年COVID-19确诊患者被连续纳入回顾性研究。纳入标准:1)确诊COVID-19患者;2)入院的病人。排除标准为:1)入院时已患有重症的患者;2)入学与考试时间间隔>2天;3)没有可用的数据或延迟结果如下所述。根据入院时间,该中心纳入的患者被分为两个数据集,80%用于培训(2019年12月23日至2020年1月28日239名患者),20%用于内部验证(2020年1月29日至2月13日60名患者)。5个测试数据集于2020年2月20日至2020年3月31日期间从其他8个中心收集(补充材料)在中国、意大利及比利时以相同的纳入及排除标准(图1).
如果病人在住院期间至少符合下列其中一项标准,便会被标记为患有“严重疾病”[6,13]: 1)需要机械通气的呼吸衰竭;2)冲击;3) ICU入院;4)器官衰竭;或者5)死亡。如果患者在整个住院过程中没有达到上述标准,直到康复出院,则被标记为“非严重疾病”。
数据收集
临床、实验室和放射学特征以及结局数据来自国际严重急性呼吸道和新发感染联盟共享的电子病历[14].经鼻咽拭子标本高通量测序或实时逆转录酶PCR检测阳性,定义为COVID-19确诊病例。在咨询了呼吸专家并查阅了最近的COVID-19文献后,确定了一组临床、实验室和放射学特征,并从电子医疗系统收集了数据。临床特征包括基本信息(5个变量)、共病(11个变量)和症状(13个变量)。所有临床特征均在患者首次入院时获得。记录42项化验结果,包括全血计数、白细胞分化计数、d-二聚体、c反应蛋白(CRP)、心肌酶、降钙素原、肝功能检查、肾功能检查、b型利钠肽、电解质检查。由于大多数早期患者的数据缺失,动脉血气未被考虑在内。实验室结果的度量转换使用在线转换表[15].变量的详细列表可以在表1而且2。
语义计算机断层扫描(CT)特征(包括毛玻璃影、实变、血管增大、支气管气象和病变范围评分)由两名放射科医生(具有5年胸部CT图像经验的放射科医生Yang P.和具有20年胸部CT图像经验的放射科医生Xie Y.)在所有数据集上独立评估,他们对临床和实验室结果不知情。任何不同意见都通过一致阅读来解决。病变范围确定为毛玻璃样影或实变区,并根据病变体积在每个单叶的比例用6分制进行分级:0=未累及肺实质;1=高达5%的肺实质受累;2 = 5 - 25%;3 = 26 - 50%;4 = 51 - 75%;累及肺实质5=76 ~ 100%。由肺炎辅助诊断系统(version 1.17.0;舒坤科技),最终成绩为五叶总分(图2).详细的CT采集和重建参数在补充材料。
特征选择和建模
所有的特征选择和模型训练都单独在训练数据集中进行,以防止信息泄露。中给出了所使用函数的概述表S1。为了降低特征维数,先去除具有较高的Spearman对相关性(r=>0.8)和与所有剩余特征的最高平均相关性的特征,然后应用Boruta算法选择重要特征[16].Boruta算法结合了基于随机森林分类算法的特征秩和基于特征选择过程的多次迭代的选择频率。基于bagged tree模型的递归特征消除,并使用交叉验证技术(10次折叠,10次)来选择性能最佳的特征组合。为了平衡正负样本量,在特征选择和建模过程中使用了一种自适应的不平衡学习综合采样方法(ADASYN) [17].特征选择过程用于临床、实验室和CT语义模型单独和组合。
基于所选特征的逻辑回归模型被训练,验证数据集被用于内部验证模型的预后性能。训练4个模型:模型1仅包含基线临床特征,无症状;模型2采用所有所选临床特征;模型3选取语义CT特征、年龄和性别;模型4采用了所有选定的临床、实验室和CT特征。
由于样本量较大,将最佳模型的预后性能与训练数据集上的其他模型进行比较。最佳模型的性能和PSI评分在数据集上进行了测量通过接收机算子特征(ROC)和混淆矩阵。为了衡量过拟合的水平,结果在最佳模型上随机化,整个过程重复,从特征选择到模型构建和评估。
根据最佳表现模型的概率的第一个四分位数(第25百分位数)和第三个四分位数(第75百分位数),训练数据集中的患者被分为低、中、高风险。使用nomogram和在线计算器来提供最佳训练模型的可解释性。试验数据集被用来衡量预后性能和最佳模型的有效性。
统计分析
基线数据汇总为中位数,分类变量为频率(%)。对连续数据采用Mann-Whitney检验,对分类数据采用Fisher精确检验,对严重组和非严重组的差异进行检验。使用斯皮尔曼相关系数测量特征相关性。我们确定了ROC曲线下面积(AUC)及其95% CI,并使用D的方法测试了模型1-3和模型4之间的AUC差异el昂et al。(18],包括AUC和来源于混淆矩阵准确性、敏感性、特异性、阳性预测值(PPV)和阴性预测值(NPV)的指标。基于Hosmer-Lemeshow检验的校准图用于估计模型在测试数据集上的拟合优度和一致性。p值均为双侧,p<0.05为显著性。所有统计分析、建模和绘图都在R(3.5.3版本)中进行,详细的包特征列在表S1。
结果
人口学和临床特征
在回顾性队列的299名住院COVID-19患者中,中位年龄(四分位数范围)为50岁(35.5-63.0岁),年龄范围为20-94岁。137例(45.8%)为男性。所有临床特征及CT表现总结于表1,有关化验结果的详情,请参阅表2。在5个队列作为测试数据集的426名住院COVID-19患者中,中位年龄(四分位数范围)为62岁(50.0-72.0岁),年龄范围为19-94岁。236例(55.4%)为男性。
特征选择
在临床特征中,选择年龄、医院工作、体温和发病至入院时间。从实验室特征集中选取淋巴细胞(比例)、中性粒细胞(比例)、CRP、乳酸脱氢酶(LDH)、肌酸激酶、尿素和钙。仅从CT语义特征中选取病变范围评分。综合这三类特征选择特征时,最终将年龄、淋巴细胞(比例)、CRP、LDH、肌酸激酶、尿素、钙纳入组合模型。
在训练和验证数据集中建模性能
模型性能如下。模型1基于年龄和医院就业情况,在训练数据集上的AUC为0.74 (95% CI 0.69-0.79),在验证数据集上的AUC为0.83 (95% CI 0.72-0.94)。模型2具有年龄、医院工作、体温和发病时间等临床特征,在训练数据集上的AUC为0.78 (95% CI 0.73-0.83),在验证数据集上的AUC为0.74 (95% CI 0.59-0.89)。模型3基于CT上的年龄和病变范围评分,在训练数据集上的AUC为0.75 (95% CI 0.70-0.80),在验证数据集上的AUC为0.83 (95% CI 0.72-0.94)。
当将这三类特征合并时,组合模型(模型4)选择了7个特征(年龄、淋巴细胞(比例)、CRP、LDH、肌酸激酶、尿素和钙),在训练数据集上达到了最高的AUC,为0.86 (95% CI 0.82-0.90),在验证数据集上达到了0.90 (95% CI 0.82-0.98)。在训练数据集上,模型4的AUC值显著高于模型1 (p=0.001)、模型2 (p=0.033)和模型3 (p=0.003)。低、中、高风险概率重新分类的分界值分别为0.21和0.80。
临床使用
基于从最佳模型中选择的特征,建立nomogram来定量评估疾病的严重风险(图4).已开发的在线计算器可在www.covid19risk.ai。与PSI评分(临界值:90)相比,模型4(临界值:0.53)在五个测试数据集上显示出更高的auc、准确性、敏感性和npv (表3).5个检测数据集中重症患者在低、中、高危人群中的比例有显著性差异(图5).
讨论
这项国际多中心研究单独和联合分析了入院时COVID-19患者的临床、实验室和放射学特征,以回顾性地开发和前瞻性地验证预后模型和工具,以评估疾病的严重程度及其进展,并将其与PSI评分进行比较。我们发现COVID-19重症患者多为高龄、多合并症、胸闷,入院时实验室检查异常,肺部CT病变范围更广。在测试数据集中,使用更简单的线性回归模型比PSI评分产生更好的预后表现。我们相信这些模型可以用于风险评估和分类。
既往研究报道,年龄和潜在共病(如高血压、糖尿病和心血管疾病)可能是COVID-19患者需要入住ICU的危险因素[19,20.].本研究发现,男性、非医院工作人员、患有高血压、糖尿病、心脏病、慢性阻塞性肺病、脑血管疾病、肾脏疾病、乙型肝炎病毒感染、体温较低、胸闷的老年COVID-19患者更容易在发病早期发展为重症。其中年龄、医护人员、体温、发病至入院时间对预后有一定影响。年龄是最重要的特征,它可能与其他特征相互作用,这就是为什么从这些特征中只选择年龄进入我们的组合模型(模型4)。Z侯et al。(21]已经证实,新冠病毒使用与新冠病毒相同的细胞进入受体(血管紧张素转换酶-2)。然而,COVID-19患者合并高血压和糖尿病是否由于血管紧张素转化酶-2、增加药物治疗而导致重症风险更高尚不清楚[22].医院工作人员的进展风险较低,这可能是由于年龄较低、受教育程度较高、感染后的医学知识较多,但必须考虑到这类数据的不平衡性质。
此外,早期研究表明,COVID-19重症患者有更多的实验室异常,如c反应蛋白,d-二聚体、淋巴细胞、中性粒细胞、乳酸脱氢酶均高于非重症患者,与预后相关[19,20.,23].在我们的研究中,我们还发现严重组在全血细胞计数、白细胞分化计数、d-二聚体,CRP,肝功能,肾功能,降钙素原,b型利钠肽和电解质。其中淋巴细胞比例、中性粒细胞比例、CRP、LDH、肌酸激酶、尿素、钙是影响预后的重要因素,提示COVID-19在发展为重症时可能对多器官系统造成损害。然而,目前COVID-19的病理结果表明,没有证据表明新冠病毒可直接损害肝脏、肾脏和心脏等其他器官[24].
目前的报道显示,胸部薄层CT因其高灵敏度和监测疾病发展的能力,是临床诊断的有力工具[25,26].此外,既往研究报道,磨玻璃影和实变是COVID-19肺炎患者最常见的CT表现,但不具有特异性[27].临床观察显示ICU患者入院时实变病变明显较多,非ICU患者磨玻璃影病变较多[28].在我们的研究中,我们发现血管扩大、支气管气征和病变范围评分在非严重组和严重组之间有显著差异。在这些特征中,只有病变范围评分具有预后作用,但不足以选择联合模型。这说明这些早期CT语义特征虽然具有诊断价值,但对COVID-19重症患者发病的预测能力有限。
国家卫生健康委员会在新版《新冠肺炎诊疗方案(第七版)》中增加了重危病例预警指标[29],包括外周血淋巴细胞进行性减少,白细胞介素-6、CRP、乳酸进行性升高,肺部CT表现短时间内进展迅速。在这项研究中,我们利用住院时记录的临床、实验室和放射检查的年龄、淋巴细胞分数、CRP、LDH、肌酸激酶、尿素和钙评分来训练一个预测严重疾病发作的模型。我们的模型结合了来自多个来源的这些特征,当在来自中国、意大利和比利时的五个外部数据集中验证时,显示出良好的性能。此外,该模型能够将COVID-19患者分为低、中、高危重症人群。我们认为,该模型具有比PSI评分更高的预测性能和简单性,可用于住院时潜在严重疾病的初步筛查和分类工具。此外,该模型可用于临床试验中患者的选择和/或分层,以使患者群体均质化。后续的实验室测试需要以更高的准确性评估严重风险。
作为感染人类的冠状病毒家族之一,SARS-CoV-2与严重急性呼吸综合征冠状病毒、中东呼吸综合征冠状病毒具有相似的病原学、临床、放射学和病理特征[23,30.,31].因此,我们认为,基于目前的临床、放射和病理数据,开发可靠的早期预警模型对于当前和未来可能的冠状病毒暴发是必要的。
我们的研究有几个局限性。首先,选择偏差是不可避免的,因为样本量有限且不平衡。其次,不同种族和民族的患者临床和实验室结果可能存在差异,患者入院前的自我用药可能会影响临床和实验室结果。第三,去医院和住院管理的门槛可能因国家而异,我们也意识到RNA病毒可以迅速变异,并可能对模型的性能产生影响。因此,我们建议这些模型应该不断更新,以获得更好的性能,例如使用保护隐私的分布式学习方法[32,33].第四,本研究使用的CT特征是来自第一次CT扫描的语义特征,放射组学或深度学习方法可能提高其预后性能,后续CT扫描可能获得更多信息。最后,由于分析中包含大量的预测因子,以及特征选择和建模的复杂性,过拟合总是可能的。我们通过使用外部验证队列缓解了这一问题,并通过重新运行对随机结果的分析来得出一个“机会”(AUC=0.5)结果。
结论
根据确定的标准,老年COVID-19患者和非医院工作人员似乎更容易在住院后患上严重疾病,这可能导致广泛的实验室和CT异常。此外,我们基于乳酸脱氢酶、c反应蛋白、钙、年龄、淋巴细胞比例、尿素和肌酸激酶的模型可能是比肺炎严重程度指数更有用的COVID-19患者入院风险评估的初步筛查和分诊工具。
补充材料
可共享的PDF
脚注
这篇文章有补充资料可从www.qdcxjkg.com
作者贡献:吴刚,杨平,谢阳,王欣,和P. Lambin构思并设计了这项研究。吴国和杨平对文献检索有贡献。杨平、饶晓星、李俊、李俊、杜东、赵生、丁勇、刘波、孙玮、F. Albarello、A. D'Abramo、V. Schininà, E. Nicastri、J. Wu、M. Occhipinti、G. Barisione、E. Barisione、J. Guiot、A. Frix、M. Moutschen、R. Louis、P. Lovinfosse和C. Yan对数据收集有贡献。G. Wu, H. Woodruff和P. Lambin对数据分析有贡献。G. Wu, H. Woodruff和P. Lambin对数据解释有贡献。G. Wu和C. Yan对表格和数字做出了贡献。G. Wu, I. Halilaj和P. Lambin为建立网站做出了贡献。G. Wu, P. Yang, H. Woodruff和P. Lambin对该报告的撰写有贡献。
利益冲突:G. Wu没有什么可透露的。
利益冲突:杨平没有什么可透露的。
利益冲突:谢颖没有什么可透露的。
利益冲突:H.C. Woodruff在提交的工作之外拥有Oncoradiomics的股份。
利益冲突:饶毅没有什么可透露的。
利益冲突:J. Guiot没有什么可透露的。
利益冲突:A-N。弗里克斯没有什么可透露的。
利益冲突:R. Louis没什么可透露的。
利益冲突:M. Moutschen没有什么可透露的。
利益冲突:李佳玮没有什么可透露的。
利益冲突:李静没有什么可透露的。
利益冲突:C. Yan没有什么可透露的。
利益冲突:杜没有什么可透露的。
利益冲突:S. Zhao没有什么可透露的。
利益冲突:丁颖没有什么可透露的。
利益冲突:B.刘没有什么可透露的。
利益冲突:W. Sun没有什么可透露的。
利益冲突:F. albareillo没有什么可透露的。
利益冲突:A. D'Abramo没有什么可透露的。
利益冲突:V. Schininà没有任何可披露的内容。
利益冲突:E.尼卡斯特里没有什么可透露的。
利益冲突:M. Occhipinti报告来自Menarini基金会和诺华的资助,在提交的工作之外。
利益冲突:G. Barisione没有什么可透露的。
利益冲突:E. Barisione没有什么可透露的。
利益冲突:I. Halilaj没有什么可透露的。
利益冲突:P. Lovinfosse没有什么可透露的。
利益冲突:王x没有什么可透露的。
利益冲突:吴j没有什么可透露的。
利益冲突:P. Lambin报告称,在提交的工作中,有the Medical Cloud Company的少数股权,在提交的工作之外,有Varian Medical、Oncoradiomics、ptTheragnostic/DNAmito和Health Innovation Ventures的资助/赞助研究协议;他收到了Oncoradiomics, BHV, Varian, Elekta, ptTheragnostic和Convert pharmaceuticals的顾问/演讲者费和/或旅费报销/外部拨款写作费和/或实物人力贡献;P. Lambin拥有Oncoradiomics SA, Convert pharmaceuticals SA公司的股份,是两项已发行专利的共同发明人,放射组学(PCT/NL2014/050248, PCT/NL2014/050728)授权给Oncoradiomics,一项mtDNA专利(PCT/EP2014/059089)授权给ptTheragnostic/DNAmito,三项非专利发明(软件)授权给ptTheragnostic/DNAmito, Oncoradiomics和Health Innovation Ventures,以及三项非问题。深度学习-放射组学和LSRT的非授权专利(N2024482, N2024889, N2024889)。
支持声明:这项工作得到了ERC高级资助(ERC- adg -2015,编号694812 - Hypoximmuno),欧洲计划H2020 (ImmunoSABR -编号733008,PREDICT - ITN -编号766276,chameeleon -编号952172,EuCanImage -编号952103),TRANSCAN联合跨国电话2016 (JTC2016“清楚”-编号UM 2017-8295),中国奖学金委员会(编号201808210318)和Interreg V-A Euregio meus - rhine(“Euradiomics”-编号EMR4)的支持。资助者在研究的设计和实施中没有任何作用;数据的收集、管理、分析和解释;手稿的准备、审查或批准;并决定将手稿提交出版。这项工作得到了荷兰癌症协会(KWF Kankerbestrijding)的支持,项目号12085/2018-2。本文的资助信息已存入交叉参考基金注册。
- 收到了2020年4月9日。
- 接受2020年6月11日。
- 版权所有©ERS 2020
本版本根据知识共享署名非商业许可4.0的条款发布。