摘要
2019冠状病毒病预测模型
背景
近3个月来,COVID-19在中国各地爆发,并蔓延到世界各地[1].这种疾病引起了不同程度的疾病。入院时COVID-19患者在非重症患者中的比例为84.3%,重症患者占15.7% [2].大部分非重症肺炎患者在治疗过程中会逐渐好转痊愈,而其他患者则会迅速发展为重症,预后较差[3.,4].根据最近的报告,在所有COVID-19患者中,复合终点的累积风险为3.6%,累积风险为20.6% [2为了治疗严重的疾病。
虽然尚不清楚对非重症COVID-19患者的早期识别和干预能否防止病情发展为重症。结合治疗其他疾病的经验,可能对治疗有很大的促进作用。在本文中,我们的目标是建立一个预测模型来识别高危非重症肺炎患者的早期。
方法
于2020年1月2日- 20日在武汉大学人民医院招募86例新冠肺炎非重症肺炎患者作为培训队列,于2020年1月28日- 2月9日前瞻性招募62例患者作为验证队列。实时荧光定量PCR证实。根据美国胸科学会社区获得性肺炎指南的标准,将COVID-19疾病严重程度定义为重症和非重症肺炎[2,5].排除标准包括:(1)入院时或随访时病情严重程度不明确;(二)住院时诊断为重症的;(3)确诊并在其他医院治疗;(4)入院前15天内给药;(5)随访期间给予氧支持。根据患者在14天随访期间是否进展为重症,将患者分为进展组和未进展组。共病包括糖尿病、高血压、心脑血管疾病、慢性阻塞性肺疾病、恶性肿瘤、慢性肝病、慢性肾病、肺结核和免疫缺陷疾病等。
从电子病历中提取临床特征和实验室检查结果。采用双盲法从胸部CT影像中提取影像学特征[6].为了准确评估病灶大小,采用基于人工智能(AI)的COVID-19诊断系统,通过分析CT值自动测量肺炎体积比[7,8].
采用Logistic回归作为分类器建立预测模型。通过训练数据集与验证数据集交叉验证的ROC曲线下面积(area under The ROC curve, AUC)的值来量化预测模型的识别性能。根据模型中各变量的权重计算风险指数,确定高危人群。所有分析均使用R-3.6.0进行。
结果
148例患者中位年龄为46.5岁(IQR 35.8-58.0),其中81例(54.7%)为女性。60例(40.5%)非重症患者进展为重症,中位进展时间为5.0天(IQR 2.8-9.0)。在培训队列中,60例(40.5%)非重症患者进展为重症患者,26例(41.9%)在验证队列中。这两组患者进展的中位天数分别为5.5天(IQR 1.0-9.0)和5.0天(IQR 3.0-9.8)。变量的描述在表1.
为了建立预测模型,我们测试了除治疗特征外的所有临床、实验室和放射学变量。最终将4个变量纳入模型,包括共病(β=1.234, p=0.036)、入院时呼吸困难(β=1.583, p=0.095)、乳酸脱氢酶(β=0.007, p=0.027)和淋巴细胞计数(β=−2.012,p=0.002)。对训练数据集进行Hosmer Lemeshow检验(χ2= 10.451, p = 0.235)。训练数据集交叉验证的AUC值为0.819 (95% CI: 0.731-0.907)。在验证数据集中,它是0.759 (95% CI: 0.635-0.884)。根据回归系数,赋予四个变量不同的权重。共病为每单位12分,呼吸困难为16分,乳酸脱氢酶为0.07,淋巴细胞计数为- 20。然后计算每个人的总得分,不同的得分显示不同的风险。基于训练数据集风险评分的AUC值为0.856 (95% CI: 0.776-0.935)。根据约登指数确定的最佳临界值,将患者分为高危组和低危组(总分>−6.0和≤−6.0),敏感性为0.941,特异性为0.635表1.
讨论
在我们的预测模型中,共病与疾病进展相关,这意味着有共病的患者比没有共病的患者更有可能进展。既往研究表明,重症患者伴有共病的比例较高[9].我们进一步证实伴有合并症的非重症患者更容易进展。需要说明的是,入院时呼吸困难的p值在多元回归中不小于0.05,这可能是由于在调整其他变量后,呼吸困难与本研究结果之间的关系并不是严格的线性关系。虽然我们之前尝试了其他性能更好的模型,但由于逻辑模型的可解释性和应用的简单性,我们最终选择了逻辑模型。进展的患者更有可能伴有淋巴细胞计数的减少和乳酸脱氢酶的增加[2,10].我们的研究进一步证实了这两个指标也与进展有关。淋巴细胞计数下降通常表明免疫功能下降,多器官功能障碍可能导致乳酸脱氢酶升高[11,这与我们在临床上观察到的现象一致。
此前有报道指出,高龄是COVID-19患者预后不良的危险因素之一[2,3.].然而,年龄没有包括在模型中。提示在早期治疗中不能忽视对年轻非重症患者的治疗。我们推测,年龄对疾病进展的贡献反映在共病和呼吸困难。此外,一些研究报告了放射性指标与COVID-19疾病之间的相关性[12].入院时CT影像的影像学特征虽已详细描述,但未纳入模型。我们推测,治疗期间的多张图像而不是单张图像可能表明疾病的进一步进展。虽然模型中没有包含人工智能从CT图像中提取的变量,但这是一次很好的尝试,将是我们后续研究的重点。
这项研究有一些局限性。首先,本研究中纳入的COVID-19患者来自一家医院,这可能是我们模型推广的一个潜在限制。二是按照当地政府规定将危重患者转移到其他定点医院。我们无法在短期内追踪患者的死亡情况,也无法评估模型与总生存期之间的关系,这是本研究的一大遗憾。
总之,我们的模型可以根据入院时的临床特征预测非重症COVID-19患者的病情进展。该模型通过一个性能良好的前瞻性验证队列进行验证。在该模型的帮助下,临床医生可以在常规的临床指标很少的情况下,轻松识别高危非重症患者,从而有助于COVID-19的治疗和预防。
脚注
资助者:国家自然科学基金;DOI: http://dx.doi.org/10.13039/501100001809;格兰特:81901817;湖北省自然科学基金;DOI: http://dx.doi.org/10.13039/501100003819;格兰特:2018 cfb136;武汉大学创新种子基金;格兰特:TFZZ2018020。
利益冲突:纪博士没有什么可透露的。
利益冲突:袁博士没有什么可透露的。
利益冲突:沈博士没有什么可透露的。
利益冲突:吕博士没有什么可透露的。
利益冲突:李博士没有什么可透露的。
利益冲突:陈医生没有什么可透露的。
利益冲突:朱博士没有什么可透露的。
利益冲突:刘博士没有什么可透露的。
利益冲突:梁博士没有什么可披露的。
利益冲突:林博士没有什么可透露的。
利益冲突:谢博士没有什么可透露的。
利益冲突:李博士没有什么可透露的。
利益冲突:陈医生没有什么可透露的。
利益冲突:卢博士没有什么可透露的。
利益冲突:丁博士没有什么可披露的。
利益冲突:安医生没有什么可透露的。
利益冲突:朱博士没有什么可透露的。
利益冲突:高博士没有什么可披露的。
利益冲突:倪博士没有什么可透露的。
利益冲突:胡博士没有什么可披露的。
利益冲突:施博士没有什么可透露的。
利益冲突:施博士没有什么可透露的。
利益冲突:董博士没有什么可披露的。
- 收到了2020年3月16日。
- 接受2020年5月10日。
- 版权©2020人队
本文是在知识共享署名非商业许可4188滚球软件.0的条款下开放获取和发布的。