摘要
用于诊断活性肺结核(PTB)的胸部射线照相受差的特异性和读者不一致的限制。进出评分系统已成功地用于提高各种肺疾病的胸部射线照相的性能。我们进行了系统审查,以评估PTB评分系统的诊断准确性和再现性。
我们搜索了多个数据库进行研究,以评估PTB胸部X线摄算系统的准确性和再现性。我们总结了与PTB相关的特定放射线特征和评分系统的结果。在适当的情况下,我们使用随机效应模型估计类似研究的汇总性能。
13项研究涉及审查,其中九九是低结核病(TB)负荷环境。没有评分系统仅基于放射线摄影结果。所有研究使用具有各种临床和放射功能组合的系统。11研究涉及用于做出医院呼吸分离的决定的评分系统。没有包括关于或记者间重现的数据。上叶渗透(汇集诊断或3.57,95%CI 2.38-5.37,五项研究)和空腔(诊断或1.97-25.66,三项研究)与PTB显着相关。评分系统的敏感性高(中位数96%,IQR 93-98%),但特异性低(中位数46%,IQR 35-50%)。
胸部Xchargraph评分系统似乎有用于在医院统治PTB,但它们的低特异性排除了PTB中的统治。有必要为艾滋病毒和门诊设定的人开发准确的评分系统,特别是在高结核病装备设置中。
介绍
尽管早期诊断是结核病(TB)控制的关键原则,但在2010年,所有形式的TB的全球案例检测率仅为65%[1]。认为现有诊断测试的局限被认为有助于低案例检测率[1]。痰涂片显微镜和胸部射线照相是大多数高结核病负担国家的TB最常用的两种测试。涂片显微镜具有低灵敏度,并且无法检测到所有TB案例的近一半[2]。涂片显微镜具有特别有限的肺结核TB,儿童和艾滋病毒(PLWH)的人的价值。
胸部射线照相是一种快速测试,已被用于诊断肺结核(PTB)[3.]。胸部放射线照相可以在护理点进行,并掺入筛选和诊断算法中,通常是在可能的PTB中的人群中涂抹显微镜的附加试验,或作为特定人群的筛选测试,例如来自高的移民-Bonden TB设置。虽然胸部射线照相被承认对检测肺异常具有高灵敏度,但其用于诊断PTB的用途受到适度特异性的限制,并且在射线照片的报告中具有高和观察者的观察者的差异[4.]。因此,基于胸部射线照片诊断活性PTB的概率取决于读者并不标准化。
在胸部射线照相读取的标准化方法的发展中克服了使用胸部射线照相的类似障碍,克服了胸部射线照相的标准化方法,该系统由国际劳工组织的国际联盟成功雇用的系统,和美国国家职业安全与健康研究院[5.那6.]。还开发了评分系统,用于分级囊性纤维化患者肺病的严重程度和程度[7.],并形成肺损伤分数的一部分,用于评估成人呼吸窘迫综合症的严重程度[8.]。类似地,用于PTB的标准化评分系统,用于将权重与PTB一致的胸部射线照片的特定特征分配,如果准确和可重复,可能会使用主要预先存在的资源来增强TB案例检测率。这种用于PTB的标准化评分系统还具有与新核酸扩增试验相结合的可能性,例如XPERT MTB / RIF(Cepheid,Sunnyvale,CA,USA)[9.],可以作为降低成本的分诊测试,也可以作为Xpert MTB/RIF阴性患者的附加测试。
2005年发表了一篇关于隔离疑似结核分枝杆菌住院患者的临床预测规则的系统性综述[10.[但对于我们的知识,没有先前的系统评论已经评估了PTB射线照相评分系统的表现。因此,我们进行了系统审查,以估计使用疾病患者的活性PTB的胸部射线照片特征来估计评分系统的诊断准确性。次要目标是评估PTB胸部X线射线评分系统的可重复性。
方法
我们遵循Cochrane协作诊断测试精度工作组建议的诊断测试精度的系统审查指南,包括在开始评论之前在编写详细的协议[11.那12.]。
我们的目标是包括随机对照试验和所有研究设计的观察研究(IE。横截面,案例控制和队列)评估射线照相评分系统进行诊断为PTB的性能。我们包括研究报告的数据,我们可以从中提取真正的正,真正的负,假阳性和假阴性值,以确定灵敏度和特异性估算,以及仅报告诊断准确性的概要措施(下面定义)的研究。
参与者是可能的PTB患者≥15岁。我们将研究限制为那些包含至少10名TB患者的研究。旨在评估类似于常规临床实践中存在的患者的患者,我们排除了专门涉及特定患者群体的研究,例如肺炎患者,恶性肿瘤(血液学和固体器官)和免疫介导的炎症疾病,以及患者血液透析。我们还排除了研究TB患者的无症状接触的研究。
索引测试是任何胸部X线评分系统,比较器没有胸部射线照相系统。
目标条件是肺检询,胸膜和胸腔淋巴结的TB。如果疾病涉及肺部牙科或多个位点,我们包括米拉蒂,其中一个是肺部。
我们认为液体或固体培养为活性PTB的参考标准。
放射照片评分系统被定义为将数值权重定义为与PTB(例如空位病变)一致的胸部射线照片的特定特征分配的系统,其中有或没有临床发现。
敏感性是PTB患者被评分系统正确识别的患者的比例。特异性是没有PTB的患者的比例,他们被评分系统正确识别。阳性预测值(PPV)是由被正确诊断为PTB的评分系统被认为是阳性的患者的比例。消极预测值(NPV)是由不含PTB正确诊断的评分系统所考虑的患者的比例。
诊断量比(DOR)是具有PTB的患者的患者,所述PTB具有特定的临床或射线照相特征除以具有相同临床或放射线特征的PTB的参与者的几率。
再现性是指胸部射线照片多次读取胸部射线照相时评分系统的协议。协议可以是“读者内部的”,当同一个人读取胸部射线照片不止一次,蒙蔽他或她之前的阅读或“读者互相”,当两个或更多人读取相同的胸部射线照片。协议反映了测试的可重复性(评分系统),并且与测试的准确性无关。
搜索研究识别方法
我们搜索了Medline(1946年至2012年8月30日),Embase(1947年至2012年8月30日)和科学网(1899年到2012年8月30日),用于相关文章,使用已发布的过滤器进行诊断测试以提高灵敏度[13.那14.]。我们使用Sensitiv * [Tw]或诊断* [tw]或di [fs]和Xcoxporph * [网格]或胸部X射线[Tw]或Mass Chest X射线[网格]或光荧光仪* [Tw]或Scor *[tw]和结核病(子标题:淋巴结/粟粒/多药/胸膜/肺)β或分枝杆菌结核病[mesh]。详细的搜索策略可以在线补充材料中找到。我们还审核了包含的文章的参考列表和通过搜索中确定的文章和审查的世界卫生组织报告。
选择研究
最初,两次审查作者(L.M.Pinto和K.R. Steingart)独立审查了英语,法语和西班牙语的题称和摘要,以获得资格。选择由审阅者视为相关的引文,并检索文件以进行全文审查。接下来,每个符合条件的文章由两名审稿人(L.M.Pinto和K.R. Steingart)独立评估,以反对选择标准。通过审核人员之间的讨论解决了分歧。保留了除以其排除原因的排除研究清单。
评估研究质量
两位审稿人(L.M.Pinto和K.r. Steingart)独立评估了使用11项的核心诊断准确性研究质量评估(Quadas)的核心套装的研究质量,验证工具来评估偏见的存在和诊断准确性研究的变化[15.]。如推荐,每个项目得分为“是”,“否”或“不清楚”。
数据提取
两份评论作者(L.M.Pinto和K.r. Steingart)独立地从每项研究中提取数据,使用试驾的数据提取形式,然后根据飞行员获得的经验完成。分歧是通过讨论解决的。提取数据以进行各种特征,包括以下特征:作者;出版年份;学习规划;世界银行2012年世界银行数据归类国家收入状态分类:2012年世界银行数据[16.];双层表(带有细胞记录单个射线照相特征的真实阳性,假否定,误报和真正的否定否定);和评分系统的细节及其性能特征。数据提取形式包括在线补充材料中。
统计分析
二次表格的数据用于计算各个研究的评分系统的灵敏度和特异性估计,以及他们在研究作者确定的截止的95%置信区间(主要是基于最佳敏感性和使用接收器操作员特征曲线)。生成森林图以使用元盘显示敏感性和特异性估计(版本1.4)[17.]。当提供数据时确定与PTB相关的特定射线照相特征的DOR。通过对森林地块的目视检查和通过I范围统计测量的异质性来评估异质性(i2)。仅当射线照相特征和患者人群相似跨研究和I时,才会汇集特定放射线特征的DOR2≤75%。使用随机效应方法进行META分析,以考虑研究的可变性,并在估计中导出不确定性的保守评估[18.],使用元盘(版本1.4)[17.]。没有进行使用漏斗图或回归测试等方法的正式评估,因为没有发现这种技术对于诊断数据有用[19.]。通过从带有语言过滤器的搜索策略中检索引文来尝试估计语言偏见,并将“过滤”引用作为检索的整个引用的百分比报告。
结果
我们确定了12个883个引文,其中排除了重复的文章后确定了9137个独特的物品。我们使用语言过滤器进行了搜索,以评估偏差程度,并发现我们的搜索策略包含语言过滤器的所有研究中的81%。在筛选标题和摘要后,发现187篇文章满足进一步审查的标准,并检索其全文。全文审查后,出于各种原因,174篇文章被排除,并在系统审查中包含13条(所有观察研究)(如图。1)[20.-32.]。
包括研究
我们没有识别任何基于射线照相标准的评分系统。其中13项研究中,12项研究涉及组合临床和射线照相特征的评分系统[20.-31.]一项研究涉及13个临床呼吸孤立临床预测规则的验证[32.]。本研究被列为若干研究中的若干研究中的回顾性应用预测规则,通过我们的系统审查对一群题为PTB的症状的符合条件的参与者。本研究还测试了来自其他七项研究的规则,这些研究被排除在我们的系统审查之外,因为它们不满足我们的参考标准[33.那34.]或者没有使用胸部射线照相上可视化的特定功能作为评分系统的一部分[35.-39.]。表格1列出了12个包含的原始研究的特征,总共包含5767名参与者,以及验证了这些评分系统中的六个的单一研究(在345名参与者中验证)。在研究中包含可能PTB的个体的中位数为283(第177-431号间隔范围)。
七项研究包括所有可能PTB的患者[20.-25.那32.]五项研究包括可能的PTB患者,被发现有阴性痰涂片[26.-30.一项研究明确排除了PLWH [31.]。在高收入国家进行了九项研究。五项研究涉及放射科医生;两项研究包括肺部学家和五项研究没有报告射线照相阅读器的专业。在线补充材料中提供患者的人口统计特征。报告时,大多数患者是男性。11项研究包括PLWH,占合格患者的11-61%。
排除研究
我们确定了两项研究,该研究旨在推导出临床 - 射线摄影患者临床放射线评分系统,该患者发现痰盂涂抹阴性[40那41.]。这两项研究都满足了我们纳入标准的大部分,发现存在纵隔腺病变和腔的存在,与单变量分析中的PTB显着相关。然而,这些研究都不是PTB的分数。研究由lE.minor.等。[41.结论,“数量不足以为TB开发成绩”,而D DAVIS.等。[40]表示“详尽测试后,我们无法识别可靠预测细菌学证实结核病的任何因素的组合”。
我们还排除了13项研究,使用自动化计算机辅助诊断,因为这些研究都不是使用文化作为参考标准,纳入本评论的标准[42.-54.]。涉及涉及胸部射线照片的评分的五项研究,因为这些研究旨在根据胸部射线照片上可视化的异常程度来级别PTB的严重程度,而不是评分系统的诊断准确性[55.-59.]。我们还排除了使用胸部X线读取和记录系统(CRRS)的三项研究[60.-62.]尽管这些研究表明CRRS工具具有良好的可靠性,用于在胸部射线照片上可视化的PTB的特征,因为这些研究没有使用培养作为参考标准。
评估方法质量
如所示图2,所有的研究都存在验证偏倚,因为胸片结果和/或评分系统的临床成分在这些患者的选择中发挥了作用,这些患者将被作为参考标准进行进一步调查。13项研究中有7项(54%)没有纳入被认为代表目标人群的样本,因为这些研究没有以连续或随机的方式纳入所有可能的PTB患者,通常只包括没有合适对照组的入院患者。6项(46%)研究没有明确说明对评分系统的各个部分对患者进行评分的人是否对参考标准的结果不知情。
发现
包括所有可能的PTB患者的研究
我们确定了六项研究,包括所有可能PTB的所有患者[20.-25.]。所有研究均在住院环境中进行。所有研究旨在导出最佳的预测分数,以鉴定可能具有PTB的患者并需要呼吸孤立,表1。在单变量分析中,发现与PTB显着相关的研究中最常见的射线照相特征是上叶浸润(合并DOR 6.65,95%CI 4.42-10.01;五项研究)(如图。3A)和腔(DOR范围2.11-10.08;三项研究)(在线补充材料)。
概括了分数和其各自的权重的参数的细节表2.以及与评分系统的性能特征以及最终规则有助于决策。研究用来使用几种不同的方法来获得评分系统的权重:单变量分析(三项研究)显着的参数的逻辑回归;分类和回归树分析(一项研究)[21.];一般回归神经网络分析(一项研究)[22.];和卡方递归划分(一项研究)[23.]。所有六项研究的评分系统敏感性均超过80%(中位数95%,范围81-100%)。在报道特异性数据的5项研究中,特异性估计数较低(中位数42%,范围22-72%),表明PTB的规范值较低。
图4.显示在个人研究中报告的评分系统的敏感性和特异性的森林曲线。由于评分系统的差异,我们没有池估计。
仅包括痰涂片阴性的可能PTB患者的研究
我们在此类别中确定了五项研究[26.-30.]。在住院环境中进行四项研究,以确定呼吸孤立的临床规则[26.那27.那29.那30.];虽然在门诊设置中进行了一项研究[28.](表1)。与先前描述的一组研究集中包含了可能的PTB的所有患者,在单变量分析中,发现与PTB相关的研究中最常见的射线照相特征是上叶浸润(汇集DOR 3.57,95%CI 2.38-5.37;五学习) (如图。3B.)和空腔(DOR范围1.97-25.66;三项研究)。由于这些评分系统(在线补充材料)的差异,我们没有基于评分系统的汇率估计。
为了获得评分系统的重量,两项研究使用了在单变量分析中发现的参数的逻辑回归[27.那30.],虽然三项研究涉及先前研究的验证[26.那28.那29.]。其中一个验证研究使用自动启动,这是一种重采样方法,旨在提高数据的内部有效性[27.]。所有研究均达到评分系统的敏感性大于93%(中位数96%,范围93-98%)。然而,特异性估计值低(中位数35%,范围为14-50%),再次表明PTB的差值差(如图。5.)。我们没有考虑这些评分系统是类似的,因此没有汇集精度估计。
一项研究,在住院环境中进行,排除了PLWH(表1)[31.]。Logistic回归用于得分的权重,但该研究还验证了W的得分isnivesky.等。[30.]。本研究发现敏感性为97%,特异性为42%(表2.)。
验证了各种临床预测规则的研究
一项研究评估了13个不同的临床预测规则(鉴定了综合文献搜索),用于疑似PTB的住院患者的呼吸分离[32.]。如上所述,13项预测规则中的六项符合纳入审核的标准。作者回顾性地将各种规则应用于早期研究中包含的急诊室患者[25.](本研究包含在当前的系统审查中),以推导出PTB的评分系统。类似于原始研究,验证研究发现,大多数评分系统对PTB的特异性差。提供各自推导研究中六种评分系统的性能特征的比较,并提供了验证研究表3。
再现性
含有的研究没有报告有关报告内或记者间重现性的数据。
讨论
我们进行了这一系统审查,目的是评估标准化放射线评分系统的诊断准确性,用于诊断PTB,以及标准化是否提高了胸部射线照相的性能。我们的评论未能发现任何依赖放射线照相特征的任何研究,可以获得分数,并且所有包括的研究结合了不同的临床标准的明确射线照相标准。审查的目的是评估射线照相评分系统的效用作为诊断工具,特别是在低收入,高收入的高度负担门诊环境中,如果准确的话,这种系统将是一个非常有利的,似乎是这种研究的缺乏。其中大部分研究是基于医院的,在高收入,低TB负担环境中决定的决定性研究。
PTB的患者可以产生高达44个QuanTa每小时Tb Bacilli(一个量子被定义为感染剂量)[63.],突出了在医院环境中患有PTB患者快速呼吸分离的必要性。然而,患者的不必要的呼吸道分离大大提高了医疗保健系统的成本[64.]并且在资源限制的设置中,其中隔离床可能短路,一些患者的不必要的隔离可能排除适当的孤立。评分系统,提高对可能PTB患者对呼吸隔离的主题患者的准确性可以大大提高医疗保健系统的效率和资源利用。患有低特异性的分数,并具有高排列的价值(中位数NPV 99%,范围93-100%,七项研究报告的值),但规则价值差(中位数PPV 22.5%,范围8-61%,价值在八项研究中报告)PTB。在单独的研究中验证六种分数反映了同样缺乏特异性。与乡村收入地位进行了分层分析,反映了与中低收入国家相比,高收入国家的评分系统更好地表现,但改善不太可能是临床显着(在线补充材料)。然而,这种分数仍然有助于限制进一步调查的患者的数量(与使用胸部射线照相的主观评估相比,已知具有极差的特异性,从而需要进一步测试更大的测试怀疑患有PTB的患者数量),特别是涂抹阴性的患者。
由w开发的预测规则isnivesky.等。[30.]在四项研究中验证,其中两种研究是在具有负痰涂片的患者中进行的。评分系统始终如一地表现出高于92%的敏感性,但特异性差。作为排除测试,该评分系统似乎在多项研究中验证。研究的研究oto等。[28.]是在早期研究中由同一研究小组的得分进行验证研究[27.]。虽然在验证队列中修改了分数的截止,但评分系统在没有结核病患者的患者的亚组中表现良好。四项研究认为患者对于PTB的阳性,如果他们有任何一个存在的特征[20.那23.那26.那29.那30.使这些系统类似于检查表而不是加权评分系统。
我们才发现一项研究,评估了门诊患者的临床放射线摄影系统。我们的系统审查也未能识别具有可能PTB的PLWH的临床放射线摄影系统。B.ock.等。[20.]在PLWH中进行了亚组分析,但发现没有与该亚组中的PTB显着相关的射线照相特征,该发现与PTB中所描述的PTB的射线照相表现的非典型性质一致[65.]。
自动计算机辅助诊断采用纹理分析等技术来阅读数字胸片,似乎是标准化和提高数字胸片诊断性能的一种有前途的方式[66.]。但是,我们的评论表明缺乏方法论高质量的研究。该领域的研究人员可以通过以下公布的进行和报告其工作的指导方针提高其技术,以确保他们的努力有助于高质量的证据基础[67.那68.]。
我们系统审查的实力在于对文献的广泛审查,两个审稿人独立进行筛选,质量评估和数据提取。然而,需要承认三个警告,同时解释系统审查的结果。首先,13项研究中的12项在住院患者中进行,与门诊剂相比,TB疾病的表现可能受到频谱偏差的群体的群体[69.]。其次,在高收入,低TB负担的情况下进行了九项研究,疾病的射线照相表现,射线照片的射线照相表现可能在这种情况下与低收入相比不同,高负荷设置[70]。最后,大多数研究的目的是评估用于医院呼吸隔离的PTB的可能性,这些评分的推导可能与出于诊断目的而推导的评分系统有不同的目的(因此有不同的分界)。我们将搜索范围限制在英语、法语和西班牙语的文章上,但对语言偏见的评估表明,我们包含了很大比例的可用文献。然而,我们可能无意中没有包括其他语言的文章,并承认这是审查的一个缺点。通过QUADAS评估,我们判断研究在几个项目上存在偏倚风险。在所有研究中,胸片结果和/或评分系统的临床组成部分在决定哪些患者将接受文化(验证偏倚)中起着重要作用。这种偏误可能导致了对诊断准确性的过高估计[15.]。尤其如此,用于研究放射学发现指导要求痰培养为TB的决定。七项(54%)的研究未被认为包括代表性样本(选择偏见)。六次(46%)研究没有提供有关盲目解释致盲的充分信息。选择偏见和盲目的盲目是研究设计的特征,也与膨胀的准确估计有关[71.那72.]。在解释结果时,需要考虑纳入研究质量的这些限制。
结论
我们的系统审查并未仅基于射线照相特征来确定PTB的评分系统。这种系统的开发和验证有助于标准化胸部射线照片的解释。审查鉴定了预测PTB可能性的临床放射线测量系统,患者入院的患者。这种评分系统旨在评估呼吸分离的需要。这些系统中的大多数具有高灵敏度,但PTB的特异性很低。有必要推导PLWH和门诊患者的准确评分系统,尤其是在低资源设置中。在精心设计的研究中,胸部射线照片解释的技术进步需要在精心设计的研究中进行验证,以评估其效用。
致谢
我们感谢L.A. Kloda(Life Sciences Library,McGill University,Canada)在制定搜查策略方面的指导和协助。
脚注
本文提供了补充材料www.www.qdcxjkg.com.
支持声明:这项工作得到了支持欧洲和发展中国家的临床试验伙伴关系(tb-neat grant)和加拿大卫生研究院(CIHR)(MOP-89918)。MP由薪水奖提供支持Cihr和Fonds de Rechercheduquébec - 桑特。L.M.PIGTO由奖学金支持Shastri Indo-Canadian Institute。这些代理商在分析数据和决定上发表的作用没有作用。
利益冲突:没有宣布。
- 已收到2012年7月12日。
- 公认2012年10月11日。
- ©2013年