摘要
干燥空气运动挑战经常用于筛选在运动诱导的支气管混凝网(EIB)管理中具有潜在效用的药物。本研究的目的是确定使用这种挑战的三种结果测量的再现性,以及基于这些结果的药物评估研究的样本大小要求。
40名哮喘成人受试者在一次筛选运动挑战中测试呈阳性,他们又接受了两次相同的挑战,间隔1到>35天。结果测量包括一秒内用力呼气量最大百分比下降(FEV)1),运动后(%下降马克斯),以及FEV下降百分比以下的区域1/ 30分钟时间曲线(AUC30.)和60分钟(AUC60)运动后。
通过组内相关系数评估,这些结果的重现性分别为0.72、0.53和0.35马克斯, AUC30.和AUC60分别测量。样本量要求证明EIB的衰减相当于50%的下降%马克斯是9 14和19个受试者的百分比下降吗马克斯, AUC30.和AUC60响应,分别(90%功率)。
结论是,在一秒内用力呼气量下降的最大百分比比曲线下面积测量有更大的重现性和结果在临床试验中更大的力量。样本量计算曲线可用于研究设计和解释已发表的研究。
运动性支气管收缩(EIB)发生在70-80%的哮喘患者中。这种支气管收缩被认为是气道高反应性的表现,因此,不会导致炎症反应或潜在哮喘的恶化。因此,哮喘患者的目标应该是鼓励锻炼,同时为潜在的哮喘提供最佳的抗炎治疗和任何额外的治疗,以尽量减少与锻炼相关的症状。
而吸入类固醇治疗可将EIB的大小降低50%或更多1- - - - - -5在美国,通常需要额外药物治疗以消除所有症状。吸入短效和长效β2-激动剂能有效预防或逆转EIB6- - - - - -8,但这种影响可以在定期调节后降低9- - - - - -12.抗白三烯、抗胆碱能药和抗组胺药等更具体的药物已被证明能部分减弱反应13- - - - - -15.显然,需要在这一领域进行进一步的研究,以确定可以定期使用的药物或更可能的组合,以完全预防与运动相关的哮喘症状。
在许多评价EIB治疗效果的研究中,结果测量是一秒内用力呼气量(FEV)最大下降百分数1)(%下降马克斯)3.,14,16- - - - - -19.偶尔还对FEV下降百分比以下的区域进行额外分析1/时间曲线(AUC)13,15,17,20.,21.令人惊讶的是,关于这些结果测量的可重复性,或关于评估和比较药物对EIB的保护能力的样本量要求的信息很少。此外,据作者所知,尚无关于这些结果变量之间的临床关系的报道。因此,没有根据假定FEV的下降百分比是给定的衰减百分比1相当于AUC的相同衰减。
本研究的目的是确定%堕落的重现性马克斯以及30的AUC (AUC30.)和60分钟(AUC60)运动后。第二个目的是提供运动挑战性研究的样本尺寸测定的指导性,类似于先前用于过敏原和甲素挑战的那些22,23.最后,在临床当量方面比较了百分之秋季和AUC测量。
方法
主题
哮喘患者40例(男25例,女15例;表1⇓)和欧洲投资银行自愿参与了这项研究,这项研究得到了卡罗林斯卡医院研究伦理委员会和麦克马斯特大学健康科学中心的批准。每位受试者在参与前均给予书面知情同意。所有受试者均为非吸烟者,短效吸入β可稳定控制哮喘2独自一人。除了它们的β外,三个受试者使用稳定剂量的吸入剂量(分别为200,400和800μg)2受体激动剂使用。所有受试者均有FEV1> 70%的预测24.在与季节性环境过敏原暴露相关的期间,特应性受试者没有被研究。在任何研究来访之前,受试者未在知情的情况下暴露于其他环境过敏原(除室内尘螨外)≥2周。
研究设计
受试者参加实验室≥2次筛选,然后2天,间隔1-21天(33名受试者)或>35天(7名受试者)。在所有实验室检查前,受试者被要求不使用支气管扩张药物≥8小时,不使用咖啡因≥24小时。每天同一时间(+/ - 30分钟)对每个受试者进行运动挑战。
方法
在最初的筛查来访期间,记录受试者的特征和历史,并进行递增周期力量器运动测试,直到主观疲劳25.在第二次筛选访问期间,一个干燥的空气锻炼挑战(稍后描述)被亵渎的工作速率等于增量测试中达到的最大工作速率的80%。如果这导致FEV下降1从15-45%的基线开始,这个工作率被选择用于随后的锻炼挑战。如果FEV的百分比下降1超出这个范围,然后以适当的较小或较大的工作频率进行进一步的筛选挑战。所有筛查来访至少间隔24小时。
在fev中落后的主题1在筛选运动挑战期间测量≥15%,然后在单独的日子上进行,在筛选期间使用的工作率相同的工作率进一步的运动挑战。
干燥的空气运动的挑战
受试者在固定的循环功计上进行运动(卡罗林斯卡站点:SECA Cardiotest 100, Vogel and Halke, Hamburg, Germany)。McMaster站点:Ergomed 740, Siemens Mississauga, Canada)以恒定的工作速率5分钟。受试者佩戴鼻夹,在室温(21.5°C)下从连接的道格拉斯袋储气库吸入干燥的室内空气(相对湿度<10%)通过3路汉斯-鲁道夫(型号2700,堪萨斯城,MO,美国)的吸气口到吹口。FEV1(卡罗林斯卡网站:Vitalograph MDI Compact, Förbundsmaterial,瑞典斯德哥尔摩。McMaster位点:Collins公司,Braintree, MA, USA)运动前和运动后立即以及运动后1、3、5、8、10、15、20、30、40、50和60分钟。运动前(基线)FEV1被确定为三个测量值中最大的,彼此之间间隔≥30秒。
分析
运动后支气管收缩反应以%下降计马克斯, AUC30.和AUC60.具体来说,%堕落马克斯表示FEV最低1以运动后一小时计算,以运动前FEV的百分比表示1测量。AUC30.测量的是FEV下的面积1(以运动前值的百分比表示)/时间曲线(运动后30分钟)使用线性梯形积分计算。有时FEV1大于基线值时,面积从AUC测量中减去。AUC60计算方法类似,但计算的是运动后60分钟。
使用这些分析技术测量的响应的再现性指标是使用类内相关系数获得的26.这给出了一个通常变化的数字-1-1,其中1表示完全一致,0表示没有关系,而负数表示不同意。该数字的大小给出了测量中总可变性的分数,可以由受试者之间的因素来解释。
为了获得运动挑战对评估抗哮喘治疗的效用的指示,计算了证明反应给定百分比衰减所需的样本量。样本量是根据测量的标准差和预期的平均响应差异计算的,使用以下方程:
在哪里n为预测样本量,Tt检验的t-score是否对应于期望的α(1型错误的概率)和β(2型错误的概率),σ是sd和μ1- - - - - -μ2这是应该检测的临床重要的最小差异吗27.这个方程适用于双尾检验。使用迭代过程,所有的样本容量预测都是使用t分布,自由度设置在与结果样本容量计算相对应的水平上。对下降百分比进行了样本量预测马克斯, AUC30.和AUC60测量。进入公式的sd是第一次和第二次挑战的测量值之间的差异。因此,所有的标准偏差都是基于受试者的方差,这只适用于重复测量设计(交叉或前后测量)。p=0.05,差异有统计学意义。
当根据临床试验的样本量要求来比较这三种技术时,重要的是每种技术的保护程度在临床上是等同的。例如,知道这一点x受试者将被要求证明在百分比下降中有50%的衰减马克斯测量,y受试者需要证明AUC的衰减为50%60只有假设这两种衰减程度在临床上是等效的,测量才会是有用的信息。到目前为止,这种假设没有任何理由。为了确定这三种测量方法之间的临床关系,本文作者回顾了文献,确定了在安慰剂和治疗条件下使用≥2种方法评估EIB程度的研究10,13,15,21,28.由此产生的百分数衰减之间的关系百分数下降马克斯测量和百分比衰减两AUC30.和AUC60技术如图1所示⇓.衰减百分数计算为在安慰剂和治疗条件下的结果之间的百分数差。对这些数据集进行了线性回归分析,得出以下两个方程:
![图。1。-](http://www.qdcxjkg.com/content/erj/17/4/581/F1.medium.gif)
一秒内用力呼气量(FEV)最大下降百分数衰减程度之间关系的说明1)(%下降马克斯)和曲线下面积(AUC)测量30分钟(AUC30.)及60分钟(AUC60)。参考数字放在每个数据点附近。
这些方程用于比较三种分析技术在临床上等效衰减程度的样本量计算。
结果
基线FEV1第一和第二挑战之间没有系统地不同(3.42±0.10升相对分别为3.40±0.10 L;p > 0.05)。基线FEV之间的平均绝对差1两个攻毒日的数值为4.25±0.70%。
百分比下降的平均幅度马克斯, AUC30.和acu60表2包含了回应⇓.类内相关系数为%下降马克斯测量为0.72,用于AUC30.测量为0.59和AUC60测量为0.35(图2⇓).因此,受试者内变异性占百分比下降总方差的28%、41%和65%马克斯, AUC30.和acu60分别测量。同样在图2中⇓,第一次和第二次测量值之间的差值与两次测量值的平均值进行了对比马克斯, AUC30.和AUC60.这些图说明,第一次和第二次测量之间的差异的大小在这些对象的测量范围内基本上是相同的。
第1次和第2次挑战一秒内用力呼气量下降最大百分比(FEV)的关系1)(%下降马克斯):类内相关系数(ICC)=0.72;b)第一次和第二次测量值之间的差值(Δ),与两次测量值的平均值绘制出下降百分比马克斯;c) FEV下降百分比下的第1和第2个挑战之间的关系1/时间曲线(AUC),运动后30分钟(AUC30.): ICC = 0.59;d)两项AUC测量值之间的差值,并与平均值进行对比30.;e)运动后60分钟第1次和第2次挑战AUC的关系(AUC)60): ICC = 0.35;f).两种AUC测量值之间的差值,并与平均值进行对比60.
运动后一秒用力呼气量(FEV1)最大下降百分数(%下降)马克斯)和FEV下降百分比以下的区域1/时间曲线为30 (AUC30.)及60分钟(AUC60)在2个挑战期间,两者之间的差异(δ)
为了确定重现性的程度是否受到挑战之间允许的时间间隔的影响,百分比下降之间的差值的绝对值马克斯第一次和第二次挑战的测量被绘制在间隔上(图3)⇓).从1 - >35天开始,随着时间间隔的增加,第一次和第二次攻毒之间的测量差异没有增加;事实上,它似乎在减少。
一秒内用力呼气量(FEV)下降两个最大百分数差的绝对值1)(%下降马克斯)的测量值,并将其与两个挑战之间的时间间隔相乘。
估计的样本量需要说明统计学上显著的衰减率下降马克斯, AUC30.和AUC60响应,基于两个响应的平均值和表2中delta值的sd⇑如图4所示⇓.因此,图4a中的曲线⇓是基于22.3%的衰减来计算的马克斯治疗与未治疗之间的差异sd为9.02%马克斯单位。在这些数字中包括了估计样本量要求的说明,以证明在90%的功率下,每个响应的衰减率为50%;这是9 21和40个受试者的百分比下降马克斯, AUC30.和AUC60分别测量。在图5中⇓,单独的x轴已包括%下降马克斯, AUC30.和acu60根据等式(2)和(3)中的关系,曲线和这些已经相对于彼此对齐,因此在放置垂直线的任何一点的所有三条曲线上存在临床等效程度的衰减程度。进行这种校正后,证明衰减所需的受试者的数量相当于%堕落的50%减少马克斯是否有9,14和19名受试者使用百分比下降法马克斯, AUC30.和acu60,分别测量。
样本量要求,以证明一秒内用力呼气量(FEV)最大下降百分比的预期衰减范围1)(%下降马克斯);b) FEV下降百分比以下的区域1/运动后30分钟的时间曲线(AUC);c)运动后60分钟AUC及反应。这五条曲线(从上到下)分别代表90%、85%、80%、75%和70%的功率。虚线说明了如何计算样本大小要求,以证明每个响应在90%的功率下衰减50%。
样本量要求,以证明在一秒内用力呼气量(FEV)下降最大百分比的预期衰减范围1)(%下降马克斯;-): FEV下降百分比以下的区域1/时间曲线(AUC)运动后30分钟(AUC30.;- -):运动后60分钟AUC60;- - - -)响应90%的功率。根据公式(2)和(3)对x轴进行校准和定位,使每个响应在任何点的衰减程度在临床上是等效的。
讨论
在该研究中,比较了用于量化运动诱导的支气管间程度的三种技术的再现性和功率。对于FEV的最大百分比,已观察到最大的再现性1和60分钟的面积的最少再现性1/时间曲线。此外,这些技术检测治疗的衰减效果的能力如此之强,以至于使用百分比下降法更有可能检测到微小的衰减程度马克斯样本大小相同的技术。
AUC的类内相关系数(ICC)30.本研究的技术测量值为0.59,与Hofstra观测值0.67相似等.29.观察到较高的ICC %下降马克斯技术(0.72)不同于Hofstra等.29.观察到该结果的ICC较低(0.57)。然而,一般来说,两项研究一致认为,欧洲投资银行反应的可变性不到一半是在受试者内部或误差方差。目前的观察还表明,这种重现性延伸到大于35天的挑战之间的时间间隔。
虽然已经观察到百分率下降有很好的重现性马克斯作者认为,这不足以推断出在所有研究应用中的高度效用。在交叉研究中,测量的变化是重要的结果变量,是样本量、变化的可变性和变化的临床重要程度决定了研究的力量。由于这个原因,变化的sd在%下降马克斯, AUC30.和acu60在第一个和第二个挑战之间已经测量和使用,以及衰减程度的范围和所需的功率级,以预测应该在临床试验中使用的样本量。作者认为,与国际刑事法院相比,这些信息提供了更多关于每种技术效用的信息。
据估计,≥9个受试者的样本量应该足以证明,90%的功率,%秋季衰减50%马克斯治疗反应的测量。必须强调的是,如果>的衰减程度或<50%被认为是最小的临床重要差异,那么在研究设计中相应地需要更少或更多的受试者,如图4所示⇑.目前估计需要9名受试者证明50%的反应衰减,这比霍夫斯特拉报告的6名儿童证明相同效果的估计样本量要大等.29.在该研究中,样本容量使用Z分布估计,而在本研究中,由于sds是从相对较小的总体样本(n=40)估计的,因此使用了t分布。如果使用z分布,那么估计的样本量为7,类似于霍夫斯特拉等.29.与霍夫斯特拉等.29,目前的结果表明,需要更大的样本量来证明类似的AUC衰减30.和AUC60结果。目前的发现与霍夫斯特拉的发现不一致的原因等.29尚不清楚,但可能是因为他们的计算是基于儿科受试者和基于跑步机的协议。
通过回顾那些两者都下降的研究马克斯和AUC30.或AUC60进行了测量,并对公式1和2进行了估计,试图用它来转换下降百分比的衰减马克斯测量临床等效AUC衰减30.和AUC60测量。对于这两个方程,很明显,给定的衰减程度为%下降马克斯(当经处理的响应表示为未处理的反应的百分比)相当于AUC测量的更大衰减。即使在施加这些方程式之后,也观察到使用较小的样本尺寸,观察到临床上等同的衰减程度,使用%堕落马克斯测量。
虽然交叉设计研究的样本量要求已经提出,但可以计算确定平行组研究的样本量。方程1仍然适用,但σ应该是测量本身的标准差,而不是两次重复测量之间的差值的标准差。这个等式可以用来计算每个治疗组所需的受试者。执行此计算以确定证明50%衰减%下降所需的受试者数量马克斯这些方程计算出每个治疗组需要15个(假设未治疗的反应为22.32%的下降,治疗和未治疗的反应的标准差为12.2%的下降单位)。这个数字与霍夫斯特拉建议的每个治疗组12名受试者相似等.29在他们对哮喘儿童的研究中这种计算假设并行组设计的结果测量将是对单一运动挑战的反应。如果结果实际上是治疗前和治疗后的反应情况的变化,那么两种挑战之间差异的标准差(9.02%下降)马克斯(此处测量的单位)应用于估计样本大小。在本例中,图3中的曲线⇑可用于估计研究各分支的样本量需求。
在这项研究中,建议少于10名受试者证明50%的衰减%下降马克斯.显然,需要更多的对象来说明较小程度的衰减。此外,可能需要更多的研究对象来证明两种治疗方法的保护作用是不同的。例如,如果一种药物阻断了75%的百分比下降马克斯另一种药物阻止了50%的下降马克斯在9名受试者中,至少90%的时间都能检测到这两种影响。然而,两种药物衰减程度的差异仅为25%(75%-50%),这一差异需要30名受试者使用% fall来证明马克斯结果(图3所示⇑).因此,在设计比较两种药物的研究时,决定两种药物之间的哪些差异被认为具有临床相关性是很重要的。这个差异应该用在方程1中,或者绘制在图3a中⇑以计算适当的样本量。
进一步使用这些样本量要求是评估已发表研究的力量。通常对各种药物预防EIB疗效的研究对象≥10人10,14,16,20.,30.- - - - - -33并因此有足够的动力,假设保护程度等于< 40-50%衰减的%下降马克斯被认为在临床上不重要。通常,研究是比较两种药物或剂量对EIB的衰减能力。通常这些研究并不比评估单一化合物的研究包含更多的研究对象13,18,19,21,34因此,End可能在检测临床上药物或剂量之间的重要差异方面能力不足。
平均%堕落马克斯在这项研究中,这一比例为22%。在一些研究中FEV下降更大1在安慰剂处理条件下实现。本研究中估计的样本尺寸很可能会高估未经治疗的%堕落的研究中所需的那些马克斯大于本研究中受试者所达到的。
值得注意的是,%堕落马克斯在第一次运动挑战中,七个人的价值不超过15,而在第二次运动挑战中,有13个人的价值不超过15。有六名受试者的百分比下降马克斯两项运动挑战的值均<15。虽然可以认为这些受试者代表筛查失败,但作者选择将他们纳入分析,因为这些符合筛查标准的受试者将被纳入将使用样本量估计的临床试验。
总而言之,有研究表明,运动后一秒钟内用力呼气量下降的最大百分数比曲线下测量的面积具有更大的重现性。更重要的是,已经提供了关于样本量要求的信息,这些信息可用于设计动力良好的研究和评价已发表的研究。这些结果表明,在药物疗效和药物比较研究中,一秒内用力呼气量的最大百分比下降比曲线下测量的面积更有力。
致谢
在这份手稿的准备过程中,来自C. Goldsmith的统计建议受到了极大的赞赏。
- 收到了1999年12月31日。
- 接受2000年10月9日。
- ©ERS期刊有限公司