条文本

下载PDF

寻找一些合作宣言?
免费的
  1. 约翰D。艾特
  1. 通信:
    博士J D。艾特
    疗法,女王医疗中心,诺丁汉大学,诺丁汉,英国;john.blakey在{}nottingham.ac.uk

来自Altmetric.com的统计

请求的权限

如果你想重用任何或所有本文的请使用下面的链接,这将带你到版权税计算中心的RightsLink服务。你将能够获得快速的价格和即时允许重用内容在许多不同的方式。

MDR,探索性分析的主要工具

尽管有大量的证据表明,许多常见疾病有很强的遗传因素,遗传关联研究提供了令人失望的是难以了解其病理生理学。原因之一是,由于识别潜在变异了1000年罕见的成功条件,研究人员已经在很大程度上继续问简单的问题更复杂的疾病。然而,在这个问题的胸腔、公园1(看到页面265年)协会的一项研究,使用一些新统计方法之一,有可能产生更多的生物相关的协会。

一个简短的历史教训

上个世纪的大部分时间里,基因关联研究的建议,现在我们知道他们可能会引起关注,无论所需的技术飞跃。“自然非facit saltum”(自然不会使飞跃)是一个最喜欢的格言达尔文和极大地影响了数学模型的适应。2接受这样的模型,包括各种各样的元素,每个贡献一个小整体效果,意味着遗传关联研究复杂疾病是徒劳的在现实的人口规模。然而,自1980年代以来实验证据已累积来挑战这一观点。在许多物种中,个人已被证明的遗传变异占很大一部分遗传性状的变异,3,4虽然这些明显是少数。5,6

研究单一多态性

过多的关联研究试图找到这几个高度影响力的位点为常见,复杂的特征,比如哮喘、7但几乎没有可复制的成功。已经有大量以改善此类研究的设计,包括在本杂志,8但是提到潜在的遗传复杂性通常只支持使用中间表型。在生物学上合理的模型,9 -,13一个候选基因的多态性的机会单独施加重大影响仍然很低,特别是在常见,异构条件。庞大的人口因此需要可靠地检测绝大多数贡献的影响。举个例子,请考虑使用IL13,可能的候选基因的最大支持7与异位性。这个基因的变化研究最近与IgE水平超过3000成年人个人从一般人群。尽管一个强大的协会(p = 0.00002),多态性解释<表型方差的0.6%。13一个奇迹多少类似大小的影响初步研究中没有发现了所以没有去测试在庞大的人口。鉴于这种先验概率低找到真在大多数基因关联研究协会,他们的“重大”的发现可以说是更有可能是假阳性。14

研究多个位点

一起几个候选基因被认为更有可能比一个多态性解释足够的遗传变异性的特征是可靠地检测到。这个简单的求和的效果将不会在任何情况下,考虑到生物过程的复杂性。然而,考虑检测多态性位点同时也提供了机会,一起克服遗传缓冲稳定表型变异的潜在的不利影响。15日,16位点表现出上位如果他们的集体特征影响大于预期给出个人的影响在隔离)(可能是微不足道的。这些上位相互作用在实验模型中发现的数量出现类似于或大于位点的数量与独立,添加剂的影响,17虽然这只能指导人类的情况。因此一个明显的矛盾存在于,我们有一个令人信服的论点同时学习许多位点,但大多数研究测试协会每个多态性或重建的单体型。

标准方法的局限性

茎的主要限制研究先前技术,但由于基因分型技术的进步,成本,和网上资源的爆炸,统计障碍现在限制这样的努力。简单地应用统计检验是用于一个一对等位基因基因型组合的优点是容易执行(如果耗时),但是没有共识的解释多个测试的结果,并不是完全独立的。标准回归模型可以适应交互项,但这将导致一个指数增长的估计。有一个生成的每个参数信息数据的减少,因此大错误和术语可能错误地排除在一个模型。回归建模和重复测试都需要推断从用户基本的遗传模型。

MULTIFACTOR-DIMENSIONALITY减少

构思一个方法来处理其中的一些问题是,所使用的公园1在这个版的《华尔街日报》:Multifactor-dimensionality减少(MDR)。耐多药和相关技术组合分区的数量是两个新技术,寻求处理高维数据揭示复杂的关系,假设的遗传模型。

MDR过程详细解释在其他地方,18包括相关的文章这篇社论。1茎有三个关键组件的方法:首先,基因型数据跌到一个单变量和两个水平(高、低风险)病例对照比基于预先确定的阈值(如> 1)。第二,茎为每个可能的基因型的模式风险是来自一个分区的数据(例如,9/10):“训练集”。这种模式的预测能力是在剩下的数据进行测试。第三,最佳预测值的有效性由重复量化数据集分成训练集和测试集。获得的概率分类器的精度和验证可以使用排列测试估计的一致性。

虽然没有技术代替充足的招聘,这种方法的一个优势是他们的权力来检测上位在相对较小的人群(数以百计的人)。19然而,权力似乎明显影响拟表型和遗传异质性的存在,并等待正式评估三个或更多多态性和在其他场景如基因-环境相互作用或上位的主要影响。出于这些和其它原因(如α水平和连锁不平衡)之间的不确定关系,目前MDR主要是探索性分析的工具。

互补的,其他几个类型的机器学习新兴和发展,增加的部分原因是可用的微阵列数据。一致的结果从这些分析多个基因和环境因素将很快出现,但每个仍需要验证人口集中的假设在一个非常大的研究。这一步最近用β的荟萃分析结果的比较2肾上腺素能受体和哮喘与发现超过8000英国1958年出生人口的成员。20.

结论

公园1要称赞在使用新技术来考虑一个中间表型之间的关系和茎单一和基因型在一个大的人口。此外,使用逻辑回归来证实他们的发现协同行动的多态性在血管内皮生长因子2和肿瘤坏死因子α强调使用互补的方法寻求和量化。显然没有公司推断可以由一个单一的报告,但一个明确的假设已经生成了一个复制体外研究和指导研究。

引用

脚注

  • 利益冲突:没有宣布。

相关的文章