摘要
对于大多数流行病学家来说,在呼吸流行病学中引入遗传方法是新的,后基因组阶段提出了新的挑战。在描述了与哮喘和慢性阻塞性肺疾病领域相关的具体问题后,本文介绍了关于技术和科学进步的两个主要方法学方面。第一个是关于基因组和后基因组阶段的生物学方面,即。如何研究基因组,转录组和蛋白质组。第二个领域涉及遗传流行病学,考虑设计(病例控制和基于家庭)和统计分析问题。关键方面是大样本量,良好的表型和根据机会窗口考虑环境-基因相互作用。
已确定的需求包括以下方面。1)在该领域建立标准的网络,并获得足够大的样本。2) Multidisciplinarity;流行病学家、临床医生、遗传学家和生物信息学专家的合作,以及流行病学家不太熟悉的学科专家的合作,为基于转录组和蛋白质组的新的表型特征做好准备。3)对部分呼吸道流行病学家进行遗传分析技术培训,对部分遗传流行病学家进行呼吸流行病学培训。
考虑到遗传和环境呼吸流行病学领域的伦理方面、公共卫生方面和组织方面,也需要解决对研究的影响。
这项工作是在2002年1月在法国Cernay举行的欧洲呼吸学会关于该主题的研究研讨会上发起的。188bet官网地址
遗传学会压倒流行病学领域吗?在这个不断变化的世界中,流行病学是否应该继续关注环境和公共卫生问题?有必要进行大规模的人口研究吗?尽管遗传学家和临床医生的共同兴趣可能是病理生理学,即。遗传学家和流行病学家对途径的兴趣,共同的兴趣可能是由遗传流行病学家开发的设计和分析问题。一个主要的问题是,人们认为一个学科太复杂了,不可能被该领域以外的人理解和使用,从而对其他学科的人缺乏信心。本综述的一个主要目的是列出与建立涉及呼吸流行病学家、遗传学家、环境流行病学家和临床医生的多学科研究相关的问题,这是一个与当前国家和国际平台发展日益相关的主题。在描述了与哮喘和慢性阻塞性肺病(COPD)领域有关的具体问题之后,介绍了有关相关技术和科学进展的两个主要方法方面。第一个是关于基因组和后基因组阶段的生物学方面,即。如何研究基因组,转录组和蛋白质组。第二个领域涉及遗传流行病学,涉及设计(病例控制和基于家庭)和统计分析问题。此外,在遗传和环境呼吸流行病学领域的研究,伦理考虑,公共卫生和组织方面的影响将被提出。最后,总结了关键点,并讨论了基因组和后基因组阶段呼吸流行病学下一步的挑战和需求。
目前在哮喘和慢性阻塞性肺病遗传学和呼吸流行病学方面的挑战
需要一种严格的方法来研究哮喘和慢性阻塞性肺病的遗传学,以确定这种复杂的多因素疾病的病因的所有方面。哮喘和COPD的适当表型特征是至关重要的。环境影响的异质性(短期影响、长期影响、队列效应、累积暴露、保护性和有害影响、等。)需要考虑。在可能确定特别易感染疾病的人(主要是对特定危险有抵抗力的人)方面,出现了伦理问题。关于哮喘和慢性阻塞性肺病遗传学的详细综述可以在其他地方找到1- - - - - -9.
研究遗传学是为了了解潜在的疾病机制,确定疾病的亚群,确定有风险的个体,预防疾病,并确定新的治疗目标。研究遗传流行病学是因为目前的知识不足,从小样本中有许多多态性和许多不确定的结果。为了研究疾病亚型、基因-基因相互作用和基因-环境相互作用,在基于人群的研究中需要大样本1,2.染色体上不同位点上等位基因的非随机组合(连锁不平衡),取决于位点的遗传距离、任何一个位点突变的年龄和种群的历史,使种群样本中相关基因的研究复杂化。一般来说,这意味着需要同时研究每个被研究基因的几个单核苷酸多态性(SNPs)。
这很可能是易患哮喘的基因在过去被选为人群中的常见基因。澳大利亚土著居民的情况很好地说明了选择的压力。在这个高度感染寄生虫的人群中,血清总免疫球蛋白E浓度与皮肤点刺试验阳性呈负相关。遗传多态性的性质不同于那些白种澳大利亚人,并有更强的关联特异表型。在欧洲也是如此,人口地理可能对疾病表型的总体观察变异有很大贡献。欧洲环境多样,遗传结构不统一。欧洲人的基因多态性显示了农业在1万至6000年前从中东传播的迹象,随后是乌拉尔人向欧洲东北部的可能传播,以及在草原上驯化马的游牧民族(及其后代)的传播,并出现在农业扩张的末期10.从这些变化的人群中留下的遗传梯度将与等位基因频率和哮喘基因的存在相关,并将增加基因鉴定的复杂性。单倍型在人群之间可能有显著差异的例子包括β2肾上腺素能受体和主要组织相容性复合体的基因。
大多数已知的对哮喘的遗传影响都是通过对候选基因的研究确定的,即。已知功能的基因。现在有几个小组正试图通过位置克隆来鉴定新的基因。这个艰难的过程包括三个步骤:1)遗传连锁的研究(即。疾病和染色体区域的共同遗传);2)感兴趣区域的精细测绘;3)基因测序鉴定和基因表达研究。连锁研究对应于一组分析家族内DNA标记共同遗传的方法,以确定基因组的特定区域是否包含与感兴趣的表型相关的基因。在这类研究中经常使用的lod评分是用于确定遗传位点是否相关的统计检验的结果,表示为在两种假设下观察到的数据的几率的log10与nonlinked。通过全基因组筛选进行的连锁研究表明,哮喘和其他免疫疾病与某些染色体区域的连锁是一致的,也有器官特异性的巧合,如。治疗特应性皮炎和牛皮癣。这些观察表明,影响疾病表达的基因可能集中在少数染色体区域内,存在具有普遍影响的基因簇,如。影响皮肤炎症和免疫,特应性皮炎的特应性成分可能具有次要而非主要影响。在哮喘方面,位置克隆已经成功,特别是在13号染色体上11,并在20号染色体上鉴定出一种分解素和金属蛋白酶33 (ADAM33)12二肽基肽酶10 (DPP10)在2号染色体上13.
虽然吸烟是慢性阻塞性肺病发展的主要环境危险因素,但与吸烟相关的气流阻塞的发展存在显著差异。严重α-1-抗胰蛋白酶(AAT)缺乏症患者COPD的频繁发展(如。蛋白酶抑制剂(PI)表型Z)已被证实是copd的遗传危险因素,为肺气肿发病的蛋白酶-抗蛋白酶假说提供了基础。尽管只有一小部分COPD患者(估计为1-2%)遗传严重的AAT缺乏症,但AAT缺乏症可作为遗传和环境因素相互作用导致COPD的模式14.其他尚未确定的遗传决定因素可能影响PI Z个体中气流阻塞的可变发展。除了PI之外,许多相关研究还比较了COPD患者和对照组中被推测参与进行性和不可逆气道阻塞发展的候选基因的变异分布15.对于每一个候选基因,至少有一项研究驳斥了这种关联。COPD病例-对照遗传相关性研究结果不一致的原因有几个,包括遗传异质性和人群分层。在病例对照研究中,观察到的基因多态性与疾病的关联可能是由于:1)候选基因的直接作用;2)连锁不平衡,即易感基因与遗传标记的关联(家系间、群体水平);3)由于病例和对照之间不完全匹配导致的人口分层,包括种族背景的混淆。在波士顿早发性COPD研究中16,在早发性慢阻肺先证者一级亲属中鉴定出与吸烟相关的易感性的多种表型,包括一秒钟用力呼气量(FEV)1), FEV1/肺活量受限、支气管扩张剂反应性和慢性支气管炎。定性和定量肺功能表型的连锁分析结果表明:即。p < 7.4×10−4)17COPD或肺活量测定值的链接位于染色体1、2和12上18,19.
遗传学在理解哮喘病因方面可能发挥的作用是一个有争议的问题。过敏原假说似乎不能解释全球哮喘患病率的增加。这一假设认为哮喘的主要原因(因此也是全球哮喘发病率增加的原因)是过敏原暴露导致特应性敏化,进而诱发支气管高反应性(BHR)和哮喘。事实上,BHR并不是衡量哮喘患病率的一个很好的替代指标,它与哮喘的具体机制更相关20.,21.在儿童和成人中,特异反应病例的比例均小于40%22.目前还没有足够的证据表明幼年接触过敏原是导致哮喘的主要危险因素,因为还没有进行足够的队列研究来证明这种联系,事实上,一些研究也没有发现这种联系。另一种假设是,易感性的变化可能通过更好的卫生条件来发生,从而减少婴儿感染,从而减少t辅助因子(Th)-1细胞因子反应和增加Th2免疫反应。有人认为西化的主要特征是家庭规模小,早年感染的减少(尤其是胃肠感染),出生时人口大,饮食改变(脂肪酸多,蔬菜少)。然而,用卫生假说取代过敏原假说可能是用一个教条取代另一个教条。卫生假说是在过敏原Th1/Th2范式中概念化的,它似乎最多解释了两例哮喘病例中的一例22- - - - - -24.甚至这也可能被高估了,因为这种联系可能并不完全是因果关系,而过敏可能是哮喘易感性的结果。如果增加富裕和西方化所涉及的一系列变化可以解释哮喘患病率的增加,它并不一定会引起经典的特应性(Th2)机制25.
遗传流行病学研究可能有助于了解这种疾病的起源。基于人群的遗传干预的最大潜力发生在以下情况:已知疾病是通过单一明确的机制发生的,只有少量基因与该机制相关,且几乎没有时间或地理差异。哮喘不满足这些条件。它通过多种机制发生,而这些机制还没有被很好地理解;许多基因似乎与迄今已研究的主要(过敏)机制的不同方面有关,并且存在无法用遗传因素解释的主要时间或地理变异。迄今为止,哮喘遗传学在解释相当一部分哮喘病例方面取得的成功有限,在解释人群模式方面则更不成功。缺乏重复并不意味着观察到的关联是无效的,但它确实限制了它们在科学和公共卫生方面的作用。在过去的30年里,随着哮喘和过敏的增加,哮喘的表现可能主要归因于环境的变化。遗传学不能解释全球哮喘患病率的增加。一些人认为,遗传因素对健康的重要性被高估了,而将遗传知识应用于干预措施的伦理和实际问题被低估了。 Searching for environmental causes of asthma is likely to yield useful and useable results, whilst the study of gene-environment interactions could play an important secondary role. A simplistic approach would be to ignore genetics, although this would not serve the epidemiological community well. To get to the roots of the disease will be so complex that all of the skills ofthe molecular geneticist and the epidemiologist will berequired, together with work on animal models. It is important that new theories of asthma causation, including nonallergic mechanisms, are developed and tested. The overall goal should be to incorporate more complex paradigms in order to disentangle the aetiology of such a complex disease or group of diseases. Subtypes should be considered; genetics have shown that diabetes is no longer one disease. Intermediate phenotypes are now popular, but difficult to define, because the definition of intermediate pathways is debatable. From the point of view of finding genes, the most promising intermediate phenotype would be one that is the closest to gene, in order to find linkage.
基因组和后基因组阶段的观点
后基因组是指建立完整的人类基因组序列后的一段时间。真正的后基因组阶段尚未到来。对基因组序列的了解只是第一步,由于目前可用的图谱存在错误,在给定基因中寻找snp和单倍型现在需要一个重新测序的阶段。基因需要通过它们的序列、功能、调控和多态性来表征。在后基因组阶段,遗传流行病学和技术考虑都将发挥关键作用。通过对转录组和蛋白质组的研究,表型可能在未来得到改善。
人类基因组测序显示,基因数量比预期的要少。现有的草案在使遗传学更容易获得的同时,也增加了其他方面的复杂性,因为功能基因比预期的要小。目前的一个挑战是将这些知识应用于流行病学。遗传流行病学的要求包括可获得大量患者、家庭成员和对照组的DNA,高质量的表型,以及通过快速、低成本和灵活的基因分型来识别基因或全基因组变异的临床数据和方法。从技术上讲,已经存在许多可能性。snp在基因组中每几百个碱基中就会出现变异26- - - - - -28.公共数据库中很大一部分假定的snp尚未得到验证,需要更多关于不同人群中等位基因频率的信息。仅评估每个基因编码区域的两个多态性将无法提供足够密集的信息。变异的频率在很大程度上取决于种群,在这方面,关于种群分布的信息是至关重要的。单倍型模式信息可以用少量的snp来定义29- - - - - -32.基因中在不同单倍型之间常见的位点可能与定量表型相关(如ACE基因的血清血管紧张素转换酶(ACE))可能提供关于因果变异的关键信息。
在发现SNP后,大规模人群的流行病学应用带来了技术挑战。质谱是基于引物延伸分析不同分子量的产物在基质上运行,并按其大小进行分离。它的优点包括速度(每次分析2秒),分析大量个体的可能性,绝对结果带来的高质量,样品制备的小型化(每次反应0.5-2 ng DNA)和snp选择的灵活性。未来的技术趋势包括电场阵列,它适用于少量的个体和snp,寡核苷酸连接,它适用于大量的snp,基于周期的技术和质谱,这是大量个体的选择方法。对于大量snp和个体来说,最合适和有效的方法还没有建立起来,这是一个密集的研究领域33,34.
通过cDNA阵列研究转录组是困难的,但在技术上是可行的,并提供了一个定量表型表征的新领域。使用DNA阵列进行全基因组基因表达分析相当于进行成千上万次的Northern blots35,36.这项技术的最新发展使研究大量分子与大型基因库的相互作用成为可能,从而为从基因功能到发育、癌症、衰老和药理学等生物过程提供了基本的见解。这些技术提供了从小规模、低通量分子生物学向功能基因组学方法转变的可能性。它将有助于进一步理解生物过程,遗传网络和生命系统使用大规模系统,高通量技术,无论是在纯发现模式或与传统的假设驱动方法相结合。系统生物学是一个新兴的领域,旨在对生物系统进行系统级的理解,它超越了基于还原论方法对其孤立部分和基本机制的静态描述。它能够系统地描述完整生物系统(基因组、转录组和蛋白质组)的全套DNA、RNA和功能分子及其代谢相互作用(相互作用组和代谢组)。
蛋白质组学是对蛋白质表达变化及其修饰的整体模式的研究。蛋白质组学的情况很有希望,但从技术角度来看,比基因组学更加困难。大约有3万个基因,但蛋白质可能有40万~ 100万个37.生成假设、方法和候选(先天的假设)蛋白质方法都很有趣。技术方面仍然是主要考虑因素,尚未解决。如果无法获得高亲和力配体,人类蛋白质组项目将无法交付,这些配体以基因组相关的成本和时间生产。有必要大幅提高抗体的通量,降低抗体开发的成本,并确保高通量阵列避免交叉反应。预计在未来5年,成本将降低100倍,从而使技术更容易获得。专家们的目标是开发一种能够跟踪人类基因组中每个基因的蛋白质输出的基质。流行病学家所熟悉的一个方面是人类蛋白质组的动态性质,它随着环境特征和一天中的时间而变化。潜在的未来应用包括所谓的患者“队列”,其目的是为了开发药物排斥、预后、早期诊断和疾病管理的标志物,等。理解生物网络是一个挑战。目前,工具只能用于不到5%的蛋白质,但作为从人类基因组测序中获得的知识的直接应用,在未来几年内,这一领域可能会有实际应用38.
未解决的问题涉及观察到的变化的有效性和定量准确性,包括大量数据的准确性和可重复性,以及可以从cDNA探针的杂交信号强度得出的基因表达水平的推论。一个核心问题是基因的选择,这应该是进一步研究的重点。对单个基因和基因簇的研究,从共同功能、相互作用、共同调节以及最终通过其潜在基因理解蛋白质网络的角度进行分析,可能会提供信息。为了促进不同来源基因表达数据的可比性,确保不同基因表达数据库和数据分析软件的兼容性,制定标准至关重要。
未来研究的限制因素可能仍然是表型,而不是遗传技术。其他需要考虑的方面是质量控制问题,包括背景噪音与信号,与学科间和学科内可变性相关的重复需求,研究的样本数量,以及在公共或私人伙伴关系的背景下保护结果和共享数据(和方法)。蛋白质组水平的可变性是巨大的,因此在应用这些技术的挑战。在人口水平上的验证问题是至关重要的。
遗传流行病学:设计和分析
由于大规模基因分型设备的发展,经典的病例对照设计在遗传流行病学中进入了一个新阶段(表1)⇓).此外,对于COPD等疾病,其发病年龄通常较晚,基于家庭的设计具有局限性。在寻找遗传因素的背景下出现了新型病例对照设计。尽管这种设计在遗传流行病学家中很有名,但没有经过广泛培训的呼吸道流行病学家也可以使用。与经典的连锁分析相反,关联研究对于熟悉环境因素背景下的关联、选择、混杂和相互作用的流行病学家来说是直观的。
病例对照设计
后基因组流行病学背景下的病例对照研究通常与经典研究相似,但在后基因组背景下有一些特异性。在病例和对照的选择上,种群分层引起了人们的广泛关注。为了改变一种关系,一个未测量的混杂因素需要非常强,因此,对人口分层的重视很可能有些夸大39这一点最近得到了强调40.由于群体分层可能会影响一系列多态性,任何影响都可以通过使用大量未选择的标记来最小化(全基因组控制法)41)或选择涉及种群子结构的标记,并采用潜在类分析42.密切关注研究设计也可以纠正人口分层。种族背景的匹配并不总是显而易见的,因为当多民族人群中的通婚变得复杂时,很难定义种族。组匹配是通常使用的技术,极端形式使用兄弟姐妹控制,并通过兄弟姐妹传输不平衡测试(S-TDT)进行分析。然而,由于兄弟姐妹在基因上比不相关的受试者更相似(过度匹配),研究表明,当使用兄弟姐妹对照而不是不相关对照时,需要两倍的样本量。
测量误差有很大的影响,即使它们是非差分的,即。与疾病或暴露无关正确测量疾病的必要性再怎么强调也不为过,当与疾病相关的基因座本身不是一个功能变异时,测量误差的特定类型就会出现,因此,对真正遗传风险的测量就会出现缺陷。相互作用的评估也受到非差动测量误差的阻碍。已经提出了修正这些扭曲效应的统计方法43,并涉及综合验证、测试-重测可靠性和子研究,尽管它们仍然必须假设风险因素的重复测量是有条件独立的,因为它们的真实值。
遗传因素和环境因素的分析有相似之处。新的方法,如DNA池类似于生态学研究。从某种角度分析遗传因素比分析环境因素容易。对于一个特定的个体来说,基因是不受时间影响的,大自然以平衡的、阶乘的设计传递基因。
家庭研究
基于家庭的研究设计问题9,44- - - - - -46以及这些设计的分析方法背后的概念47应该首先考虑。利用遗传标记鉴定和描述复杂疾病的易感基因有两种基本策略:基因组扫描和候选基因的研究48.候选基因应根据其功能进行鉴定。明确的(狭义的)候选基因是与疾病和已确定的异常或相关动物模型相关的已知功能或结构的基因。不太明确(广义上)的候选基因是生物系统的一部分,对疾病有更多推测性的影响。它们可能会引起人们的兴趣,特别是当它们所处的区域与先前报道的基因组扫描有关联时,或者是基于相关组织的表达谱数据时。复杂疾病的易感基因大致可细分为三类:1)主要基因(一般稀少,渗透力强,是过去的主要研究热点);2)寡基因(可能在人群中相当常见,可能与其他风险因素结合导致风险升高);3)多基因(只产生很小的影响,而影响疾病表达需要很多基因)。目前公共卫生研究的兴趣集中在寡基因上。利用遗传标记数据调查易感基因的遗传流行病学研究有两个主要目标48.第一个目标是识别危险因素易感基因,这可以细分为定位和提供影响的证据。第二个目标是对这一风险因素的作用进行建模。
全基因组搜索的目标是利用遗传标记,通过连锁分析定位易感基因。遗传标记是DNA中已知和唯一位置的部分,可用于识别不同的等位基因(亚型),从而确定个体的基因型。连锁是亲缘关系中标记等位基因和疾病的共分离49.一个非常常见的设计是在有两个患病兄弟姐妹及其父母的家庭(患病兄弟姐妹对设计)中调查均匀分布在总基因组上的约350个标记(平均标记距离10 cM)。更一般地说,联系设计包括许多受影响的大家庭、2-3代多人受影响的家庭、受影响兄弟姐妹的家庭、有一个受影响儿童的家庭以及孤立人群的研究。从定性和定量性状得到的分数可以用作表型,在大群体的情况下,考虑极端表型可能是有兴趣的。全基因组扫描的主要优点是不需要知道或假设任何生物机制。然而,由于数百个标记物的多次测试,可能会发现假阳性和假阴性之间的平衡50,因此很难达到统计显著性。然后,根据基因组扫描提示的连锁区域可以用作精细定位的起点,包括在该区域调查可能的候选基因。
在传统的病例-对照设计中,由于对照组必须与病例具有相同的遗传背景,因此很难确保对照样本的质量。为了避免由于人口分层而产生的错误结果,有时采用以家庭为基础的控制。TDT的原理47,51,52是基于父母控制等位基因。TDT,相当于流行病学家熟悉的McNemar统计量,同时测试连锁和配子不平衡。与人口分层问题无关,基于家庭的研究设计可能是首选,因为它们有时比传统的病例对照设计更容易实施。两个例子是,当病例很年轻,父母很容易被招募时,以及当病例代表的目标人群定义不清时,因此很难确定适当的人口控制群体,因此,父母或兄弟姐妹对照是一个有吸引力的替代方案。它还允许使用现有的族集合。病例-父母三人组设计的基础是采样受影响的病例及其父母,仅测量病例的表型信息,但测量病例和所有父母的遗传标记。根据哪种等位基因会传播给受影响的孩子,哪种等位基因不会传播给受影响的孩子,对每个父母进行分类。没有传递给受影响儿童的等位基因被用作基于家族的控制(“伪兄弟”)。只有杂合亲本才能产生信息。另一个强有力的遗传流行病学观点是,病例-父母三人组可以被视为一个病例与三个“伪兄弟姐妹对照”的匹配。 Although traditional conditional logistical regression can measure the main effects of genes and gene-by-environment interactions (即。等位基因传播是否依赖于儿童暴露于感兴趣的环境因素),它不能衡量环境暴露的主要影响,因为它是一个只有案例的设计,环境因素只在受影响的儿童中测量。相对风险可能偏向于一种,因为假设伪兄弟姐妹永远不会受到影响,而对于一种常见疾病来说,这很少是真的。如果存在重组或不完全连锁失衡,真实的相对风险也可能大于观察到的优势比。另一个潜在的偏倚来源发生在一个标记处于致命胎儿基因的连锁不平衡时。这种偏倚无法被检测到,因为等位基因传播与孟德尔传播的预期相比较(即。没有真正的对照)。因此,在解释case-parent三元组设计时必须谨慎。TDT方法的威力取决于杂合亲本的数量和标记等位基因的相对传播概率。对于基因型相对风险≥2、显著性水平为5%、幂为80%的基因座,广泛的遗传模型检测200个家系可能是合适的,但如果要调查广泛的遗传模型,可能需要600个家系。
兄弟姐妹控制是父母控制的合理替代方案,特别是在父母无法提供的情况下,例如当病例仅在成年晚期表现出感兴趣的疾病时。分析带有兄弟控件的案例最有效的方法是使用匹配设计,其中案例及其兄弟控件定义了一个匹配集,使用传统的条件逻辑回归模型进行分析。兄弟姐妹控制并没有因为种族隔离扭曲而产生偏差,但它们可能很难与年龄和性别相匹配。如果它们的基因型不同,它们是有信息的,尽管设计仍然存在与过匹配相关的问题。可以使用年龄和性别相匹配的更大的表兄妹控制池,但可能会出现潜在的偏见。因此,伪兄弟姐妹仍然是罕见隐性主基因最有效的控制53.在效率方面,种群控制与伪兄弟对照具有相似的效率,并且这两种类型的控制都比兄弟对照高效,也比兄弟对照高效得多。由于过度匹配,兄弟姐妹在基因主效应方面的效率低于群体对照,而且通常需要两倍于群体对照的样本量。而在基因环境互作方面,兄弟姐妹比群体对照更有效,因为基因型的超匹配有助于发现显著的基因-环境互作。虽然可以收集家庭进行研究,但仍有很好的理由从人群中抽取对照样本,以便比较家族性多重病例与人口控制。
总之,基于家庭的研究的弱点包括“过度匹配”遗传背景(兄弟姐妹对照和主要基因效应的一个大问题),在没有合格对照时丢失病例,非父系关系,以及比传统病例对照研究更难招募。基于家庭的研究的优势包括控制人口分层的能力、父母可用时的效率(年轻病例)以及基因-环境相互作用的效率。基于家庭的研究也有遗传学上的好处,即推断单倍型(比单个snp信息更丰富),检查基因型错误(孟德尔不一致性)和检测起源父母效应(印记)。值得注意的是,在基于家庭的研究背景下,遗传相对风险与比较病例和对照的关联研究具有不同的意义。不能用家庭来评估归因风险;需要病例对照研究。
基因-环境相互作用
在目前对基因-环境相互作用的兴趣出现之前,环境因素之间的相互作用一直是众多讨论的主题。遗传流行病学中出现了三种重要的“相互作用”形式,包括常染色体上等位基因的两个副本之间(“显性”),两个位点之间(“上位性”),以及基因与环境之间。自Fisher在1918年的最初描述以来,统计相互作用(依赖于尺度,仅对应于两个因素影响的可加性的偏差)对生物学机制的解释很少,这一点在20世纪80年代末得到了许多流行病学家的认可。对于两个风险因素的联合作用,存在许多可能的零假设,以证明因果作用的独立性54.有针对性的干预往往针对风险亚群体,尽管全人群干预可能更有效55.在与已知危险因素存在强相互作用的情况下,允许这种相互作用的检测可能具有更强的检测新因素的能力,尽管这种能力的增加是有限的,除非影响的方向发生逆转。新的设计包括个案研究,这些研究依赖于基因型和环境原因之间或人群中两个基因型之间的孟德尔随机化。当兴趣仅仅在于相互作用时,可以脱离乘法模型进行简单的研究。
基因与环境的相互作用在概念层面上是一个有争议的问题。它通常被视为决定论的解毒剂,认为某些相互作用可能会抵消被鉴定为高遗传风险的受试者的遗传风险。研究相互作用的论据包括生物学上的合理性,特异性的改善,易感群体中这种相互作用的强度的增加,以及偏差和混淆的可能性的降低。反对相互作用研究的论点是它们的尺度依赖性、多重比较的问题以及足够的功率所需的大样本。在21世纪,作为因果推断基础的效应修正将会得到更多的关注,而不是关联。在已经怀疑协同生物相互作用的疾病中可以预期成功,而在常见多因素疾病中成功的可能性较小,将取决于聚合易感性。在这方面,功能性状可能比基因型信息更丰富。忽略基因-环境相互作用对完全连锁不平衡检测的影响可能会阻碍潜在功能变异的识别。为了解开复杂疾病背后的机制,使用既考虑到连锁不平衡又考虑到基因-环境相互作用的模型是很重要的。
通过研究流行病学文献中哮喘和COPD的主要假设,可以发现哮喘和COPD流行病学背景下潜在的基因-环境相互作用的说明9.英国人,荷兰人和慢性阻塞性肺病的蛋白酶-抗蛋白酶假说,以及哮喘的卫生假说都提供了有趣的例子。英国假说可被认为是环境假说,荷兰假说可被认为是环境基因(宿主因素,以哮喘、BHR和过敏为代表)假说(如。刺激物)交互。蛋白酶-抗蛋白酶假说以基因假说(PI)开始,以基因(PI)和环境(吸烟)作用于同一生理途径的假说结束。最后,卫生假说已经从环境假说(与感染原接触)转变为天然免疫途径基因与内毒素暴露之间的相互作用。PI与吸烟的相互作用56, CD14和toll样受体在卫生假说的背景下57,58可能会被发现。与氧化剂接触的相互作用,如吸烟59、空气污染60或者职业暴露61,同时服用阿司匹林62以及基因间的相互作用63.总之,考虑一条通路中的所有基因已经变得至关重要,由于已经确定的潜在候选基因的数量,有必要对基于环境的基因假设及其后续测试进行充分的假设(表2)⇓).由于内部逻辑而导致的学科之间的潜在冲突需要解决。对路径和时间效应的考虑至关重要。个体暴露在环境中的历史,疾病表现的历史,这导致了对中间表型的考虑,疾病本身的表型,以及描述严重程度和恶化程度的表型。呼吸道流行病学家很清楚与遗传流行病学相关的选择和混杂问题,但很少意识到基于家庭的设计的潜力。相反,生物学家和遗传学家经常提出以前在环境因素的背景下已经解决(并可能解决)的方法问题。显然,更多的多学科工作将有利于所涉及的所有学科(表2)⇓)用于进一步研究哮喘和慢性阻塞性肺病的起源,以及疾病预防的潜力。
从遗传流行病学到公共卫生
研究复杂疾病的遗传学是一项多学科的事业。研究家族可以通过单基因疾病的位置克隆进行基因鉴定,其中人类遗传学家发挥了主要作用,遗传流行病学家发挥了重要的贡献作用,尽管临床医生的作用较小。位置克隆仍然是复杂疾病的范例,但它需要一个不同的结构。对功能(基因驱动研究)感兴趣的科学家和对疾病病因(疾病驱动研究)感兴趣的科学家之间的争论是有建设性的,这两种方法需要结合起来。遗传学家不再能够独自建立一个项目,遗传流行病学家和临床医生的能力是必要的。从遗传流行病学的角度来看,环境因素属于分子流行病学的范畴。例如,德国已经建立了国家基因组学研究网络,其中包括以疾病为导向的网络和几个平台,其中有一个用于高通量基因分型的网络,还有一个用于设计、数据管理和分析的平台,称为遗传流行病学方法学中心。只有满足对表型、基因型和方法学方面的能力和专业知识的需要,才有可能解决复杂疾病病因学的某些遗传因素(表2)⇑).
人类基因组流行病学(giant)计划是一项由致力于在全球范围内开发和传播基于人群的基因组数据的个人和组织共同努力的成果64从公共健康的角度来看潜在的应用包括一级预防(例如帮助了解疾病的生物学,可能导致基于大规模干预或目标风险干预方法的战略的发展)、二级预防(例如开发用于全人群筛查的初级测试)和治疗(例如在替代干预措施中进行选择)。65- - - - - -67.相关信息包括:1)基因变异的患病率;2)评估基因变异对疾病和残疾负担的贡献(外显率和归因分数);3)在不同人群中与基因-基因和基因-环境相互作用相关的疾病风险的大小以及与靶向干预相关的疾病风险;4)基因检测的临床有效性和实用性;5)基因检测和服务的决定因素和影响。仅靠流行病学数据显然是不够的,必须制定政策,将基因检测纳入公共卫生专业人员和政策制定者、研究人员、医疗保健提供者(初级和专家)和消费者的医学或公共卫生规划。“巨网”旨在发展信息交流、知识库(包括具体方面的审查)、培训和政策。
流行病学家一词包括几个方面,包括呼吸道流行病学家、危险因素流行病学家、环境流行病学家和遗传流行病学家。从遗传学家的角度来看,流行病学家和临床医生通常被视为良好家庭队列的收集者(即。提供表型和DNA)。后基因组时期的挑战之一是理解并获得适当的培训,以确保对某一特定疾病感兴趣的流行病学家工作的各个方面的真正整合(表2)⇑).
道德
遗传流行病学、DNA取样和银行业务提出了新的伦理问题。目前,按照银行的构成模式,可以分为四种类型:一是通过大学和医院的研究活动建立的银行;2)根据立法决定建立的机构,例如在冰岛和爱沙尼亚,在这些国家,整个国家都决定DNA是一种国家资源,在他们的国家进行开发;3)制药公司或初创公司为了将研究成果商业化而建立的商业银行;4)与正在征集DNA捐赠者的实体相对应的虚拟银行通过并将结果发送给个人或通过医生。
此外,重要的是要指出,人们对异质人群的DNA越来越感兴趣,而不是高风险人群的DNA,或对分离株的DNA(就人群而言)。随着基因组图谱的绘制和对大群体snp的研究,靶点发生了变化68.这反过来意味着,伦理方面不仅必须考虑新兴银行类型学提出的问题,而且还必须摆脱在同质人群中进行研究的单基因模型。大多数道德规范都集中在个人权利(自主权、同意、歧视、保密、等。).提出的指导方针不再完全回应人口银行研究提出的新问题。制定规范框架似乎是必要的。联合国教育、科学及文化组织、世界卫生组织、人类基因组组织和医学科学内部组织理事会等机构已经解决了研究、人口和社会之间的一些新关系69- - - - - -71.
至少有六个重要问题需要解决如下。2)互惠原则即。让健康人群和社区参与,但没有直接的即时利益和同意参与。我们需要找到一种方式让社区在这样的环境中表达自己72.匿名样本通常用途有限,因此,在未来10年,编码DNA可能会以一种持续的方式使用,前提是有伦理审查。3)作为个体匿名或编码的机密性不能掩盖遗传易感性谱的问题,这可能出现在一个群体或一个地区。4)由于其社会学、心理学和文化的影响,银行业必须前瞻性地考虑。特别是,明确研究人员的变动、资金不足、机构结构和责任问题等方面的政策应该是透明的。5)结果的沟通需要提前明确。6)商业化问题也需要解决73.
此外,虽然人们通常不能拥有自己的DNA,但他们确实可以行使控制权,以及机构的监护权。DNA的转化为样本增加了知识知识。专利只适用于具有新颖性、创造性和经济效用的东西。关于如何区分发现和发明,各国之间一直存在争论。知识产权可能具有商业价值,这一点从一开始就应该明确。在过去的5年里,人民作为一个群体的共享利益的概念也出现了。目前讨论的焦点是人们的贡献是否得到承认,还是作为公共卫生或人道主义目的的直接投资获得回报72.正是在这种情况下,一些国家要求共同为DNA申请专利,而另一些国家则要求DNA应始终保留在原产国,或只有在获得中央代表机构批准后才离开该国。后基因组阶段提出了各种新的方面,包括机密性、可追溯性、商业化和专利、对受试者的反馈以及国家之间的差异,这些都需要解决。
将遗传研究纳入呼吸流行病学的要求
将遗传学纳入呼吸流行病学的相关性并不是显而易见的,尽管人们普遍认为新的概念和方法在付诸实践之前需要讨论。更多的信息、培训(包括呼吸道流行病学家和遗传学家)和讨论似乎是必要的(表2)⇑).
从流行病学的角度来看,应该强调关联研究中有效的病例对照设计的重要性,这是流行病学专家的专业领域,因此值得肯定。遗传学家可以被提醒到良好的表型特征的中心重要性,这是基于呼吸流行病学的。大样本量和复制的需要,以及群体分层的概念(混杂的一种类型)现在已经很好地理解了。未来的研究应系统地收集参与此类研究的个人的来源信息。在队列中建立嵌套的病例对照研究,并准备好对新的基因发展做出快速反应,这将是有效的。有人建议定义学习标准,从而充分实现现有队列中的机会。需要在尊重各种研究现有框架的组织方面进行改进,以鼓励建立数据库的网络和可能的聚合,包括承认建立生物收集所要求的工作74.在呼吸流行病学领域,在标准化方面已经有了良好的基础,英国医学研究委员会慢性阻塞性肺病调查问卷、欧洲共同体呼吸健康调查以及儿童哮喘和过敏国际研究等举措都证明了这一点。
在不忘记环境因素的主要重要性的同时,特别是吸烟与慢性阻塞性肺病的关系,现在流行病学家之间有一个共识,即遗传研究值得认真考虑。为了了解环境影响的复杂性,有必要考虑到随时间变化而表现不同的疾病的相关暴露窗口。呼吸流行病学社区的真正优势在于方法方面,因为遗传研究中提出的许多复杂问题与传统环境流行病学设计和分析中的问题和挑战有很大的共同之处。通过流行病学家的高水平统计建模,环境学家和遗传学家之间可能出现新的合作可能性,目前的重点是环境。设计和统计方面可能是呼吸和遗传社区之间的桥梁,在它们与遗传流行病学的共同界面上。在这些领域培训流行病学家将为决定是否将“新遗传学”纳入流行病学研究和公共卫生提供知识,相反,在流行病学方法方面培训基础科学家和临床医生是发展真正的多学科研究的必要步骤。在欧洲科学学会的各种倡议的支持下,特别是在欧洲一级,国际网络正在出现,特别是在哮喘和过敏性疾病方面,并应为后基因组呼吸流行病学的挑战提供框架75,76.
致谢
作者要感谢所有使Cernay研讨会成为可能的人。它由欧洲呼吸学会组织,并得到国际流行病学协会(I188bet官网地址EA)、国际遗传流行病学学会(IGES)和国家研究所Santé et de la Recherche Médicale (INSERM)的支持。他们还感谢所有在研讨会期间和之后提出深刻见解的人。
脚注
↵后基因组呼吸流行病学小组:J. Anto, M.P. Baur, H. Bickeboller, D. Clayton, W.O.C. Cookson, F. Demenais, P.J. Helms, I. Humphery-Smith, S. Imbeaud, F. Kauffmann, B.M. Knoppers, M. Lathrop, J. Little, N. Pearce, D. Schaid, E. Silverman, S. Weiss, M. Wjst
- 收到了2003年7月4日。
- 接受2004年4月5日。
- ©ERS期刊有限公司