生物数据库-生物标本库
马萨诸塞州总医院的丹尼尔·麦克阿瑟认为,最大的人类外显子数据库——外显子组聚集联合数据库(ExAC,Exome Aggregation Consortium database)在识别导致个体疾病的遗传因素方面具有更好的准确性,为患者提供更明确和直接的益处。
他是 8 月 17 日发表在《自然》杂志上的一篇论文的资深作者,该论文的研究作者使用来自 20 多项疾病研究的 DNA 数据编制了数据库进行分析。 ExAC 于 2014 年在线发布,查询次数超过 500 万次。 在这篇《自然》封面故事发表的同一天,《新英格兰医学杂志》和《自然遗传学》分别发表了使用该数据库纠正先前关于 DNA 变异和疾病的观点的研究文章。
庞大的人类 DNA 目录可以帮助研究人员发现导致疾病的微小错误,其中一些是出错的线索。 ExAC 是一个包含 60,000 多个基因编码个体的数据库,旨在研究由单个故障基因引起的罕见疾病。 这些疾病中的大多数非常罕见,以至于公众从未听说过它们。 但也有成千上万的人生病,他们作为一个群体占出生率的百分之一。
为什么样本量对罕见疾病相关基因很重要
对于罕见疾病,医生试图通过分析患者的 DNA 来寻找遗传原因。 但每个人都携带着数千种不同于标准 DNA 的变异,目标是找到一两个使人生病的变异。
研究人员通常通过关联推理来做到这一点。 如果患者出现以前从未见过或在其他情况下极为罕见的差异生物数据库,则可能被认为是疾病的原因。
挑战在于从公众那里获得足够的 DNA。 如果样本量太小或在不同人群中不够全面,单个突变可能会被错误地归因于导致患者出现问题。 更好的抽样可能表明这种差异也经常发生在健康人身上。 错误的导线可能会影响患者护理或错过治疗。
新英格兰医学杂志报道的遗传误诊
同一天生物数据库,《新英格兰医学与自然杂志》的一项无关研究中提出了这种“遗传误诊”的一个例子。 它着重于一种称为肥厚性心肌病的遗传性疾病。 心肌增厚会干扰泵血。
在一个检查了三年记录的实验室中,发现有七名患者被告知他们携带两种与心脏病相关的 DNA 变异体。 这两种变体后来都被重新归类为良性。 其中五个是非洲人后裔,如果最初对这些变体的研究包括了足够多的非裔美国人样本,他们可能就不会得出错误的结论。
科学家们引入了新的数据库ExAC,可以避免此类错误。 它提供了比过去更全面的 DNA 变化集合。 在欧洲、非洲、南亚、东亚和拉丁美洲血统的人中,大约有 1000 万个微小变化被记录在案。
拷贝数差异的自然遗传学校正
在同一天发表在 Nature Genetics 上的另一项研究中,在 ExAC 近 60,000 人的外显子组数据中分析了稀有拷贝数差异 (CNV) 的比例和身份。 研究发现,平均而言,个体携带 0.81 个缺失基因和 1.75 个重复,大多数 (70%) 携带至少一个稀有基因 CNV。
对于每个基因,研究人员凭经验估计了对 CNV 的相对耐受性,证实基于单核苷酸变异 (SNV) 基因限制的检测与进化保持分析独立相关。 该研究文章指出,受 CNV 影响的基因在精神分裂症患者中比在对照组中更为宽容。
ExAC的CNV数据是人类遗传差异谱系的重要组成部分,有助于个体基因组的揭示和群体疾病的研究。
大自然用 ExAC 指出过去的错误
Nature 文章中的分析提供了另一个示例,说明如何使用 ExAC 指出过去的错误。 研究人员分析了 192 个 DNA 差异,这些差异以前被认为与该疾病有关,但在 ExAC 中显示这些差异在一般人群中非常普遍。
研究人员发现,根据新标准,至少有 163 例病例应该被重新分类为良性或可能是良性的。 去年 11 月,研究人员报告说,126 个此类差异已被重新分类。
但科学家们指出,比 ExAC 更大的数据库还需要准确地将遗传变异与疾病联系起来或排除,还有很长的路要走。