科研进展

心理所发表合作文章综述全基因组时代基因连锁分析的原则、方法和应用

发布时间:2015-05-13 作者:中国科学院心理健康重点实验室 李昭 陈超

  许多年来,连锁分析 (linkage analysis) 都是对孟德尔疾病和具有家族聚集倾向的复杂性状进行遗传作图 (genetic mapping) 的主要工具。而近几年来,随着研究焦点向常见变异(common variants)的转移,全基因组关联研究(genome-wide association studies,GWAS)被广泛采用,很大程度上代替了连锁分析。然而,随着全基因组测序(whole-genome sequencing,WGS)被越来越多地使用,连锁分析再次成为鉴定疾病致病基因的重要且强有力的工具。连锁分析常与WGS中的过滤方法联用,在发现GWAS不擅长的罕见变异(rare variants)中起到重要作用。新的观点认为罕见变异可能在复杂疾病的病因学中占据相当大的比例。尽管一些书籍和综述文章对连锁分析进行过深入阐述,但目前还没有关于连锁分析与WGS相结合的论述。 

  中国科学院心理健康重点实验室客座教授Jürg OTT和该实验室王晶研究员,与贝勒医学院的Suzanne M. Leal教授合作,综述了连锁分析的原则和方法,并提供了连锁分析及其在全基因组测序数据中应用的实践指南。 

  目前,由于高额的测序费用,绝大多数研究仅对少部分家族成员进行测序,即全基因组测序以基于家系的研究为主(family-based WGS studies)。这些研究对测序数据的分析以过滤方法(filtering approaches)为主,即设定一系列排除标准,对测序获得的变异位点进行排除,剩下的变异再进一步分析其与疾病或表型的相关性。过滤方法可以获得可能与疾病相关的易感位点,但遗传位点与疾病之间的相关性没有统计学证据的支持。连锁分析很好的弥补了这一缺陷。基于WGS的连锁分析方法可以为遗传变异或基因在疾病病因学中作用提供统计学证据,同时连锁分析既可以直接用于WGS数据的分析,也可以对过滤后的数据进行分析,从而评估哪些变异需要在更大样本中验证。此外,连锁分析还顾及了拟表型、低外显率等孟德尔疾病的常见特征,并能够在DNA样本质量评估、家系关系正确性验证、杂合子检测、测序样本选择、精简后续验证位点等环节中起作用,大大提高全基因组测序数据分析的准确性和效率。 

  Jürg OTT教授和王晶研究员、Suzanne M. Leal教授合作署名的综述文章在简要说明全基因组连锁分析(genome-wide linkage analysis)的优势以及连锁分析与关联分析(association analysis)的比较之后,着重讨论了连锁分析使用的不同算法,以及它们在计算机程序中的实现,并特别强调了这些算法在测序数据中的应用。此外,本文还提供了基于WGS数据进行连锁分析的详细步骤和方法,为读者提供了一个详尽的应用实践指南。 

  该研究首次阐释了连锁分析方法在全基因组测序数据中的应用,并提供了一套实践指南。随着测序技术的发展和测序成本的降低,连锁分析必将在WGS数据分析中被广泛使用并发挥积极作用。 

  本研究发表于5月11日《Nature Reviews Genetics》期刊。 

  论文链接:
  Ott, J., Wang, J. & Leal, S. M. Genetic linkage analysis in the age of whole-genome sequencing. Nat Rev Genet 16, 275-284 (2015).


附件下载: