考古科学中心应邀发表基于祖先重组图重建古今人类群体遗传系谱的研究进展及展望
2024年8月30日,四川大学考古科学中心、四川大学华西医院罕见病研究院袁慧军/何光林研究团队,联合广东省毒品实验技术中心(国家毒品实验室广东分中心)刘超院士研究团队,在《遗传》杂志上发表了题为“基于祖先重组图重建古今人类群体遗传系谱的研究进展及展望”的综述文章。该综述介绍了ARG重建的理论基础,并综述了遗传系谱的早期应用与构建ARG的方法及其进展,进一步探讨了ARG的应用潜力和重建ARG面临的挑战与未来展望,旨在加深对ARG理论基础和应用场景的理解,推动ARG在演化基因组学和医学基因组学中的应用。
随着古今人群大规模基因组资源的公布、计算生物学工具的革新及大数据挖掘相关算力的提升,基因组学领域正在经历一场革命性的变化。这些进步和变化不仅显著加深了人们对人类起源、迁徙及混合等复杂演化历程的理解,而且也揭示了这些过程对人类疾病健康状态的影响,加速了人们对人类健康和疾病遗传学基础的研究,还为挖掘人类基因组中记载的群体演化历史及疾病遗传学基础的演化轨迹提供了新的途径。祖先重组图(ancestral recombination graph, ARG)技术,通过分析全基因组中不同区域的重组事件和共祖特征,重建了基因组片段之间的演化关系。ARG 记录了所研究基因组序列分歧以来的所有共祖和重组事件,并指明了每个基因组位置的完整系谱,是基因组分析的理想数据结构。
本综述主要包括5个部分内容:
(1)ARG重建的理论基础。即使是表面上看似无关的个体,若追溯到足够久远的时间,理论上均可以找到一个共同的祖先。这表明所有现代人类之间存在着潜在的遗传联系。DNA片段通过特定路径传递至共同祖先,从而构成了该基因组位置的局部遗传系谱。
(2)遗传系谱的早期应用。法医遗传学家利用遗传系谱来识别案件嫌疑人以及失踪人口的身份,破获了一系列诸如金州杀人案(Golden State Killer)和鹿皮女孩案(Buckskin Girl)等冷案、积案。
(3)构建ARG的方法及其进展。自Hein等在1990年首次引入基于简约法构建ARG以来,目前已经开发了20多种方法用于ARG的构建(如下图),本文选取被研究者们广泛使用的四种方法进行了介绍。
(4)演化基因组学的应用。演化基因组学的一个核心议题在于如何最有效地表示和分析基因组多样性,以洞察塑造生物演化历史的关键过程、力量和事件。基于ARG,我们可以筛选自然选择信号,推断等位基因的频率的时空演化轨迹,构建现代和古代人类基因组的统一遗传系谱,识别尼安德特人和丹尼索瓦人的遗传渐渗。
(5)基因型填补和系谱关联分析。基因型填补(genotype imputation)是一种成熟的策略,可以增强基于芯片数据的关联研究的效能,基于ARG我们能够识别并利用那些在参考面板(haplotype reference panel)之外的遗传变异。
构建ARG的方法学进展
总的来说,整合遗传系谱关系和基因组变异数据,不仅对群体和个体遗传学有重要价值,还可以纠正遗传关联研究中罕见和常见变异的地理混杂差异,有力推断潜在的演化事件、过程和参数,如突变时间、自然选择和古代群体之间的接触。此外,树序列可用于整合不同数据源,并构建可随新变异发现而更新的人类基因组变异的参考系谱树序列结构。这种结构结合高效的树序列算法,可以实现多样化的统计遗传操作,包括基因分型、基因型填补和单倍型定相。同时,这种结构还可用于以保护隐私的方式有效地共享数据,即通过根据推断的祖先而不是单个样本来描述数据集。
四川大学考古科学中心、四川大学华西医院罕见病研究院袁慧军教授、何光林副研究员,广东省毒品实验技术中心(国家毒品实验室广东分中心)刘超院士为文章共同通讯作者,昆明医科大学法医学院硕士研究生杨青鑫和四川大学考古科学中心、四川大学华西医院罕见病研究院王萌鸽博士为文章共同作者。相关工作得到国家自然科学基金、四川大学考古科学中心开放课题、国家社会科学基金重大专项、四川大学华西医院1.3.5等项目的资助。
杨青鑫, 王萌鸽, 刘超, 袁慧军, 何光林. 基于祖先重组图重建古今人类群体遗传系谱的研究进展及展望[J]. 遗传, 2024, 46(10): 849-859. doi: 10.16288/j.yczz.24-150