四川大学考古科学中心logo

Sci. Adv. | 四川大学考古科学中心袁慧军团队构建高原人群STR遗传图谱,揭示其在高原适应中的关键作用

日期:

人类基因组的多样性是漫长演化历史的深刻烙印,记录着我们的祖先在迁徙、混合与适应过程中的生存智慧与遗传博弈。青藏高原,这颗星球上最极端的生存环境之一,以其低氧、低温和强紫外线辐射,为我们探究演化-基因-健康的三角关系提供了天然的动态实验室。过去十几年,科学家们通过对EPAS1、EGLN1等基因的单核苷酸多态性(SNP)的研究,初步揭示了高原人群在低氧适应中的经典遗传机制。然而,这些已知的遗传线索远未描绘出人类适应极端环境的完整图景,尤其是在被称为基因组“暗物质”的短串联重复序列(STR)领域,其在高海拔适应与人类健康中的作用长期处于探索的盲区。

近日,四川大学考古科学中心、华西医院罕见病研究院袁慧军教授团队在Science Advances发表题为《Short tandem repeats in populations of the Qinghai-Tibet Plateau and adjacent regions provide insights into high-altitude adaptation》的研究论文。该研究首次系统构建了青藏高原及周边地区人群的全基因组短串联重复序列(STR)变异图谱,揭示了STR在高原环境适应性演化中的多层次调控功能,为理解人类适应极端环境的遗传机制提供了全新视角。四川大学华西医院罕见病研究院黄雨果博士后和重庆医科大学基础医学院法医系王萌鸽副教授为共同第一作者。四川大学考古科学中心、华西医院罕见病研究院袁慧军教授、何光林副研究员和程静副研究员;四川大学华西医院卜枫啸副研究员和卢宇副研究员为共同通讯作者。

青藏高原作为地球上最极端的生存环境之一,其低氧、低温和强紫外线辐射条件,为研究人类对环境适应的遗传机制提供了独特的天然实验室。过去的研究主要聚焦于EPAS1、EGLN1等基因的单核苷酸多态性(SNP),初步揭示了高原人群低氧适应的部分机制。然而,占人类基因组过半的重复序列,特别是短串联重复序列(STR)在高原适应中的作用,长期以来是研究的薄弱环节。袁慧军团队基于“十万例罕见病患者全基因组测序计划(GSRD-100KWCH)”项目中高原人群资源,整合了7876例全基因组测序数据,其中包括3808例新测序的藏缅语族和汉族高原人群样本。研究团队通过先进的生物信息学方法,对超过110万个STR位点进行系统分析,构建了全球首个高原人群全基因组STR变异图谱,填补了高海拔人群STR遗传资源的关键空白。

研究揭示了藏缅语族人群独特的STR遗传结构。研究发现,藏族、彝族等藏缅语族人群拥有与低海拔汉族人群显著不同的STR变异模式,这些差异不仅反映了群体遗传结构和迁徙融合历史,还发现大量高度分化的STR集中于已知的高原适应相关基因(如SHISA8、MAPKAPK5)及其调控区域,提示其可能受到自然选择(图1)。同时该工作证实了STR对基因表达的调控功能。研究发现这些分化的STR可能是表达数量性状位点(eQTL),其长度变异能够精准调控靶基因的表达水平,从而增强机体在极端环境下的适应能力。系统研究识别出与高原环境强相关的关键STR。通过关联分析,研究筛选出超过17,000个与海拔、温度、日照辐射等环境因子显著相关的STR。这些STR通过多种机制发挥作用:位于编码区的STR通过改变氨基酸序列影响蛋白质功能;位于调控区的STR通过改变增强子活性影响基因表达;这些STR调控的基因显著富集于溶酶体、叶酸代谢、能量代谢等与高原适应密切相关的通路(图2)。此外,研究还建立了STR与复杂性状的关联。研究发现这些功能性STR与影响肺功能、血脂水平等复杂性状的遗传风险位点存在显著连锁,为解释GWAS研究中的“缺失遗传力”提供了新线索(图3)。

该研究将人类适应性演化的研究视角从传统的SNP拓展至更为复杂的STR变异,证明这类遗传“暗物质”在高原环境适应中扮演着不可或缺的角色。研究构建的STR变异图谱为后续的功能基因组学、医学遗传学和法医学研究提供了宝贵资源,其整合多组学数据的分析策略也为研究其他复杂性状的遗传机制提供了新范式。

复旦大学群体遗传学家徐书华教授指出,本研究为藏缅语族人群构建了首个全面、高质量的STR变异图谱,通过整合群体分化、环境关联与eQTL分析,系统筛选出可能参与高海拔环境适应的候选STR位点,为后续功能研究提供了清晰的“路线图”。中科院生物物理所医学遗传学专家何顺民教授认为,该研究建立的STR等位基因频率数据库具有重要临床应用价值,将提升针对藏缅语族人群遗传变异解读的精确度。研究发现非编码区STR与复杂疾病风险位点的紧密联系,为理解“遗传力丢失”问题提供了新的研究方向。未来,研究团队将进一步通过功能实验验证关键STR的生物学效应,并利用长读长测序等技术,全面解析复杂结构变异在人类演化和疾病中的作用。这一研究不仅深化了对人类适应极端环境机制的理解,也为精准医学和人类健康研究提供了新的遗传学基础。

图1 全基因组STR变异发现和多态性模式

图2 藏缅族语人群遗传背景和STR变异景观

图3 STR介导多层次高海拔环境适应性调控