文献研读 | 匡卫民(2017级博士) : Nature | 百万年前的古DNA数据反映猛犸象遗传历史
2021-4-19
摘要:古基因组数据为研究物种形成和长期适应性进化提供重要的信息。虽然DNA片段在理想环境下可以保存时间超过一百万年,受到诸多条件的影响,现有古DNA研究难以涉及更新世物种形成等早期演化问题。本研究报道了在西伯利亚永久冻土层出土的3例更新世早期和中期猛犸象臼齿中(2021年2月17日在线发表,doi: 10.1038/s41586-021-03224-9),成功提取到DNA并获得了全基因组数据,其中2例距今时间超过一百万年。本研究发现在更新世早期的西伯利亚东部存在两种猛犸象谱系,其中一支产生了长毛象,另一支则未知。本研究发现北美的哥伦比亚猛犸的祖先可以追溯到更新世中期的这两个世系发生了杂交事件,且基因混合比例相似。此外,也发现与北极环境适应相关的基因发生了突变,这些基因与长毛、体温调节、脂肪堆积和耐寒性等相关。
研究背景:
猛犸象(Mammuthus sp.)在约5 Ma就起源于非洲,随后移民至北半球。在更新世时期(2.6 Ma-11.7 Ka),猛犸象分化形成了南方猛犸象(Mammuthus meridionalis)和草原猛犸象(Mammuthus trogontherii),随后又分化形成哥伦比亚猛犸象(Mammuthus columbi)和长毛猛犸象(Mammuthus primigenius)(图1)。目前,关于长毛猛犸象和哥伦比亚猛犸象的起源和进化历史还尚不清楚。基于此,本研究分析了西伯利亚东北部的3例更新世早期和中期的猛犸象的全基因组序列(样品名称根据地理来源命名,分别为Krestovka、Adycha和Chukochya;图2),详细地揭示了猛犸象的遗传历史。

图1 猛犸象。图片来源于网络。
结果与讨论:
1 | 样品时间和系统发育分析:
首先,利用线粒体基因组数据和核基因组数据分别对样品时间进行估计,两个数据得到相似的结果。线粒体基因组的结果为Krestovka:1.65Ma(95%CI:2.08–1.25Ma)、Adycha:1.34Ma(95%CI:1.69–1.06Ma)和Chukochya:0.87Ma(95%CI:1.07–0.68Ma)。核基因组的结果为Adycha:1.28Ma(95%CI:1.64–0.92Ma)和Chukochya:0.62 Ma(95%CI:1.00–0.24 Ma)。同时,分子标记估计的时间与地质估计的时间一致(图2)。
其次,基于常染色体数据对系统发育树进行重构,发现这3例猛犸象落在了所有欧亚猛犸象之外,包括来自欧洲和西伯利亚的猛犸象。Adycha和Chukochya的系统发育位置与它们的所有长毛猛犸象的直接祖先类群聚是一致的。然而,Krestovka猛犸象的分化要早于哥伦比亚和长毛猛犸间的分化,即在更新世晚期西伯利亚东部存在着两种谱系的猛犸象,包括Krestovka谱系(在猛犸象首次出现在北美之前就与其他猛犸象分化了)和Adycha以及所有更新世中晚期的长毛猛犸象谱系(图2)。

图2 猛犸象系统发育和物种分歧时间分析。
2 | 哥伦比亚猛犸象的起源
本研究多证据支持哥伦比亚猛犸象的基因组中有更高的比例来源于Krestovka谱系。首先,D-statistics和Treemix分析的结果都揭示了在哥伦比亚猛犸象和Krestovka谱系间共享过量的衍生等位基因,这与Krestovka的系统发育位置不一致(Krestovka位于其他猛犸象的最基部)。这表明哥伦比亚猛犸象的部分祖先来自Krestovka谱系。此外,为了进一步评估在猛犸象种群历史中Krestovka谱系的演化背景,通过评估3个古代个体与一个西伯利亚长毛猛犸象的所有可能的系统发育关系的组合,结果发现哥伦比亚猛犸象是其他猛犸象杂交的后代,其中38%-43%的遗传组分来自于Krestovka谱系和57%–62%的遗传组分来自于长毛猛犸谱系(图3)。
另外,D-statistics分析还发现哥伦比亚猛犸象和Wyoming长毛猛犸象之间的衍生等位基因的共享水平更高。根据F4估计这些基因组之间存在10.7%–12.7%额外的共享等位基因。由于哥伦比亚猛犸象携带着Krestovka谱系很大一部分的遗传组分,从哥伦比亚猛犸象到北美长毛猛犸象的基因流会导致Krestovka之间更大比例的共享等位基因,推测基因流可能是单向的,即从长毛猛犸象到哥伦比亚猛犸象。这意味着哥伦比亚猛犸象的基因组是两个物种杂交的结果,其中Krestovka和长毛猛犸象各自贡献了约50%,随后北美长毛象又额外贡献了约12%的遗传组分。

图3 猛犸象进化历史分析。
3 | 猛犸象的适应性进化
长毛猛犸象通过一系列适应性变化进化形成了一种耐寒的动物。本研究确定了所有更新世晚期的长毛猛犸象以及所有非洲大草原猛犸象和亚洲猛犸象的携带衍生等位基因的蛋白质编码变化。在更新世早期和中期的猛犸象基因组中,发现在Adycha和Chukochya长毛猛犸象的基因组中分别有85.2%和88.7%的特异性蛋白编码基因发生改变。这些特异性蛋白质编码基因发生改变与长毛猛犸对北极环境适应密切相关,并富集到与毛发生长、昼夜节律、体温调节以及白色和棕色脂肪沉积相关的基因。此外,发现西伯利亚的M. trogontherii猛犸象(即Adycha)已经形成了毛茸茸的毛发,以及对寒冷和高纬度环境的生理适应。
结论
本研究利用古DNA技术获得了百万年前的猛犸象的全基因组数据,结果发现哥伦比亚猛犸象是长毛猛犸象和一种以前未被报道的古代猛犸象(Krestovka)杂交的后代,且各自贡献了约50%的古老遗传物质。此外,本研究也为研究物种形成过程中的适应性进化提供了素材,发现更新世晚期的猛犸象基因组(Adycha)中就已经适应了北极环境适应。该研究达到了古DNA获取的理论时间上限,为古DNA技术在更新世材料的应用提供了成功范例,也为古DNA技术探究早期物种形成提供了新的研究思路。
原文链接:https://www.nature.com/articles/s41586-021-03224-9