首先声明,我本人不是这一行的,仅仅是业余爱好者,错误在所难免。虽然业余,但也不能像民科那样天马行空, 怎么也得尽量说一些有根有据的东西。
用人类DNA研究人类历史,最早是用mitochondrial DNA(线粒体DNA)分型这个工具的,因为线粒体DNA比较稳定比较短, 又好测又省钱, 在早期研究中比较常见。线粒体DNA是通过母系遗传,男性细胞中也有来自母亲的线粒体DNA, 但不能传到下一带,只有女性的线粒体DNA可以传给下一代。美国是最早研究美洲土著的线粒体DNA, 首先辨别出来4个分型,按字母表顺序就命名为A/B/C/D, 正好,这4个分型也是东北亚母系的主要分型,这也是证实美国土著是由西伯利亚东北部迁移到美洲的DNA研究的最早证据。
另外一个是技术是测男性Y-DNA类型,人类nuclearDNA(核DNA)是包含在23对染色体里的,其中第23对是决定性别的性染色体,女性是XX,男性是XY, 其中Y只来自父亲的遗传,所以Y-DNA只能在男性中可以测到,女性没有。除了法医,业余爱好者也对Y-DNA最感兴趣,只不过法医的对象是嫌疑犯,而业余爱好者的对象是历史上的人物或史前人群。
除了性别,人类其它表征,比如大家最关心的皮肤/毛发颜色等种族特征,基本上是由其它22对染色体(又叫常染色体,常染)决定的。 如果能把DNA全测,那当然是最准确的,但在早期是非常昂贵,第一个全序测定,据说是花了几百个亿美元。哺乳动物包括人类,有30亿个碱基对,可以辨别的基因近3万个,每个基因含有几十到几千个碱基对,其它没啥用的或一时不知道有啥用就称为Junk DNA。 早期因为测序贵,也只有西方国家,做一些值得做的工作,比如德国Max Planck Institute(中文简称马普所)Svante Paabo做的古尼安德特人测序。 现在随着技术进步,测序成本已经大幅降低。
做古DNA研究,按样本来源分有2个思路:用现代人DNA样本来倒推古人; 或直接拿古样本来测。 显然,后者是最准确的,但是,古DNA不是那么好测的, 因为DNA会被环境分解, 特别是在南方热湿环境中,另外,在酸性土壤中DNA也不容易保存下来。
在早期古DNA测序,外源DNA污染也是个大问题,因为古DNA可以采到的量很少,还包裹在一堆蛋白质/酶之类的东西之中,经过不同的经手人之手,所以早期测的古DNA结果, 后来才知道很多实际上是现代人的DNA。
所以现在古DNA研究的全基因分析有标准程序,需要超净室,样本表面需要清理干净, 尽量选择牙齿内部或人头骨里的一个叫petrous bone内的DNA,这2处DNA有可能保存得比较完整,用小钻机取样,取出的骨粉还需要用一个技术来富集DNA,像钓鱼一样把古DNA钓出来,然后再测序, 这个富集摄取技术最早是在2010年被哈佛的David Reich实验室应用在古DNA研究中, 就这样也不能保证测序成功,而且即使是能测出的,也还有个coverage, 即只能测出部分基因。 另外,结果还得经过外源DNA污染检查,如果污染率高于一定百分比,这个结果就得弃去。
中国目前做古DNA的组,首推中科院古脊椎动物与古人类研究所付巧妹, 她是德国马普所Svante Paabo的学生,又在哈佛David Reich组做过博士后,2017年发表了中国第一个古DNA的全基因分析, 即4万年前的田园洞人。其它机构是2019年以后才开始与西方接轨, 其中有吉林大学崔银秋(与马普所和付巧妹合作), 大概以后会有厦门大学的王传超(哈佛David Reich组的博士后)。 至于复旦,以前他们主要是用现代人DNA样本来倒推古人, 不出问题才怪呢,不知道复旦现在或以后会不会跟上,但至少到目前为止,还没在重量级学术杂志看到他们发表的关于中国古DNA的论文。
就拿吉林大学为例吧,以前他们也测了中国古代样本的Y-DNA,发在李红杰博士论文上,比如新疆小河的古DNA,Y-DNA是一水的R1a。中亚的R1a,是与Andronovo 文化(来自哈萨克草原的proto-印度-伊朗人,或雅利安人)东进有关。 可是, 吉大今年发的文章(https://www.nature.com/articles/d41586-021-02948-y),小河的Y-DNA又变成R1b了,而根据基因分析,与西伯利亚冰河时期的老土著ANE(Ancient North Eurasian)最接近, 而与proto-印度-伊朗人没啥关系。
总之,这行目前还在高速发展之中,10年前做的东西,可能现在就过时了,甚至是错误的,5年前做的工作,可能当时是影响巨大,但现在看可能也有瑕疵,甚至是重大缺陷。
ps.
付巧妹的工作,她的学生Melinda Yang有篇科普文章作了总结,里面能点击的都是文献出处。现在论文在正文里一般不提Y-DNA,但在supplementary material里面会说的,但付巧妹似乎对Y-DNA不感兴趣,在她的去年7月Science杂志上发的中国南北方的古DNA论文里, 连补充材料里都找不到Y-DNA数据。
https://urnow.richmond.edu/features/article/-/19013/-ancient-dna-is-revealing-the-genetic-landscape-of-people-who-first-settled-in-east-asia.html?utm_source=www&utm_medium=referral&utm_campaign=features-story
吉林大学最近除了在Nature上发的新疆古DNA文章,还发了Ancient genomes from northern China suggest links between subsistence changes and human migration, 这篇不错,值得细看。
https://www.nature.com/articles/s41467-020-16557-2
王传超和他的哈佛老板一起在今年发了一篇关于东亚古DNA文章,其中蒙古和西伯利亚的数据比较多,那里考古历来发达,其样本和数据西方比较容易得到。