打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
人類學雜記——14.?批《世界主要民族基因圖譜》中的謬誤,以正視聽
人類學雜記——14. 批《世界主要民族基因圖譜》中的謬誤,以正視聽

(溫馨提示:簡化字版本見後。)

近期在网絡上流行一個帖子,叫“《世界主要民族基因圖譜》+《從DNA看人種歷史》”(不給鏈接了,很好搜到,到處被轉載,我又査不清始作(俑)者)。應該說這個帖子還是有不少內容的,對於分子人類學的外行來說也有不錯的科普作用,但因爲這個帖子本身是愛好者寫的,我作爲專業人士(本人在復旦大學現代人類學重點實驗室作分子人類學研究工作),感覺也有義務對其中有錯誤的地方作一下批判和糾正,以免以訛傳訛。

首先是文中的“基因”一詞用得就不正確。按照生物學的嚴格定義,基因是“控制性狀的基本遺傳單位,亦即一段具有功能性的DNA序列”。一般來說,這樣的DNA是要轉錄成RNA並最終表達為多肽(如蛋白質)的。最常見的基因是類似血紅蛋白基因、乳糖酶基因、乙醇脫氫酶基因這樣的。而“基因圖譜”,或者說叫“遺傳圖譜”(genetic map)是指在人類的基因組上,每個基因到底分佈在46條染色體的哪個位置的圖,比如這樣(Y染色體的基因圖譜):



而這篇外行文章所作的圖,其實是Y染色體類型的分佈頻率圖,和基因無關,和人種也是無關的。首先,大家從中學生物課中都能學到,每個人46條染色體,其中有22對是常染色體,另外兩條,男性是一條X染色體和一條Y染色體,而女性是一對X染色體。這篇文章裏面所謂的“某某人種基因”的圖其實畫的都是Y染色體的類型,也就是只有男性有,並嚴格按照父系來傳遞的染色體。

Y染色體其實上面的基因非常少,密度比其他染色體都少得多,總數也就100個左右,上面其他部分大多數是高度重複且難以釋讀的序列,有時稱作“垃圾序列”,包括上圖斜線陰影部分的“異染色質”。目前Y染色體上已知的很多基因都是與男性性徵、睾丸和精子發育等相關的,而沒有發現和膚色、相貌、體格等等和種族有關特徵相聯繫的基因。也就是說,Y染色體的類型與種族沒有因果關係。

這裏面說一個重要問題,就是兩個事物的相關性和因果關係的區別。有因果關係的兩個事物未必相關性好,而另一方面,相關性非常好的兩個事物也未必存在因果關係。這裏舉兩個例子:(一)有人做了個統計,發現某個地方得心血管疾病的人平均壽命高於不得心血管疾病死的人,於是得出結論:得心血管疾病可提高人的壽命。當然常識告訴我們,心血管疾病顯然會造成人死亡的,但爲什麼從平均壽命上反而看不出來呢?因爲因先天性疾病夭折的、餓死的、事故死的、傳染病死的人通常死亡年齡更輕,只有有幸未因爲這些原因死亡的,纔在年齡較老時得了心血管疾病。(二)有人把小明的年齡和中國的GDP做了個圖,發現不但單調,而且曲線還很接近指數函數,相關性非常好。於是作出結論:說中國的GDP增長的原因是小明的年齡增長了。不過也有人說,不對,因爲中國的GDP增長了,所以小明的年齡增長了……仔細想想,就明白,小明的年齡和中國近幾十年的的GDP都是隨年份增加的,而本身年齡和GDP二者之閒互不爲因果。



所以,回到那篇《世界主要民族基因圖譜》(見上圖),裏面寫了什麼“黃種基因:N(極北基因)、O(东亞-南亞基因);椶種基因:C(東北亞-澳洲基因)、D(矮黑人基因);印第安基因:Q(美洲基因)”等等,其實就沒幾個靠譜的。首先,我們前面已經提到,Y染色體上不包括已知的決定相皃或種族特徵的基因,也就是說,Y染色體和種族是沒有直接的因果關係的。另一方面來看,比方說假如最早成爲椶種人的人裏面主要包含C和D單倍羣,或者C和D單倍羣開始擴張時的祖先能確定是椶種人,或者當時Q在開始擴張時就在美洲,那至少也是一種間接的因果聯繫。只可惜,在這點上,那個圖也是錯的,或者至少是缺乏依據的。

該文作者對一些Y染色體單倍羣作出人種或地理判斷的主要依據是含這些單倍羣在哪些族羣中有較高的比例。比如因爲安達曼人(安達曼是現在印度轄下緬甸西南方的一個羣島)是矮黑人,而據稱在安達曼人的一個羣體裏面測出的Y染色體都是D單倍羣,因此說D單倍羣是矮黑人。但我們仔細看數據來源(Thangaraj K, 2003),裏面安達曼羣島的Onge和Jarawa人都是D型而大安達曼島並無D型。此外安達曼只是幾個非常小的羣體(1850年時大約7千人,大部分是大安達曼島人,而現在整個安達曼土著僅存400餘人),D單倍羣的人口絕大多數分佈在亞洲大陸和日本列島上(西藏和日本比例最高,有40%以上,漢族在2%左右),基本上都屬於黃種人的範疇。對於小的族羣,不論Y染色體類型還是體皃特徵都容易受始祖效應、漂變或者少量外來人口的影響,同時體皃特徵也受地理環境的選擇,很難說安達曼島的Onge和Jarawa人就代表了D單倍羣的始祖羣體的體質特徵。同樣,C型有大量是漢族和阿爾泰語族,僅通過澳大利亞和巴布亞新幾內亞那幾個民族就說C型是椶種人也是缺乏依據的。



再說地理上,說Q型是美洲基因就太冤了。要知道美洲的支系大體屬於Q1a3a1-M3的一小支(美洲北部少數後遷去的愛斯基摩和納-德內語系人中的Q有的不是),而Q型的絕大多數早期分出來的支系基本都分佈在亞洲,比如中國、北亞或猶太人等。只不過亞洲人多,Q型在亞洲多只占了人羣的一小部分,而在美洲,因爲正好是Q1a3這支在1万多年前通過白令海峽到了無人區,因此成爲了美洲尤其是中南美洲父系的絕大多數。而你不能因此說亞洲的Q就是美洲基因,他們幾千輩子就從來沒有到過美洲。或者說,你叔叔做了什麼和你已經不相干了。

至於N單倍羣因爲最近共祖的單倍羣O大體分佈在東亞和東南亞,且N型內部早期的支系基本都在中國有分佈,而北亞,尤其到歐洲的俄羅斯、烏拉爾和波羅的語族,N基本都屬於N1c1-M178這一支系,擴散年代相對較晚,說明N型的起源和擴張也應該是在東亞而非北亞,最可能是在中國發生的。自然不應把N型說成是北亞類型。如果算人口數而不是只看比例,中國的N(>5%)比北亞及以西的N總數還多,亞洲的Q也不一定比美洲的Q少。
 


圖裏還有一些錯誤,是不同來源文章的檢測精度不同造成的,例如南北方漢族裏面高比例的K(“新幾內亞基因”)其實主要是O2*-M268(xO2a-M95,O2b-M176)以及N-M231,但早期的文章裏並未檢測M268和M231,因此這兩部分人就都算在上游的K-M9單倍羣裏面了。在其他的圖裏有的把這兩部分人單算成其他顏色了。不一樣的分類法放一起比較自然不會有正確的結果。

至於文章裏面的話就比那個圖還要更不靠譜了,比如“哈薩克人和蒙古人的大部分來源於澳洲原始白人”,還有“印度的黑人大多屬於安達曼群島的土著”,等等,無力反駁了,一句句反駁這種話對不起我和讀者的智商。

再有一點噁心的,Y染色體譜系是全球多個實驗室共同硏究的,單倍羣的命名也是全球科硏人員在2002年開了個會纔最終定下來的,怎麼成了“美國版”的“人種基因圖譜”了?

如果您想瞭解更多關於Y染色體和分子人類學的知識,請看我的blog(http://www.360doc.com/httphttp://blog.sina.com.cn/s/articlelist_1180557177_3_1.html )和視頻(//v.youku.com/v_show/id_XMTcwNzU1NzE2.html ),以及訪問“蘭海的分子生物學論壇”(http://www.ranhaer.com/ )。

===============以下是簡化字版本=================

近期在网络上流行一个帖子,叫“《世界主要民族基因图谱》
+《从DNA看人种历史》”(不给链接了,很好搜到,到处被转载,我又查不清始作(俑)者)。应该说这个帖子还是有不少内容的,对于分子人类学的外行来说也有不错的科普作用,但因为这个帖子本身是爱好者写的,我作为专业人士(本人在复旦大学现代人类学重点实验室作分子人类学研究工作),感觉也有义务对其中有错误的地方作一下批判和纠正,以免以讹传讹。

首先是文中的“基因”一词用得就不正确。按照生物学的严格定义,基因是“控制性状的基本遗传单位,亦即一段具有功能性的DNA序列”。一般来说,这样的DNA是要转录成RNA并最终表达为多肽(如蛋白质)的。最常见的基因是类似血红蛋白基因、乳糖酶基因、乙醇脱氢酶基因这样的。而“基因图谱”,或者说叫“遗传图谱”(genetic map)是指在人类的基因组上,每个基因到底分布在46条染色体的哪个位置的图,比如这样(Y染色体的基因图谱):



而这篇外行文章所作的图,其实是
Y染色体类型的分布频率图,和基因无关,和人种也是无关的。首先,大家从中学生物课中都能学到,每个人46条染色体,其中有22对是常染色体,另外两条,男性是一条X染色体和一条Y染色体,而女性是一对X染色体。这篇文章里面所谓的“某某人种基因”的图其实画的都是Y染色体的类型,也就是只有男性有,并严格按照父系来传递的染色体。

Y
染色体其实上面的基因非常少,密度比其他染色体都少得多,总数也就100个左右,上面其他部分大多数是高度重复且难以释读的序列,有时称作“垃圾序列”,包括上图斜线阴影部分的“异染色质”。目前Y染色体上已知的很多基因都是与男性性征、睾丸和精子发育等相关的,而没有发现和肤色、相貌、体格等等和种族有关特征相联系的基因。也就是说,Y染色体的类型与种族没有因果关系。

这里面说一个重要问题,就是两个事物的相关性和因果关系的区别。有因果关系的两个事物未必相关性好,而另一方面,相关性非常好的两个事物也未必存在因果关系。这里举两个例子:(一)有人做了个统计,发现某个地方得心血管疾病的人平均寿命高于不得心血管疾病死的人,于是得出结论:得心血管疾病可提高人的寿命。当然常识告诉我们,心血管疾病显然会造成人死亡的,但为什么从平均寿命上反而看不出来呢?因为因先天性疾病夭折的、饿死的、事故死的、传染病死的人通常死亡年龄更轻,只有有幸未因为这些原因死亡的,才在年龄较老时得了心血管疾病。(二)有人把小明的年龄和中国的
GDP做了个图,发现不但单调,而且曲线还很接近指数函数,相关性非常好。于是作出结论:说中国的GDP增长的原因是小明的年龄增长了。不过也有人说,不对,因为中国的GDP增长了,所以小明的年龄增长了……仔细想想,就明白,小明的年龄和中国近几十年的的GDP都是随年份增加的,而本身年龄和GDP二者之间互不为因果。



所以,回到那篇《世界主要民族基因图谱》(见上图),里面写了什么“黄种基因:N(极北基因)、O(东亚-南亚基因);棕种基因:C(东北亚-澳洲基因)、D(矮黑人基因);印第安基因:Q(美洲基因)”等等,其实就没几个靠谱的。首先,我们前面已经提到,Y染色体上不包括已知的决定相貌或种族特征的基因,也就是说,Y染色体和种族是没有直接的因果关系的。另一方面来看,比方说假如最早成为棕种人的人里面主要包含CD单倍群,或者CD单倍群开始扩张时的祖先能确定是棕种人,或者当时Q在开始扩张时就在美洲,那至少也是一种间接的因果联系。只可惜,在这点上,那个图也是错的,或者至少是缺乏依据的。

该文作者对一些
Y染色体单倍群作出人种或地理判断的主要依据是含这些单倍群在哪些族群中有较高的比例。比如因为安达曼人(安达曼是现在印度辖下缅甸西南方的一个群岛)是矮黑人,而据称在安达曼人的一个群体里面测出的Y染色体都是D单倍群,因此说D单倍群是矮黑人。但我们仔细看数据来源(Thangaraj K, 2003),里面安达曼群岛的OngeJarawa人都是D型而大安达曼岛并无D型。此外安达曼只是几个非常小的群体(1850年时大约7千人,大部分是大安达曼岛人,而现在整个安达曼土著仅存400余人),D单倍群的人口绝大多数分布在亚洲大陆和日本列岛上(西藏和日本比例最高,有40%以上,汉族在2%左右),基本上都属于黄种人的范畴。对于小的族群,不论Y染色体类型还是体貌特征都容易受始祖效应、漂变或者少量外来人口的影响,同时体貌特征也受地理环境的选择,很难说安达曼岛的OngeJarawa人就代表了D单倍群的始祖群体的体质特征。同样,C型有大量是汉族和阿尔泰语族,仅通过澳大利亚和巴布亚新几内亚那几个民族就说C型是棕种人也是缺乏依据的。



再说地理上,说
Q型是美洲基因就太冤了。要知道美洲的支系大体属于Q1a3a1-M3的一小支(美洲北部少数后迁去的爱斯基摩和纳-德内语系人中的Q有的不是),而Q型的绝大多数早期分出来的支系基本都分布在亚洲,比如中国、北亚或犹太人等。只不过亚洲人多,Q型在亚洲多只占了人群的一小部分,而在美洲,因为正好是Q1a3这支在1万多年前通过白令海峡到了无人区,因此成为了美洲尤其是中南美洲父系的绝大多数。而你不能因此说亚洲的Q就是美洲基因,他们几千辈子就从来没有到过美洲。或者说,你叔叔做了什么和你已经不相干了。

至于N单倍群因为最近共祖的单倍群O大体分布在东亚和东南亚,且N型内部早期的支系基本都在中国有分布,而北亚,尤其到欧洲的俄罗斯、乌拉尔和波罗的语族,N基本都属于N1c1-M178这一支系,扩散年代相对较晚,说明N型的起源和扩张也应该是在东亚而非北亚,最可能是在中国发生的。自然不应把N型说成是北亚类型。如果算人口数而不是只看比例,中国的N>5%)比北亚及以西的N总数还多,亚洲的Q也不一定比美洲的Q少。

 




图里还有一些错误,是不同来源文章的检测精度不同造成的,例如南北方汉族里面高比例的
K(“新几内亚基因”)其实主要是O2*-M268(xO2a-M95,O2b-M176)以及N-M231,但早期的文章里并未检测M268M231,因此这两部分人就都算在上游的K-M9单倍群里面了。在其他的图里有的把这两部分人单算成其他颜色了。不一样的分类法放一起比较自然不会有正确的结果。

至于文章里面的话就比那个图还要更不靠谱了,比如“哈萨克斯坦人和蒙古人的大部分来源于澳洲原始白人”,还有“印度的黑人大多属于安达曼群岛的土著”,等等,无力反驳了,一句句反驳这种话对不起我和读者的智商。


再有一点恶心的,
Y染色体谱系是全球多个实验室共同硏究的,单倍群的命名也是全球科硏人员在2002年开了个会才最终定下来的,怎么成了“美国版”的“人种基因图谱”了?

如果您想了解更多关于
Y染色体和分子人类学的知识,请看我的bloghttp://blog.sina.com.cn/s/articlelist_1180557177_3_1.html )和视频(//v.youku.com/v_show/id_XMTcwNzU1NzE2.html),以及访问“兰海的分子生物学论坛”(http://www.ranhaer.com )。

首發於2012.08.19,新浪博客
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
现代人类简史(下):末次冰期与全新世
基因说我们都是从非洲来的?这是真的吗?
人類學雜記——4. 我們是北京猿人的後代麼?
用《爱在西元前》的曲调来背诵高中生物的遗传规律
发现文明:连载7
爱新觉罗皇族的Y染色体
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服