点此刷新登录注册

回族佛教

 找回密码
 立即注册
查看: 224|回复: 0

人類學雜記——5. Y染色體在全世界的譜系

  [复制链接]
发表于 2015-10-7 21:21:40 | 显示全部楼层 |阅读模式


人類學雜記——5. Y染色體在全世界的譜系

(溫馨提示:簡化字版本見後。)

本文這些內容其實在視頻裏有所介紹,爲之前沒看過的各位讀者知識構架完整起見,再拿出來說說。這是2008年的Y染色體樹
http://vdisk.weibo.com/s/1WSEF,現在已經有了一定的更新。更新並未對樹有大的改動,基本上是細化,只有少量是位點在樹形中的改變。目前譜系的一個大致情況是(爲了好記,遠未分到目前已知的最細):

A*:Y染色體最古老的分支,只分佈在非洲。
B-M60:只分佈在非洲,如俾格米人。
C-M130:較早期到達東亞的人群,高頻於阿爾泰語系的蒙古、滿、哈薩克等族及澳大利亞
土著等,漢人中通常5 – 10%
D-M174:較早期到達東亞的人群,在西藏、日本等地將近一半,在漢族和南方少數民族也
有較低比例分佈
    D1-M15:藏族及周邊民族較高頻、漢族及南方部分少數民族有較低比例分佈
    D2-M55:僅分佈於日本,占日本40%以上,繩文人的主要成分
    D3-P99:青藏高原東部(康區)、白馬人及納西族等高頻
E:非洲高頻,南歐及中東有一定分佈,中國極少
F*-M89(G至T的祖群):中國零星分佈,個別少數民族高頻
G:土耳其、高加索、哈薩克斯坦西部高頻,中國零星分佈
H:印度次大陸,中國極少
I:主要分佈在歐洲,北歐和巴爾幹高頻,中國極少
J:阿拉伯、猶太人等高頻,中國零星分佈,回族中有一定比例
K*-M9(L至T的祖群):中國零星分佈,個別少數民族高頻
L:西亞至南亞低頻分佈
M:新幾內亞土著和美拉尼西亞
N-M231:較晚期到達東亞的人群。阿爾泰語系、芬蘭人等中高頻分佈,在中國廣泛分佈,
漢人中通常10%以下,部分少數民族中較高頻
    N1c-Tat:烏拉爾語系的標誌性單倍群,中國少量分佈
O-M175:較晚期到達東亞的人群,廣泛高頻分佈於東亞,占漢族75%以上
    O1a-M119:中國東南沿海、壯侗族群、臺灣原住民分佈較集中,東南亞島嶼也有廣泛分佈
    O2-M268:漢族中5%以上
        O2a1-M95:華南、南方少數民族、中南半島及印度Munda人群分佈較多
        O2b-M176:最主要集中於朝鮮半島、朝鮮族和日本彌生人,越南和漢族也有少量分佈
    O3-M122:中國最常見的單倍群,遍及整個東亞和東南亞,占漢族50 – 60%左右
        O3a1c-002611:漢族常見類型,占漢族15%以上
        O3a2b-M7:苗瑤族群特徵類型,通常占漢族5%以下
        O3a2c1-M134:漢族30%左右,廣泛分佈於東亞、東南亞
            O3a2c1a-M117:漢族和藏緬語族的特徵類型,漢族15%以上
P*-M45(Q和R的祖群):很少見
Q-M242:印第安人的絕大部分,北亞一些群體高頻,漢族2%左右
R-M207:印歐語系的主要群體,高頻分佈於歐洲至中亞、南亞,漢族2%左右,中國部分少數民族較高
S:新幾內亞土著和美拉尼西亞
T:印度、中東、地中海、東非等地較低頻分佈

04.jpg

Y染色體在全世界的譜系" title="人類學雜記——5. Y染色體在全世界的譜系" action-data="http%3A%2F%2Fs9.sinaimg.cn%2Fmiddle%2F465ddf79gb65449fb95f8%26690" action-type="show-slide" style="border-width: 0px; list-style: none; width: 104px; height: 589px;">
(圖片可以點擊後放大的)

注意上面的A-T的字母,不全是並列的。A已經發現不是單系羣(monophyly,即不是說一個祖先的所有後代構成的集合),而是旁系羣(paraphyly,即是同一個祖先的後代,但去除了其中一些支系以後構成的集合。)

這裏着重說一下單系羣和旁系羣的定義:“哺乳動物”和“鳥類”都是單系羣,而傳統意義的“爬行動物”不是,爬行動物加上哺乳類和鳥類一起纔是單系羣。而所謂“爬行動物”就是旁系羣。另外還有一種定義,就是複系羣(polyphyly)。複系羣指由不止一支共同祖先的後代構成的集合。或者說這個集合的個體的最近共同祖先不屬於這個集合。例如“溫血動物”(包括鳥類和哺乳類兩支)就是複系羣,因爲恒溫的能力是分別演化來的,而鳥類和哺乳類的最近共同祖先(即在樹上分叉的點)並非溫血動物。一般來說,在一棵演化樹上,最好的分類標準是單系羣。旁系羣在不得已時可以用,而複系羣應當盡量避免。

好了,A*是旁系羣(見《人類學雜記——4. 我們是北京猿人的後代麼?》裏面的Y染色體樹),F*、K*、P*也是旁系羣,而其他的字母的支系目前來看都是單系羣。A-T都是Y染色體亞當的後代;F*-T都是一個有M89突變的人的後代,屬於F;K*-T都是一個有M9突變的的後代,屬於K;而P*-R都有M45的突變,屬於P。對於旁系羣,用一個星号表示。例如屬於F,但不屬於G、H、IJK的支系,寫成F*。具體定義就是F*-M89(xM201,M69,M523)。其中M201、M69、M523分別是G、H、IJK三支的定義位點,x表示去除。請注意,當旁系羣裏面去除的支系不同時,雖然也都能用星号代替,但其表示的定義並不相同。

對於Y染色體的支系命名,規矩是,頭一個字母大寫。後面的是每一層由阿拉伯數字和小寫英文字母交替,通常先發現的支系編號小,後發現的大。支系應該由SNP來定義,需要注意的是,因爲Y染色體的譜系在不斷細化中,某個用SNP定義好的分支的層數會不斷加深,則其支系名稱也會不斷改變。舉個例子,M134定義的支系,在2002年叫O3e;後來2005年左右發現了M324 (O3a)在M122 (O3)下游,M134+改叫O3a5;到了2008年的樹上發現了上游的P201 (O3a3),M134+改叫了O3a3c;到了2011年,因爲又在上游訂正了P164的位置(O3a2c),M134+就改叫O3a2c1了。因此在讀不同年代的數據的時候,需要注意支系名稱對應的到底是哪個版本的樹。比如O3a4,在2005的樹裏面指M7+,而在2008的樹裏指的就是002611+了。因爲不同硏究的精度不同,旁系羣的星号也會有不同含義,比如O3*-M122(xM324)和O3*-M122(xM134)顯然就是不同的,前者在漢族只有2%左右的比例,而後者超過了1/4。

02.jpg
Y染色體在全世界的譜系" title="人類學雜記——5. Y染色體在全世界的譜系" action-data="http%3A%2F%2Fs12.sinaimg.cn%2Fmiddle%2F465ddf79gb6544a19607b%26690" action-type="show-slide" style="border-width: 0px; list-style: none;">

關於分佈,應該說明,不是一個類型在哪個羣體裏比例越高,就越可能是祖先羣體。因爲有始祖效應發生,即本來一個很複雜的羣體,其中少數一些人遷到了遠處,形成了新的人羣,就會有少數幾個始祖的後代占了這個新人羣的很高比例。比如N單倍羣在芬蘭人、雅庫特人等羣體裏面都占了很高比例,但N應該是來源於中國的,而當前漢族的N不到10%,且中國任何一個民族的N也到不了那麼高的比例。所以說,看見N就說是烏拉爾人,看見C就說是蒙古人,看見Q就說是印地安人的說法是不對的,不能把爸爸和兒子攪反了(更嚴格地說,應該是在留在原地的和遷出去的兄弟,而哪兒是爸爸住的地方,不一定容易考察清楚)。

03.jpg
Y染色體在全世界的譜系" title="人類學雜記——5. Y染色體在全世界的譜系" action-data="http%3A%2F%2Fs9.sinaimg.cn%2Fmiddle%2F465ddf79gb65449de7628%26690" action-type="show-slide" style="border-width: 0px; list-style: none;">

要査Y的譜系,可以去ISOGG(國際遺傳譜系協會),http://www.isogg.org/tree/index.html ,這個网站定期更新,位點列得很全,而且能査到支系命名的歷史變化。不過這個純學術网站不知道被什麼腦抽的人封了,要翻牆纔能連上。

當然,詢問各種問題,最好的還是論壇,即“蘭海的分子生物學論壇”,http://www.ranhaer.com,上面有大量資深愛好者,也有幾個專業人士在,歡迎大家註冊和討論。

===============以下是簡化字版本=================

人类学杂记——5. Y染色体在全世界的谱系

本文这些内容其实在视频里有所介绍,为之前没看过的各位读者知识构架完整起见,再拿出来说说。这是2008年的Y染色体树 http://vdisk.weibo.com/s/1WSEF,现在已经有了一定的更新。更新并未对树有大的改动,基本上是细化,只有少量是位点在树形中的改变。目前谱系的一个大致情况是(为了好记,远未分到目前已知的最细):

A*:Y染色体最古老的分支,只分布在非洲。
B-M60:只分布在非洲,如俾格米人。
C-M130:较早期到达东亚的人群,高频于阿尔泰语系的蒙古、满、哈萨克斯坦等族及澳大利亚土著等,汉人中通常5 – 10%
D-M174:较早期到达东亚的人群,在西藏、日本等地将近一半,在汉族和南方少数民族也
有较低比例分布
    D1-M15:藏族及周边民族较高频、汉族及南方部分少数民族有较低比例分布
    D2-M55:仅分布于日本,占日本40%以上,绳文人的主要成分
    D3-P99:青藏高原东部(康区)、白马人及纳西族等高频
E:非洲高频,南欧及中东有一定分布,中国极少
F*-M89(G至T的祖群):中国零星分布,个别少数民族高频
G:土耳其、高加索、哈萨克斯坦斯坦西部高频,中国零星分布
H:印度次大陆,中国极少
I:主要分布在欧洲,北欧和巴尔干高频,中国极少
J:阿拉伯、犹太人等高频,中国零星分布,回族中有一定比例
K*-M9(L至T的祖群):中国零星分布,个别少数民族高频
L:西亚至南亚低频分布
M:新几内亚土著和美拉尼西亚
N-M231:较晚期到达东亚的人群。阿尔泰语系、芬兰人等中高频分布,在中国广泛分布,汉人中通常10%以下,部分少数民族中较高频
    N1c-Tat:乌拉尔语系的标志性单倍群,中国少量分布
O-M175:较晚期到达东亚的人群,广泛高频分布于东亚,占汉族75%以上
    O1a-M119:中国东南沿海、壮侗族群、台湾原住民分布较集中,东南亚岛屿也有广泛分布
    O2-M268: 汉族中5%以上
        O2a1-M95:华南、南方少数民族、中南半岛及印度Munda人群分布较多
        O2b-M176:最主要集中于朝鲜半岛、朝鲜族和日本弥生人,越南和汉族也有少量分布
    O3-M122:中国最常见的单倍群,遍及整个东亚和东南亚,占汉族50 – 60%左右
        O3a1c-002611:汉族常见类型,占汉族15%以上
    O3a2b-M7:苗瑶族群特征类型,通常占汉族5%以下
    O3a2c1-M134:汉族30%左右,广泛分布于东亚、东南亚
        O3a2c1a-M117:汉族和藏缅语族的特征类型,汉族15%以上
P*-M45(Q和R的祖群):很少见
Q-M242:印第安人的绝大部分,北亚一些群体高频,汉族2%左右
R-M207:印欧语系的主要群体,高频分布于欧洲至中亚、南亚,汉族2%左右,中国部分少数民族较高
S:新几内亚土著和美拉尼西亚
T:印度、中东、地中海、东非等地较低频分布

01.jpg
Y染色體在全世界的譜系" title="人類學雜記——5. Y染色體在全世界的譜系" style="border-width: 0px; list-style: none; width: 104px; height: 589px;">
(图片可以点击后放大的)

注意上面的A-T的字母,不全是并列的。A已经发现不是单系群(monophyly,即不是说一个祖先的所有后代构成的集合),而是旁系群(paraphyly,即是同一个祖先的后代,但去除了其中一些支系以后构成的集合。)

这里着重说一下单系群和旁系群的定义:“哺乳动物”和“鸟类”都是单系群,而传统意义的“爬行动物”不是,爬行动物加上哺乳类和鸟类一起才是单系群。而所谓“爬行动物”就是旁系群。另外还有一种定义,就是复系群(polyphyly)。复系群指由不止一支共同祖先的后代构成的集合。或者说这个集合的个体的最近共同祖先不属于这个集合。例如“温血动物”(包括鸟类和哺乳类两支)就是复系群,因为恒温的能力是分别演化来的,而鸟类和哺乳类的最近共同祖先(即在树上分叉的点)并非温血动物。一般来说,在一棵演化树上,最好的分类标准是单系群。旁系群在不得已时可以用,而复系群应当尽量避免。

好了,A*是旁系群(见《人类学杂记——4. 我们是北京猿人的后代么?》里面的Y染色体树),F*、K*、P*也是旁系群,而其他的字母的支系目前来看都是单系群。A*-T都是Y染色体亚当的后代;F*-T都是一个有M89突变的人的后代,属于F;K*-T都是一个有M9突变的人的后代,属于K;而P*-R都有M45的突变,属于P。对于旁系群,用一个星号表示。例如属于F,但不属于G、H、IJK的支系,写成F*。具体定义就是F*-M89(xM201,M69,M523)。其中M201、M69、M523分别是G、H、IJK三支的定义位点,x表示去除。请注意,当旁系群里面去除的支系不同时,虽然也都能用星号代替,但其表示的定义并不相同。

对于Y染色体的支系命名,规矩是,头一个字母大写。后面的是每一层由阿拉伯数字和小写英文字母交替,通常先发现的支系编号小,后发现的大。支系应该由SNP来定义,需要注意的是,因为Y染色体的谱系在不断细化中,某个用SNP定义好的分支的层数会不断加深,则其支系名称也会不断改变。举个例子,M134定义的支系,在2002年叫O3e;后来2005年左右发现了M324 (O3a)在M122 (O3)下游,M134+改叫O3a5;到了2008年的树上发现了上游的P201 (O3a3),M134+改叫了O3a3c;到了2011年,因为又在上游订正了P164的位置(O3a2c),M134+就改叫O3a2c1了。因此在读不同年代的数据的时候,需要注意支系名称对应的到底是哪个版本的树。比如O3a4,在2005的树里面指M7+,而在2008的树里指的就是002611+了。因为不同研究的精度不同,旁系群的星号也会有不同含义,比如O3*-M122(xM324)和O3*-M122(xM134)显然就是不同的,前者在汉族只有2%左右的比例,而后者超过了1/4。

05.jpg
Y染色體在全世界的譜系" title="人類學雜記——5. Y染色體在全世界的譜系" style="border-width: 0px; list-style: none;">

关于分布,应该说明,不是一个类型在哪个群体里比例越高,就越可能是祖先群体。因为有始祖效应发生,即本来一个很复杂的群体,其中少数一些人迁到了远处,形成了新的人群,就会有少数几个始祖的后代占了这个新人群的很高比例。比如N单倍群在芬兰人、雅库特人等群体里面都占了很高比例,但N应该是来源于中国的,而当前汉族的N不到10%,且中国任何一个民族的N也到不了那么高的比例。所以说,看见N就说是乌拉尔人,看见C就说是蒙古人,看见Q就说是印地安人的说法是不对的,不能把爸爸和儿子搞反了(更严格地说,应该是在留在原地的和迁出去的兄弟,而哪儿是爸爸住的地方,不一定容易考察清楚)。

06.jpg
Y染色體在全世界的譜系" title="人類學雜記——5. Y染色體在全世界的譜系" action-data="http%3A%2F%2Fs9.sinaimg.cn%2Fmiddle%2F465ddf79gb65449de7628%26690" action-type="show-slide" style="border-width: 0px; list-style: none;">

要查Y的谱系,可以去ISOGG(国际遗传谱系协会),http://www.isogg.org/tree/index.html ,这个网站定期更新,位点列得很全,而且能查到支系命名的历史变化。不过这个纯学术网站不知道被什么脑抽的人封了,要翻墙才能连上。

当然,询问各种问题,最好的还是论坛,即“兰海的分子生物学论坛”,http://www.ranhaer.com,上面有大量资深爱好者,也有几个专业人士在,欢迎大家注册和讨论。

首發於2012.01.12,新浪博客

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

科学无神论上一条 /2 下一条

回族佛教网

Copyright ©2014 回族佛教 All Right Reserved.  Powered by Discuz!  ( 陕ICP备05010893号-1 )

本站信息均由会员发表,如侵犯了您的权利请发帖投诉 分享按钮

快速回复 返回顶部 返回列表