語言學和遺傳學結合,給中華文明探源打開新窗口

2020-12-11 觀察者網

4月25日,《自然》雜誌發表了復旦大學金力院士團隊的《語言譜系證據支持漢藏語系在新石器時代晚期起源於中國北方》一文。這篇論文揭示了世界第二大語系漢藏語系起源及分化的時間和地點,引起了學術界的廣泛討論。對此,觀察者網採訪了論文團隊的重要成員,復旦大學人文社會科學數據研究所東亞語言數據中心負責人潘悟雲教授。

(採訪/觀察者網 武守哲)

觀察者網:潘悟雲教授您好,很高興有這樣一個機會就漢藏語系起源和華夏文明探源問題對您做一個採訪。一直以來,對漢藏語系分化時間以及起源地點存在兩種假說。 「北方起源假說」認為它起源於大約4000年-6000年前中國北方的黃河流域,而「西南起源假說」則認為它起源於至少9000年前的東亞西南部某地。這篇論文出來之後,可不可以說支持「北方起源假說」的一派在學術界將有壓倒性的優勢?

潘悟云:有關漢藏語系起源的假說就像你提到的那樣,主要就是兩種,之前的主流意見也是「北方說」。像美國的馬提索夫,包括國內的許多學者,認為黃河中上遊,也就是陝西甘肅寧夏一帶是起源地;另外一種以歐洲的van Dream教授為代表,提出中國西南到印度東北這一帶地方是起源地。

這兩大派有關起源地點的論述,其實本質上還是一種猜想,用的是傳統的那種語言歷史比較法。其缺陷是不能解決時間和地點的互動問題,兩派爭來爭去,結論卻大相逕庭。

潘悟雲教授在上海高校比較語言學E-研究院接受了觀察者網的採訪

語言就像一棵樹,枝幹上有樹杈,一支又一支生出來,可以表示語言之間的關係,但發源在什麼地方,什麼時間,沒辦法搞定。一直到20世紀,美國的斯瓦迪士提出一個新的方法——語言年代學,才開始確定語言的發生年代。

地質學用碳14測定年代。碳14是放射性物質。活生物體內的碳14和空氣進行交換,含量是固定的,死了之後碳14的含量會越來越少,碳14衰減的速度是恆定的,根據碳14的現存含量與衰減速率,就能算出該生物的死亡時間。

同源的兩種語言,原來的詞彙是一樣的。分開來以後,詞彙就會發生變化,如上古漢語中的 「首」變成了「頭」,「口」變成了「嘴」,「目」變成了「眼」。如果語言的變化速度也像碳14那樣是恆定的話,根據兩種語言中現存同源詞的多少,就可以知道其分化的時間。

斯瓦迪士根據很多語言的統計,認為語言核心詞的變化速度是一樣的。統計兩種語言中現在的同源詞數與變化速率,就可以算出這兩種語言到底在什麼年代開始出現分化的,這就是語言年代學的基本原理。

按照這個理論框架,有人也計算過漢語和藏語分開的時間,但是引發學界不少人的批評。批評者認為,語言演變的速度並不是恆定的,戰爭頻仍、移民複雜的年代,比如魏晉和唐宋時期,都會導致語言變化的加快。核心詞彙的變化也有快慢的不同,自然現象、身體部位名稱變得慢一點,數詞、代詞的變化相對較快。這就給語言年代學提出了挑戰。

我們現在採用的是更先進的貝葉斯系統發生學的方法。這個方法原來用在生物學上面,認為物種的演進也有快有慢,這也影響了語言學。

漢藏語系中109種語言的譜系樹

前幾年,在《Science》和《Nature》上發了好幾篇用這個方法解釋印歐語、南島語分化的文章。我們看了以後,認為漢藏語的研究也可以借鑑這個方法。漢藏語 「北方起源說」還是一種猜想,我們的目的是要把它定下來,也就是從猜想到實證,要用科學的數學方法把它計算出來。

結果出來後,主流派非常高興,因為我們的研究結果支持了他們的猜想——漢語分化出來的時間大約就在5900年前,地點是黃河中上遊,能和仰韶文化和馬家窯文化對接起來。

中國有中華文明五千年之說,但國外並不承認。甲骨文至今也只有3000多年,再往上就沒有記錄了,夏文化以及黃帝、炎帝等等在西方人看來是一種傳說,國際上無法認定為「史」。中華文明五千年根據在哪裡?「中華文明探源工程」主要根據考古發掘。全國各地有許多挖的出來的文化遺址,如仰韶文化、良渚文化,馬橋文化等等。良渚文化尤其值得一提,它已經有城市的形態了,是一個較高文明的象徵。

仰韶文化與馬家窯文化

通過考古挖掘和對各種遺址的斷定,「中華文明探源工程」認為中華文明大約有5800年,我們計算的結果是漢語出現在5900年,和考古的考證基本差不多。我們沒有直接參用考古的材料,僅通過語言分析,得出相近的結果。這個工作的意義很大,可以說,我們是對「中華文明探源工程」的細化。

觀察者網:您現在的這個領域跨了多個學科——生物學,遺傳學和語言學。在國內,這幾個學科越來越緊密地走到一起,大約是在什麼時候?

潘悟云:90年代。復旦大學的金力院士採集了大量的東亞人基因10萬例,得出結論:整個東亞地區的各個人種都是從非洲來的。這就完全推翻了中國人來自「北京猿人」的假說,金力院士研究發現北京猿人的後代都死光了,而東亞族群都來自非洲,這個結論很有震撼性,而且在世界上也得到了廣泛承認。

現在學術界的主流看法是,400萬年前人類的祖先從非洲開始了第一批擴散,之後出現了北京猿人,尼安德特人、爪哇人等等。這些古人類都沒有傳下來,比如北京猿人經受不起冰川期的變化,尼安德特人在3萬年前還有,但最終也沒有留下來。後來,在非洲東部進化出現代人,並在十萬年前向全世界各地擴散。現在看起來外表很不一樣的現代人種其基因大部分都是一樣的,是現代人走出非洲以後繁衍的後代。金力教授通過他的研究,發現東亞人群來自非洲。北美的印第安人大約是1萬多年前通過白令海峽從東亞遷過去的,絕大多數的生物學家和遺傳學家都認可這個觀點,儘管還有極少數人反對。

周口店遺址博物館門口的「北京猿人」雕像

但是遷徙到中國的這一批非洲人走的路線,以及到底是怎麼變化的,要通過基因上一個個位點的比對來判定。由基因關係畫出的樹狀圖,我們會發現漢族和藏族是最接近的,相對來說,漢族和苗族、瑤族、侗族要遠一些。

剛才我們講到「同源詞」這個概念,和生物學上的基因測定非常類似。如果兩種語言的同源詞越多,就說明這兩個語言非常接近。越少,則它們的關係就越疏遠。由此可以畫出它們的譜系圖,還可能進一步說明它們分化的時間和路線。

所以我們需要反思一下「人」這個概念,他區別於動物的一個顯著的標誌就是語言,有了語言,才有文字,有了文字,才有文獻,這樣人類的智慧才能一代代的傳下去。動物靠進化,人類靠文化。

1996年金力教授寫了一篇關於東亞人來自非洲的文章登在《文匯報》上,我看了之後非常感興趣。

之前我們認為亞洲大陸有好幾個語系:阿爾泰語系、漢藏語系、南亞語系和南島語系,曾認為這些語系是毫無關係的。之前所以這麼認為,是認為說這些語言的人種沒有什麼發生學上的聯繫。比如爪哇猿人和北京猿人沒什麼關聯,完全是兩個人種,所以他們後裔的語言也應該是兩種不同的語言。但是後來我們發現南島語系和漢語其實是有關係的,尤其是一些核心詞。比如說,女性生殖器很重要,涉及到人類的繁衍。女性生殖器國內講的最多的發音就是pi,現在的南島語也說pi;女性的乳房也很重要,因為這和哺育後代息息相關,上古漢語的發音是nio,南島語是nu,是很接近的。

漢語中大量的核心詞和南島語系的相似,會給人一個猜想,這兩種語言是不是有同一個祖先?我當時百思不得解的是,如果漢藏與南島人種沒有發生學上的關係,大量的核心詞為何如此相似呢?看到金力教授的文章以後,就恍然大悟,原來他們都是從同一祖先演化來的。我們很快見面了,並且開始了合作,通過語言學和遺傳學共同探討東亞人群、語言、文明的產生和演化。

在那個時候,國家有一個「三代斷代工程」,也是想解決中華文明的起源問題。

觀察者網:這個工程在學術圈後來爭議性比較大。

潘悟云:所以我們和金力院士商量,能不能走另外一條路,從生物遺傳學與語言學角度去觀察中華的文明,也許有更可靠的一面。

後來,金力教授主持了復旦大學的現代人類學的重點實驗室,這個實驗室是跨學科的,包括生物、考古、語言、歷史等多個方面,我也一直擔任他們的語言學顧問。發表在《自然》雜誌上的這篇文章是我們多年合作的一個成果。

觀察者網:您剛才提到,生物遺傳學和語言學的研究結果,如果比較吻合,那麼結論就更加可靠了。有沒有這樣一種可能,就是兩種方法最終的結果沒有走到一起,發生了比較大的分歧,那麼這個狀況會怎麼處理?

潘悟云:這種情況當然是可能會有的,因為雙方都有自己的方法與材料,都會做出自己的「樹形圖」,結果可能會有偏差。

語言學的「樹形圖」是根據同源詞畫的。例如,太陽這個詞,漢語最早是「日」,上古讀njit。藏語的太陽是nima,ma是後綴,ni是詞根。上古漢語的nit,與藏語的ni非常接近,一眼就能看出它們之間的同源關係。

但是「七」在各種語言中的同源關係就很難看出,普通話讀thi,羌族讀in,景頗語讀anit,彝語讀s,它們之間的同源關係就不是一眼能看出,需要語言學家作系統的比較、分析,才能得出同源結論。如果不經分析就否定它們之間的同源關係,這樣的例子多了自然就會影響到譜系樹的正確性。

遺傳學上也會有這種情況,基因測定也會受到其它因素的幹擾。但是,至今我們看到遺傳與語言算出來的結果大部分是一致的。

觀察者網:說到到概率和統計學的話,必然涉及到樣本的問題,也就是核心詞群的大小,這個樣本的廣度會不會影響對結果的判定?

潘悟云:當然是樣本越多,統計越精確,但工作量也相應地就非常大了,所以我們這篇論文只選取了98個核心語義,在美國馬提索夫的STEDT資料庫中選取了109種語言,不算前期的材料處理,光是最後的運算,在4核8線程的電腦上就連續運行了4天。我們今後會打算擴大統計樣本,以求得更精確的結果。

觀察者網:現在有個通行的說法,認為秦漢以後漢語的分支變少了,是和「書同文」有關。相比之下,歐洲始終未能形成統一的語言,比如歐盟各國有20多種語言,怎麼看待這現象,是個政治歷史相關嗎?

潘悟云:這涉及到對語言的理解。我們認為上海話和廣東話是一種語言,只不過是漢語的兩個方言,而一些西方學者則會認為它們是兩個不同的語言。

今天的歐盟有23種官方語言

有一次我問挪威一位科學院的院士,挪威和丹麥語之間的距離,有沒有北京話和天津話那麼大?他說沒有,挪威語和丹麥語的距離大概是北京西城和東城的差距差不多。但大家都認為它們是兩種語言。

觀察者網:最後一個問題,能否透露一下,您和金力教授這個團隊在未來進一步研究的具體方向是什麼?

潘悟雲:終極的方向,是各個學科通力合作,搞清楚整個東亞人群、文明的演化面貌。現在我們研究歷史,往往都在研究「史後史」,也就是有文字以後的歷史。

文明史或者信史有文獻作為根據,但是這個歷史對我們來講還是太「近」了,只有3000多年。其他民族的文獻出現更晚,藏文出現是7到9世紀,緬甸11世紀,泰國是13世紀。還有其他好多民族是沒有文字的,那麼研究他們的信史就更困難。

金力團隊合照,左起:嚴實博士、金力院士、潘悟雲教授、張夢翰博士

人類的祖先走出非洲,到了東亞已經幾萬年了,這幾萬年的歷史都是我們研究的對象。當然,在沒有文獻的情況下還可以依靠考古。但是考古發現有空間的限制,不可能在任何地方挖下去就一定能挖出個遺址來。但是,人類的智慧還可以想出其他的方法。人類的身上都有基因與語言,這是我們每個人身上的歷史記錄。

現代人的基因是古代人基因演化的結果,現代人的語言也是古代語言演化的結果,依靠遺傳學與語言學的知識,我們可以從現代人的基因與語言推測古代人的基因與語言,畫出演化譜系樹。最後我們能推動人類學的發展。人類學分為分子人類學、語言人類學、文化人類學、體質人類學等等,我們可以從好幾個窗口來觀察有文字以前的東亞史的文明起源和發展。

當然,語言學和生物學還有自己的目的。通過上述的研究還有可能使歷史語言學更新換代,這是我們在語言學領域的目標。

觀察者網: 在未來,日本韓國的學者也會加入進來研究整個東亞的文明探源項目嗎?

潘悟云:漢語與和日語、韓語的關係非常密切,有人統計韓語中70%借自漢語,日語漢借詞佔到50%。明治維新之後,日本接觸西方文化,利用漢字造出了很多新詞,又反過來傳到中國。

如果從東亞人群共源的角度看,我們會看到日、韓與大陸各語言之間更久遠的淵源關係。土地這個詞,東亞各語言幾乎都有共同的來源。漢語的「野」,上古發音為la。「土」上古讀khla,現在某些北方方言,把土還叫做土坷垃,坷垃就是「土」的上古讀音的遺留。

朝鮮的新羅,sai-la,sai就是新,la就是土地的意思,翻譯成英語就是new land。日語的訓讀字 「原」,原野的意思,日語讀作ha-la,ha在日語中是古日語的pa來的,ha-la就是pa-la,就是土地的意思。中國東北古代叫夫餘,上古讀音bala,也是土地的意思。突厥語中的dala(野外),南島語bala,苗瑤語的la,都是土地的同源詞。這些材料說明,從非洲來到亞洲大陸的這批人,一開始是同一批人。土地對人類來說太重要了,人類逐水土而居,離不開土地,所以說土地是核心詞中的核心詞,最不容易丟失基因,永遠刻在人類的內心中。

中、日、韓的語言關係源深流長,當然會引起三地學者的共同興趣。

觀察者網:聽了您的講述,受益匪淺,感謝您抽出寶貴時間接受我們的採訪。

本文系觀察者網獨家稿件,未經授權,不得轉載。

相關焦點

  • 探文明之源 尋民族之魂——解碼「中華文明探源工程」成果
    28日,由中國社科院考古研究所、北京大學考古文博學院牽頭,聯合近70家科研院所、高等院校和地方考古研究機構共同參與的「中華文明起源與早期發展綜合研究」(簡稱「中華文明探源工程」)發布成果,揭開中華文明源頭的神秘面紗,書寫華夏兒女共同的「家譜」。
  • 什麼是文明探源,我們探到了什麼?
    這幾年,我們經常提到「文明探源」這個關鍵詞,它的實施主體,便是中華文明探源工程,全名「中華文明起源、形成和早期發展綜合研究」,這是繼國家「九五」重點科技攻關項目——「夏商周斷代工程」之後,又一項由國家支持的多學科結合研究中國古代歷史與文化的重大科研項目。 如今,「中國」二字已逐漸清晰了起來。
  • 中國語言學研究成果首登《自然》主刊 金力團隊揭示漢藏語系起源於...
    本報訊近日,金力院士團隊宣布,綜合運用語言學和遺傳學等多學科交叉的分析方法,揭示了世界第二大語系漢藏語系起源及分化的時間和地點。該研究為探尋中華文明的起源和發展歷程,了解中國及周邊鄰國的各漢藏語系語言之間的演化關係提供了重要依據,為認識東亞人群遷移歷史提供了重要啟示。
  • 中國語言學研究成果首登《自然》,金力團隊揭示漢藏語系起源
    近日,復旦大學金力院士團隊宣布,綜合運用語言學和遺傳學等多學科交叉的分析方法,揭示了世界第二大語系漢藏語系起源及分化的時間和地點。該研究為探尋中華文明的起源和發展歷程,了解中國及周邊鄰國的各漢藏語系語言之間的演化關係提供了重要依據,為認識東亞人群遷徙歷史提供了重要啟示。
  • 文明探源的科學性思考
    當下,文明與早期國家探源是我國學術界的一個熱點,特別反映在夏朝之爭以及如何認識中華五千年文明的問題上。目前對於一些關鍵問題的看法往往眾說紛紜,甚至針鋒相對,特別是中外專家之間的立場判然有別。我覺得,許多爭論的產生,不是研究對象有什麼難度或多麼複雜,而是我們的思路和解決問題的方法存在問題。
  • 探源良渚文明的閃耀「星鬥」——梅嶺玉遺址
    與此同時,市文體廣電和旅遊局以此次大會的召開為契機,牽頭與中國考古學會新石器時代考古專業委員會、江蘇省考古學會、江蘇省考古研究所、南京大學文化與自然遺產研究所合作,啟動了溧陽文明探源工程。關於梅嶺玉的詳細數據和資料還有待進一步探究,相關考古工作剛剛起步、任重道遠。同時,建議把梅嶺玉遺址考古納入「考古中國」文化探源工程。
  • 考古實證中華5000年文明!
    2001-2003年,實施了探源工程預研究。2004-2015年,探源工程由科技部批覆,國家文物局負責組織,依託「十五」國家科技攻關計劃、「十一五」和「十二五」國家科技支撐計劃,已實施4個階段的研究工作。2016年中華文明探源工程4期完成結項。
  • 考古實證中華文明五千年 填補世界文明史空白
    」(簡稱「中華文明探源工程」)成果發布會在國務院新聞辦公室舉行,國家文物局副局長關強介紹了相關情況。「中華文明實際是在黃河、長江和西遼河流域等地理範圍內展開並結成的一個巨大叢體。」探源工程負責人之一、北京大學考古文博學院教授趙輝說,「這個叢體內部,各地方文明都在各自發展。在彼此競爭、相對獨立的發展過程中,又相互交流、借鑑,逐漸顯現出『一體化』趨勢,並於中原地區出現了一個兼收並蓄的核心,我們將之概括為『中華文明的多元一體』。」
  • ——講述文明探源歌舞劇《甲骨文》背後的故事
    跌宕起伏的故事、精緻華麗的舞美、氣勢恢宏的場景……12月15日,全省首部以商朝末年真實歷史故事為原型的文明探源歌舞劇《甲骨文》在市職工文體中心首演。數百名觀眾仿佛跟隨劇情中考古隊員的追溯進行了一場穿越時空的旅行,一同見證甲骨問道、十祀徵夷、羑裡八卦、天命歸周,在音樂、光影、舞蹈之中,探尋殷商王朝的奧秘。
  • 中華文明的發展節奏與中華民族的偉大復興
    我國歷史研究的最新成果和幾十年的成果積累,為習近平同志關於中華文明系列重要論述鋪墊了豐厚的研究基礎,提供了有力的理論支撐。  2018年5月28日,「中華文明起源與早期發展綜合研究」(簡稱「中華文明探源工程」)最新成果發布後,《人民日報》載文指出:「中華文明探源工程用豐富的證據和科學的研究揭示出中華文明獨立起源 的客觀事實,使『中華文明西來說』等謬論不攻自破。
  • 為什麼說伏羲打開了中華文明之門,神農種下了中華文明之根
    這也是我國遠古文明一直是「聖人」文明的原因,因為彼時的確是極少數天資卓絕的道德完人,帶領普羅大眾向前邁步的歷史時期。八卦的發明與使用,說明當時的人類不僅可以發現天地之間的規律,而且可以用符號來表徵這些規律,並進而應用這些規律。所以說,文明的真實含義就是用八卦這樣的文系統來指導人類社會實踐的過程。這在中國文化裡是這麼表述的:「剛柔相摩,謂之天文,文明以止,謂之人文」。
  • 二〇二〇,南陽考古新發現——探源先夏文化 追尋文明源起
    文明,又是如何點亮第一束光並一路閃爍走到今天?這些答案,就深藏在那些層層疊起的文化層裡,也深藏在那些我們已知和更多未知的巖石上的遠古史詩裡。正是考古人孜孜以求的發掘和探尋,把我們的目光一再拉長至更久遠的歷史深處。
  • 在這裡,致敬中華文明的根與魂——走近二里頭夏都遺址博物館
    光明日報記者 王勝昔 光明日報通訊員 郝永飛  位於河南省偃師市的二里頭夏都遺址,是「中華文明探源工程」與「夏商周斷代工程」的重要遺址。中國社科院二里頭考古工作隊在此蹲點堅持考古60年,刷新了中國考古界一系列第一。
  • 從考古發現看中華文明起源:世界最早水稻在哪
    具有悠久歷史的中華文明是如何起源的?它經歷了怎樣的發展歷程?為了回答種種問題,2000年,中華文明探源工程啟動。  目前,探源工程第三階段工作即將開始,經過多年的工作,在大量考古發現的基礎上,最早的中國正在一點一點揭開她神秘的面紗。
  • 「中華母親節城市聯盟」探源之行在甘肅順利接棒
    11月25日至27日,由西安市社會科學院和西安市華胥文化研究會組成的 「中華母親節城市聯盟」甘肅探源之行聯合課題組赴甘肅考察學習,這是繼11月9日山西探源之行順利啟動後,又一次滿載收穫的考察學習之旅。趙傑部長向我們介紹了華池悠久的歷史和深厚的文化,溫磊副部長對課題組的本次活動表示了高度認同,他認為倡議設立「中華母親節」是順應時代發展需要的舉措,中華文化博大精深,源遠流長,需要佔領自己的文化陣地,設立中華母親節是堅定文化自信的需要,有利於激發中華兒女發自內心的信仰。此外,考察組還參觀了南梁法官教育基地馬錫五審判方式陳列館和華池縣博物館。
  • 「中華母親節城市聯盟」河北探源之行
    走進邯鄲市中國女媧之鄉媧皇宮寒冬雖至,熱情不減,12月14日至15日,由西安市社會科學院和西安市華胥文化研究會組成的 「中華母親節城市聯盟」河北探源之行聯合課題組赴河北邯鄲市考察學習,這是繼山西、甘肅探源之行後又一次尋根探祖之旅
  • 中華書局 | 語言學聯合書單2020年度書單(留言贈書)
    ,讓「小眾」而有趣的語言學走近大眾。 中華書局1963年以陳昌治本為底本,印行《說文解字附檢字》,2013年重新製版,出版了《說文解字附音序、筆畫檢字》。發行以來,深受讀者歡迎之外,也收到讀者反饋。應讀者之需,我們請陶生魁先生加以整理,採用新式標點符號,結合反切給字頭加注了漢語拼音,製作了所有字的音序和筆畫索引,以方便讀者。