馬家窯文化、仰韶文化、磁山文化的地理分布區域。 圖源:參考文獻3
撰文| 楊梟
責編| 陳曉雪
● ● ●
一萬年前,歐亞大陸見證了兩大語系的誕生:西方誕生了印歐語系,東方誕生了漢藏語系,如今,世界上超過60%的人口所講的語言均屬於這兩大語系。漢藏語系分布極廣,從太平洋西岸至內陸的尼泊爾、巴基斯坦,都有漢藏語系的「主講人」。然而,漢藏語系在何時何地誕生一直以來都飽受爭議。
4月25日,《知識分子》介紹了復旦大學金力團隊的研究[1]:通過系統發生學(phylogenesis)方法,研究人員重構了漢藏語系下各個分支的親緣關係,推算出漢藏語系起源於新石器時期的中國北部,大約5900年前的黃河上遊,並且與馬家窯文化和仰韶文化的出現有關。
短短11天之後,《美國國家科學院院刊》(PNAS)發表了一篇相似的研究[2](下簡稱List團隊的研究)。法國東亞語言研究所、德國馬克斯普朗克人類歷史科學研究所、巴黎決策數學研究所組成的科學家團隊同樣採用了系統發生學的研究方法,得出了相似但不同的結論:漢藏語系起源於7200年前的中國北部,並與晚期磁山文化和早期仰韶文化相關。
兩項研究的結論為何有差異?
首先,兩項研究所採用的資料庫不同。在List 團隊的研究中,資料庫由該研究的專家構建,包含50種漢藏語系的分支語言,每種語言約有180個左右的核心詞彙,同時包含了一千多年前的古代語言,包括上古漢語、古緬語、古藏語以及通過田野調查收集的現代語言的一手語料。而金力團隊採用的資料庫由伯克利大學的專家構建,包括109種分支語言,每種語言大約100個詞,但是不包含方言。
在研究方法上,List 的團隊構建並分析了更多種可能發生的譜系,在所有這些譜系中,僅有33%的譜系表明,漢語最先從整個語系中獨立出來;但是在金力團隊的研究中,漢語總是最先獨立,自成一支。
也就是說,List 團隊對於漢語是否最先獨立並無較大把握,但是金力團隊的研究對此更為確定。另一方面,金力團隊的譜系分析結合了系統地理分析,從而探討了語言演化的路徑,如下圖;而List等人考慮了更多與馴化物種相關的詞語。
兩項研究存在諸多差異,因此也得到了不同的結論,還需要進一步的研究才能確定究竟誰的時間判斷更合理。
「兩個獨立的研究團隊,採用不同來源的語言材料,通過計算得到了相近的語言演化歷史,這是非常不容易的,尤其是在語言學這個領域內。我們雙方的結論是相互兼容的,也是可以相互驗證的。」 金力告訴《知識分子》。
通過系統地理學方法,估算漢藏語言原始家園的概率密度。圖源:參考文獻1
新研究的結論如何得出的?
本研究的作者之一、馬克斯普朗克人類歷史科學研究所的遊涵(Johann-Mattis List)博士告訴《知識分子》,在開展研究工作時,兩個團隊知道彼此的工作,但為了確保獨立性,並沒有查看彼此的研究結果。
遊涵(Johann-Mattis List),馬克斯普朗克人類歷史科學研究所高級研究員,曾在復旦大學交換學習。
在這項研究中,List 團隊研發了一套針對性的標註方法,它不僅可以標註出具有相同來源的詞,而且可以標註哪些音是相互聯繫的。然後,通過運用系統發生學方法,推測出它們的歷史關係,構建了它們的譜系。
語言學界認為,語言演化與農業擴張息息相關。當人類進入新石器時代,種植業和畜牧業越發達的部落,其所講語言的地位也會越高。
因此,研究人員特別考察了諸多有關農耕家庭的詞彙,以解釋農業發展與語言演化的關係。在他們所構建的譜系中,至少六項馴化物種可以找到相對應的古詞,包括粟(小米)、豬、綿羊、水稻、牛和馬,如下圖。考古學上,這些物種也的確在當時被馴化。粟、豬、綿羊等詞甚至在7200年前就已經出現在原始語系中,但最早講漢藏語的祖先,並不知道「水稻」。
這些詞語來源於農耕民族,按時間和地點推算,他們屬於晚期磁山文化和早期仰韶文化。與北方起源假說(*)一致,這一語言產生後,主要分化為兩支,東支演化為漢語,而西支則演化出了包括藏語在內的多種語言。
公元前1400年(當時中國為商朝),漢文字誕生,從此東支漢語的傳播勢不可擋,鄰近地區的少數族語很快被同化。而西支則在多樣性上發展壯大,部分原因在於文字產生的較晚,其分支下最早的藏文、西夏文形成於公元764年和1070年。
語言傳播與對應的早期馴化物種。圖源:參考文獻2
語言學研究的新方法
系統發生學(又簡稱譜系學)原本用來研究生物個體的演化歷史,但現在越來越多的學科採用了這一方法。簡單來講,當兩個等位基因出現變異,通過分析它們的特徵,向上建立譜系,找到出現變異的根源,這樣逐層建立,得到一個完整的發生譜系。因為語言演化中也存在譜系,因而越來越多語言學研究開始採用譜系學的方法。
「基於語言譜系,結合群體遺傳學以及進化生物學的分析方法,我們可以更有效地估算這些語言的分化年代,並推測分化地點。這對了解語言的歷史,尤其是史前歷史是非常重要的。」金力告訴《知識分子》。
他同時表示:「國際頂級刊物上連續發表兩篇有關漢藏語系演化的重要文章,也可以反映出國際科學領域對中國語言學的歷史研究也是非常的重視。這是一個非常不錯的開端。我們也希望有更多的不同學科的專家能夠加入到漢藏語系研究的這個行列中。」
List 也抱有相同的期望。「我希望科學界批判性地看待這些結果,並試圖改進這項工作。」他在郵件中回復道:「我們的數據可以自由訪問(https://dighl.github.io/sinotibetan/),任何人都可以閱讀並改進我們對詞語關係的詳細判斷。」
*註:北方起源假說認為漢藏語系起源於大約4000-6000年前中國北方[4];與之相對應的西南起源假說認為,漢藏語系出現在9000年前的中國西南或印度東北部[5]。
參考文獻:
1. Zhang M, Yan S, Pan W, et al. Phylogenetic evidence for Sino-Tibetan origin in northern China in the Late Neolithic[J]. Nature, 2019: 1.
2. Sagart L, Jacques G, Lai Y, et al. Dated language phylogenies shed light on the ancestry of Sino-Tibetan[J]. Proceedings of the National Academy of Sciences, 2019: 201817972.
3. LaPolla R J. The origin and spread of the Sino-Tibetan language family[J]. 2019.
4. LaPolla, R.J. In Areal Diffusion and Genetic Inheritance: Problems in Comparative Linguistics (eds Aikhenvald, A. Y. & Dixon, R. M. W.) 225-254 (Oxford Univ. Press, 2001).
5. van Driem, G. in Trans-Himalayan Linguistics (eds Owen-Smith, T. & Hill, N. W.) 11-40 (de Gruyter, 2014).
| 皮皮魚