科學家們運用遺傳學領域的研究方法研究語言的演變,得出結論說,印歐語系的發源地在今天的土耳其境內。
一個偉大的理論,往往能用在很多領域。比如,和愛因斯坦的相對論一樣,達爾文的進化論也有狹義和廣義之分。狹義進化論指的是生物進化理論,廣義進化論的基本原理和狹義的相同,但應用涵蓋要廣得多,在很多領域都可以用到。
簡單來說,任何一樣東西,只要滿足以下四個條件,就可以用進化論加以解釋:一、可以複製自己;二、複製時偶爾會出現差錯;三、不同的差錯有不同的成活率;四、差錯可以被繼續複製下去。
顯然,DNA分子是完全滿足這四個條件的。除此之外,信息在人群中的傳播也滿足這四個條件,這就是為什麼英國科普作家理察·道金斯(Richard Dawkins)在《自私的基因》一書的最後一章裡發明了「密母」這個新概念來形容信息的傳播,他認為信息可以分成一個個難以分割的小單元,和基因很相似,密母(Meme)這個詞就是在基因(Gene)的基礎上生造出來的。
語言也是信息的一種,語言的演變史是否可以用生物進化的思路去研究呢?傳統語言學家反對這種做法,但新一代研究者卻早已迫不及待了。紐西蘭奧克蘭大學(University of Auckland)計算機專家羅素·格雷(Russell Gray)教授和他領導的一個研究小組試圖把遺傳學的研究方法移植到語言學研究當中去,取得了革命性的突破。
語言學研究的熱點之一就是印歐語系的起源問題。印歐語系是世界上使用人數最多的語系,廣泛分布於歐洲、西亞和南亞地區。關於印歐語系的起源有兩種理論:一種理論認為它起源於黑海北方的大草原(Pontic Steppes),大約在6000年前被一個名叫庫爾幹(Kurgan)的遊牧民族帶到了其他地方;另一種理論認為印歐語系起源於安納託利亞(今土耳其),是在8000~9500年前伴隨著農業的傳播而散布到世界各地的。
前一派的主要論據來自動植物詞彙,他們假設一種語言中如果出現了只在特定地區才有的動植物名稱,比如「鮭魚」和「山毛櫸」之類,那麼這種語言就很可能起源於該地。但是反對派則認為,因為氣候變化等原因,古代動植物的分布情況很可能和現在大不相同,因此這個方法很不可靠。
那麼,有沒有可能運用遺傳學分析中所使用的數學工具來研究語言的起源呢?眾所周知,基於DNA順序變化的數學分析法可以用來推測生命進化的順序和時間,數學家們只要假定DNA突變的概率是固定的(很容易找到符合這個要求的DNA片段),就可以通過簡單的數學計算分析出兩種不同物種的共同祖先是誰,以及何時分家的。這樣的分析程序已經發展了幾十年,相當成熟。
2003年,格雷教授用這個方法分析了200個所有語言裡都會有的詞彙,比如「我」和「天空」等,然後將它們在各種語言中的變體用數學的語言加以定義,再輸入到現成的遺傳學分析程序中分析,得出結論說,印歐語系的各種語言分家的時間大約在7800~9800年前,符合第二種假說。
這篇論文發表在當年出版的《科學》(Science)雜誌上,引起了很大爭議。這個方法只分析出了語言分家的時間,得出的結論相當原始。格雷的學生昆汀·阿特金森(Quentin Atkinson)繼承了老師的衣缽,採用流行病研究領域常用的一款分析軟體,找出了印歐語系的確切誕生地。
在流行病學領域,很多時候需要醫生們通過分析各地採集的樣本,推斷某種病菌或病毒源自哪裡。這不光是遺傳問題,還涉及地理學。比如,如果兩個地方相隔很遠,或者隔著一道山峰,病菌是很難直接傳播過去的。因此,研究人員必須想辦法把地理信息轉變成計算機語言,和遺傳信息混在一起進行分析。經過科學家多年努力,這種分析方法已經很成熟了,有了專門的分析軟體。阿特金森仿照上次的方法,把語言的變化和地理數據同時輸入到計算機中,得出的結論明顯支持安納託利亞起源說。
這篇文章發表在今年8月24日出版的《科學》雜誌上。阿特金森對記者說,他採用的方法叫做貝葉斯種群地理研究法(Bayesian Phylogeographic Approaches),此法雖然很抽象,也很另類,但它正在得到越來越多的語言學家的支持,前景一片光明。
閱讀更多更全周刊內容請微信掃描二維碼成為中讀VIP,閱讀期期精彩內容!
版權聲明:凡註明「三聯生活周刊」、「愛樂」或「原創」來源之作品(文字、圖片、音頻、視頻),未經三聯生活周刊或愛樂雜誌授權,任何媒體和個人不得轉載 、連結、轉貼或以其它方式使用;已經本刊、本網書面授權的,在使用時必須註明「來源:三聯生活周刊」或「來源:愛樂」。違反上述聲明的,本刊、本網將追究其相關法律責任。