語言|最早的語系:沒有人群遷徙,就沒有語言大規模的傳播

2021-01-13 騰訊網

本文來源:[澳]彼得·貝爾伍德 《最早的農人:農業社會的起源》

轉自:語言學人

電影《瘋狂原始人》(The Croods 2013)畫面

愛心提示

由於微信公號改版不再按時間流推送,互動少的讀者會逐漸接收不到(及時)推送。

為防失聯,及時看到新內容,推薦大家或可設個星標,或是多點在看留言

感恩大家一直以來的支持,期待更多好內容能與大家準時相遇。

01

語系發生及其網絡:「語言區」,或「語系樹」

語言學家以及那些對比較歷史語言學感興趣的歷史學家、考古學家和人類學家,都傾向於認為語系的歷史有兩種類型:一個是從母語言到子語言的系統發育過程(即「語系樹」模式),另一個是共同進化模式,強調相鄰語言之間的互動作用(即「語言區」模式)。

語言學家鮑勃·迪克森認為,語系的存在是由於語言短期內間斷性擴張所致語系表現出共同的區域語言特徵,這則是長期持續互動和借用過程的結果。正如他所說:「每種語言都有可能與其他語言有兩個相似之處:第一個是基因的相似性,它們出自同一種原始語言;第二個是地域的相似性,這是因為各語言在地理上相鄰,相互借用造成的」。還有第三個可能,即巧合導致的相似,但這一條對於我們的討論無關緊要。

在印歐語和南島語這樣的大語系中,以上兩個過程造成的結果非常顯著。相距動輒成千上萬千米的一些語言,卻具有顯而易見的種系親緣關係。例如,英語和孟加拉語,馬來語和大溪地語,納瓦霍語和加拿大的阿薩巴斯語。另一方面,在一些特定區域,不同語系表現出共同的區域特徵。語言學家討論較多的這類「語言區」包括印度次大陸、中美洲、巴爾幹半島和亞馬遜盆地。然而,需要強調的是——這些區域內的語言,儘管存在互動,但一直保持它們自身的種系關係。比如,我們並沒有在印度次大陸發現存在結構和詞彙上混合了印歐語、達羅毗荼語、藏緬語和南亞語而無法分類的語言。另一個研究很充分的案例是亞馬遜的沃佩斯(Vaupes)地區,那裡的一些群體甚至實行異語外婚制(即人們必須和來自其他語言族群的人通婚),然而,儘管本地語系存在結構趨同和普遍的多語現象,但類似阿拉瓦語和圖卡諾語這樣的語系在種系上仍然保持內在的一致性。

亞馬遜流域 圖源:《亞馬遜萌猴奇遇記》

另一個重要的基本概念是新語系的最初形成。按照迪克森的看法,新語系的形成相當之快。由於內部(遺傳因素)和外部(地理因素)兩個方面的原因,語言一直處於持續變化中。比較一下盎格魯撒克森英語、喬叟的英語直到E.M.福斯特的英語,或者將現代羅曼語(Romance)諸語言與其共同的祖先拉丁語相比較,就明確無誤地證明了這一點。因為這個理由,可以推斷,那些分布範圍廣大的語系,例如印歐語系和南島語系,應該是在距今很近的年代就達到了目前的地理範圍,它們當今所有的語言分支仍然表現出擁有共同的源頭就是證明。有些語言學家推算,語言可以追蹤到的時間上限在距今7000年到10000年,早於這個時間,文化中常用的基本詞彙表中的共有同源詞百分比不會超過5%—10%。

因此說,如果早期印歐語系人群從起源地傳播到遙遠的冰島和孟加拉所用的時間超過了1萬年,那麼印歐語系的存在狀態不可能像今天這樣還可以被語言學家清晰地辨認出來。

以上的表達似乎有點不好理解,但它確實表明,今天屬於農業族群的各大語系確實是全新世而非更新世發生的現象,它們的歷史完全處在以農業方式從事食物生產的時間範圍之內。

02

語系的識別與種系關係

南島語系包括大約1000多種語言,分布範圍橫貫半個地球,從馬達加斯加直到復活節島。南島語的使用者大約有3.5億人,大部分在東南亞,特別是印度尼西亞和菲律賓。南島語系中各語言的使用者人數不一,從幾百人(如西太平洋土語)到超過6000萬人之眾(爪哇語)。南島語族群大多數是亞洲人種,但西太平洋上的美拉尼西亞人很多也說南島語,就像菲律賓的尼格利陀人一樣。在西方殖民時代之前,這裡區域文化的發展差異巨大,從印度教和伊斯蘭國家到森林狩獵採集遊群各種形態均有。

然而,南島語族各實體的這種時空分布狀態並不是毫無來由的。儘管南島語族分布十分廣大,而且有一些其他族群特別是西美拉尼西亞人是後來學會的南島語,但它們在語言和文化上有一個共同的核心地區,所有語言都是由此發散出來的。

再來看一些相關概念。語系(language family),是指一組語言,具有一套同樣的語言特徵,主要是從語言發展的早期階段保留下來的。某些重要特徵確實來自語言肇始期(原語言階段)的發明,當然如果沒有其他外部語言作為佐證,這一點還無法確認。語系或語族由關係親密的語支(subgroup)構成,語支的共同特點是有創新(而不是對原來特點的保留),類似於生物分類學上的派生或自形特徵。

不可否認,對同源詞的識別複雜而困難,在理論上這會影響歷史解釋的準確性。例如,如果一個語支所有的語言在分化不久都開始借用,那麼借詞通常就會模仿同源詞。但在這種情況下,這些早期借詞與真正的同源詞(一般是繼承而來)一樣,因產生於類似的地理環境而內在含義相近。

此外,如果出自祖先語言中的保留詞只是保存在一個語支而非在周邊語支均有,經常會被誤以為是創新詞,這樣傳播較遠的真正的同源詞就會被忽略而得不到記錄。在這些情況下,語言研究的樣本密度顯然非常重要。人們必須搞清楚,其他語言是真的沒有這些詞,還是沒有被記錄下來。

《最早的農人:農業社會的起源》,[澳]彼得·貝爾伍德 著

語系樹建構起來之後,從中可以發現語言的某些特徵。所有語言都有一個可重建的祖型——原始語言(proto language)(或者是一組多層次的原始語言),表現出一套可復原的特徵。對於試圖重建古代文化的史前學家來說,最重要的特徵詞彙是傳達了最原始含義的古代事物。

如果復原出的事物詞彙其現代含義寬泛而且與其他詞彙含義交疊,那麼價值就比較有限,但一般來說,這類原始詞彙是非常有用的文化信息來源。例如,原始語言的重建證實,下文討論的很多重要語系確實植根於農業人群而非狩獵採集者。語言分析有時也能揭示出一種特定的文化特徵是來自原始語言最初出現的時候,還是後來才引入的。因此,西太平洋地區許多與農業、航海、漁業和制陶有關的物質文化看起來可以連續不斷地回溯到原始海洋語階段(Proto Oceanic stage),即太平洋地區所有南島語言的最初發展階段,大約距今3500年。類似的情況,根據白樂思的說法,密克羅尼西亞馬裡亞納群島查莫羅語(Chamorro)裡的大量詞彙,是在大約距今4000年前直接來自原始馬來玻里尼西亞語,而不是更晚時候通過借用來到這些島嶼的。

狩獵的原始人

然而,人們一定會問,如何確定所重建原始語言的地理範圍?它只在某個村子使用,還是在一個大的方言區廣泛流行?很久以前,戈登·柴爾德曾經評論原始印歐語:「雅利安語(原始印歐語)起源的搖籃在地理上必定是一個統一的整體;單是語言資料就體現出存在一組方言體系,在特定區域或大致相同的統一地理環境中構成了一個語言連續體。」萊曼的觀點與之類似:「很顯然存在一個社群,不管其規模大小和內部一致性如何,它們在一段時間內都說著後來名之為原始印歐語的相對統一的語言,而且這個社群還具有自己獨特的文化。」但這並不意味著語言一定發源於某一個單一族群,比如說來自一處村落。正如迪克森所指出的那樣,一個特定語系「可能並非來自單一語言,而是來自某個小區域內一組結構和形式類似的不同語言」。但是,一個原始語言不能在多個不相關的語言方向上走得太遠,否則會破壞其內涵的統一性。

另一個方面,不同語系樹可能有強弱之分,或者語系樹在其不同發展階段有強有弱強語系樹的形狀就像真正的樹那樣,具有明顯的根和發散出的枝。舉一個例子,玻里尼西亞語在其早期分化過程中形成了完整的樹狀結構,其中包括一種現在研究很透徹的原始語言——原玻里尼西亞語。根據安德魯·帕利的研究,該語言有大量創新內容,包括多達1392個事物名詞(其中也有一些可能是同源詞,但在玻里尼西亞之外尚未發現)、14項形態特徵和8項語法特徵。所有這些都是在一個邊界清晰且統一的起源地創造出來的,地理位置在大約公元前1000年到公元500年的西玻里尼西亞,特別是湯加和薩摩亞群島。這意味著存在一段漫長的發展停滯期,就相關考古材料來看,停滯了1000多年,在此期間,本地區人群之間保持交流聯繫,共同經歷了大量而廣泛的語言變化,但這些變化從未傳播到周邊其他地區,如斐濟或萬那杜。

一般來說,語系的發源地,就像古生物學那樣,最可能的地方是語支最早分離的地方,或者說語系樹開始分叉的地方。但是,請記住,要想確定這一點,我們必須要有一個強語系樹。如果是一個呈「耙形」結構的弱語系樹,那就不太可能確定語言的準確起源地。幸運的是,許多語系都同時包含了耙形和樹狀兩種分支結構。例如,印歐語系的大多數語支是耙形結構,但是古代安納託利亞語有足夠的特徵說明印歐語系可能起源於土耳其的某個地方。同樣,馬來玻里尼西亞語支也是耙形結構,但是,在南島語系裡,臺灣土著語不屬於馬來玻里尼西亞語支,而是形成了幾個第一層語支,非常有力地證明了臺灣島是南島語言的發源地。另一點需要注意的是,語系並不總是起源於當前分布範圍的中心。中心區域起源的推斷顯然不適用於類似南島語和貝努埃剛果語(包括班圖語)這樣的語系,這些語系早期基本上是從發源地單向向外傳播的。

03

語言和語系是怎樣傳播的

語言學家一般假設,一個真實存在的語系,一個可以通過對共享創新的比較研究得以證明的語系,其內部結構系由遺傳構建而成,包括人群擴張過程中形成的多層次的可復原的原始語言。從比較的角度來看,這是唯一有意義的解釋。歷史資料表明,如果語言單獨傳播,沒有伴隨本語種人群的遷徙或者擴散,那麼永遠不可能產生我們所討論的這種跨大洲級別的基因相似的語言群。人們只需要考察一下過去許多大帝國的多種多樣的語言歷史——亞述、阿契曼尼德、希臘、羅馬、蒙古、阿茲特克,甚至西班牙和英國——就會意識到這一點。如果徵服者沒有進行大規模永久性移民,單靠帝國徵服本身,那麼長期來看,當地很少會去使用外來語。

貿易在大規模語言傳播過程中的作用也不大。在注重貿易的巴布亞紐幾內亞,語言的多樣性在民族志時代達到了創紀錄的水平(紐幾內亞當時有大約760種語言),現在這裡普遍使用巴布亞皮欽語(一種混合語言——譯者注)和英語,在很大程度上這是現代力量如國家、文化、電視和族外婚等造成的社會巨變的結果。然而,即使存在所有這些誘因,巴布亞皮欽語的統治地位仍然只是整個太平洋範圍內的一個局部現象,而且規模和遙遠的史前時期相比完全不可同日而語。由此可見,徵服、貿易和文化擴散可以傳播語言,但除非得到另一個因素——語言使用者自身移民活動的支持,單靠傳播永遠不會達到跨洲大語系的規模。

基本上,最核心的一點就是觀察到,如果用比較方法識別出某語言是具有來自共同祖先語言(或一系列相關方言)歷史的一個遺傳單元,那麼該語言必定是通過母語使用者的遷徙傳播來的,而不可能僅僅通過語言轉換來傳播。考慮到這裡所研究的語言關係萬年以內的證據已經很難明確找到,以上觀察對於從整體上認識現代人類的歷史至關重要。既然世界上大部分地區和人群都可以劃入少數幾個大語系,那麼現代人類的史前史很可能就是由大規模的洲際人群遷徙造成的。

但是,我認為最重要的一個前提是,不應該假定說母語的遷徙人群全部來自語系最初產生地區的土著居民。很多情況下,人群的生物特徵和其語言並不完全對應,這種情況需要進一步解釋。舉例來說,西歐和南亞的人種有著明顯的生物學差異,但他們的語言同屬一個語系。在生物學特徵上,美拉尼西亞人和說南島語的菲律賓人更為接近,但他們的語言完全不是同一個語系。語言轉變和接觸導致的語言變化在今天顯而易見,在人類整個歷史上也同樣如此。

相關焦點

  • 非洲這個國家的祖先來自中國臺灣,操起源於臺灣的語言,是黃種人
    與之相伴的還有語言。馬達加斯加是否存在土著居民,目前學術界尚無定論,已知最早在馬達加斯加居住的居民是來自亞洲的南島語系移民。王建《馬達加斯加》:第一批移居馬達加斯加的南島語系移民稱為瓦津巴人,他們於公元前10—公元前2世紀移民至馬達加斯加,並定居於中部高原地區。
  • 儋州話:一種語言兩套讀音
    《儋縣誌》稱,「本縣語言、方言種類較多。漢語方言有儋州話、軍話、客家話、白話、臨高話、海南話;少數民族語言有黎語和苗話;公共場合一般講普通話。」  要問儋州的方言是什麼話?似乎很難回答。  儋州是一個古老的移民城市。幾千年來,黎、漢、苗、壯族人民相繼遷徙而來,同時也帶來了自己的語言。
  • 在遠古時代,「日本人」只有語言,沒有文字
    在遠古時代,「日本人」只有語言,沒有文字。早在江戶時代,已有學者通過日語和周邊民族語言的比較,調查了解日語語系,探究日語的源流。例如,新井白石和藤井貞幹就曾指出,日本語和朝鮮語相類似。明治以後,語言比較進一步展開,並形成了4種較有說服力的觀點:1.日語屬烏拉爾·阿爾泰語系,特別是屬於阿爾泰語。2.日語和同屬於烏拉爾阿爾泰語系的朝鮮語關係密切。3.日語和南方語系關係密切。4.日語是從阿伊努語分離出來,即源於阿伊努的語言。上述第4種論說,即認為日語和阿伊努語存在親緣關係的論說的主要倡導者,是被稱為「阿伊努之父」的J.巴切拉。
  • 中國人發現了700多萬平方公裡的領土,卻沒有佔領,留下一堆野狗
    我國臺灣省的原住民所使用的語言,也屬於南島語系,我國臺灣省的原住民所使用的語言有:泰雅語、阿美語、卑南語等等。南島語系民族起源於我國的華南地區,他們首先在我國的福建沿海一帶活動,然後渡過臺灣海峽,進入臺灣島,最後,遷徙至東南亞、南太平洋的各個島嶼之上。
  • 新石器時代晚期,漢藏語系起源於中國北方 復旦團隊揭示全球第二大...
    復旦大學金力院士團隊通過對109種漢藏語系語言的近千個詞彙詞根——語義組合(root-meaning)進行譜系建模分析,歷時兩年多,重構了漢藏語系諸語言間的親緣關係,並以此推算了漢藏語系的分化時間和起源地。
  • 都是從一時期進化來的人,為什麼形成的語言卻各有不同?
    世界上從猿類進化成人,幾乎都是差不多的時間線,經過好幾萬年的發展,形成不同的人中,皮膚顏色的不同,還有不同的語言,但是究竟是什麼樣的原因導致了這種情況的發生呢?而最早的發現的早期的智人化石,是在18856年字德國的杜塞道夫城附近的尼安德特河谷的洞穴中發現的,所以人類學家把尼安德特人作為這一類型古人類的代表型。
  • 英語起源於哪種語言?事實上所有的歐洲語言都出自同一語系!
    語言是文明的象徵,也是文明傳播的基礎,但因為地域的阻隔,各自國家也都發展出了自己的的語言,不同的語言的文字不盡相同,但在結構上肯定會出現相同之處,其中英語因為其結構的簡單性在語法上很容易學習,但因為龐大的詞彙量而很容易讓人望而卻步;而漢語卻恰恰相反,所需詞彙不多,但在語法的變換上十分複雜,這也就導致了中西方的不同思維模式。
  • 中國語言學研究成果首登《自然》主刊 金力團隊揭示漢藏語系起源於...
    本報訊近日,金力院士團隊宣布,綜合運用語言學和遺傳學等多學科交叉的分析方法,揭示了世界第二大語系漢藏語系起源及分化的時間和地點。該研究為探尋中華文明的起源和發展歷程,了解中國及周邊鄰國的各漢藏語系語言之間的演化關係提供了重要依據,為認識東亞人群遷移歷史提供了重要啟示。
  • 世界三大活化石式的標準語言
    梵語隨著雅利安人在公元前14世紀進入印度大陸而逐漸傳播、發展,並影響著南亞、中亞、東南亞,甚至東亞地區的文化。按照梵語的字面意思,即為「完全整理好的」,也即整理完好的語言,這是一種高雅純正或完美的表達方式,而非世俗語言。
  • 人類語言起源於哪?專家稱找到源於非洲有力證據
    因此,這種相似性並非偶然,而是現代人類語言起源於非洲的有力證據。  語言起源的社會學解讀  對於人類語言的起源,早在1866年的巴黎語言學會上相關學者就得出一個共識:沒有必要在學術會議上討論這個話題,因為這「純屬浪費時間」。世界上有6000多種語言,要弄清語言的起源與演化非常困難。
  • 古DNA揭秘中國史前人群遷徙動態與族群源流丨亮點成果
    為進一步增進公眾對中科院亮點工作的了解,同時促進院屬各單位進一步加強對重大成果的傳播推廣,特啟動「中科院科技創新亮點成果篩選」活動。中科院相關職能部門現已推薦候選條目,歡迎大家積極參與投票,相關得票數將作為正式當選條目的重要參考依據。感謝對中科院科技創新工作的鼓勵和支持!
  • 關於人類語言的10個問題,語言最早起源於什麼時期?
    關於人類語言的10個問題,語言最早起源與什麼時期?青蛙呱呱叫,小鳥啼囀鳴,萬物生靈發出各種不同的叫聲、吼聲和啼鳴聲,構成大自然最和諧美妙的聲音。但是只有我們人類是唯一擁有複雜語言的靈長類動物,這是為什麼呢?我們最早的語言是什麼?最早擁有語言的是什麼人?尼安德特人已經開始用語言交談了嗎?
  • 古脊椎所揭秘中國史前人群遷徙動態與族群源流
    事實上,他們是南島語系人群(現今主要生活在臺灣島及太平洋島嶼等地)的祖先來源;整個東亞沿海族群之間都存在遺傳聯繫,這為修正此前流行的該地區古人群來源的「兩層假說」提供了遺傳學基礎,並為農業-語言傳播模式及相關研究提供了重要證據。
  • 古DNA揭秘中國史前人群遷徙動態與族群源流
    中國科學院古脊椎動物與古人類研究所團隊利用共同開發的古DNA技術,首次正式發表大規模中國南北方史前人類基因組分析結果。在中華民族探源方面,揭示出中國8400年來的南北分化格局、內部不斷融合的過程、雙向的遷徙擴散模式及人群的主體連續性;在修正東亞南方人群演化模式方面,闡明南島語系人群的中國南方起源。
  • 從分子人類學看現代人的起源與遷徙3——棕色人種與老亞洲人
    在D人群進入亞洲的同時,CF集團中的一支 C 也大體沿著 D 的老路進入亞洲,C 和 D 人群是最早佔據亞洲的現代人,故被統稱為老亞洲人。C 人群的後裔主要分成南北兩支,南支 C人群後來演變成棕色人種的祖先。
  • 「解讀」亞洲人群遺傳多樣性
    一項從全基因組水平揭示亞洲人群的精細遺傳結構、系統闡明亞洲人群遺傳結構與地理分布,以及語言結構之間關係的研究成果,12月10日發表在國際權威學術期刊《科學》
  • 語言是如何產生的,新石器時代的人會說話嗎?
    語言是生物同類之間用於溝通的具有統一編碼和解碼標準的聲音訊號。對於人類來說,語言不僅是進行溝通交流的表達符號,更是人類社會保存和傳遞文明成果的重要工具。語言學家認為,語言起源必須具備三個方面的條件:一是人類的思維能力要發展到一定的水平,能夠對客觀世界進行分類概括,並有一定的記憶、想像、判斷和推理的能力;二是要具備一定的生理條件,即人類的喉頭和口腔聲道必須進化到能夠發出清晰的聲音;三是人類社會有了產生語言的必要,人與人之間發展到「彼此間有些什麼非說不可的地步」。
  • 人類的語言是如何出現的?
    那麼人類的語言是在什麼條件產生的呢?人類語言又是在什麼時期出現的呢?,人類語言有一個由簡單到複雜的發展過程,社會意識是人類通過語言的形式建立起來的。亞當、夏娃生的該隱、亞伯沒有後代,在亞當130歲時又生了第三個兒子賽特,以後生下的孩子聖經沒有記載,按聖經族譜敘述,幾千年後的諾亞以及現代的人類都是賽特或其兄妹的後代。
  • 印度貨幣上有17種語言,你知道每種語言有多少人在用嗎?
    印度的語系主要有印歐語系、漢藏語系、南亞語系、德拉維達語系,語言複雜。印度的第一官方語言是印地語,但印地語並不能通行全國,遠不如漢語普通話在中國的地位,它約有41%人口使用;比如在中央邦就說印地語,在安德拉邦就說泰盧固語,在古吉拉特邦就說古吉拉特語,在泰米爾拉德邦就說泰米爾語。
  • 徐文堪談語言起源與古代語文的釋讀
    亞馬孫叢林裡有一種皮拉哈人,文化發展程度是比較低的,他們幾乎沒有數的概念,只能數到三,一般的原始部落總還有自己的故事、傳說或是神話,皮拉哈人都沒有。但他們也有自己獨特的文化,他們的語言並不比其他的群體落後,在他們自己的文化系統內,語言是高度發達的,可以表情達意。