一種語言單詞數量與語法難易成反比?全球七千種語言情況仍待研究

2021-01-08 北晚新視覺網

據國外媒體報導,國際頂尖學術期刊《皇家學會會刊》最近刊登了由英國華威大學尼克•蔡特教授、美國康奈爾大學莫頓•克裡斯琴森教授和哥倫比亞洛斯安第斯大學弗洛倫西亞•雷亞利教授等心理學家組成的研究小組撰寫的報告。該報告聲稱,一種語言的單詞數量越多,其語法規則就會越簡單。

資料圖。新華社記者 任瓏 攝

研究人員是基於英語單詞(大約40萬個)、漢語單詞(大約10萬個)和玻里尼西亞語單詞(不到2萬個)的研究提出這一假說的。他們採用統計學的抽樣推斷法,並藉助語料庫分析工具對這三種語言的單詞和語法做了分析和研究。

其研究的結論是,英語和漢語的語法規則比較簡單,容易掌握;而玻里尼西亞語的語法規則相當複雜,非常難學。這項研究(包括人口與詞彙的相關性研究)前後歷時5年,並獲得了歐洲科學研究委員會、英國科學研究委員會等的基金資助。

這份報告一出,轟動了學術界特別是語言學界。很多新聞媒體都對此事做了報導,其中義大利《晚郵報》還評論道,這項研究成果加深了人們對語言的認識和理解,為人們研究語言與認知的關係提供了參考和幫助。

無獨有偶,1988年中國知名學者周海中教授在一次學術講座上說過:在當今人類語言中,英語的單詞數量是最多的,而語法規則很可能是最少的(大約150條);無論何種發達語言,其單詞數量與語法規則之間或許都存在著一定的反比關係。這種反比關係很值得學術界,尤其是語言學家們關注和研究。

近幾十年來,許多專家學者都在努力探究人類語言的單詞數量與語法規則之間的各種關係,希望能解開其中的一些秘密。他們有的採用統計方法來進行研究,有的採用抽樣方法來進行研究;而語料庫、大數據、網際網路等是他們近年藉助的研究工具。

目前全世界大約有7000種語言,每種語言的符號系統都極為複雜,語言的單詞數量與語法規則之間的關係也非常複雜。因此,所有語言是否真的存在單詞數量越多,語法規則就越簡單的現象?這一問題還有待於學術界廣泛深入的探討和研究。

 

 

來源:猜你會好奇

編輯:TF019

相關焦點

  • 人類7000種語言塑造7000種大腦認知體系:語言和思維的相互塑造
    這是一種與眾不同的時間思考和表達方式。還有一些有趣的例子,比如有些語言數量詞中只有1和2,有些沒有數字7和8,他們很難將數字與物體數量匹配起來,數字計算能力很弱。愛斯基摩人對雪花的表達有60多種,他們看到不同形態的雪花可以很快地找到相對應詞彙來描述。還有,德語和西班牙語都有陰格和陽格,但是德語和西班牙語有些單詞的陰格和陽格是相反的。
  • 海歸教授白鋼:掌握數十種語言的語言「達人」
    簡直像是「世外高人」,他掌握的語言種類全部寫下來需要半頁紙,除了西方現代主要語種——英語、法語、德語、俄語、義大利語、西班牙語、希臘語之外,他更著力學習和研究了世界幾大文明體的幾十種古典語言,如西臺語、古希臘語、拉丁語、梵語、巴利語、阿維斯特語、古波斯語、古亞美尼亞語、哥特語、古教會斯拉夫語、吐火羅語、蘇美爾語、阿卡德語、舊約希伯來語、阿拉美語、烏加裡特語……  他就是白鋼
  • 世界上最難學的五種語言!漢語竟然只能屈居第二?!
    上面列舉的語言在全球都有數千萬至數億的使用人數,是語言中的「龐然大物」。根據不完全統計,全世界所有的語言共有六千多種,而其中96%的語言其使用者人數總和還不到全球人口的4%,在學校和網際網路上出現過的語言其比例不到20%。
  • 語言進化研究的跨學科思考:語言是心理時間旅行的外延
    心理時間旅行VS普遍語法UGChomsky(1965)的普遍語法(universal grammar,UG)被語言學、心理學和生物學廣泛接受,語言進化的模型大多是建立在UG的基礎之上。他認為人類一出生時大腦中就存在UG,通過後天刺激,個別語法才從UG中選擇選擇出來,UG是人類掌握語言的決定因素,語言的遞歸性是人與動物語言的根本區別。
  • 全球最難翻譯的十大單詞
    新東方網>英語>英語學習>語法詞彙>流行語>正文全球最難翻譯的十大單詞 2009-11-13 19:47 來源:新浪教育 作者:
  • 全球最易學的十大語言排行榜!漢語能排第幾?看完就知道了!
    而隨著國家強大,世界各國開始學習漢語,甚至有些國家還將漢語作為他們的官方語言,最近一份有關於全球最容易學習的十大語言排行榜出爐了!那麼漢語能夠排在第幾名呢?看完就知道了!首先,世界上最容易學習的十大語言分別是弗裡斯蘭語、世界語、義大利語、瑞典語、葡萄牙語、挪威語、西班牙語、法語、南非語!而我國的漢語,被認為是全球最難學的語言,對此,大家是不是嚇到了呢?
  • NLP 與 NLU:從語言理解到語言處理
    與NLP最大的區別之一是NLU超越了解單詞,因為它試圖解釋和處理常見的人類錯誤,如錯誤發音或字母或單詞的顛倒。推動NLP的理論是Noam Chomsky在1957年的「句法結構」中所設定的假設:「語言L的語言分析的基本目標是將L的句子的語法序列與不符合語法的序列分開。 這不是研究語言L的句子,而是研究語法序列的結構。」
  • 國際語言復興研究的理論和實踐
    但Bernadette O』Rourke(2018)指出,Fishman 的逆向語言變遷理論主要是將語言的使用擴展到教育和政府等機構,但這在當前現實情況下並沒有真正發生。語言衰落的另一方面體現在被復興後的語言與原有語言有諸多不同:雖然新的語言有許多原有語言的特徵,但同時具有新發音、新語法、許多新單詞,在新的場合被使用,這些可用於該語言討論過去從未談過的新話題。
  • 如何「錨定」NLP模型中的語言智慧?丨長文評析語言探針
    需要注意的是,模型在探針任務上的性能預測,可以與專為這類任務設計的、經過明確訓練的模型的最新技術性能進行比較,以了解編碼語言知識的程度。 當然,還有其他方面需要深入分析,例如: 更大的模型能夠更好的編碼語言知識嗎?模型所捕獲的語言知識在複雜性方面(維度大小,參數數量)如何變化?
  • 世界三大難學語言排行榜!俄語第三,恭喜你學會了世上最難語言
    世界上存在著數千種語言,每個語言都有自己的特點。許多聰明的人能同時掌握四五門語言。那麼世界上哪些語言最難學呢?下面排行榜123的小編就來為大家盤點下世界三大難學語言。世界三大難學語言1、漢語2、阿拉伯語3、俄語1、漢語漢語是典型的象形文字,早在數千年的商朝,人們便已經發明了甲骨文,這是最早的較為成熟的漢字。
  • 2115年我們會講什麼語言?
    1880年,巴伐利亞的一位神父創造了一種語言,並希望在全世界使用。這種新創的語言混合了法語,德語和英語的單詞,稱之為Volapük(沃拉普克語),但世界並不接受這種新語言。幾年後,又有人發明了Esperanto(世界語),Volapük逐漸退出歷史舞臺,Esperanto的名字更好聽,並且語法單詞更易於讓人們學習。但世事變遷,後來英語發展成為一種國際語言,Esperanto又逐漸出局。兩千年前,英語是丹麥鐵器時代部落的一種不成文的方言。
  • 外媒:全球常用語言超7000種 中國語言達300種
    參考消息網1月1日報導 外媒稱,全世界近70億人口,在日常生活交流中,使用7000多種語言。全球語言種類的分布並不均勻,亞洲人和非洲人使用的語言更加豐富多彩。據新加坡《聯合早報》網站2015年12月31日援引英國《每日電訊報》報導,巴布亞紐幾內亞(Papua New Guinea)是擁有語言種類數量最多的國家,有839種不同的「現行語言」,數量是歐洲各國語言總和的近三倍。這個國家的文化和部落呈多樣性,所以839種語言均為土著語。報導稱,中國人一共說300種語言,在235個國家的民族語言多樣性指數排名上名列第6位。
  • 最大熵方法及其在自然語言處理中的應用研究
    要想切實的減少人機交流過程中的阻礙,需要在編製程中加強計算機設備對於自然語言的多重性領會,可以領悟到自然語言本身所具有的思想意識。上述兩種階段,前一種被稱作是自然語言理解,後一種責備稱作為自然語言生成。自然語言的處理總體上包含著自然語言的領會以及語言意識生成兩種環節,在過去的幾年中,研究人員對於自然語言的研究頻率較為廣泛,但是自然語言的生成探索程度較為薄弱,此種情況正在隨著探究而發生轉變。
  • 語言認知的關鍵模塊:比語言本身的誕生早3000到4000萬年
    語言能力是建立在我們理解單詞的組合以及組合間關係的能力之上的,但是人們對這種更基礎能力的進化史卻知之甚少。現在,英國華威大學的研究人員已經確定——這種理解語言的關鍵認知模塊在猴、猿和人類的最終共同祖先身上已經出現,它比語言本身的出現要早至少3000至4000萬年。相關論文於當地時間10月21日發表在《科學進展》雜誌上。
  • 漢語不是世界上最難學的語言,最難的語言竟然是鄰國的它?
    網絡上一度流傳著,聯合國教科文組織發布的世界上最難學的十大語言排行,漢語被認為是全世界最難學的語言,想必大家都聽說過。在實際教學中,據美國外交學院的統計,以母語為英語者,至少需要學滿2200個小時,漢語才能達到精通水平。
  • 初中生巧用詞源輕鬆備戰高考:聽力發音單詞語法是有機體切莫亂背
    很多小朋友都誤以為英語難學,主要是感覺單詞難記,語法難學。 事實上,英語和世界語一樣,是印歐語系語言中最好學的。 語法難學是因為您在用錯誤的方法記憶單詞,不了解人類語言的最基本常識。而單詞難記的根本原因是您沒有正確理解單詞和聽力、發音、語法之間的關係。
  • 這項語言的關鍵能力,比語言本身還早誕生3000萬到4000萬年
    語言能力是建立在我們理解單詞的組合以及組合間關係的能力之上的,但是人們對這種更基礎能力的進化史卻知之甚少。現在,英國華威大學的研究人員已經確定——這種理解語言的關鍵認知模塊在猴、猿和人類的最終共同祖先身上已經出現,它比語言本身的出現要早至少3000至4000萬年。相關論文於當地時間10月21日發表在《科學進展》雜誌上。
  • 人類語言消亡簡史
    據統計,全世界共有六千餘種語言,而這些語言的使用情況差異極大。其中,96%的語言其使用者數量之和不到全球人口的4%,只有不到20%的語言在學校和網際網路上使用。研究顯示,全球有近2500種語言處於瀕危狀態,在聯合國繪製的《全球瀕危語言分布圖》中,代表著危機的紅色標記幾乎布滿世界各地:圖片來源於網絡
  • 世界主要語言學習難度統計表,英語成了全世界最簡單的語言?
    在我們小時候,就一直流傳著一種說法,英語是全世界最簡單的語言,英語真的是全世界最簡單的語言嗎?雷哥小詞君忍不住想說一句「XXXX」為了更好地研究這一問題,學姐在FSI官網上找到了一份世界主要語言學習難度的統計表(對於英語母語人士來說):對於以英語為母語的人來說,最簡單的是荷蘭語、瑞典語、法語、西班牙語及義大利語等屬於羅曼語系和日耳曼語系的語言,只需要半年的密集訓練,就可以到達閱讀和口語都非常流利的程度
  • 深度解讀谷歌SyntaxNet:全新TensorFlow自然語言處理模型
    在筆者看來,在自然語言處理中語法解析就是一個瓶頸技術,如果它有四、五年時間做優化改進,將會對自然語言處理產生巨大影響。現在你可能會說,我之所以覺得這是個問題,是因為這項技術正從學術研究轉變為商業化應用。但我所能說的就是,這其實是一種逆轉因果關係:正是因為我理解問題的重要性,所以我投入其中,而不是相反。