用數學邏輯之美揭示語言結構之妙

2020-12-13 光明網新聞中心

  【語言論壇】    

用數學邏輯之美揭示語言結構之妙

——談談語言學中的數學方法

作者:馮志偉,系杭州師範大學特聘教授

  傳統語言學的目的在於規定正確讀和寫的種種規則,這樣的語言學有點像法律;

  歷史語言學用譜系樹的方法來表示不同語言之間的親屬關係,這樣的語言學一如生物學;

  結構語言學力圖找出語言中各個要素之間的結構關係,這樣的語言學酷似化學。

  那麼,語言學和數學究竟有什麼關係呢?

  華羅庚說過:「宇宙之大,粒子之微,火箭之速,化工之巧,地球之變,生物之謎,日用之繁,無處不用數學。」馬克思指出:「一種科學,只有在成功地運用數學時,才算達到了真正完善的地步。」恩格斯也認為,「任何一門科學的真正完善在於數學工具的廣泛應用。」

  他們都認識到數學在科學研究中的重大價值。數學的用處如此之大,其原因在於數學具有邏輯之美,而任何領域都離不開邏輯。

  那麼,語言學和數學有什麼關係呢?

 

  語言學和數學都是有相當長歷史的古老學科。語言學歷來被看作典型的人文科學,數學則被許多人看成最重要的自然科學。在學校教育中,語文和數學被認為是兩門基礎學科,成為任何一個受教育者的必修課。它們似乎成了學校教育的兩個極點:一個極點是作為文科代表的語文,一個極點是作為理科代表的數學。在一般人看來,語文和數學似乎是兩門風馬牛不相及的學科;甚至有的人認為,用數學方法來研究語言,是一種離經叛道的古怪行為。很少有人想到,這兩門表面上如此不同的學科之間竟然還存在著深刻的內在聯繫。

  漫長的發現過程

  語言具有奇妙的結構,數學具有邏輯之美,在人類的科學發展歷史上,學者們經過了相當漫長的過程才逐漸察覺到語言學和數學之間的親密關係,認識到可以用數學的邏輯之美來揭示語言的結構之妙。

前蘇聯數學家馬爾可夫

  早在19世紀中葉,就有人用數學來研究語言現象。1838年,英國學者皮特曼選取了20本書,每書取500詞,共計1萬詞,以此為語料進行統計,得到常用英語詞頻表,於1843年出版。這可能是我所看到的文獻中使用數學方法研究詞頻的最早記載。

  1913年,前蘇聯數學家馬爾可夫採用概率論方法研究了《歐根·奧涅金》中的俄語元音和輔音字母序列的生成問題,提出了馬爾可夫隨機過程論,後來成了數學的一個獨立分支,對現代數學產生了深遠影響。語言結構中所蘊藏的數學規律,成了馬爾可夫創造性思想的源泉。《歐根·奧涅金》是普希金的長篇敘事詩,講的是一個哀婉的愛情故事,我們讀《歐根·奧涅金》,欣賞的是它的故事情節或者獨特的詩歌節律,而馬爾可夫卻獨具慧眼,從中發現了隱藏在字裡行間的數學規律。

  1935年,美國語文學家齊夫提出了齊夫定律,用數學方法描述頻率詞典中單詞的序號與頻率的分布規律。

  計算機和語言的不解之緣

  與此同時,有一些傑出的學者學開始從計算機和通信的角度來關注語言問題,取得了突破性的成就。

英國數學家圖靈

  英國科學家圖靈在1950年發表的《機器能思維嗎》一文中天才地預見到計算機和自然語言將會結下不解之緣。他提出,檢驗計算機智能高低的最好辦法是讓計算機來講英語和理解英語。

  20世紀50年代提出的自動機理論來源於圖靈在1936年提出的算法計算模型,這種模型被認為是現代計算機科學的基礎。圖靈的工作首先導致了麥克羅克–皮特的神經元理論。一個簡單的神經元模型就是一個計算的單元,它可以用命題邏輯來描述。接著,圖靈的工作導致了有限自動機和正則表達式的研究,這些研究都與語言的形式化描述有密切關係,把數學與語言緊密地聯繫起來。

  1948年,美國科學家香農把離散馬爾可夫過程的概率模型用來描述語言的自動機。1956年,語言學家喬姆斯基從香農的工作中吸取了有限狀態馬爾可夫過程的思想,首先用有限狀態自動機作為一種工具來刻畫語言的語法,並且把有限狀態語言定義為由有限狀態語法生成的語言。這些早期的研究工作產生了「形式語言理論」這樣的研究領域,採用代數和集合論把形式語言定義為符號的序列。喬姆斯基在研究自然語言的時候首先提出了上下文無關語法,計算機科學家巴庫斯和瑙爾等在描述ALGOL程序語言的工作中,分別於1959年和1960年獨立地提出了巴庫斯–瑙爾範式,並發現他們提出的這種範式與喬姆斯基的上下文無關語法是等價的。這些研究把數學、計算機科學與語言學巧妙地結合起來,大大地促進了學者們採用數學方法來揭示語言的數學面貌。

  這個時期的另外一項基礎研究工作是用於語音和語言處理的概率算法的研製。香農把使用通信信道或聲學語音這樣的媒介傳輸語言行為比喻為噪聲信道或者解碼。他還借用熱力學的術語「熵」作為測量信道的信息能力或者語言的信息量的一種方法。他採用手工方法來統計英語字母的概率,然後使用概率技術首次測定了英語字母的熵為4.03比特,用數學方法來描述語言的統計規律。

  在這些研究的基礎上,在語言學中出現了數理語言學、計量語言學等廣泛採用數學方法的新興學科。

  法國數學家阿達瑪是一位具有獨特創見的學者,他用自己的慧眼,清楚地認識到語言學在人文科學中是最容易與數學建立聯繫的學科。他斬釘截鐵地指出:「語言學是數學和人文科學之間的橋梁。」

  顯而易見,具有邏輯之美的數學確實能夠幫助我們洞察語言規律,發現語言的結構之妙。

  大數據時代的自然語言處理

美國數學家香農

  進入信息網絡時代之後,語言研究開始從大規模真實文本語料庫中來獲取語言知識,必須使用統計方法,進一步推動了數學在語言學中的應用。在自然語言處理中,提出了隱馬爾可夫模型、最大熵、噪聲信道等基於統計的數學模型,統計方法成為機器翻譯研究的主流,機器翻譯由基於規則到基於統計,統計機器翻譯的勢頭日益強大,一直延續到2007年。

  從2007年開始,在大數據、雲計算等因素的影響下,自然語言處理在統計方法的基礎上又向前跨進了一步,開始採用深度學習的方法,機器翻譯、自動問答、信息檢索、信息抽取等領域的研究,廣泛採用循環神經網絡、長短時記憶、卷積神經網絡等深度學習的數學方法。深度學習比統計方法更勝一籌,取得了振奮人心的成績。自然語言處理的研究離開數學幾乎寸步難行了。

法國數學家阿達瑪

  隨著我國自然語言處理研究的進一步發展,越來越多的學者開始關注語言學中的數學方法,數學方法在語言研究中的應用越來越廣泛。就是在傳統的語言學研究中,也開始採用數學方法,而不再認為使用數學方法來研究語言是一種離經叛道的古怪行為。在語言研究中採用數學方法,現在已經得到了我國語言學界的普遍認同。隨著自然語言處理研究的發展,數學已經成為語言學研究的一種最重要的工具。

  今天,現代語言學的研究,特別是面向計算機的語言學研究,越來越離不開數學了。我們應當與時俱進,進行更新知識的再學習,更加自覺地把數學方法應用到語言研究中,用數學的邏輯之美來揭示語言的結構之妙,從而推進我國語言研究的現代化和信息化。

  《光明日報》( 2017年07月09日 12版)

[責任編輯:李伯璽]

相關焦點

  • 分子之微,宇宙之大,發現無處不在的數學結構和神奇的數學之美
    下文摘自《迷人的圖形》前言部分, [遇見數學] 已獲出版社授權許可. 150張彩色插圖給你帶來視覺和科學的盛宴,不可抑制的數字之美躍然紙上!我6歲那年,在一個朋友那裡看到了一些稀奇古怪的小五角星。與之不同的是,我剛剛開始接觸數學時,它卻給我一種寡淡無味的感覺。學習數學似乎就意味著擺弄數字。雖然代數略有不同,但也僅是用符號來代替未知數罷了。如果有人告訴我化石雅致、美妙的幾何形狀與數學之間有著緊密的聯繫,我肯定會覺得不可思議。
  • 異曲同工之妙 | 音樂與數學
    除了教授數學,我還是一名專業的指揮家。經常有人問我:「要兼顧數學補習班和指揮家的事業,應該很不容易吧?」其實,我從來不覺得這是全然不同的兩件事,因為指揮家閱讀樂隊總譜(將樂團各聲部的音集中記錄的樂譜)的過程,和解讀數學的邏輯非常相似。我為了學習指揮而去歐洲留學時,經常聽人說:「不錯,他的邏輯思維很強。」
  • 數學之美
    文/王眾傑 楊敬飛 數學家可以用美來評價數學,設計師也可以用數學來創造標誌,數學與設計的結合在交融與碰撞中不斷激發人們的靈感與創造能力。數學原理為標誌設計提供了一種內在的邏輯,藉助它可以使標誌設計的形式達到內在的理性美與外在的感性美的統一。
  • 讓孩子知道:數學之美(數學中讓人愉悅的東西)!
    我國著名數學家華羅庚說過:「就數學本身而言,是壯麗多彩、千姿百態、引人入勝的……認為數學枯燥乏味的人,只是看到了數學的嚴謹性,而沒有體會出數學的內在美。」數學家徐利治說:「作為科學語言的數學,具有一般語言文字與藝術所共有的美的特點,即數學在其內容結構上和方法上也都具有自身的某種美,既所謂數學美。
  • 數學也動聽,邏輯與藝術融合之舞,超級美的享受
    感性的音樂與理性的數學可謂是兩個極端,音樂是作為我們抒發感情、表現感情的一種感性藝術,數學則是一種通過抽象的思辨、嚴謹的邏輯論證等思維方式構建起的「思維體操」,從表面看二者並沒有明顯的聯繫,其實音樂中到處都是數學。
  • 數學邏輯與語文邏輯之比較
    數學邏輯與語文邏輯之比較:數學和語文一樣屬語言學科。數學是數字語言,語文是文字語言。語言屬於人設人定人解人用人描人表。數學有數學邏輯,語文有語文邏輯,比如:1,數學,人設「1,2,3,4,5,6,7,8,9,10」,那麼就存在「1+1=2」的數學邏輯關係。人設「圓周長,圓半徑」,那麼就存在「周長=2半徑ⅹ3.14」的數學邏輯關係。
  • 數學之美的兩種形式,發現宇宙深處的奧秘
    或者,我們可以像分割大腦一樣分割數學,用代數的「左腦」按邏輯順序思考,用幾何的「右腦」以更直觀的方式思考。但這個領域也根據一個更微妙的區別而細分:一個人在兩種數學美之間的偏好。首先,對於非數學專業人士來說,很難把數學看成是美的。當然,美在觀者的眼中,但當數學藝術隱藏在黑暗中,被難以穿透的符號和術語所遮蔽時,也很難看清。
  • 科學之數學美
    數學是現代科學中不可或缺的部分,因此科學中處處可見數學美。美感與文化有關,人們對美的欣賞則與個人的文化水平有關。科學也是一種文化,科學之美,也與一個人的教育程度、科學素養有關。即使是學理工科的,也並不是每個人都能欣賞科學理論中的數學之美。理論物理學家們常說,麥克斯韋方程,兩個相對論,都體現了數學美。然而,沒有一定數學修養的人,看到的只是一大堆繁雜討厭的數學公式,哪有什麼「美」呢?
  • 數學教育意義探求之數學的本質,數學的教育特徵,數學的教育意義
    如果不通過數學教育活動,到哪裡能找到如此簡結的問題解決方法。3.形式化,數學形式化是用形式符號體系表現的,形式化要使用徹底的形式語言,把數學思維過程中所有能夠表述出來的東西,包括邏輯聯繫詞、推理符號、公理、定理等,完全用符號表示。數學教育關注學生在研究複雜問題時,能抓住問題的關鍵所在,構造出形式化的數學模型。
  • 數學之美
    我顯然沒有能力深入討論數學這座無比深奧、巨大、輝煌的人類思想寶庫,只敢十分卑微地匍匐著看一下裡面各種光彩奪目的結論。正因為如此,我願意從宏觀的視角來討論一下數學的主要分布,從而消除大家由於過於敬畏而產生的害怕、甚至抗拒,引導大家欣賞數學之美,鼓勵下一代獻身數學。
  • 武漢文獻中心舉辦「數學之巧與思維之妙」活動
    武漢文獻中心舉辦「數學之巧與思維之妙」活動 2018-02-01 武漢文獻情報中心 【字體:中科院武漢物理與數學研究所研究員楊小舟作了一場生動有趣的科普講座——「數學之巧與思維之妙」。活動由武漢文獻中心主辦,武漢科學普及研究會和中科院武漢教育基地協辦。
  • 數學的解法之美、結論之美、繪圖之美、體驗之美
    數學之美是指從數學裡得出的美學。有數學家從數學中得到美的愉悅,形容數學是一種藝術形式,或是一種創造力活動,就如音樂和詩歌。伯特蘭·羅素以下列文字形容他心中的數學之美:"數學,正確看待時,不僅具有真理,還具有至高的美-一種冷而嚴峻的美,一種屹立不搖的美,如雕塑一般,一種不為我們軟弱天性所動搖的美。也不像繪畫或音樂有富麗堂皇的裝飾,而是純粹地崇高、絕對地完美,是最偉大的藝術,然而這是極其純淨的美,只有這個最偉大的藝術才能顯示出最嚴格的完美。
  • 數學之美:數學的深刻性
    ‍一般方程不但統一了各類二次平面曲線,而且可以表示平面上任意位置的曲線(而不要求曲線的中心在原點);通過坐標變換一般方程可以轉變為標準方程;更加令人驚奇的是,這種深刻性闡明了不同概念之間高度的內在聯繫:一般方程揭示了「二次曲線類型的判定」和「二次方程根的判別式」在底層的視野中很難預料到的隱藏關係。
  • 從《數學之美》說起,聊聊數學的磅礴力量
    我的答案是:那些覺得數學有趣的人,往往最有趣。內斂的數學之美數學之美是內斂的,是極其富有邏輯性的,是需要經過深刻思考和體悟的。因而能體會到數學美感的人,他們看待這個世界的角度和態度往往是異於常人的,他們總能觀察到那些平凡事物背後的有趣之處。
  • 必能驚豔到你的數學之美
    我國著名數學家華羅庚(1910-1985)說過,「就數學本身而言,是壯麗多彩、千姿百態、引人入勝的……認為數學枯燥乏味的人,只是看到了數學的嚴謹性,而沒有體會出數學的內在美。下面這一組美圖,將帶你走進一個極致的數學美學世界!
  • 繪本創意教學:發現思維之妙,想像之妙,創意之美(三)
    我引導學生運用聽、讀、猜、悟、說、寫、畫、演等策略發現繪本之妙。
  • 學術四中|探索「開端」之妙,綻放「統整」之美
    教研是一場富有詩意的修行,是用生命影響生命,用生命溫暖生命的過程。是天府四中人不斷追求的生命狀態。文言文開端簡潔而魅力無窮,情節曲折而結構搖曳。孩子們在課堂上感受不同開端帶來的不同效果和藝術魅力。未來,天府四中「明日之星」基地班將開展「學術+」「課堂+」「寫作+」「活動+"等多樣的學習方式,豐富的學習內容,走進每位職初教師急需引領的專業生活,助力每位教師成長為最好的自己!葉俊宏老師以「探索「開端」之妙,綻放「統整」之美」為題作專題報告,從學科融合、群文閱讀、學段融通三個方面進行了詳細的介紹。
  • 清華媽媽帶你發現生活中的數學之美
    而在調查的所有偏科學生中,有多達78%的孩子為數學偏科。抽象的符號,繁難的計算,枯燥的推理;浩瀚的題海,重複的訓練,八股化的考試,數學正日益被「妖魔化」,從而導致許多人對這門學科總體上的逃避。簡潔的語言,精巧的構造,嚴謹的結構;代數的優雅,幾何的神韻,清澈的理性,無數數學大師、科學巨匠因數學之美的牽引,而熱愛數學讚美數學。
  • 結構主義之「結構」
    所以說,結構主義也是一種看世界的方式,如此而言,類同於馬克思主義,是一种放之四海而皆準的東西,但也是因為這個原因,它惹出了諸多麻煩。熱鬧一陣後,被所謂的「後學們」壓過了風頭,但回過頭來看,「結構」兩字似乎生長進了我們的腦子裡,拿不到了。
  • 引導孩子讀「數學名著」,學會欣賞數學之美,孩子會一輩子感激你
    對於喜歡科學探索的孩子,可以引導他們多讀數學名著。對於喜歡數學的人來說,數學是極美的,可以說任何一門學科都無法與之相比。德國數學家克萊因說:「音樂能激發或撫慰情懷,繪畫使人賞心悅目,詩歌能動人心弦,哲學使人獲得智慧,科學可改善物質生活,但數學能給予以上的一切。」然而欣賞數學的美並不是那麼容易,因為它不象美術和音樂那樣,直接可以用眼睛去欣賞,用耳朵去聆聽。