《生活大爆炸》中,天才Sheldon提出了一個問題:最棒的數字是幾?答案是唯一的。
天文學家Raj答道:「5318008?」
Sheldon解釋道:「錯誤答案。最棒的數字應該是73。這是因為,73是第21個質數,而它反過來說,37是第12個質數,而它再反過來21則是構成73的兩個數字,也就是7和3相乘的結果。同時73用二進位表示的結果是1-0-0-1-0-0-1,而它反過來念還是1-0-0-1-0-0-1,兩者是一致的。」
看到這裡,不得不感嘆數字的神秘與純粹的美感。天才數學家高斯曾說:「數學是科學的女王,而數論是數學的女王。」在數學界,有眾多天才投入到數論這一暫時還看不到實用之處的領域,他們的唯一目的就是追求純粹的數學之美。
數學之美!正如企業家王小川所說:「數學可以和音樂、美術一樣,具有美感。康德認為數學式之所以美,在於它的合理性——合理是大腦天生的邏輯演繹系統,人人皆有。因此,當我們討論數學之美時,不是比喻,不是人為造作,而是真的人性之感受。」
吳軍博士的科普著作《數學之美》,深受讀者好評,曾獲得了國家圖書館第八屆文津圖書獎和中華優秀出版物提名獎。其實,更準確地說,這是一本介紹如何用數學公式解決計算機、信息技術領域中與人類生活息息相關問題的書籍。在這本書中,你將看到大學時期學習的離散數學中的圖論、布爾代數、線性代數中的矩陣運算竟神奇般的分別解決了網絡爬蟲、搜尋引擎和網頁排名三大難題。即使是高中時期所學的餘弦定理,竟然也被用來解決了計算機對新聞分類的難題。讀完之後,不得不感嘆數學的魅力,原來我們生活中的一切全都離不開數學。正如近代物理學之父伽利略所說:「數學是上帝描寫自然的語言。」
這本書最大的特點有兩個。其一,作者在書中介紹了「信息熵」這個概念,用來對信息的量化度量。《數學之美》這本由34個章節組成的書籍,除了個別介紹科學家生平與研究領域、方式的章節,橫跨了30多個對細小但極為重要領域的思考,每一章都信息量滿滿,充滿著無數個好點子。因此,絕不用擔心這本書的信息量不夠多。其二,作者在書中介紹自然語言處理教父馬庫斯之所以貢獻和地位如此之高,並不是源於他自己的直接發明,而是因為馬庫斯對幾乎所有自然語言處理領域都有獨到見解,因而為他的博士生弟子指明了正確的研究方向,避免了所謂的「無謂嘗試」時間。弟子都是大牛,老師馬庫斯地位自然不會低。這本科普書有點像馬庫斯的做法,書中的數學公式與技術細節並不多,更多的內容用來講述科學家遇到問題後,對問題產生的最本質思考,以及如何運用數學解決問題的思路,其中的創新之處令人讚嘆不已、回味無窮。
下面,談一談其中的幾點感悟。
英語語法學習的思考
20世紀50年代到70年代,科學家試圖用計算機算法描述語法規則來處理自然語言的理解問題,結果出乎意料的是,這20年的研究成果近乎為零。
問題出在哪裡,我們不是一直通過語法書來學習語言的嗎?在18、19世紀,西方語言學家對自然語言的語法規則總結已經非常完善,為何將這些語法規則輸入到計算機中卻並不能達到很高的準確率呢?
作者在書中給出了解答,有兩個原因。一方面是因為用語法規則試圖解析所有語句,到最後會出現一些矛盾現象。而為了處理這些矛盾,又必須用大量的算法說明各個語法規則的使用環境,這就會導致代碼的成倍增加。另一方面,作者指出即使可以寫完涵蓋所有自然語言的語法規則,計算機也很難用來解析,這是因為計算機太難處理詞義和上下文相關特性的問題。
雖然基於規則的自然語言處理進展不順,但是相關的爭論還是在70年代之後持續了近15年之久。直到到了90年代,更多的研究人員才相信這條路行不通。此時,自然語言處理才完成了由語法規則到統計方式的過渡。
現在,大家更傾向於相信的是:「任何語言都有語法覆蓋不到的地方,總會有例外或者一些不確定性的存在。」按照數學語言的說法,那就是語言是無限和開放的集合,因此語法並不具備對語言完備的解編碼規則。
回想起自己學習英語的經歷,當時也犯了很多錯誤。學生時期,我非常傾向於用邏輯來理解,尤其是歐幾裡得《幾何原本》中公理化的嚴密邏輯方式,這給我在理科的學習中帶來了巨大幫助。但是,我想當然地認為語法就是英語中的邏輯,掌握好語法就能掌握好英語。
於是,我花了很大力氣鑽研一本語法書,但總是對書中一些不精確、邏輯矛盾的地方感到困惑,甚至我向多個老師請教,也會有一些解釋不同的情況出現。有人認為是固定搭配;有人認為是理解某種底層邏輯,就能很好理解為什麼是這樣。各有各的說法。
即使是現在,網際網路上還有類似的爭論。語法書與語法書之間總有一些地方的邏輯不同;課外培訓機構鄙視固定搭配,認為英語中沒有所謂的固定搭配,那是老師基本功不夠,純靠理解也可以掌握所有詞組;而學校的傳統教育依然要求學生對詞組、句型進行背誦。
吳軍博士在書中拿「科學家用語法規則處理自然語言的失敗」案例就是對這種現象的一種解釋,我沒有太多對語言學的深層次理解,不過這個科學案例讓我更加傾向於相信下面這個觀點:不必太糾結於語法中那些稍有矛盾和不精確的地方,學習英語應該把語法學習和廣泛閱讀兩者相結合,而後者還更加重要一些。
好教育的暢想
吳軍博士的《數學之美》這本書在每章開頭都提出了很多問題,而這些問題與我們的生活息息相關,能夠瞬間激發我們的好奇心與求知慾。
比如:相比於英語這種羅馬拼音式語言,漢語的輸入法應該如何解決?自然音節編碼輸入?還是偏旁筆畫拆字輸入?輸入法輸入漢字需要同時考慮每個漢字的平均擊鍵次數和尋找這個鍵所需時間,那麼如何平衡二者?如果只考慮平均擊鍵次數,這確實可以縮短輸入時間,但是這與我們的思維模式相同嗎,是否會有一些阻礙?據說當時有3000多種中文輸入法出現,如果要佔領市場,你會選擇哪種中文編碼方式?為什麼曾經火爆的五筆輸入法,現在幾乎全軍覆沒?
相比於解決問題,好的教育更應該鼓勵提出問題。正如網際網路上流傳的這樣一種說法:好的學生善於解決問題,而聰明的學生善於找到重要的問題。
另外,讀過吳軍博士這本書的讀者,很多人都發出了這樣一種感嘆:讀了「數學之美」,才發現大學時學的數學知識竟然如此親切,比如馬爾可夫鏈、矩陣計算、圖論、餘弦定理,竟然可以解決這麼多信息技術領域的問題。
國外一些網絡公開課的結尾總會有很多延伸閱讀、推薦閱讀的文章,這恰恰可以把學生從獨立知識的理解引入到多個層面,大大加強了知識與知識之間的聯繫。
好的教育本該如此,這本書中的單個章節如果加入到相應的數學章節作為延伸閱讀補充,想必會有不一樣的效果。
結語
數學不僅有純粹之美,數學應用依然很美。你覺得呢?