作者自述:過去幾周,我一直在和我最喜歡的無政府主義者諾姆·喬姆斯基進行電子郵件交流。我最初聯繫他是想問他,人工神經網絡(ANN)的最新發展是否會促使他重新考慮他著名的語言理論——普遍語法(Universal Grammar)。我們的談話內容涉及深度學習可能存在的局限性,以及神經網絡可以在多大程度上模擬生物大腦,還涉及到了更具哲學性的領域。在這篇文章中,我不會直接引用喬姆斯基教授的話,因為我們的討論是非正式的,但我將嘗試總結其中的要點。
本文最初發布於 Towards Data Science 博客,由 InfoQ 中文站翻譯並分享。
喬姆斯基是誰?
喬姆斯基首先是位語言學教授(被許多人稱為「現代語言學之父」),但在學術圈之外,他更為知名的身份可能是活動家、哲學家和歷史學家。他出版了 100 多本書,並在 2005 年《外交政策與展望》雜誌進行的民意調查中被評為世界頭號公共知識分子。
鄭重聲明,我是喬姆斯基作品的崇拜者,尤其是他對美帝國主義、新自由主義和媒體的批評。我們的觀點略有分歧的地方在於他對歐洲大陸哲學家(尤其是法國後結構主義者)的駁斥。或許,我在成年早期太過頻繁地從福柯、拉康和德希達那裡汲取靈感,因此受到了毒害,但我總是發現,喬姆斯基的哲學分析方法在道德上很有吸引力,但有點過於「乾淨」,對於我們的世界,無法給出令人滿意地解釋。雖然喬姆斯基對那些後結構主義傑出人物的蔑視顯而易見,但他的哲學觀點比他的批評者對他的讚揚更加微妙
普遍語法
我從一開始就聲明了,我不是語言學家,但在這一部分,我將試著大概介紹下普遍語法理論。在喬姆斯基之前,語言學中佔主導地位的假設是,人類的大腦天生是「白板」(就像一塊空白的石板),通過強化獲得語言。也就是說,孩子們聽到父母說話,他們會模仿他們聽到的聲音,當他們正確地使用一個單詞或構造一個句子時,他們會受到表揚。喬姆斯基的研究表明,強化作用只是其中的一個原因,人類大腦中肯定存在一種與生俱來的結構,這種結構是普遍存在的,能夠促進語言學習。他的主要論點是:
兒童獲得語言的速度太快,而且數據太少,無法用強化學習來解釋(也被稱為「刺激貧乏」)。即使在與人類相同的數據面前,動物也無法獲得語言。20 世紀 60 年代有一個著名的實驗,語言學家試圖教一隻黑猩猩(名為「尼姆喬姆斯基」)學習手語,但 10 年後,它仍然無法交流,只能完成一些基本的任務。所有人類語言之間都有共性。這表明,即使語言是獨立發展的,但在所有人類大腦的共同結構中,仍然存在著普遍性的特徵。孩子們並不是天生只能學習一種特定的語言。如果你把一個在肯亞出生的孩子帶到德國長大,他們學習德語就會和德國孩子一樣容易。這種關於基因硬編碼語言能力的理論在科學界被廣泛接受,但顯然,接下來人們會問,「這種普遍語法實際上是什麼樣子?」很快,勇敢的研究人員就開始著手探索所有人類語言的共同特性,但是,對於我們天生的語言能力是什麼形式,目前仍然沒有形成共識。可以肯定的是,普遍語法並不包含具體的句法規則,而更可能是一種基本的認知功能。
喬姆斯基假設,在人類歷史的某個階段,人類發展出了一種執行簡單遞歸過程的能力,他稱之為「合併(Merge)」,這就是我們在人類語言中看到的句法結構的屬性和約束。這有點抽象(太複雜了,一下也說不清楚),但本質上「合併」是將兩個對象合併成一個新對象的過程。雖然看似平淡無奇,但在腦海中組合概念並遞歸地完成這一操作的能力,卻強大得令人難以置信,使得我們能夠構建「無數種層級結構的表達式」。
這一微小但至關重要的基因飛躍不僅可以解釋我們的語言交流能力,還可以(至少是部分地)解釋我們的數學天賦和人類創造力。這種大約 10 萬年前發生在我們的其中一位祖先身上的「合併」突變,可能是區分人類和其他動物的關鍵因素之一。
人工神經網絡
我聯繫喬姆斯基教授的主要原因是,我想聽聽他對人工神經網絡(我對這個話題的了解比對語言學的了解多得多)的看法。人工神經網絡是機器學習模型的一個子集,它大致地模仿人類大腦,以類似的方式學習(通過大量樣本)。這些模型只需要很少的硬編碼,並且可以用相對簡單的架構執行相當廣泛的複雜任務(例如圖像標記、語音識別、文本生成)。由谷歌開發的 AlphaGo Zero 模型是這種方法的一個有指導意義的示例,它學會了下圍棋(一種複雜且具有挑戰性的棋類遊戲),最終成為人類世界冠軍不可戰勝的對手。
最令人印象深刻的是,經過訓練後,它能在沒有硬編碼或人工幹預(也就是「白板」)的情況下完成這一切。雖然人工神經網絡肯定不是人類大腦的完美類比,但我問喬姆斯基教授,這些模型是否表明,實際上我們不需要硬編碼的認知結構來從分散的數據中學習。
喬姆斯基實事求是地指出,ANN 適用於高度專門化的任務,但是這些任務必須受到嚴格的限制(儘管得益於現代計算機的內存和速度,其適用範圍可能會顯得很大)。他把人工神經網絡比作適用於高層建築的大型起重機;雖然這兩種工具都令人印象深刻,但它們都存在於具有固定邊界的系統中。
這一推理思路與我的觀察一致,即我所目睹的所有深度學習方面的突破都發生在非常特定的領域,我們似乎沒有接近任何類似通用人工智慧的東西(不管這意味著什麼)。
喬姆斯基還指出,越來越多的證據表明,人工神經網絡並不能準確地模擬人類認知,人類認知更豐富,其涉及到的計算系統甚至可以擴展到細胞水平。
如果喬姆斯基是對的(我認為他是正確的),那麼深度學習研究可能的發展結果是什麼?歸根結底,人類的大腦並沒有什麼神奇之處。它只是一個由原子組成的物理結構,因此,我們完全有理由相信,在未來的某個時候,我們可能能夠創造出具有普遍智能的人工版本。也就是說,目前的人工神經網絡只是提供了這種認知的一個模擬,根據喬姆斯基的邏輯,如果我們不首先提高自己對有機神經網絡運行機制的理解,就不可能到達下一個前沿。
道德相對主義
現代數據科學家擔憂的一個突出問題是,如何以合乎道德的方式使用人工智慧,但有時,在其他具體的領域中,其邊界會比較模糊和主觀。喬姆斯基的工作為深度學習的未來提供了獨特的技術視角,普遍語法也具有深刻的道德含義,因為語言是我們探討和解釋世界的方式。例如,喬姆斯基的觀點是,上述固有的神經結構排除了道德相對主義,而且必須存在普遍的道德約束。
道德相對主義有許多不同的形式,但其核心原則是,道德認定沒有客觀依據。道德相對主義者稱,儘管我們可能深信諸如「奴隸制不道德」這樣的說法,但我們沒有實用的方法來向持不同意見的人證明這一點,因為任何證據都必然依賴於價值判斷,而我們的價值觀歸根結底是外生的,由文化和經驗決定。
喬姆斯基認為,道德根植在大腦中,因此,從定義上講,道德是一種生物系統。所有的生物系統都會變異(自然地,或是因為不同的刺激),但它們也有局限性。以人類的視覺系統為例:實驗表明,視覺系統具有一定的可塑性,並受到經驗的影響(尤其是在幼兒時期)。通過改變提供給人類視覺系統的數據,就可以真正地改變感受器的分布,從而改變個體感知水平線和垂直線的方式。
然而,你無法把人類的眼睛變成昆蟲的眼睛,或者賦予某人看到 X 射線的能力。喬姆斯基認為,生物系統(包括道德)可以大幅變化,但不是無限的。他接著說,即使你相信我們的道德完全源自文化,你仍然需要以同樣的方式獲得文化,就像你獲得任何體系一樣(這歸因於與生俱來的普遍存在的認知結構)。
對於這種解讀,我最初持保留意見,如果我們假設道德只是「合併」(或同樣原始的東西)的結果,那麼這可能會帶來理論上的局限,而我的直覺是,我們的道德可以變化如此之大,以至於實際上不可能做出普適性的陳述。過去,喬姆斯基討論過道德進步似乎會遵循某些趨勢(例如接受差異、拒絕壓迫等等),但我看不出來,這些廣泛的趨勢在從如此簡單的原子認知結構中出現時如何保持一致。
當我向喬姆斯基教授提出這一觀點時,他認為這是種錯覺,當我們不理解事物時,它們看起來比實際情況更加多樣化和複雜。他舉了寒武紀大爆發以來動物身體結構變化的例子。僅僅在 60 年前,生物學的主流觀點還是,生物體的差異如此巨大,對於其中的每一種,都必須以個體為基礎進行研究,但現在我們知道,這是完全錯誤的,物種之間的遺傳變異相當小。在複雜的後天系統中,變異必定很小,否則我們無法獲得。
英文原文:
https://towardsdatascience.com/noam-chomsky-on-the-future-of-deep-learning-2beb37815a3e
延伸閱讀:
嚴選DevOps工具鏈的建設-InfoQ
關注我並轉發此篇文章,私信我「領取資料」,即可免費獲得InfoQ價值4999元迷你書,點擊文末「了解更多」,即可移步InfoQ官網,獲取最新資訊~