AI 離數學推理自動化有多近?

2020-11-28 騰訊網

上世紀70年代,已故數學家保羅·科恩(Paul Cohen)曾做出了一個影響深遠的預言,「在未來某個時候,數學家將被計算機所取代。」而且,他還預言所有的數學都可以實現自動化,包括數學猜想的「證明」。自那以後,這個預言始終令廣大數學家們感到既喜又憂。

證明是一個逐步驗證猜想或數學命題真偽的邏輯論證。一旦被證明,猜想就變成了定理。證明既確立了一個陳述的有效性,又解釋了為什麼它是真的。不過,證明也很奇怪,它是抽象的,且與物質經驗無關。

從已有的經驗來看,猜想產生於歸納推理,即對一個有趣問題的直覺反應,但證明一般遵循演繹的、循序漸進的邏輯。它們往往需要複雜的創造性思維以及更費力的填補空白的工作,顯然機器還無法做到這一點。

計算機定理證明器可以分為兩類。自動定理證明器(ATPs),通常使用窮盡式的蠻力方法來完成大型計算。而交互式定理證明器(ITPs)則是充當證明助手,可以驗證一個論點的準確性,並檢查現有證明的錯誤。但是,即使這兩種策略結合起來也不能實現自動推理。

另外,這些工具也沒有受到大多數數學家的歡迎,「對於數學家來說,它們是非常有爭議的,卡內基梅隆大學的認知科學家 Simon DeDeo說。

而且,用計算機實現數學證明還面臨一個艱巨的挑戰:一個機器系統能否產生一個有趣的猜想,並以人們能理解的方式證明它嗎?最近來自世界各地實驗室的一系列進展表明,人工智慧工具可能會是問題的答案。

今年6月,由Christian Szegedy領導的Google Research的一個小組發布了最近的成果,他們努力利用自然語言處理的優勢,使計算機證明在結構和解釋上更像人類。7月,布拉格捷克信息學、機器人和控制論研究所的Josef Urban小組報告了一組由機器生成和驗證的原始猜想和證明。

對於這些進展,一些數學家認為定理證明器是一個潛在的「顛覆者」,而另一些人則說,讓計算機來寫證明對於推動數學的發展是沒有必要的,同時也是不可能的。但是,一個能夠預測有用的猜想並證明一個新定理的系統本身就意味著,推理存在自動化的可能性。

有用的機器      

長期以來,數學家、邏輯學家和哲學家一直在爭論人類靈感在數學證明中的地位和作用。但對於計算機科學家來說,定理證明器並不存在爭議。它們提供了一種嚴格的方法來驗證程序是否可行,而關於直覺和創造力的爭論不如找到一種有效的方法來解決問題來得重要。

例如,在麻省理工學院,計算機科學家Adam Chlipala設計了定理證明工具,它可以生成以前需要由人類編寫的加密算法,以保障網際網路交易的安全。

「你可以用一種工具對任何一種數學論證進行編碼,並將你的論證連接在一起,以創建安全證明,」Chlipala說。

在數學領域,定理證明器幫助產生了複雜的、計算量大的證明,節省了數學家們幾百年的時間。克卜勒猜想是一個很好的例子,它描述了堆疊球體的最佳方式,提供了一個很有說服力的例子。1998年, Thomas Hales和他的學生Sam Ferguson一起,利用各種計算機數學技術完成了一個證明。這個結果非常繁瑣,佔據了3G的空間,以至於12個數學家分析了好幾年才宣布他們有99% 的把握確定它是正確的。

克卜勒猜想並不是唯一被機器解決的著名問題,另一個有名的例子是四色定理。該定理認為你只需要四種色調就可以給任何二維地圖上色,從而使沒有兩個相鄰的區域共享一種顏色。1977年,數學家使用電腦程式解決了這一問題。

在2016年,三位數學家用一個電腦程式證明了一個長期存在的開放挑戰,即布爾畢達哥拉斯三倍問題。但是這個證明的最初版本大小高達200TB,僅僅是下載就需要花上數天時間。

複雜的情感      

按道理說,這些例子可以用來說明數學自動化的可行性,但事情沒這麼簡單。一個質疑是,如果他們想使用定理證明器,數學家必須首先學會編碼,然後想辦法用計算機友好的語言來表達他們的問題。

但顯然這些做法不符合解決數學問題的一般流程,「當我把自己的問題重新構造成適合這項技術的形式時,我為什麼不自己解決這個問題呢?」哥倫比亞大學的數學家Michael Harris說。

許多人只是認為在他們的工作中不需要定理證明器。倫敦帝國理工學院的數學家Kevin Buzzard說:「他們有鉛筆和紙就夠了!」三年前,他將自己的工作從純數學轉向專注於定理證明器和形式化證明。「計算機已經為我們完成了驚人的計算,但它們從來沒有自己解決過一個困難的問題,」他說,「在它們做到這一點之前,數學家們是不會相信這些東西的。」

但Buzzard和其他人認為定理證明器很有必要。首先,「計算機證明可能並不像我們想像的那樣陌生,」DeDeo說。最近,他和現就讀於史丹福大學的計算機科學家Scott Viteri一起,對一些著名的規範證明(包括歐幾裡得《元素》中的一個)和幾十個機器生成的證明進行了逆向工程,使用一種名為Coq的定理推理器編寫,以尋找共性。他們發現,機器證明的網絡化結構與人做的證明的結構非常相似。他說,這種共同的特徵可能會幫助研究人員找到一種方法,讓證明助手在某種意義上解釋自己。

「機器證明可能並不像它們看起來那麼神秘,」DeDeo說。

其他人說,定理證明器可以成為有用的教學工具,無論是在計算機科學還是數學領域。在約翰霍普金斯大學,數學家Emily Riehl開發了一些課程,讓學生使用定理證明器寫證明。「這迫使你非常有條理,思維清晰,」她說。「第一次寫證明的學生可能會有困難,不知道自己需要什麼,也不了解邏輯結構。」

Riehl還表示,她在自己的工作中越來越多地使用定理證明器。「這不一定是你必須一直使用的東西,也永遠不會代替在紙上演算,」她說,「但使用證明助手改變了我寫證明的思維方式。」

此外,定理證明器還是極好的校驗能手。1999年,俄裔美國數學家弗拉基米爾·沃沃德斯基(Vladimir Voevodsky)利用機器在他的一個證明中發現了一個錯誤。從那時起,直到他在2017年去世,他一直是使用計算機檢查證明的積極支持者。

Hales說,他和Ferguson在用計算機檢查原始證明時發現了數百個錯誤。即使是歐幾裡得《元素》中的第一個命題也不是完美的。如果機器能幫助數學家避免這種錯誤,為什麼不利用它呢?

而劍橋大學數學家、菲爾茲獎章獲得者Timothy Gowers想得更遠。他設想未來定理證明器將取代主要期刊的審稿人。「我可以看到它成為標準做法,如果你想讓你的論文被接受,你必須讓它通過自動檢查器。」他說。

與計算機對話      

但在計算機能夠普遍檢查甚至設計證明之前,研究人員首先要掃清一個重要的障礙:人類語言和計算機語言之間的溝通障礙

如今的定理證明器並不是為了方便數學家而設計的。ATP一般用於檢查一個語句是否正確,有了ATP,程式設計師可以將所有的規則或公理編碼進去,然後問某一猜想是否遵循這些規則。然後計算機就會完成所有的工作。「你只需輸入你想證明的猜想,然後你希望得到答案,」加州大學伯克利分校的計算機科學家Daniel Huang說。

但問題是,ATP不能解釋其工作。所有的計算都發生在機器內部,在人眼看來,它就像是一條由0和1組成的長長的字符串。「沒有人類能看懂那個證明。」Huang說。

而ITP擁有龐大的數據集,其中包含多達數萬條定理和證明,它們可以掃描這些數據集來驗證一個證明是否準確。與ATP不同的是,ATP是在一種黑匣子中運行,只需吐出一個答案,而ITP則需要人與人之間的互動,甚至是一路的指導,所以它們並不是那麼的遙不可及。

近年來,ITP越來越受歡迎。2017年,布爾畢達哥拉斯三元組問題背後的三位數學家使用ITP Coq創建並驗證了他們證明的形式化版本;2005年,微軟劍橋研究中心的Georges Gonthier使用Coq將四色定理形式化。Hales還在克卜勒猜想的形式化證明上使用了名為HOL Light和Isabelle的ITP。

今天,該領域的前沿研究者會嘗試將學習與推理相融合。他們經常將ATP與ITP結合起來,還整合了機器學習工具,以提高兩者的效率。他們設想的ATP/ITP程序可以使用演繹推理,甚至可以像人們一樣交流數學思想。

推理的極限      

Josef Urban認為,通過這種結合的方式,可以實現證明所需的演繹和歸納推理的結合。他的團隊在機器學習工具的指導下建立了定理證明器,讓計算機通過經驗自行學習。在過去的幾年裡,他們還探索使用了神經網絡。

而谷歌研究部的Szegedy認為,在計算機證明中實現自動推理的挑戰是一個更大領域的子集:自然語言處理(NLP),這涉及到單詞和句子使用中的模式識別。和其他小組一樣,他的團隊希望定理證明器能夠找到並解釋有用的證明。

受AlphaZero等人工智慧工具快速發展的啟發,Szegedy的小組希望利用語言識別方面的最新進展來撰寫證明。他說,語言模型可以展示出令人驚訝的堅實的數學推理能力。

他在Google Research的小組最近描述了一種使用語言模型(通常使用神經網絡)來生成新證明的方法。在訓練模型識別已知為真的定理中的一種樹狀結構後,他們進行了一種自由形式的實驗,只要求網絡在沒有任何進一步指導的情況下生成並證明一個定理。在生成的數千個猜想中,大約13%的猜想既可證明又是新的(意味著它們沒有重複資料庫中的其他定理)。他說,這個實驗表明,神經網絡可以教給自己一種理解證明的樣子。

「神經網絡能夠發展出一種人類風格的直覺,」Szegedy說。

當然,這些努力是否能實現科恩40多年前的預言,目前還不清楚。Gowers曾表示,他認為到2099年,計算機將能夠超越數學家。他預測,到那時,數學家起初將享受一段美好時光,「數學家做所有有趣的部分,計算機做所有無聊的部分。但我認為這只會持續很短的時間。」

「畢竟,如果機器繼續改進,並且它們能夠獲得大量的數據,那機器應該也會變得非常擅長做有趣的部分。」Gowers說。

參考資料:

https://www.quantamagazine.org/how-close-are-computers-to-automating-mathematical-reasoning-20200827/

原創:競科技

相關焦點

  • 計算機距離數學推理自動化有多近?
    據報導,在1970年代,已故的數學家保羅·科恩(Paul Cohen)是唯一獲得過數學邏輯領域勳章的人,據此做出了一個廣泛的預測,這一預測繼續激起和激發了數學家——「在未來的某個不確定的時期,計算機將取代數學家。」因在集合論中大膽的方法而聞名的科恩(Cohen)預測,所有數學都是可以自動化的,包括編寫證明。
  • AI是如何檢測色情片的?
    一個婚禮博客Clarifai使用其產品來進行自動化的內容審核,而以前負責審批圖像的編輯則轉向從事定性標記的任務。這並不是要降低自動化下真正的人力成本。人們必須對AI進行訓練,並對內容進行分類然後進行標記,以便AI能夠識別哪些不能或可能導致創傷後應激障礙(PTSD)。這才是未來應有的樣子:公司提供個性化,現成的解決方案,使其全部業務能夠在越來越多的數據上訓練更好的分類器。
  • 行測篇8:判斷推理之數學推理題做題方法!
    行測篇8:判斷推理之數學推理題做題方法!這次課我們主要來講解國考行測判斷推理題之數學推理的內容,數學推理相對來說是較為簡單,經過訓練可以拿到高分的一類判斷推理題型,所以我們要著重對這方面的內容進行研究訓練。下面主要圍繞數學推理各類題型及對應解題方法給大家做出詳細說明。
  • 趣味數學——邏輯推理(一)
    從廣義上說,任何一道數學題,任何一個思維過程,都需要邏輯分析、判斷和推理。我們這裡所說的邏輯問題,是指那些主要不是通過計算,而是通過邏輯分析、判斷和推理,得出正確結論的問題。  邏輯推理必須遵守四條基本規律:  (1)同一律。
  • 傳遞性、三段論、歸納法——初中數學演繹推理三大基本方法
    初中數學能力包括空間想像能力、抽象概括能力、推理論證能力、運算求解能力、數據處理能力和應用能力。推理論證能力是數學學習的基本能力之一,包含猜想和證明兩大部分。初級的推理論證通常表現為能根據已知條件和已有的數學結論,論證某一數學命題的真實性的初步的推理能力。
  • 自動化是當前與深度學習及人工智慧等的不可分割的關係
    自動化是當前與深度學習及人工智慧等的不可分割的關係,也同樣是當前的熱門主題。自動化機器學習在自動化,人工智慧,無人機等科技領域有廣泛的應用。自動化機器學習可以模擬生物學過程,比如分類,和識別。分類。分類就是識別。
  • 踏入AI領域,這些數學基礎一定要打好
    2017年LinkedIn(領英)發布的《全球AI領域人才報告》顯示,過去三年間,通過領英平臺發布的AI職位數量從2014年的5萬飆升至2016年的44萬,增長近8倍。對於專業的Researcher來說,從大學到現在,課堂上學的和自學的數學其實不算少了,可是在研究的過程中總是發現需要補充新的數學知識,如Learning、Vision等都是很多種數學的交匯場。可見數學在AI技能進階之路上有著極其重要的地位,但數學是一門龐大的學科,全面掌握難度較大,針對機器學習及具體的AI應用領域我們還是需要有的放矢地進行學習。
  • 《風聲》演繹著數學與推理的神話,這部電視劇受到網友的熱烈追捧
    在風雪中,有像大連海洋大學17人那樣的「青年抗疫突擊隊」,也有年過半百的大媽樓長。有一位大媽樓長志願者,不顧年齡和風雪的影響,每天穿著防護服為居民跑前跑後,每天定點給樓道消毒,組織核酸檢測等等,被居民熱烈稱頌,她沒有時間追劇,休息時間也很少,生活當中這樣的大媽樓長有很多,我們為有這樣的樓長以及其他像她一樣的志願者點讚。
  • 如何利用稀疏性提高AI推理速度
    NVIDIA Ampere架構使數學運算速度加倍,為各種神經網絡處理提速。如果你玩過疊疊樂,那麼就可以把AI稀疏性(sparsity)想像成是疊疊樂。遊戲參與者首先將積木塊交錯堆疊成一座積木塔。遊戲開始的時候,抽取積木很容易,但越往後進行就會變得越驚險,最後必定會有一名玩家在取出積木時碰倒整個積木塔。多年來,研究人員們一直在研究如何通過稀疏性加速AI,其過程就像是在玩兒數字版的「疊疊樂」。他們嘗試著儘可能多地從神經網絡中抽出多餘參數,同時又不破壞AI的超高精度。這樣做是為了減少深度學習所需的矩陣乘法堆,從而縮短取得準確結果的時間。
  • 如何利用稀疏性提高AI推理速度?
    遊戲開始的時候,抽取積木很容易,但越往後進行就會變得越驚險,最後必定會有一名玩家在取出積木時碰倒整個積木塔。多年來,研究人員們一直在研究如何通過稀疏性加速AI,其過程就像是在玩兒數字版的「疊疊樂」。他們嘗試著儘可能多地從神經網絡中抽出多餘參數,同時又不破壞AI的超高精度。這樣做是為了減少深度學習所需的矩陣乘法堆,從而縮短取得準確結果的時間。
  • 討論「中國社會科學離科學有多遠」,必須跳出實證主義窠臼
    文中提到,喬曉春教授認為,中國社會科學研究有五種怪現象:(1)非專業人員比專業學者在社會上更有影響;(2)未受過專業訓練的人可以輕易進入專業領域;(3)社會科學很多研究是憑經歷、感受、哲學推理下結論的;(4)通常陷入沒有意義的類似辯論賽的爭論;(5)不做文獻回顧,研究只憑想像。既然稱之為「怪」現象,自然會有某種「正常」現象與之相對照。
  • 合情推理與演繹推理的關係
    歸納是一種由特殊到一般的推理,根據某類事物部分對象具有某種特徵,來推出這類事物的全部對象都具有這種特徵。比如「已知部分金屬(銅、鋁、鐵)能導電,所以我們推出所有金屬都可以導電」,這就是一種歸納推理。類比是一種由特殊到特殊的推理,根據一類事物具有某種特徵,來推出另一類相似事物也具有某種特徵。比如「已知地球上有水,推出火星上也有水。」歸納和類比都屬於合情推理,是一種猜想,未經過嚴格的推導,因此其結論未必正確。但學會合情推理可以發散我們的思維,使我們的思想不受拘謹。
  • 具有傳遞關係的推理---直言三段論 - STEAM新數學自媒體
    這個推理模式是不會有任何錯誤的,因為結論x→P是來源於大前提A→P的定義,因此,從條件到結果是必然的。從推理的過程看,可以認為這個形式的推理是不言而喻的,甚至可以認為這個形式的推理是毫無意義的,但是,這個論證形式在日常生活中特別是在數學證明中卻是非常重要的。回憶歐幾裡得《原本》中的第一個數學問題,這個問題的證明可能是現存的能夠被稱為數學證明的第一個證明。
  • 判斷推理:必然性推理之樸素邏輯
    今天為大家帶來判斷推理題庫之必然性推理之樸素邏輯。希望可以幫助各位考生順利備考!首先和大家分享一下樸素邏輯的含義,樸素邏輯是自發形成的、不系統的邏輯推理過程,與必然性推理中其他命題有所區別,沒有自身的推理規則,在做題時,需要仔細觀察題幹信息,找準突破口。突破口也是接下來為大家詳細介紹的內容。
  • 可編程宇宙,由細胞自動機、曼德勃羅集等推理
    可編程宇宙宇宙是可編程的,推理過程如下:黑洞,白洞熵增,熵減三進位最好,因為自然常數e表示狀態多,又簡單,可以推理得出,e約為2.71828,三進位離e最近。(黑洞)用0表示混亂,熵增,粉碎代碼(白洞)用1表示秩序,熵減,重組代碼能量用2表示,能量維持0,1兩者的關係(0,1,2)數學規定其基本迭代,自組織規則,數學是三進位的構成規則。
  • 《推理論證》詳細解讀
    二、反證法矛盾:反證法的三種矛盾形式為:自相矛盾;與題設矛盾(全部或部分);與重要結論(事實)矛盾三、反證法步驟:假設結論的反面成立;經過一系列演繹邏輯推理(核心與關鍵);得到相關的三種形式的矛盾四、反證法細節:必須對原命題的結論進行全盤徹底否定,不可有任何否定的遺漏五、反證法適用:四種反證法的命題形式-至少至多命題;否定語句命題;接近公理命題;存在唯一命題
  • 吳軍:離信息越近的人,離財富越近
    在山頂燃起一堆篝火,就能夠被三十多公裡外的守望臺哨兵看到,有時甚至可以距離更遠。要是傳達的情報內容不那麼特殊的話,所需的信息容量就更大了。人類嘗試了各種方法,如旗幟、號角、時斷時續的狼煙和反光的鏡子等,甚至想像出天使和靈來傳遞信息——天使,顧名思義,就是傳遞神的信息的使者。
  • AI能夠取代數學家嗎
    直覺是不依賴於嚴格推理的洞察力。它引導我們在沒有證明的情況下走向可信的結果。它是整體性的,而不是分析性的。在數學的創造過程中,它是必不可少的。但歸根結底,在沒有找到嚴格的證明之前,通過直覺產生的結果仍然是一種猜想。有許多閃閃發光的猜想在呼喚著某個傑出的數學家來證明它們。
  • 你需要離地球多近才能被它的重力影響?
    「當一個物體從遠處以速度V向地球(質量M)駛來,需要多近才能被地球的重力場影響到?」這是一個很有趣的問題。有幾種方式可以解答你的疑惑,最簡單的就是去使用被我們成為「雙曲飛行」的假設。讓我們假設一個物體距離地球很近,以至於地表重力的影響超過可太陽。
  • 為什麼地球離太陽越近越冷?海拔越高越冷?
    畢竟爬得越高,離太陽越近(儘管是微不足道的一點距離)。這樣推理的話,海拔越高應該越熱嘛!但我們都知道山上反而要比山下冷,那這是為什麼呢?首先說海拔和溫度的關係吧 。看圖,圖中紅線代表大氣層不同高度的溫度,橫坐標表示溫度,左邊的縱坐標表示高度,右邊則是氣壓。