「全能棋王」AlphaZero 背後的真正啟示:直覺是如何戰勝邏輯的

2020-12-05 DeepTech深科技

(《麻省理工科技評論》中英文版APP現已上線,年度訂閱用戶每周直播科技英語講堂,還有科技英語學習社區哦~)

現代文明和科技已經使得我們的直覺不斷退化。絕大多數人都沒有意識到直覺的價值甚至沒有意識到它的存在。作為複雜計算的基礎,直覺是一種很容易被忽視的非常規方法。這種非常規性使得許多研究人員忽視它的潛力。

我在人工智慧領域所做的工作圍繞「先進的認知機器將使用直覺作為其智力基礎」這一想法。我們人類的思想為一般化的智力提供了充足的證據。人類本質上是直覺機器,而我們理性(和自覺)的自我只是基於直覺的機器之上的一個模擬。與笛卡爾的名言「我思故我在」形成鮮明的對比,意味著我們的理性思維就是把我們與其他所有生物區分開的東西。

我們因此在認知上有了偏見,要求技術和方法由邏輯機器驅動。這就是 Good Old Fashioned AI (GOFAI) 在過去幾十年間失敗的原因,它從一開始就試圖通過邏輯範式來解決智力問題。

一個關於直覺的機器的反直覺的預想就是「邏輯思維如何從直覺機器中產生呢?」自 2012 年以來,我們已經見證了深度學習技術令以難以置信的進步。深度學習網絡就是直覺機器。深度學習網絡通過歸納來進行推理或者作出預測。深度學習系統已經能夠執行通常保留給生物大腦的任務了。已知對於傳統計算來說難以進行的任務,例如面部和語音識別,可以由這些機器以超越人類的水平執行。

然而,深度學習網絡無法執行長除法等邏輯任務。人們不應該指望能夠教導一個動物(比如你的寵物狗)加減,更不用說乘法。然而,人類的大腦卻可以執行各類這樣的邏輯問題。我們不得不問,洞穴人能做乘法嗎?我們是天生就具備先進的邏輯認知能力,還是說那是我們作為先進文明的結果而學到的能力?

要實現更一般化的人工智慧需要跨越的巨大鴻溝就是所謂的「語義鴻溝」。我們要如何將深度學習(低階語義)系統與邏輯(高階語義)系統的能力融合在一起?

人類思維能夠發揮邏輯推理的偉大功績。如果我們的思維機器都是基於直覺的,那麼它是如何做到這一點的呢?我要在這裡假設我們沒有任何天生的邏輯裝置。在我們已經存在於這個星球上的短時間內,現代智人不大可能發展出這種認知機制。因此,為了消除語義鴻溝,我們需要使用只基於直覺的機制來彌合。這意味著我們不需要將邏輯組件與直覺組件進行融合。我們所需要一切的就只是直覺組件。

因此我們需要充分的證據來證明,複雜的邏輯思想可以通過直覺機器來完成。

這才是 AlphaZero 革命性的啟示。AlphaZero 是 DeepMinds Go play 程序的最新版本。我之前介紹過 AlphaGoZero 如何可以從零開始掌握圍棋的玩法(不需要人類的經驗)。西方人從來沒有玩過圍棋的遊戲,根本就不理解它。所以 DeepMind 的 AlphaGoZero 成就的相關性已經被消除了。我們不明白這個成就的重要性。然而,圍棋一直被認為是一個直覺遊戲。所以一個基於直覺的機器掌握了這項遊戲並不令人驚訝。

什麼?DeepMind 的新化身(AlphaZero)卻能做的就是玩西洋棋?這對很多人來說仍沒有什麼令人驚訝的,自 1996 年 IBM 的 DeepBlue 擊敗卡斯帕羅夫以來,這個遊戲就被「解決」了。對於外行來說,AlphaZero 只花了幾個小時就能從頭開始掌握西洋棋遊戲也沒什麼值得注意的。甚至 AlphaZero 在 100 場比賽中能夠摧毀最好的西洋棋程序 Stockfish 也並不值得注意。

真正了不起的是 AlphaZero 在消解更合乎邏輯的對手方面所起的作用。為了讓你理解,我會引用一些象棋社區的評價。

它接近「類型 B」,按照克勞德·香農和艾倫·圖靈的夢想,用類似於人類的方法來下棋,而不是蠻橫的力量。—Gary Kasparov.我總是在想,如果有一個超級先進的物種降落在地球上並向我們展示他們如何下棋,那將是怎樣的情況。現在我覺得我知道了。—Peter Heine Nielsen它的棋路不像人類,但也不像程序。它以第三種方式,可以說是外星人的方式下棋。—Demis Hassabis(DeepMind 創始人,西洋棋愛好者)

對於那些了解西洋棋的玩家來說,最好的辦法就是觀看 AlphaZero 和 Stockfish 的實戰。你會看到的是一個基於直覺的系統如何拆解基於邏輯的對手。以下是遊戲及專家評論:

AlphaZero 西洋棋的走法非常不同。為了獲得優勢超過對手的位置,它願意犧牲一些棋子。它正在發揮一種西洋棋柔道,利用對手的對短期利益的熱切渴望來對抗它。它將對手置於西洋棋中稱為「被迫強制」的地位,無論如何走動都只會導致更糟糕的結果。

西洋棋的遊戲似乎更具整體性,所有棋子都以高度協調的方式移動。AlphaGo zero 所進行的遊戲最大限度地發揮了它的創造力,而它的邏輯對手無法超脫短期收益。它不僅在用一種不可想像的方式來玩西洋棋,而且這種方式將被置於令所有人驚嘆的位置上。

關於 AlphaZero 的論文在最近結束的 NIPS 2017 大會上發表。那是一篇很短的論文,主體部分只有 7 頁長。它提供了廣泛的關於如何評估棋盤上的落子位置和決定下一步走法的有趣的細節。

和 Stockfish 每秒搜索 7 千萬位置相比,AlphaZero 每秒只搜索 8 萬個位置。

直覺機器使用的評估比邏輯對手少 1,000 倍。

你在這裡與 AlphaZero 共同見證的是對我關於直覺機器和他們執行邏輯推理的能力的原始論證的驗證。這是被連結的語義鴻溝。這是一個極其艱巨的通用人工智慧的裡程碑正在以創紀錄的速度被超越。我想 AI 界的任何人都期望這樣的進展能夠迅速地實現。現在這樣的事情已經發生了,人工智慧的風景將被永遠改變。

相關焦點

  • 棋類大師 AlphaZero 無師自通,「通用人工智慧」加速到來?
    我們因此產生了需要(由邏輯機器推動的)邏輯和方法論的認識偏見。這確實是懷舊範的AI(GOFAI)試圖以形式邏輯為出發點解決智能問題失敗了幾十年的原因。對於基於直覺的機器,其中一個反直覺的預言是「邏輯思維怎麼能從直覺機器裡冒出來呢?」自2012年以來,我們已經看到了深度學習技術取得了令人難以置信的進展。深度學習網絡就是直覺機器。這些系統學習通過利用歸納來進行推理(或做出預測)。
  • 神秘主義、直覺與邏輯悖論
    事實是,無論何時,當你全神貫注於某個麻煩,或你的生活中的某件大事——例如,性——那麼,不論你從什麼事情開始,聯想將最終而且不可避免地導向背後的相同主題。弗洛伊德在分析之後指出,夢顯得是多麼有邏輯。夢當然是有邏輯的。」在這裡,維根斯坦承認夢是有邏輯的,亦即可以通過邏輯來理解夢。
  • 呂贇剛榮膺甘肅業餘棋王和新科省象棋冠軍
    新甘肅客戶端蘭州11月30日訊(新甘肅·甘肅日報記者李滿福)經過九輪密集大戰,全國象棋業餘棋王(甘肅省預選賽)暨2020年甘肅省象棋錦標賽,昨晚在蘭州鳴金收兵。名不見經傳的定西通渭小夥呂贇剛一路過關斬將,最終衝上一號臺,並先手戰勝最後一個對手張尕軍後,成為新的甘肅業餘棋王和全省新科象棋冠軍。
  • 世團賽柯潔與李世石"過招" 呼籲關注"誰是棋王"
    開幕式之後,李世石和柯潔分別央視節目「誰是棋王」落子並寄語棋迷。  開幕式場面令人興奮,而開幕式開始前的興奮點在於找日本圍棋的「史前巨獸」們籤名合影。棋迷、工作人員、記者,以及不少參賽棋手,趙治勳、小林光一、王立誠、依田紀基身邊的人絡繹不絕。
  • AlphaZero:從小白開始制霸多個遊戲
    儘管 AlphaZero 是從隨機遊戲開始訓練,並且只知道基本的遊戲規則,沒有內置專業知識,這一份評估與論文描述了 AlphaZero 如何快速學習每種棋類遊戲並成為最強玩家。 前西洋棋世界冠軍 Garry Kasparov 評價道: 我無法掩飾對它的欣賞,它下棋的風格靈活多變,和我很像!
  • 反直覺冷知識,五分鐘讀懂,人類是如何進步的?
    大家好,今天我們來聊聊,哲學家波普爾的思想,關於人類的認知,是如何實現增長的? 換句話說,那些不能被證偽的認知,就不能算是真正的知識,比如神學,怎麼說都對,而且還無法反駁,這種認知就不是真正的知識。 真正的知識,必須是可以被證明是錯誤的,也就是可以被證偽的,這是波普爾作科學哲學家的一個重要結論。
  • 《棋王》蘊含的中國傳統文化英譯研究——以杜博妮 2010 年修訂本...
    杜博妮對翻譯策略的選擇,其背後的主要原因是她主張立足於中國文學的個人翻譯觀, 一反翻譯研究界長期被「歐洲中心主義」話語統治的局面。 關鍵詞:《棋王》;傳統文化;「道」;「仁愛」 《棋王》及其英文譯本 作為 80 年代「尋根文學」的代表作之一,《棋王》自出版以來就受到了海內外的關注,一度形成「阿城熱」現象。
  • 樹呆熊棋王爭霸賽冠軍原來是他
    由安徽百家連鎖網咖樹呆熊網咖主辦的樹呆熊棋王爭霸賽在經歷了近兩個月的線上選拔後終於迎來了線下總決賽的較量!6月16日17:00萬眾期待的樹呆熊棋王爭霸賽總決賽在合肥宿州路商之都中心廣場正式拉開帷幕!什麼是自走棋 《刀塔自走棋》是一款由遊戲玩家自制地圖的dota2衍生玩法。刀塔自走棋將策略對戰棋牌玩法與Dota自定義地圖結合,支持1-8人遊戲(單人是雲玩家練習模式,2~8人是對戰模式)。
  • 超感知探索:直覺與知覺
    第二種是大腦直覺,它是大腦超感知功能的體現,如第六感。直覺是如何產生的,「直覺信息」來自哪裡?一、直覺產生的三種機制1、右腦的功能。人腦分為左腦和右腦兩部分,左腦是邏輯腦它產生知覺感知,右腦是天才腦它產生直覺。人通常使用左腦,右腦功能被隱藏。
  • 不敵韓國圍棋人工智慧,戰勝過AlphaGo的人退役了
    2001 年,李世石在獲得第五屆 LG 杯世界棋王賽亞軍後升至七段,2003 年獲 LG 世界棋王戰冠軍,直升九段。李世石的圍棋生涯中曾有一次「妥協」的退役風波,2009 年 6 月,李世石曾向韓國棋院提交過休職書,稱因「韓國棋院對棋手不合理的約束」而身心疲憊,計劃從當日起休職到 2010 年底。半年後,李世石復職,但桀驁不馴的性格並未改變。
  • 學會這些,你也能擁有超強直覺
    其實,這種感覺沒有什麼特別「不科學」的地方,其背後是有心理學依據的。(1)第六感背後的心理學第六感可以解讀為:即時的情境解讀,其背後的邏輯是:通過少量的細節,與我們大腦中已有的資料快速匹配,然後得到一個分析結果。
  • 愛因斯坦:我相信直覺,一切科學成就都始於直覺
    直覺太重要了,愛因斯坦說:「一切偉大的科學成就都始於直覺的知識,也就是說,從不言自明的公理出發,才能加以推演。……而直覺是發現這些公理的必要條件」。愛因斯坦說:「我相信直覺和靈感。……有時候我感到自己是對的。
  • 再揭邪教全能神(圖)
    三年裡,人們是否對全能神邪教有了全面深刻的認知和防患意識呢,吳女士死於賓客熙熙攘攘的麥當勞餐廳這樣的悲劇還會再上演嗎,全能神究竟是怎麼蠱惑人心的?她常對信徒說自己被聖靈感動見到異夢異象,還終日講解她的異夢、異象和啟示。1991年下半年,楊向彬在河南以「聖靈作工」的名義寫出了「神話」。「神話」中將信徒分為神長子、神眾子、子民、效力者、淘汰者等各種等級。各信徒對比「神話」,發現自己都有可能被淘汰。趙維山因此而認識到了楊的巨大價值,不顧楊高考落榜後精神分裂的現實,將其納入權力體系,並將她發展為自己的情婦。
  • 順周期背後的宏觀交易邏輯是什麼
    整個市場都把目光集中在這些已經被充分討論過的交易邏輯上,諾安成長某種意義上,就是晶片這個熱門交易邏輯的結果。但往往能夠賺到錢的,都是不是熱門的交易邏輯。而是一個真正貫穿大經濟基本面的交易邏輯,比如2015年全年有很多花裡胡哨的概念。又是遊戲,又是電影……但真正縱觀那輪行情,移動網際網路給社會帶來的改變,才是真正的財富密碼。
  • 「阿爾法狗」雖然在棋盤上戰勝了人類,但它取勝的利器是模仿人類
    「阿爾法狗」雖然在棋盤上戰勝了人類,但它取勝的關鍵「武器」卻恰恰是模仿人類。「阿爾法狗」是美國谷歌公司旗下人工智慧公司「深度思維」開發的智能軟體(圍棋電腦程式),研發者稱它「已經集合了3000萬種職業棋手的下法」,但這款圍棋電腦程式與此前不同的是,「它具有數百萬次深度學習與自我對戰,十分接近帶著直覺和第六感的人類大腦」。
  • 直覺去了哪裡?
    30年前這一問題被美國一知名雜誌刊登後引發了熱議,因為直覺告訴我們換不換都是一樣的,但答題人選擇換。數學愛好者、專業人士紛紛加入討論,進行了一場曠日持久的論戰,還發展出了諸多變種。現在讓我們來回顧一下這道經典問題,來看看直覺到底哪出錯了,信息又是如何影響結果的。
  • 如何看待女生的直覺?早就有預感,不想拆穿他!
    女人的直覺是一種與生俱來的判斷力,它是跟生理有關的。 男人自然也有他自身的優點,所以這根本沒有什麼, 女人通過敏銳的視覺,尖銳的根據一切可以搜集到的生物信息, 從而得到貌似直覺的判斷, 其實女人的每一個結論肯定都是有它的支持理由的!女人都相信直覺判斷,首次見一個人,直觀知道是否能合得來,是否能接近。
  • 再戰阿爾法狗,還是棋王柯潔的又一次「不務正業」?
    大眾對於柯潔最早的認知,絕大部分源自2017年與"阿爾法狗"那次人類棋王與人工智慧的"人狗大戰",在那次對決中柯潔三番棋全敗,其中第二局被機器評定表現完美。而當時的賽後採訪中,柯潔也表示對"阿爾法狗"心服口服: "我輸了都沒什麼脾氣"。
  • 鬥魚棋王爭霸賽:三星刺客面對玄策只能拉胯?相依為命才是關鍵
    備受玩家們關注的鬥魚峽谷棋王爭霸賽於昨日正式開啟11月份的新賽程,據悉棋王爭霸賽10月份便是吸引了2千多位王者模擬戰玩家和主播參與,雖說選手實力參差不齊,但是幾百場的精彩對決看大觀眾們也是大呼過癮。有了10月份的基礎,鬥魚峽谷棋王爭霸11月份熱度再升級!
  • 人工智慧首次戰勝職業玩家
    在這篇論文中,多次出現一個詞:「直覺」,也就是我們常說的「牌感」。DeepStack注重培養人工智慧出牌時的「直覺」。在運用深度學習,反覆自我博弈之後,DeepStack學會了在每一個具體情境出現時進行推理。  這非常接近人類玩家的「牌感」,即在當前情境下對個人牌面大小的感覺,並作出相應的決策。