柯潔別做夢!人類進化5000年也幹不過AlphaGo

2020-11-28 騰訊體育

文/藍馨晴(微信公眾號:極客視界)

這是一場毫無意義的比賽,因為勝負早已註定。 李世石贏不了,就算贏一場也是僥倖,柯傑來了也沒用,吳清源復活也沒用。

如果你對 AlphaGo 或者如今的 AI 發展稍微有點了解的話,你就會明白為什麼人類下不贏電腦,就算再進化 5000 年也沒用。

先來解釋一下阿爾法狗是怎麼下棋的。

圍棋有 361 個格子,理論上講,黑子的第一步有 361 種選擇,然後白子有 360 種應對,然後黑子 359 ,以此類推。每一步棋最終可能會導致各種各樣的結果,如果你能窮盡所有結果,看看其中有多少是獲勝的,有多少是失敗的,就可以計算出這步棋有多大的可能性讓你贏。每次輪到你下棋時,都選擇贏面最大的那一步棋,最終你就是獨孤求敗,永遠都不會輸了。這就是從深藍到阿爾法狗都會使用的「蒙特卡羅樹」搜索方法。

人工智慧又一次挑戰世界冠軍,人腦還能堅持多久?

當然,這只是理論上的,因為窮盡所有是不可能的。經過估算,圍棋的全部可能性為 10^170 種,全宇宙的原子數量加起來才 10^80,阿爾法狗還沒流弊到能計算全宇宙的原子。既然不能窮盡,就只能拿有限數量的棋局來進行估算,這就組成了阿爾法狗的核心部分:「Policy Network」,稱為策略網絡。從 5000 年前中國人發明圍棋開始算起,全人類下過的棋局可能也不過幾十萬局到幾百萬局,有大量的變化和局面還未有人嘗試,這顯然不能滿足阿爾法狗的胃口。於是它發明了一種製造棋局的方法:自己跟自己下。據說它的「快速走子」2 微秒可以下一步棋,1秒鐘已經下完了幾千盤棋局了。它在和李世石比賽之前已經儲備了 3000 萬個棋局,這裡面有多少對局可能是人類再下 5000 年棋也創造不出來的。

如果光是這樣,那也還做不到獨孤求敗,畢竟和電腦相比人類還有「棋感」、「經驗」、「靈光一現」這類無法量化的東西。圍棋號稱「千古無同局」,經常會出現一步棋讓盤面發生翻天覆地的變化,就像天龍八部裡的珍瓏棋局所描述的那樣。為了防止人類通過奇招、怪招打敗阿爾法狗,它還有另外一套計算方法:「Value Network」稱為估值網絡。它從儲備的 3000 萬個棋局(按1秒鐘下幾千盤棋局來算,現在估計又增加了很多)裡提取了 3000 萬個局面,然後通過『蒙特卡羅樹』的推演來評估局面的變化,一來可以砍掉大量不值得分析的分叉提高計算效率,另外更重要的是可以推演出與之相關可能出現的新局面。將可能產生的有利或不利局面倒推回來,堵住一切人類有可能出奇制勝可能性,而選擇自己更容易下出「珍瓏棋局」的局面。比如通過算棋得出下一步走 A 位可繼續保持優勢,但評估局勢認為 B 位有可能改變整個局勢,那麼就會選擇B位。大家看直播,也發現阿爾法狗經常這麼做。控制住了局面也就基本控制了由於樣本有限而沒有覆蓋到的怪招、妙招的威脅。

當然,由於圍棋計算無法窮盡,人和機器看上去是在同一起跑線上。但阿爾法狗每1秒鐘又學習了幾千盤新棋局,其中的「珍瓏棋局」大多都是人類聞所未聞的,這簡直就是降維攻擊。人類還是洗洗睡吧。

這場比賽讓我想起了百年前英國人讓馬車與火車進行比賽,剛開始火車還輸了呢!這些比賽都沒有意義,因為電腦程式將不可避免地超越人類。當然有人說電腦程式怎麼進化也寫不出一首優美的詩,機器無法理解人類的喜怒哀樂。這是當然的,但是計算機技術悄然地改變著人類的生活,並在某些方面超越我們,但最終它們還是要為我們所用。

至於計算機會對圍棋界產生什麼樣的影響?看看現在西洋棋界就知道了,有的棋手用電腦來學習和訓練,而有的則用它來作弊。2010 年,法國大師 Sebastien Feller 在比賽中接收電腦提示而被 FIFE(西洋棋聯合會)判決提前回老家。當然,現在主流的做法是棋手們使用「象棋程序」來輔助訓練,經過電腦的計算可以排除大部分沒有意義的分支,棋手們現在一天可以研究的棋局可能超過過去幾十年甚至幾百年的總和。有車不坐為啥非要走路呢?我猜想未來棋類運動將會朝幾個方面發展:要麼完全去電腦化回歸人類運動的本質,就像火箭都上天了奧運會還有跑步一樣;要麼像西洋棋那樣讓電腦來協助比賽;即使最終被「窮盡」了,回到「琴棋書畫」這類藝術活動的範疇也不無不可。

AlphaGo 的意義根本不在於下棋,而是計算機所進化出的超強學習能力。算法的進化可以大量節約 CPU 的計算能力,就像圍棋這樣如果真的要 「窮盡」可能要用到全宇宙的原子才行,而現在只需要幾千萬盤對局就幾乎破解了這個遊戲。同理像 Siri 這種語音助手,想要窮盡人類所有的詞語表達也幾乎是不可能的,但讓計算機從有限數量的語言庫中學習人類是怎麼說話的已經變為可能。

另一方面,計算機的算法依然是大數據+邏輯計算,離人類的抽象思維、自我意識什麼的還很遠。它們所扮演的角色依然是作為人類更加便捷的工具,有時候讓人變得更「懶」,有時候讓人變成「超人」。歸根結底計算機是人類發明的,如果人類輸掉了這場比賽我們應該歡欣鼓舞,因為人類又一次戰勝了自己。當然,如果未來人類沒有利用好這個工具,並像科幻電影描述的那樣成為一種威脅,要怪也只能怪我們自己。

Geek's view

多說兩句。之前柯潔質疑說李世石籤了保密協議迴避打劫,我只想說呵呵。田淵棟博士在知乎上詳細分析了阿爾法狗的原理,除了上面說到的兩個系統之外,阿爾法狗還有一套快速走子程序,就是前面提到的可以 2 微秒走一步棋。打劫前後無非幾十步,加上所有可能性至多無非百千步走法,阿爾法狗不到一秒都計算好了。而且這個是運行在本地的,不需要通過網絡搜索,來中國戰都毫無壓力。

相關焦點

  • 所有的人類都會做夢,為什麼人類的大腦會進化出做夢的功能?
    有研究表明,世界上所有的人類都會做夢,而那些認為自己從不做夢的人,只不過是把自己做過的夢都忘記了而已。那麼問題就來了,在漫長的進化史中,為什麼人類的大腦會進化出做夢的功能?人類的夢境究竟有什麼秘密?」,也知道了人類做夢時神經系統的活動狀態),但是對於人類為什麼要做夢,到現在為止我們還沒有得到確切的答案。
  • 所有的人類都會做夢,為什麼人類的大腦會進化出做夢的功能?
    有研究表明,世界上所有的人類都會做夢,而那些認為自己從不做夢的人,只不過是把自己做過的夢都忘記了而已。那麼問題就來了,在漫長的進化史中,為什麼人類的大腦會進化出做夢的功能?人類的夢境究竟有什麼秘密?「快速眼動期」,也知道了人類做夢時神經系統的活動狀態),但是對於人類為什麼要做夢,到現在為止我們還沒有得到確切的答案。
  • 柯潔回應新版本AlphaGo問世:人類太多餘了
    對此,柯潔回應稱:「一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了。」相關閱讀:阿爾法狗之父:AlphaGo Zero 3天走完千年棋史 澎湃新聞記者 虞涵棋 王心馨倫敦當地時間10月18日18:00(北京時間19日01:00),谷歌旗下的DeepMind團隊公布了進化後的最強版AlphaGo ,代號AlphaGo Zero。新版本的AlphaGo究竟有多厲害?
  • 人類5000年後會進化成什麼樣?半人半機械是常態,腿仍然需要
    編者按:對於進化而言,5000年的時間其實很難進化出什麼技能來,隨著人類進入深空,5000年後的人類肯定會發生改變,我們可以藉助機械的力量,在骨骼中加入機械元素,變得更加強壯和敏捷。半人半機械,應該是5000年後人類的模樣。
  • 5000多年來人類真的有在進化嗎?人類把自己逼進了死胡同
    人類之所以顯得強大,站在了食物鏈頂端,主要是靠兩點:一是高度社會化,形成一個大寫的人。二是智力水平的不斷提高並發揮關鍵作用。5000年對自然進化時間太短,觀察不到明顯的變化。也就是說,一個7萬年前的遠古幼兒,如果穿越到現在,不但會玩手機,還能參加奧數競賽。
  • 5000多年來人類真的有在進化嗎?人類把自己逼進了死胡同
    人類之所以顯得強大,站在了食物鏈頂端,主要是靠兩點:一是高度社會化,形成一個大寫的人。二是智力水平的不斷提高並發揮關鍵作用。5000年對自然進化時間太短,觀察不到明顯的變化。人類經常處於兩極的困惑,一邊飛機、輪船、潛艇、火箭,「可上九天攬月,可下五洋捉鱉」,貌似無所不能;一邊冷了不行、熱了不行、渴了不行、餓了不行、幹了不行、溼了不行、忙了不行、閒了不行……就連那小到看不見摸不著的細菌病毒,都能搞得我們寢食難安
  • 5000萬年來,人類在不斷進化,為何眼睛卻毫無進化痕跡?
    都說眼睛是心靈的窗戶,在人類演化的過程中,視覺能力讓人類可以看清這個世界的五彩斑斕,那麼,人類的視覺能力又是如何出現的呢?為了解答這個謎團,來自瑞士日內瓦大學的科學家團隊,近日和德國、法國的科學家們一起,通過大數據分析研究,發現我們的眼睛,竟然和5000萬年前相同,這究竟是怎麼回事呢?讓我們一起往下看。
  • 你以為人類只有圍棋下不過阿爾法狗嗎?DOTA也玩不過它!
    前段時間,阿爾法狗戰勝圍棋天才李世石的消息在網上迅速走紅,當即很多網友稱,在以後,人類再也不能在圍棋界稱霸了,但是幸運的是,阿爾法狗研發公司稱,以後阿爾法狗不會在和人類進行圍棋比賽。可是,你真的以為只有圍棋你們下不過人工智慧機器人嗎?現在就連DOTA你也玩不過它!
  • 為什麼人類要做夢?人類的夢境究竟有什麼秘密?
    有研究表明,世界上所有的人類都會做夢,而那些認為自己從不做夢的人,只不過是把自己做過的夢都忘記了而已。那麼問題就來了,在漫長的進化史中,為什麼人類的大腦會進化出做夢的功能?人類的夢境究竟有什麼秘密?很遺憾,雖然我們已經對人類的造夢機制有了一定程度的了解(比如說知道了人類絕大多數的夢境都產生於「快速眼動期」,也知道了人類做夢時神經系統的活動狀態),但是對於人類為什麼要做夢
  • 谷歌團隊發布AlphaGo Zero:柯潔稱人類太多餘了
    谷歌團隊發布AlphaGo Zero:柯潔稱人類太多餘了(圖片來自於推特)在這款軟體發出之後,柯潔也對這款軟體發表了自己的看法,他認為:「一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了。」之所以柯潔會這樣說,主要是因為AlphaGo Zero的練習主要是通過自我對弈在三十天之內發展起來的。
  • 能贏AlphaGo的只有它自己 柯潔回應新版問世:人類太多餘了
    谷歌人工智慧團隊DeepMind團隊在國際學術期刊《自然》(Nature)上發表論文,宣布新版AlphaGo——AlphaGo Zero可以在沒有人類指導的情況下學習,其水平超過此前所有AlphaGo(阿爾法狗)。
  • AlphaGo Zero用40天成為世界最強圍棋AI
    棋士柯潔:一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了從亂下開始,1天達到V18(超越人類棋手水平),21天達到Master,40天碾壓Master。 less is more。 2017年起,在某些領域,AI不再需要人類知識。
  • 人類滅絕5000萬年後
    隨著人類這種優勢物種的消失,世界上的動物將進入一個長達數萬年的進化混亂期,人類的滅絕會促使許多新物種出現。比如,在人類滅絕5000萬年後,生命世界一定會進化出一種全新的動物體系。 人類時代之後5000萬年的世界地圖,板塊運動讓大陸位置和地形地貌產生了變化。相對於現在已經46億歲的地球而言,5000萬年並不算長。
  • 進化論:人類不過是一種沒什麼特別的動物
    雖然在歷史上,我們人類一直認為自己和其他動物有所不同,仿佛整個科就只有自己,不,準確的說有些人認為將人類和其他動物放到一起進行分類都是不對的。他們自以為是造物的極致,以為人類和整個動物界都不在一個層次上的。於是,當達爾文提出智人也不過是另外一種動物的時候,他們便大發雷霆。甚至即使到了今天,還有人不願這麼相信,他們瘋狂的詛咒、不斷地抨擊著進化論。
  • 心與宇宙系列 人類進化的終極
    機器智能也稱人工智慧,在不打破現有社會秩序下,對於人類長久的發展來說,還是比較可靠的。人類都存在幾百萬年了,不都是這樣走過來的嗎?自從達爾文創立生物進化論後,多數人相信人類是生物進化的產物,現代人和現代類人猿有著共同的祖先。但人類這一支系是何時、何地從共同祖先這一總幹上分離開來的?什麼是它分離開的標誌?
  • AlphaGo 圍棋教學工具已發布
    在Deepmind所謂的「教學工具」發布之前,小編曾在腦海出現萬千猜想……但今天揭底才知道,原來只是一個平平淡淡的網頁……(建議複製到電腦上打開,因為據有的棋友反映手機打不開,小編這裡實測手機能打開,只是讀取了較長時間)https://alphagoteach.deepmind.com
  • 研究表明,人類正加速進化,文明或是推動人類進化的巨大動力
    即便是按照高等靈長類動物進化出來的時間,也是在大概5000多萬年以前事了,而真正智人的出現也是在大概20到30萬年前的事了,這和數千年的人類文明史比起來真的是極其漫長的過程。,人類在數千年的演化過程中的確沒有特別明顯的進化特徵。
  • 人類馴化的生物不止狗狗,還有蟲子,和人類相處了5000年!
    人類進化的過程中,一直在馴化和人類共同成長生物,比如狗狗,當時狗狗的祖先灰狼,時常和人類鬥爭,於是灰狼敗在了人類手下,人類將灰狼的孩子帶回去馴養,馴養的過程中,人類發現灰狼的幼兒,更容易被人類馴養,終於它們隨著後期進化慢慢形成了狗狗,相信很多人希望自己能養只狗,甚至有很多人把狗狗當作自己家人
  • 人類是否還在進化?科學研究表明,人類進化的速度超乎想像
    人類是否還在演化?對於這個問題,很多人的答案或是不知道。的確,演化是一件很緩慢、很漫長的事情,慢到我們幾乎感覺不到它在發生,長到我們用盡一生也無法看到它的變化。但話又說回來,很多時候,我們不能僅憑自我感覺來判斷一件事,我們應通過一系列科學數據來分析。
  • 一百萬年後人類會進化成神?
    據考古研究,人類起源於森林古猿,從靈長類經過漫長的進化過程一步一步發展而來。經歷了猿人類、原始人類、智人類、現代人類四個階段。若是自然進化,一百萬年後人類同現在沒大的區別;如果人類自主進化,一百萬年後經過生物改造的人類將同現在的人類大相逕庭,甚至沒有任何相同點。一,自然進化。雖然猶太大學的亨利·哈彭丁經研究發現:人類基因組中有大約1800個基因呈加速進化狀態,這一數目佔整個人類基因組的約7%。