擊敗了李世石九段的圍棋人工智慧「AlphaGo」究竟是什麼?

2020-12-16 品玩

如果不對 AlphaGo 背後的神經網絡系統稍作了解,你很容易以為 AlphaGo,在對局開始前跟李世石站在同一起跑線上。

作為一種人工智慧的 AlphaGo,和 IBM 在上個世紀打敗西洋棋大師卡斯帕羅夫的深藍超級計算機,以及當代的蘋果 Siri、Google Now 有著顯著的區別。

要了解 AlphaGo,首先我們需要了解 AlphaGo 背後到底是一個什麼東西。

它背後是一套神經網絡系統,由 Google 2014 年收購的英國人工智慧公司 DeepMind 開發。這個系統和深藍不同,不是一臺超級計算機,而是一個由許多個數據中心作為節點相連,每個節點內有著多臺超級計算機的神經網絡系統。就像人腦,是由 50-100 億個神經元所組成的,這也是為什麼這種機器學習架構被稱為神經網絡。

你可以將 AlphaGo 理解為《超驗駭客》(Transcendence) 裡約翰尼·德普飾演的人工智慧,而它所控制的超級計算機,就像影片裡被人工智慧心控的人類一樣,共同為一種蜂群思維 (Hive Mind) 服務。

《超驗駭客》中,被人工智慧控制的工人馬丁。馬丁沒有所想,但他的所見將會被人工智慧直接獲取

AlphaGo 是在這個神經網絡系統上,專為下圍棋 (Go) 而開發出的一個實例。然而,雖然名字已經介紹了它的功能,AlphaGo 背後的神經網絡系統卻適合用於任何智力競技類項目。

這個系統的基礎名叫卷積神經網絡 (Convolutional Neural Network, CNN) ,這是一種過去在大型圖像處理上有著優秀表現的神經網絡,經常被用於人工智慧圖像識別,比如 Google 的圖片搜索、百度的識圖功能都對卷積神經網絡有所運用。這也解釋了為什麼 AlphaGo 是基於卷積神經網絡的,畢竟圍棋裡勝利的原理是:

對弈雙方在棋盤網格的交叉點上交替放置黑色和白色的棋子。落子完畢後,棋子不能移動。對弈過程中圍地吃子,以所圍「地」的大小決定勝負。

AlphaGo Logo / DeepMind

AlphaGo 背後的系統還借鑑了一種名為深度強化學習 (Deep Q-Learning, DQN) 的技巧。強化學習的靈感來源於心理學中的行為主義理論,即有機體如何在環境給予的獎勵或懲罰的刺激下,逐步形成對刺激的預期,產生能獲得最大利益的習慣性行為。不僅如此,AlphaGo 借鑑了蒙特卡洛樹搜索算法 (Monte Carlo Tree Search) ,在判斷當前局面的效用函數 (value function) 和決定下一步的策略函數 (policy function) 上有著非常好的表現,遠超過上一個能夠和人類棋手旗鼓相當的圍棋程序。

DeepMind 訓練 AlphaGo 的步驟說明:10 萬盤高手棋譜作為初始數據,進行分類後用於訓練策略函數;然後跟自己下棋;強化學習訓練策略函數,繼續下棋;下了 3000 萬步後進行回歸分析,整合蒙特卡洛樹搜索模型,訓練效用函數

 

效用函數和策略函數,分別對應 AlphaGo 的兩個思考維度:目前棋盤的現狀,和自己/對手下一步的走向

AlphaGo 所採用的 DQN 是一種具有廣泛適應性的強化學習模型,說白了就是不用修改代碼,你讓它下圍棋它能下圍棋,你讓它在紅白機上玩超級瑪麗和太空侵略者,它也不會手生。作為一個基於卷積神經網絡、採用了強化學習模型的人工智慧,AlphaGo 的學習能力很強,往往新上手一個項目,玩上幾局就能獲得比世界上最厲害的選手還強的實力。

2014 年,已經被 Google 收購的 DeepMind,用五款雅達利 (Atari) 遊戲 Pong、打磚塊、太空侵略者、海底救人、Beam Rider 分別測試了自己開發的人工智慧的性能,結果發現:在兩三盤遊戲後,神經網絡的操控能力已經遠超世界上任何一位已知的遊戲高手。

DeepMind 用同樣的一套人工智慧,不調整代碼就去測試各種各樣的智力競技項目,取得了優異的戰績,足以證明今天坐在李世石面前的 AlphaGo ,擁有多強的學習能力。

李世石執黑子,AlphaGo 執白子。大約進行了 85 分鐘時進入休息階段

在此之前,DeepMind 進行過的無數虛擬棋局訓練,以及去年擊敗歐洲圍棋冠軍樊麾二段的經驗讓 AlphaGo 已經訓練出了頂尖的弈技,極有可能高於世界上任何已知的圍棋高手。

圍棋的可能性複雜度

AlphaGo 的水平大約在專業六段左右。再和其他圍棋程序的 495 盤較量中勝 494 盤;在讓 4 子的前提下仍有 75% 的勝率。

儘管棋盤上風雲變化,早在本次開戰前,AlphaGo 跟李世石就已不在同一起跑線上了。根據 DeepMind 透露的情況,從去年 10 月 5-0 擊敗樊麾二段到現在,AlphaGo 已經在神經網絡容量(數據容量)以及自己跟自己下棋用於訓練的數據質量上有了較大的提升。而且神經網絡的分布式計算延遲也得到了優化,最終使得 AlphaGo 能夠在兩小時的限定時間內擊敗了李世石九段。


AlphaGo 只是 DeepMind 證明自己的一個工具。你也可以將這次和李世石的對局理解為 Google 的公關策略。

2014 年,這家公司曾經在其官網上寫道: DeepMind 致力於用研究深度學習的方式去真正了解智慧 (solve intelligence) 。但對於 DeepMind 和 Google 來說,打造 AlphaGo 以及其他人工智慧神經網絡不是終點。

DeepMind 三位聯合創始人

將機器學習和神經科學進行結合,打造出一種「一般用途的學習算法」。通過這種算法,DeepMind 和 Google 希望能夠將智能「定型化」,理解智能是什麼,進而更好的幫助人類理解大腦。DeepMind 聯合創始人之一的 Demis Hassabis 曾經寫道:

用算法將智慧提煉出來,有可能成為理解人類思維最神秘原理的最佳方式。

attempting to distil intelligence into an algorithmic construct may prove to be the best path to understanding some of the enduring mysteries of our minds.

在 Google 收購 DeepMind 前,收購條款中的一項就是 Google 必須成立人工智慧道德委員會。因此,在目前階段人們不必擔心這樣的人工智慧最終殺死或統治人類。但至少,人工智慧在圍棋這樣的智力類競技項目上擊敗人類,是已經註定的事情。

作為一種決策樹巨大的遊戲,圍棋本來適合人腦思考,不適合機器運算。但 DeepMind AI 的方向就是模仿人腦思考,用神經網絡「重現」智慧。

圖片來源:DeepMind, YouTube

相關焦點

  • 圍棋愛好者們,3月「翻牆」去YouTube看AlphaGo挑戰李世石啊-虎嗅網
    由於YouTube在「牆外」,這真是讓我國廣大圍棋愛好者及小眾人工智慧研究者心癢難耐,在此求央視5套能向谷歌或YouTube買下該棋局的實況直播權。哈薩比斯上月曾表示:「如果我們在3月的比賽中取勝,那麼就相當於在西洋棋比賽中擊敗卡斯帕羅夫。李世石是過去10年中最偉大的棋手。我認為,這將意味著AlphaGo比任何人類棋手都要更強。
  • AlphaGo之父解答人工智慧八大疑問
    我一定要擊敗阿爾法狗!」對於5月23日至27日與圍棋人工智慧程序AlphaGo(阿爾法狗)的對弈,目前世界排名第一的中國職業九段柯潔放出豪言。然而,AlphaGo(阿爾法狗)之父卻說,「我們發明阿爾法狗,並不是為了贏取圍棋比賽。」
  • 樸正祥擊敗劉昌赫進決賽 將與李世石爭奪麥馨杯
    搜狐體育訊 1月23日首爾消息,第8屆麥馨咖啡杯九段最強戰半決賽的一場比賽於19日在江原道舉行,由樸正祥九段對陣劉昌赫九段。結果,樸正祥戰勝劉昌赫一舉挺進決賽。  去年,樸正祥因為獲得王中王戰亞軍,從五段晉升至七段。之後不久又奪得富通杯冠軍,從而進入「入神」的行列,並因此獲得麥馨杯的參賽資格。
  • AI戰勝歐洲圍棋冠軍 圍棋界怎麼說
    「alphago」的勝利書寫了圍棋AI第一次戰勝職業圍棋選手的記錄,正如《科學》雜誌所評價,這是圍棋AI一次巨大的飛躍。對其實力,百度圍棋吧棋友生動比喻:「nba普通球員,跑去cba,在cba當了兩年主力。」「其實可以拿羽毛球、桌球之類的來說。羽毛球、桌球的歐洲冠軍,就算比不上亞洲各國的冠軍水平,但是比普通的職業水準還是要高出一些的。圍棋同理。」
  • 圍棋史上年輕的九段高手!
    圍棋史上年輕的九段高手!圍棋是一種國粹,圍棋中的九段更是一種圍棋大師的象徵,聽起來,圍棋九段挺難的,可是你知道嗎?那些年輕輕輕的人早就獲得九段稱號!王檄1984年1月10日出生王檄,中國河南開封人,中國棋院圍棋九段。
  • 鬥魚直播圍棋人機大戰 李世石VS谷歌AI
    當圍棋這個地球上最古老的智力遊戲,和最新的人工智慧碰撞,會產生怎樣的火花?3月9日(本周三)谷歌人工智慧AlphaGo機器人將在韓國首爾與圍棋高手李世石對決。而這一次比賽的獎金竟高達100萬美元!這不是谷歌AlphaGo機器人第一次和圍棋高手過招了。
  • AlphaGo對圍棋研究謝幕 留下輔助學棋的軟體
    當今世界圍棋第一人柯潔隨後轉發此條微博,並評論道:「重新學圍棋。」AlphaGo抽身離去,圍棋卻已離不開它了。  留下無人超越的高度AlphaGo雖然離去,職業棋手卻沒有鬆口氣的感覺。畢竟從李世石到柯潔,都有被人工智慧「碾壓」的經歷。AlphaGo走了,可它達到過的高度無人能超越。
  • 阿老師威武,圍棋協會為AlphaGo授予職業九段證書
    網易科技訊 5月27日消息,烏鎮圍棋峰會最後一天,也是萬眾矚目的柯潔AlphaGo最後一場,面對「圍棋上帝」AlphaGo,柯潔使出全身解數仍無濟於事最終投子認負,本次人機大戰最終以柯潔三連敗告終。中國圍棋協會為AlphaGo授予職業九段證書。中國棋院院長王汝南稱:「AlphaGo對圍棋的深度探索,給棋界帶來寶貴財富,並幫助圍棋傳播,中國圍棋協會特授予AlphaGo職業九段證書。 」不過九段似乎已經不能說明AlphaGo的實力,聶衛平曾說要「二十段」。在此之前,哈薩比斯向棋手頒獎,並與柯潔在比賽棋盤上簽字。浙江省體育局也向谷歌贈送禮物。
  • 谷歌AlphaGo首局戰勝李世石
    新浪科技訊 北京時間3月9日下午消息,今天下午谷歌人工智慧AlphaGo與韓國棋手李世石的第一場比賽結束,AlphaGo獲得今日比賽的勝利。雙方在較量3個半小時後,李世石宣布認輸。谷歌AlphaGo在第一次與世界頂尖圍棋手的較量中取得勝利,這是人工智慧發展史上重要的裡程碑,代表人工智慧已經能在諸如圍棋等高度複雜的項目中發揮出超過人類的作用。 谷歌為何要做人工智慧圍棋程序AlphaGo谷歌並不只是想做一個棋類程序,而是想做一個通用的智能計算系統。
  • 圍棋「人機大戰」升級版將上演,電腦能打敗人腦嗎?
    編者按:3月9日,舉世矚目的圍棋「人機大戰」將在韓國首爾上演,比賽一方為谷歌公司研製的人工智慧程序AlphaGo,另一方則是圍棋世界冠軍、韓國名將李世石九段。雙方將進行5盤較量,勝者將贏得100萬美元的獎金。
  • 焦點科普:人工智慧「阿爾法圍棋」究竟什麼樣
    摘要:人工智慧「阿爾法圍棋」(AlphaGo)挑戰頂尖圍棋手李世石一事廣受矚目,引發眾多討論。光就計算能力而言,現在普通電腦中的CPU就已經勝過了20年前的「深藍」,更不用提「阿爾法圍棋」所用的硬體了。
  • 谷歌阿爾法圍棋AlphaGo背景資料照片 兩個大腦介紹(圖)
    昨天,李世石【李世石資料】比賽輸了,人工智慧逆襲了?人類真的敗給人工智慧了嗎?  接下來,就讓我們了解一下,這個逆天的谷歌人工智慧AlphaGo【背後團隊Deepmind有多牛】到底是為何物?
  • AlphaGo首現Bug 圍棋算法死穴在哪兒?
    摘要: 圍棋因為變化委實太多,至今仍未有最優解,所以能存活到今天。AlphaGo並沒有徹底擊敗李世石,看起來圍棋的生命力仍然很頑強
  • 4天 52 場連勝,圍棋的江湖真的就徹底被人工智慧統治了?
    12 月 30 日,Master 戰勝 「吻別」,有人認為,「吻別」就是現世界圍棋第一人柯潔。2017 年元旦, Master 休戰。此時,它已經在奕城網取得 30 連勝。1 月 2 日,Master 從奕城網轉戰野狐圍棋,這同樣是一個匯聚全世界圍棋高手之地。圍棋世界冠軍古力九段發出懸賞,第一個戰勝 Master 的棋手,獎勵 10 萬元。
  • 李世石告別戰再現「神之一手」,首局比賽大勝韓國圍棋AI
    李世石在告別戰中都要給世人留下「神之一手」!12月18日,已經宣布退役的韓國傳奇圍棋手李世石開始自己的告別戰——對陣韓國圍棋人工智慧的三番棋大戰。在首戰中,李世石執黑中盤擊敗對手,重現2016年人機大戰第四局擊敗AlphaGo的「神之一手」。
  • 「阿爾法狗」戰勝了圍棋世界冠軍 人工智慧千億市場將引爆
    谷歌人工智慧軟體「阿爾法狗」中盤戰勝世界冠軍、圍棋職業棋手李世石九段。在此之前,圍棋是唯一沒有被計算機攻克的博弈遊戲項目,這次是計算機首次在分先(註:即不讓子,平手對局)的情況下戰勝人類頂尖棋手!3月9日中午,在韓國首爾四季酒店,一場別開生面的圍棋對決吸引了全球的目光。
  • 圍棋九段高手被清華免試錄取,網友:清華賺大了
    柯潔九段昨晚,中國圍棋九段高手柯潔被清華大學特招錄取,隨後消息便在網絡上流傳開來。柯潔九段柯潔九段在賽後接受了記者採訪,他表示十分的激動,「這次奪得三星杯意義非常重大,現在人工智慧很強,實力都非常接近,能夠拿到世界冠軍非常不容易,我想用這個冠軍來回應網上一些質疑
  • 李世石退役戰三番棋次局脆敗
    新京報訊(記者 孫海光)李世石退役三番棋第二局今天繼續在韓國首爾進行。儘管首局曾戰勝人工智慧HanDol(韓豆),但李世石今天執黑122手就投子認負。三番棋最終戰將於12月21日在李世石的家鄉全羅南道新安郡進行。
  • 農心杯圍棋賽:李世石勝村川 中國"雙保險"衝冠
    農心杯圍棋賽:李世石勝村川 中國"雙保險"衝冠 2016-03-02 19:54:08韓國「獨苗」李世石執白戰勝日本的村川大介,為韓國隊保留了爭冠的希望。  目前,中國隊還剩下連笑七段和柯潔九段,組成「雙保險」對冠軍發起衝擊。日本隊與韓國隊分別還剩井山裕太、李世石各一人。  由於農心杯一、二階段的發揮不佳,已經在本項賽事11次奪冠的「霸主」韓國在決賽階段遭遇了僅剩李世石一人戰鬥的尷尬局面。韓國隊想要奪冠,李世石必須連勝四場。
  • AlphaGo、康德和人工智慧
    人工智慧早已從技術領域破圈到大眾文化之中,成為一個被廣泛討論的熱詞,那麼除了在技術領域,給生活帶來的更多便利性之外,作為非技術人員,能在人工智慧當中學到什麼,又可以由此改變什麼呢?2016年3月,AlphaGo以4:1的成績戰勝了圍棋世界冠軍、職業九段棋手李世石;2016年末,AlphaGo在中國棋類網站上以「大師」(Master)為註冊帳號與中日韓數十位圍棋高手進行快棋對決,連續60局無一敗績;2017年5月,AlphaGo以3:0的總比分戰勝排名世界第一的世界圍棋冠軍柯潔。