AlphaGo到底是怎樣的一個人工智慧?

2020-12-04 李橘山

關於AlphaGo,我們知道這是迄今為止,人類史上最偉大的人工智慧之一,對於圍棋他的知名度要超過很多職業棋手。所有版本的AlphaGo對弈人類的戰績為67勝1敗(其中4-1戰勝李世石,野狐圍棋ID:master 60-0 戰勝人類眾高手,浙江烏鎮3-0戰勝當時世界第一人柯潔)。

人機大戰李世石 VS AlphaGo

李世石與AlphaGo人機大戰

那麼為什麼人類研究了幾千年的圍棋卻弈不過一個沒有自主思想並且是由人類研發出來的機器人。藉由這個問題,就讓小編帶領大家簡單領略一下到底AlphaGo為什麼這麼厲害,他是如何通過自我學習來戰勝這一票人類高手的?

第一手,是上帝幫忙來選擇的!我們把棋盤上所有落子得分值設為1,訓練時AlphaGo隨機往棋盤上扔了一個棋子,之後他把對手也想像成和自己一樣的二,也往棋盤扔了一個棋子,如此循環。最後雙方分出了勝負,我們把勝負設為X,勝利為X=1,失敗為X=0。這樣AlphaGo在心裡下了一盤完整的棋。

我剛才模擬贏了一次,X=1,那麼我要提高水平,新分數X=2,除了第一步,後面幾步運氣也不錯,那我把這些隨機出的局面所對應落子方法的分數都設為2吧。然後開始做第二次模擬,這次扔骰子的時候AlphaGo對圍棋已經不是一無所知了,但也知道的不是太多,所以這次的分值是2,其他落子方法的分數還是1。再次選擇落子的概率要比其他方法高一點點。同樣,假象的對手也同樣更新了自己的分數。

以此類推,AlphaGo下完它想像的幾十萬盤棋局後,選擇他推演過次數最多贏得最多的那個方案落子,而這時,AlphaGo才真正下了一步棋。不僅是第一步,AlphaGo在行棋過程中的每一步,都是如此推演的。

柯潔

不行,這太慢了,運行量太大。設計並寫出AlphaGo的黃士傑黃博士認為需要更高效的扔棋子,例如第一手扔到棋盤A1(圍棋棋盤上的一個角)這種地方是不可能贏的,同樣官子時把棋下到對面的活棋區域內也是無意義的。在這些無用位置的計算是完全可以規避的。所以,黃博士對AlphaGo進行了改進,並不是隨機性的扔棋子,而是更有效率的扔棋子。同樣,在對弈的過程中,AlphaGo對自己下的每一步棋都做了概率評價,當走到某一步可以直接判定自己的敗局或勝局時,就不繼續模擬後續的落子,直接省略的了後續的模擬,優化了算法。

最後應用到的,也是AlphaGo的核心科技,deepmind。這也是當時AlphaGo所有權的公司的英文名,中文譯為「深度學習」。

那麼到底AlphaGo是如何深度學習的呢?首先讓程序AlphaGo-A1和AlphaGo-B1進行1萬盤對弈,之後把經驗加入到訓練集之後進化成AlphaGo-A2和AlphaGo-B2,再讓A2和B2對弈1萬盤,得出A3和B3,以此類推,直到訓練出AX和BX,我們可以從這裡看出AlphaGo-A和AlphaGo-B的棋理和棋技是呈幾何倍數的增長。這就好像某個二人對抗運動項目一樣,從成萬上億的人中的人選萬分之一進行訓練,再從這萬分之一裡面再挑萬分之一,以此類推,直到找到那個最強的選手。

當然你要知道,AlphaGo在這裡訓練的每盤棋每一步,根據我們之前所說,他在心裡已經模擬了上萬種下法,再讓兩個相同水平的AlphaGo不停的對弈,直到盤出圍棋的奧妙,選定那個最強的AlphaGo作為代表,參加戰鬥。這,就叫深度學習。

李世石

AlphaGo自我對弈一天可以訓練3000萬盤,利用超過170個GPU,粗略估算超過800萬核並行計算。小編只是把AlphaGo裡面的極其深奧的算法寫成最淺顯的文字表達出來,當然,這只是很概念化的東西,更多專業性的東西我們不去深究。

相關焦點

  • 柯潔感嘆AlphaGo可怕:讓三子!如先捅三刀(圖)
    5月24日,柯潔在網上分享狀態,對於AlphaGo團隊給出的檢測報告:Master版本相較戰李世石版本提升3子的結果發表感嘆:在跟怎樣可怕的對手下棋。  柯潔寫到:「早就聽說新版alphago的強大....但...讓...讓三個?我的天,這個差距有多大呢?
  • 柯潔終結AI「符合預期」41連勝:若當初第一個與alphago對弈的是我
    【文/觀察者網 周遠方】昨夜,「半狗」柯潔贏了一隻41連勝的「小狗」,輾轉難眠…… 他在今天(18日)凌晨0時23分發微博感嘆: 一個AI滿地走的時代...除了alphago以外,這個暱稱為「符合預期」的AI尤其強,實力應該已經遠超當時與李世石對弈的alphago了吧?...
  • 人工智慧和5G到底能產生怎樣的聚變效應?
    打開APP 人工智慧和5G到底能產生怎樣的聚變效應?人工智慧最具代表性的特徵就是重新定義了勞動的效率,進而對各個垂直行業的發展起到了積極的促進作用,再加上5G技術,相互融合,相得益彰。
  • 柯潔終結41連勝圍棋AI:稱其實力遠超初代AlphaGo
    前不久,《自然》雜誌刊登了谷歌DeepMind團隊的新成果,名為AlphaZero的人工智慧程序完全靠自我對弈學習下棋,不依賴人類圍棋經驗,僅訓練3天就戰勝了AlphaGo Lee,比分100:0,後者就是戰敗李世石的那套。經過40天訓練後,Alpha Zero又以89:11戰勝了Alpha Master,即橫掃柯潔的那套。
  • 新版Alphago棋風更穩健
    alphago再過一萬年也不可能窮盡所有圍棋的定式。這次比賽其實不是人機大戰,而是人類使用電腦作為工具探索新的東西,就像哈勃望遠鏡讓人類發現新的領域一樣。人工智慧可以幫助專家以更快的速度解決問題。本次比賽的目的也不是alphago還是棋手贏,最終還是人類贏。祝柯潔好運。」來源:網易科技
  • 能贏AlphaGo的只有它自己 柯潔回應新版問世:人類太多餘了
    對此,柯潔回應稱:「一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了。」2016 年在 AlphaGo 和李世石的對戰後,人工智慧進入大眾的視野,今年5月27日,中國棋手柯潔與人工智慧「阿爾法圍棋」(AlphaGo)展開三番棋比賽的終局對決。
  • 柯潔vs阿爾法狗結果:2017alphago對陣柯潔誰贏了(最新)
    柯潔vs阿爾法狗結果:2017alphago對陣柯潔誰贏了(最新)  4月10日報導,Google在中國棋院召開發布會,宣布5月23日-27日在烏鎮主辦「中國烏鎮·圍棋峰會」,去年戰勝韓國職業棋手李世石的圍棋人工智慧AlphaGo將挑戰目前世界排名第一的柯潔九段。
  • AlphaGo 圍棋教學工具已發布
    在Deepmind所謂的「教學工具」發布之前,小編曾在腦海出現萬千猜想……但今天揭底才知道,原來只是一個平平淡淡的網頁……(建議複製到電腦上打開,因為據有的棋友反映手機打不開,小編這裡實測手機能打開,只是讀取了較長時間)
  • AlphaGo Zero用40天成為世界最強圍棋AI
    棋士柯潔:一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了李喆:完全拋開人類圍棋知識,去年論文裡提到的許多特徵和rollout全部去掉,兩個神經網絡合為一個,只給定棋盤、棋子和規則。
  • 柯潔回應新版本AlphaGo問世:人類太多餘了
    對此,柯潔回應稱:「一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了。」席爾瓦在烏鎮人機峰會上發言從語音識別、圖像分類到基因和藥物研究,人工智慧發展迅速。這些專家系統,很多是借用海量人類經驗和數據開發出來的。
  • 谷歌團隊發布AlphaGo Zero:柯潔稱人類太多餘了
    谷歌團隊發布AlphaGo Zero:柯潔稱人類太多餘了(圖片來自於推特)在這款軟體發出之後,柯潔也對這款軟體發表了自己的看法,他認為:「一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了。」之所以柯潔會這樣說,主要是因為AlphaGo Zero的練習主要是通過自我對弈在三十天之內發展起來的。
  • 翻譯界的AlphaGo,魔腦人工智慧翻譯機真的是"狼"來了嗎?
    事實上這是人工智慧的簡歷,準確的說是兩款人工智慧同聲翻譯機的「簡歷」。拋開這家叫「雙猴科技」的公司和他們的魔腦品牌翻譯機營銷方式不談,簡歷風波卻真正引發了網友和行業的廣泛思考,在喊了N多回「人工智慧將會替代人類」之後,這次人工智慧不再只是替代人類的簡單重複工作,而是真的瞄準了翻譯這個在我們常識中高大上的行業了。我們不禁要問,人工智慧替代人類的時代真的來臨了嗎?
  • 柯潔vsAlphaGo圍棋比賽日期時間
    柯潔 vs AlphaGo圍棋比賽日期時間介紹:  這場被認為是「人類頂尖棋手與人工智慧程序的終極對抗」,讓人們期待了足足一年有餘。而那個說著「AlphaGo贏不了我」的少年,終於站到了AI面前。(約合1033萬人民幣)——來源:快科技  AlphaGo是一款圍棋人工智慧程序,去年曾經以4:1的成績戰勝韓國著名棋手李世石九段。柯潔是中國圍棋職業九段棋手,他也是圍棋等級分排名世界第一。  另外還將舉辦配對賽和團隊賽,配對賽中,兩位棋手將分別與AlphaGo組隊比賽;在團體賽中,將由五位中國頂尖棋手合作,一起挑戰AlphaGo。
  • AlphaGo來了!人工智慧將出現在手機裡
    人工智慧將出現在手機裡) AlphaGo和李世石的圍棋人機大戰發展已經是這幾天火爆全球的話題。
  • 谷歌AlphaGO挑戰賽:人工智慧的邊界在人類
    其實重要的不是這次比賽輸贏的本身,而是這次事件對人類與人工智慧到底會帶來哪些影響。人類模仿上帝創造行為的產物在整個西方的世界觀眾,普遍接受與傳承的是「聖經文化」,其中有個非常重要的世界觀就是創造論。谷歌AlphaGO的技術架構採用的是模仿人類大腦神經模式,而這種模式的行為可以理解為谷歌依託其強大的科學家團隊,在當前人類對於大腦相關探索的知識範圍內,以計算機的方式將這種知識探索表現到了一個新的高度。人工智慧的邊界在人類不論人工智慧如何發展,其在本質上還是物理程序層面的問題,哪怕其具備「自思考」能力,其思考的邊界也是開發者所賦予、設定的。
  • 人工智慧在軍事領域有哪些應用價值?
    隨著谷歌2016年推出 alphago 以擊敗圍棋高手,人工智慧已成為最熱門的技術領域。 那麼什麼是人工智慧? 簡單地說,人工智慧就是賦予機器或計算機模擬人類智能行為的能力。人工智慧起源於20世紀50年代,曾經歷過兩次發展高潮,最後因技術等原因又跌入低谷,直到GPU和雲計算技術發展起來,才引發以深度學習技術為代表的第三次,也就是本次人工智慧高潮的再次爆發。人工智慧對軍事發展的影響是什麼??
  • 霍金是怎樣看待人工智慧的?他對人工智慧的真實態度是什麼
    繼續說這本《十問:霍金沉思錄》,這一回,我們來說說霍金是怎樣看待人工智慧的?人工智慧最終會超越人類的智能嗎?可能你之前看過一些國外媒體的報導,這些報導常常會以「霍金警告人類,人工智慧終將超越人類智能」作為聳動的標題。
  • 擊敗了李世石九段的圍棋人工智慧「AlphaGo」究竟是什麼?
    作為一種人工智慧的 AlphaGo,和 IBM 在上個世紀打敗西洋棋大師卡斯帕羅夫的深藍超級計算機,以及當代的蘋果 Siri、Google Now 有著顯著的區別。要了解 AlphaGo,首先我們需要了解 AlphaGo 背後到底是一個什麼東西。
  • AlphaGo之父詳解「圍棋上帝」是怎樣煉成的
    原文標題:AlphaGo是怎樣煉成的?歷史悠久的圍棋已經流傳了近3000年,但人類一直低估了一點:以第五條線為代表的棋局中部區域。這是AlphaGo之父、DeepMind創始人Demis Hassabis向外界分享AlphaGo背後故事時透露的重要信息。
  • 人工智慧是怎樣預測分子的氣味的
    打開APP 人工智慧是怎樣預測分子的氣味的 站長之家 發表於 2019-10-25 15:51:28 站長之家(ChinaZ.com) 10月25日 消息:除了視覺分析,未來人工智慧也將擅長嗅覺分析。