讓柯潔痛哭的AlphaGo,耗資3500萬美元,耗電量相當於12760個大腦

2020-12-16 新智元

【新智元導讀】還記得當年柯潔和AlphaGo對戰失利後的失聲痛哭嗎?AlphaGo背後的模型訓練要燃燒多少經費你知道嗎?本文來告訴你答案。

當年,19歲的世界圍棋第一人柯潔九段在和AlphaGo的圍棋終極人機大戰以0:3完敗,這也是人類頂尖高手與這臺機器之間的最後一次較量,AlphaGo從此將退隱江湖。

比賽至中局之時,柯潔再次被AlphaGo的手法驚到了。他先是取下眼鏡捂住自己的臉,繼而在桌子上趴了幾秒鐘,起身搖頭,再次趴下,然後才用手把頭撐起,雙手抹了抹眼睛,又重新戴上眼鏡。

韓國高手李世石也面對過AlphaGo,曾在三連敗的情況下扳回一局,連輸兩場的柯潔自然也希望能在最後一句中挽回顏面,很可惜這次柯潔全面落於下風。

2017年,機器學習領域最令人興奮的事件之一,莫過於 AlphaGo 戰勝李世石成為世界上最好的圍棋選手了。

同年10月份,DeepMind 發表了一篇論文,描述了一個名為 AlphaGo Zero 的新版本。僅僅經過36個小時的訓練,AlphaGo Zero已經比擊敗李世石的阿爾法狗更擅長圍棋了。

不僅如此,AlphaGo Zero 學會下圍棋,卻是在沒有任何先驗的遊戲知識的情況下(換句話說,就是白板)。

而相比之下,之前發布的 AlphaGo 則是在人類圍棋比賽資料庫的幫助下進行訓練的。

這一成就確實非同尋常,因為它表明,我們可以開發一個系統,教會自己從一張白紙上做一些不瑣碎的任務,並最終在完成任務方面比人類做得更好。

它同時也表明了,現在整個世界的可能性是觸手可及的,只要想像計算機可以教自己做任何人類可以做的事情。

但是取得這樣的進步卻並不便宜。

正如人類掌握圍棋需要多年的訓練一樣,計算機掌握圍棋也需要大量的資源,復現 AlphaGo Zero 的論文中報導的實驗需要花費3500萬美元的算力。

AlphaGo Zero 學習下圍棋的方法是通過一種被稱為「self-play」的過程,模擬圍棋對它自己的比賽。該論文報告了以下幾點:

1.在72個小時裡,共進行了490萬場比賽

2. 在自我遊戲過程中,每個動作大約佔用0.4秒的時間

3.在一臺機器上執行自我遊戲,該機器包含4個 TPU

不過,這裡有一個數字沒有被公布出來,就是在三天的過程中使用的進行自我遊戲的機器的數量。按照平均每場圍棋211步的估計值,得到了最終的1595臺自動對戰機器的結果,或者說6380個 TPU。

按照每個TPU每小時6.50美元的報價(截至2018年3月) ,僅僅進行復現就要花費2,986,822美元。

而這只是他們論文中的兩個實驗中的一個小實驗:

「隨後,我們使用一個更大的神經網絡,將我們的強化學習管道應用於 AlphaGo Zero 的第二個實例,並且持續時間更長。訓練再次從完全隨機的行為開始,持續了大約40天」

「在訓練過程中,產生了2900萬場自我比賽」

在為期40天的這項實驗中,使用的神經網絡的層數(大小相同)是為期3天的實驗中使用的網絡的兩倍,因此,假設實驗沒有其他任何改變,一個動作所需的計算機思考時間大約是之前的兩倍。

考慮到這一點,可以大概求出最終花費了35,354,222美元的TPU來復現這個為期40天的實驗。

就 DeepMind 運行這項實驗的實際成本而言,還有其它因素需要考慮,比如研究人員的薪水等。但是對於谷歌以外的人來說,這個數字對於重複這個實驗的成本是一個很好的估計。

另一種看待 AlphaGo Zero 實驗成本的方式是想像需要多少人的大腦來提供同樣數量的能量。

圖:當機器接管後,他們將更有效地使用我們的大腦

一個TPU消耗大約40瓦,人腦大約是20瓦。所以,這個實驗的耗電量相當於12760個人的大腦連續運轉。

這種耗電量和金錢的消耗並不是說AlphaGo Zero不是一個驚人的成就,它向世界展示了建立系統來自學完成複雜任務是可能的,只是開發這種通用技術還沒有提供給大眾而已。

也就是說,許多具有現實價值的問題並不需要超人一般的表現。也許,通過應用領域知識和 AlphaGo Zero 提供的技術,未來這些問題可以用比創建 AlphaGo Zero 便宜得多的成本得到解決。

相關焦點

  • 柯潔選修圍棋課上熱搜 網友吐槽:圍棋老師可咋教?
    今天(2月18日),圍棋世界冠軍柯潔在微博發文,「還有沒睡的朋友嘛!一想到明天有早課,有點睡不著。」在和網友的互動中,疑似證實自己在清華選修了圍棋課程。我們一起看看吧!
  • 波司登本月將在倫敦南莫爾頓街開旗艦店 裝修耗資5500萬美元
    旗艦店的開發總計耗資3500萬英鎊(合5500萬美元)。若收尾工作順利完成,旗艦店將在7月26日開張。  資料顯示,目前波司登有超過1萬個零售網點,主要集中在中國大陸地區。在截止2012年3月的一年內,其淨利潤增長17.2%,至2.25億美元;收入增長19%,達13億美元。
  • 谷歌AlphaGo之父盤中盛讚柯潔:表現非常完美
    北京時間5月25日,柯潔九段對陣圍棋人工智慧AlphaGo三番棋第二局展開較量,儘管首局輸掉後外界一片悲觀,認為柯潔之後對決毫無勝算,但今天柯潔表現出色,甚至贏得哈薩比斯的點讚。哈薩比斯一直關注今天的對決,比賽開始前他就曬出一張現場圖片,預告這場大戰即將拉開大幕。
  • AlphaGo戰勝了柯潔,又被誰打敗?不可思議的結果意味著什麼?
    谷歌AlphaGo在3:0完勝李世石後,又在2017年7月迎戰柯潔。這場世紀人機大戰被寄予厚望,結果柯潔遭遇三連敗,淚灑現場。AlphaGo一戰成名,也為人工智慧做了最好的宣傳。從此,人工智慧成為婦孺皆知的熱點話題。
  • 柯潔:李世石僥倖贏了AlphaGo AI能幫人類少走彎路
    網易體育7月10日報導:北京時間7月10日,圍棋世界冠軍柯潔接受採訪時再次談到了人工智慧,在柯潔看來,AI曲線上升的速度遠超人類,人類棋手雖然無法超越AI,但可以通過人工智慧來幫助自己無限縮短走彎路時間。
  • 曝灰熊隊3年3500萬美元續約狄龍-布魯克斯
    北京時間2月6日,據記者Woj報導稱,灰熊隊已經跟球隊後衛狄龍-布魯克斯就一份3年3500萬美元的續約合同達成協議。布魯克斯是2017年的45號秀,本賽季他已經成長為球隊穩定的分衛。據悉,布魯克斯新合同的年薪分別為1140萬美元、1220萬美元和1140萬美元。二輪秀拿到千萬級別的年薪,布魯克斯的逆襲相當勵志。原文信息源來自Woj推特
  • 基因測序新銳10X Genomics融資3500萬美元
    近日,10X Genomics公司宣布完成了3500萬美元的D輪融資,10X Genomics公司是基因測序行業的領導者,為全球各地的科研機構提供準確完整的基因測序服務。本輪融資由Meritech Capital領投,富達(Fidelity)、富國銀行(Wells Fargo)、Paladin Capital 以及軟銀(SoftBank)跟投。
  • 2838天,柯潔的微博往事
    就在柯潔進入這個社交世界的15個月前,新浪微博官方宣布,註冊用戶已經突破1億大關。彼時,那個龐大的虛擬世界裡沒幾個人認識柯潔,即便當時只有15歲的柯潔已經在圍棋圈子裡頗受關注。2012年6月,一位名叫「上古龍王」的網友在「百度知道」留下一個問題:弈城圍棋網的「潛伏」是誰?
  • AlphaGo擊敗柯潔一周年後,聶衛平說:我從來沒有失落感
    幾乎整整一年之前,AlphaGo在烏鎮沒有給人類任何機會,在三番棋中零封當時世界排名第一的人類旗手柯潔,徹底在圍棋這項古老運動中戰勝了人類。隨後,研發出這一人工智慧程序的DeepMind公司創始人Demis Hassabis就宣布,AlphaGo將永久退出競技舞臺,不再進行比賽。
  • 柯潔女朋友是誰,美女黑嘉嘉與柯潔結婚了嗎
    柯潔被稱為世界圍棋第一人,年紀輕輕的他就包攬多個世界冠軍。網友們也對柯潔的私生活表示十分感興趣,那麼柯潔女朋友是誰呢?這兩年柯潔的緋聞女友就有於之瑩、崔精、黑嘉嘉等人,我們來看看到底誰是柯潔的正牌女友。
  • 搜狗(SOGO.US)2019年Q4淨利潤3500萬美元 同比增長33%
    2019年第四季度,搜狗實現總收入3.01億美元,同比增長1%,以人民幣計,則同比增長3%。歸屬於公司淨利潤為3500萬美元,同比增長33%,基本和稀釋後的每股收益為0.09美元。非國際會計準則下,歸屬於公司淨利潤為3900萬美元,同比增長44%。搜索和搜索相關收入為2.746億美元,同比下降1%。
  • 柯潔被曝大學選修課是圍棋,遭網友吐槽有才無德,柯潔回應別罵了
    在圍棋界,柯潔是大家都知道的圍棋天才,也多次獲得國際大獎。不過,柯潔除了下棋外,還喜歡發表一些評論。比如此次疫情爆發後,柯潔就多次發表評論。對一些人吐槽明星捐款少者,認為不要「道德綁架」等。最近,柯潔凌晨時分發文稱還有沒睡的朋友,一想到明天有早課,有點睡不著。可見,柯潔也要上課。柯潔被清華大學錄取後,也就成為了清華大學的一名大學生。自然也會和大家一樣,需要上課了。不過,沒有想到不僅有很多網友沒有睡,還有網友吐槽其選修課竟然選的是圍棋,讓老師怎麼上課,更是批其是惡人,有才無德等等。
  • 智能門禁廠商ButterflyMX成功籌集3500萬美元
    智能門禁製造商 ButterflyMX 今天宣布在成長型股權融資中成功籌集了 3500 萬美元,從而讓總融資金額超過 5800 萬美元。預計到 2027 年,非接觸式入口技術將會帶來 220 億美元的市場。儘管在新冠疫情期間接觸感染並不多見,但也推動了這項技術的快速發展。CBRE 最近對 203 家公司進行的調查發現,大約一半的公司正在考慮安裝非接觸式技術,作為他們重返辦公室計劃的一部分。
  • 2838天,柯潔的微博往事:好友的墜樓,擊垮了「狂妄」的他
    不到一周時間,他的微博粉絲從1.8萬增長到42萬。那些圍棋圈外的網友開始發問,「柯潔大棋渣」是誰?「看來圍棋盲還是不少啊,在這裡我簡單介紹一下自己:我叫做柯潔,1997年出生。但如果不是在這個科技和網絡迅速發展的時代,不滿23歲的柯潔可能無法在圍棋以外的世界產生如此大的影響力,甚至是製造出如此多的爭議話題。微博就像一副放大鏡,柯潔「真性情」中的每一個稜角都被無限放大。柯潔喜歡自嘲,也習慣用略帶刻薄的言辭去評論時事——然而,他在社交網絡上擁有超過540萬粉絲,這些激烈的言論就成了引火燒身的導火線。
  • 耗資100億美元 美國韋伯太空望遠鏡完成關鍵測試:2021年發射
    提到太空望遠鏡,很多人能想到哈勃,它確實是之前最強大的太空望遠鏡,不過它的時代結束了,明年美國要發射詹姆斯·韋伯望遠鏡,這將是人類最野心勃勃的太空探測計劃,耗資將近100億美元。
  • 單從圍棋水平來說,柯潔和李世石到底誰更勝一籌?
    圍棋最早起源於中國,是琴棋書畫四藝中的一種,圍棋最先起源於中國,隋唐時期傳入日本,後來傳到歐美,最後遍布於全國全世界,圍棋能夠發散人的思維,促進人的大腦發育。在當今社會中,很多小學生也加入了圍棋培訓的行列,可見圍棋。
  • 2019年蒙古國人均GDP超4200美元,相當於哪年的中國人均水平呢?
    數據顯示,截止到2019年年底,其人口只在320萬到330萬之間,GDP卻達到了138.5億美元。即,2019年蒙古國人均GDP已超過了4200美元,在全球屬於中等收入國家,並且超過了同期的印度、越南、菲律賓、印度尼西亞等國。以印度為例,其在2019年完成的GDP約為2.85萬億美元,在全球排第五名。
  • 開思完成3500萬美元C3輪融資,老股東源碼資本領投
    【獵雲網北京】12月15日報導獵雲網近日獲悉,中國汽車後市場企業「開思」宣布完成3500萬美元C3輪融資,由老股東源碼資本領投,紅杉資本中國基金、大灣區共同家園、順為資本跟投。不到半年時間,開思先後獲得C2輪及C3輪共8500萬美元融資。其中,C2輪融資由大灣區共同家園投資有限公司領投;紅杉資本中國基金、老股東源碼資本為C1輪聯合領投方。此前,開思還曾獲得復星銳正、蔚來創投基金、灃源資本、上合資本、華業天成和長江商學院創創壹號等機構的多輪融資。
  • 北美外賣平臺飯糰完成B輪3500萬美元融資
    1月8日,北美知名外賣平臺飯糰完成B輪3500萬美元融資,由蘭馨亞洲領投,A輪領投方元璟資本,種子輪領投方凱爾特亞洲、及大眾點評聯合創始人李璟等跟投。泰合資本擔任本輪獨家財務顧問。本次融資後,飯糰已成為加拿大地區融資額最高的外賣平臺,預計累計融資額超過5000萬美元。這也是一年內飯糰第二次獲得中國和北美的知名投資機構注資。
  • 人的大腦相當於多大的「內存」?
    人的大腦相當於多大內存?拿人腦與內存相比,那真是太低估大腦了。內存是計算機系統中重要的組成部分,它可用來存儲數據,實現計算機的運算過程,存儲什麼數據呢?是存儲CPU的運算數據的,並且CPU可以隨時調用這些數據。