AlphaGo 打敗了人類,DeepMind 卻輸給了金錢

2020-12-25 雷鋒網

2014 年,對 DeepMind 而言,絕對是極具重大意義的一年。在這一年裡,它被 Google 以約 6.5 億美元的價格收購了。如今,DeepMind 收於 Google 麾下也已五年有餘,縱然有許多高光時刻,但從營收狀況來看,DeepMind 的發展,並不高光。此外,基於各種原因,DeepMind 與其「金主爸爸」 Google 的關係也略顯微妙。

這五年裡, DeepMind 發生了什麼?

曾幾何時,風光無限

2010 年 11 月 15 日,Demis Hassabis,Shane Legg 和 Mustafa Suleyman 聯合創立了 DeepMind ,公司選址在倫敦,避開了 Google、Facebook 等矽谷巨頭,在歐洲收攏了許多優秀人才——這成為了該公司的優勢之一。

不過,對於 DeepMind,其真正的優勢來自於該公司發展了一種機器學習技術——強化學習,源於 Hassabis 所擅長了兩個領域:遊戲和神經科學。值得注意的是,在此之前,強化學習在計算機領域還是一片空白。

對任何一家注重研發的公司來說,資金是不可不考慮的因素之一,DeepMind 也不例外。相關報導顯示,在 2010 年,Hassabis 曾為了募資而參加了奇點峰會,最終獲得了 200 萬英鎊投資。不過,這一資金短缺的狀況在 2014 年就發生了改變。

雷鋒網註:圖為AlphaGo 對戰李世石

經過了一年的協商,DeepMind 在 2014 年被 Google 以約 6.5 億美元收購。有了 Google 這樣強大的「金主」作依靠之後,DeepMind 取得了許多不錯的成績,其中最為矚目的當屬 2016 年 AlphaGo 首次擊敗韓國圍棋冠軍李世石,比分為 1:4。此後,DeepMind 還不斷開發出新的 AI 系統,挑戰人類的極限。

  • 2016 年底到 2017 年初,AlphaGo 化名 Master,在「在線快棋對決」中,橫掃中日韓頂尖棋手,獲 60 勝 0 負 1 平。不僅如此,它還戰勝了圍棋等級分排名世界第一的中國選手柯潔。

  • 2016 年 6 月,DeepMind 訓練的 AI 系統在雅達利遊戲《 Montezuma’s revenge》達到了大師技巧。

  • 2018 年 7 月,DeepMind 在《雷神之錘III競技場(Quake III Arena)》奪旗遊戲中和人類隨機組隊打團戰,擊敗了人類玩家。

除了遊戲領域,DeepMind 在醫療領域也取得了一定的績效。2016 年 2 月,DeepMind 成立了新醫療保健部門 DeepMind Health,由公司聯合創始人之一的 Mustafa Suleyman 領導。DeepMind Health 的第一款產品是名為 Streams 的移動應用,最初旨在幫助醫生鑑定有急性腎損傷風險的患者。但是,這一應用也讓 DeepMind 多次陷入爭議。

虧損近 10 億,健康部門陷爭議

在 AI 領域,研究成果與商業化之間仍然存在一條鴻溝,DeepMind 亦是如此,儘管 DeepMind 研發的 AI 系統得到了許多肯定,但它很少開展關於深度強化學習的大規模商業應用。雖然背靠大金主,但 Google 不可能無止境地對其進行投資,畢竟,Google 是一家商業型科技公司,盈利才是其最主要的目的。

自 2016 年開始,DeepMind 就已陷入了虧損狀態,並且虧損程度不斷加重。相關資料顯示:

  • DeepMind 2016 年虧損額達 1.54 億美元;

  • DeepMind 2017 年虧損額達 3.41 億美元;

  • DeepMind 2018 年虧損額達 5.72 億美元。 

儘管 DeepMind 較少實現創收,但其支出卻未見減少。據英國政府此前發布的資料,DeepMind 的「管理服務費」需 4110 萬英鎊,包括不動產和計算機系統運行和維護。另外,在「員工工資和其它相關成本」上,包括工資、差旅、辦公軟硬體等,DeepMind 耗資達1.047 億英鎊(約 1.37 億美元)。

不僅如此,DeepMind 的法律費用也在飆升,從 2015 年的 14.48 萬英鎊增至 65.81 萬英鎊。據外媒猜測,這高幅度上升的背後,可能和 DeepMind 的健康部門相關。

為了利用醫療數據開發健康監測 APP Streams,DeepMind 在 2015 年與英國皇家自由信託基金會首度達成數據分享合作,獲權處理基金會下屬 3 家醫院每年共計 160 萬名病人的就診記錄。而後,英國數據安全部門為此對 DeepMind 調查了一年,在 2016 年公布了調查結果。

調查結果顯示:DeepMind 和相關醫院的合作項目「不符合數據保護法」。由此,Mustafa Suleyman 領導的 DeepMind Health 在英國飽受爭議。

雷鋒網註:圖為 Mustafa Suleyman

不過,DeepMind 並不是沒有為 Google 帶來實際性的利益。DeepMind 曾開發了一套算法,以優化 Google 數據中心 250 萬臺伺服器冷卻方案,為 Google 降低了40%的能源成本。不過,這與 DeepMind 的日常管理費用相比,就顯得有些微不足道了。

DeepMind 與 Google 關係愈加微妙

爭議過後,在 2016 年,Mustafa Suleyman 曾作出表示,在任何階段,患者數據都不會與 Google 帳戶、產品或服務相關聯——劃清該醫療部門與 Google 的關係。可見,儘管歸屬於 Google ,但 DeepMind 仍有著較大的獨立性。

值得一提的是,DeepMind 的獨立性,與其籤署的《道德與安全審查協議》不無關係。在 DeepMind 被 Google 收購的前一年,也就是 2013 年,雙方籤署了《道德與安全審查協議》。該協議將 DeepMind 的核心 AGI 技術的控制權交給了一個名為 Ethics Board 的委員會。據透露,DeepMind 的三位創始人都是 Ethics Board 成員。

在收購初期,DeepMind 和 Google 度過了一段不錯的「蜜月期」,從其官網標語就可窺見一二。2014年,DeepMind 的官網標語為——「DeepMind 很高興成為 Google 的一部分」,但到了2015年,這條標語就換成了「DeepMind 很高興加入 Google 的隊伍」。

直到 2016 年,新版 DeepMind 官網上線,「Google」字樣已經無跡可尋,只能在「About Us」的頁面中介紹道 DeepMind 是 Google 母公司 Alphabet 集團的一部分。而 DeepMind 與 Google 的關係也變得越發微妙。

2018 年, 據 Financial Times 發布的消息,Alphabet 對 DeepMind 昂貴開銷的合理性已經產生懷疑。Alphabet AI 部門督促 DeepMind 說明其商業模式,並向董事會說明資金流向。審查小組稱,DeepMind 最終必須通過分享算法和數據或通過賺錢來證明其價值,儘管暫時不擔心 Alphabet 會阻止他們做想做的事,但不能保證 Alphabet 董事會明年會不會得出不同的意見和結論。

同年 11 月 14 日, DeepMind 宣布旗下的健康部門 DeepMind Health 以及負責推進「Streams」團隊將調整合併到 Google 最新成立的「Google Health」部門中,原子公司 DeepMind Health 將不再作為獨立品牌存在,但 DeepMind 的其它部門仍將保持獨立。

不僅如此,在今年 8 月 22 日,相關報導指出 DeepMind 的聯合創始人Mustafa Suleyman 已被停職。在經歷了 10 個月的合併之後,2019 年 9 月 20 日,Google 發布博客正式宣布,已將旗下科技公司 DeepMind 的健康團隊併入了 Google Health 部門。

雷鋒網(公眾號:雷鋒網)總結

這五年裡, DeepMind 的經營可謂是滋潤中夾雜著辛酸。而究其根本,依然是研究成果與商業化的鴻溝問題,DeepMind Health 被合併進 Google Health 就是最好的註解。對於如今的 DeepMind,或許是時候想想如何更進一步走向商業化,畢竟,不會盈利的子公司不是一家好的 AI 公司。

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • DeepMind 推出 AlphaGo 圍棋教學工具,圍棋學習新紀元來啦?
    上圖中,標有白圈的黑子表示上一手,虛線圓圈表示 AlphaGo 下一步可能的走法,實線圓圈表示人類選手下一步可能的走法,圓圈中的數字表示 AlphaGo 評估的黑子勝率。從官網上可以看到,該工具通過利用 231000 盤人類棋手對局、75 盤 AlphaGo 與人類棋手對局的數據,能對圍棋近代史上 6000 種比較常見的開局給出分析。
  • 人類一敗塗地?DeepMind推出Agent57,在所有雅達利遊戲上超越人類
    去年,DeepMind 推出的 MuZero 在 51 款雅達利遊戲中實現了超越人類的表現。時隔數月,DeepMind 在這一方向上更進一步,在 57 款雅達利遊戲中全面超越人類,在這一領域尚屬首次。DeepMind 在最新發布的預印本論文和博客中介紹了這一進展。
  • 【DeepMind重大突破】DNN具有人類行為,認知心理學破解黑箱
  • AlphaGo之後,DeepMind重磅推出AlphaFold:基因序列預測蛋白質結構
    機器之心報導機器之心編輯部Alphabet(谷歌)旗下公司 DeepMind 的人工智慧 AlphaGo 曾在西洋棋、圍棋等項目中取得了超越人類的表現,其研究不僅震驚世界,也兩次登上看來,人類醫學研究要前進一步了。2017 年 5 月,谷歌 DeepMind 人工智慧項目 AlphaGo(執棋者:黃士傑博士)對戰當時世界第一的圍棋選手柯潔。
  • DeepMind首次披露旗下AI專利申請情況,引發熱議
    DeepMind 創始人 Demis Hassabis 博士曾在一篇文章中介紹了其人工智慧方法(地址:https://www.theverge.com/2016/3/10/11192774/demis-hassabis-interview-alphago-google-deepmind-ai)。
  • AlphaGo「人肉手臂」黃士傑:AlphaGo Zero如何只用三天走過人類千年
    2016年3月,谷歌Deepmind旗下的圍棋程序AlphaGo,以4比1的成績戰勝韓國職業棋手李世石。一年後,拿掉所有人類知識、完全靠自學的AlphaGo Zero,在今年10月又以100比0的戰績碾壓「AI前輩」AlphaGo。從擊敗人類、到自學成材,AlphaGo的進展超乎預期,研發團隊也自然成為關注焦點。
  • 重磅| DeepMind官方確認Master身份:全面回顧AlphaGo的再度出山之旅
    人類數千年的實戰演練進化,計算機卻告訴我們人類全都是錯的。我覺得,甚至沒有一個人沾到圍棋真理的邊。但是我想說,從現在開始,我們棋手將會結合計算機,邁進全新的領域達到全新的境界。新的風暴即將來襲,我將盡我所有的智慧終極一戰!」在 1 月 1 日晚 11 時,Master 轉戰騰訊野狐圍棋,與各路高手展開了新的對局。
  • DeepMind 第四代:不學規則就能下棋玩遊戲
    第一代 AlphaGo 早在 2016 年就可以擊敗世界圍棋冠軍,但需要先輸入遊戲規則和大量人類實戰的數據進行訓練。AlphaGo Zero 只需事先輸入規則,無需學習人類實戰的數據。在谷歌的測試中,MuZero 在 Atari 遊戲中的表現優於此前所有算法,並與 AlphaZero 在圍棋,象棋和將棋上的超人類水平性能相匹配。
  • 碾壓人類!Deepmind改寫圍棋定式開玩星際2!
    在眾多定式當中,有三個定式公認的難解,人類棋手表示搞不清複雜的變化,著三個定式分別是大雪崩定式、定式以及大斜定式。最接近上帝的AlphaGo是怎麼評估定式的呢?那麼作為最強的圍棋AI的AlphaGo,是怎麼看待這些定式的呢?最近幾天,Aja Huang在臉書上公布了AlphaGo的看法,讓人耳目一新,千百年來我們的定式居然下的不對!
  • Google DeepMind 團隊發布新算法,下一個被 AI 虐哭的是誰?
    你冬練三九夏練三伏,別人一出世就自帶超強自學能力,而且人家全家輸的次數屈指可數,還都是輸給自己人,你說這比賽讓人怎麼打?Zero 和此前一樣,表示沒有用到人類的數據。所以這個算法可以讀作「木Zero」、"謬Zero"~不過開發者自己的發音是「謬Zero」。這位小哥也很有意思,來自奧地利,對各種語言都很感興趣,當然也包括一些開發語言。
  • DeepMind制霸《雷神之錘3》!碾壓人類的超級多智能體這樣訓練
    來源:DeepMind編輯:大明、鵬飛【新智元導讀】雖然人類已經無望在電子競技中打敗智能體在訓練期間的遊戲表現。人類玩家面對響應延遲的智能體的勝率仍然很低,這表明,即使被加上了與人類相當的反應延時,智能體的遊戲表現依然勝過人類玩家。
  • 再創新高:DeepMind一年燒掉6.5億美元,谷歌卻揮手免除15億債務
    這家公司因其大量研究成果被社區所熟知,比如打敗圍棋世界冠軍的 AlphaGo、預測蛋白質結構的 AlphaFold 2 等等。DeepMind 以在圍棋領域戰勝最強人類的 AlphaGo 開始廣為人們所知,2017 年 5 月,當時的世界第一選手柯潔在人機大戰中 0 比 3 落敗。
  • 陳經:根據AlphaGo弈城圍棋網的疑似測試對局預測谷李大戰比分
    弈城圍棋網有一個帳號叫deepmind。2016年1月28號谷歌Deepmind小組開發的圍棋程序AlphaGo戰勝職業選手的勁爆消息出來之後,這個帳號名引發了棋迷的關注。之後AlphaGo的共同第一作者Aja Huang發貼說,這個帳號是他本人的,但否認是AlphaGo。對此我們根據deepmind的歷史戰績進行一些推測。
  • DeepMind詳解新WaveNet:比原來快千倍,語音更自然 | 附論文
    Florian Stimberg, Norman Casagrande, Dominik Grewe, Seb Noury, Sander Dieleman, Erich Elsen, Nal Kalchbrenner, Heiga Zen, Alex Graves, Helen King, Tom Walters, Dan Belov, Demis Hassabis地址:https://deepmind.com
  • 深度揭秘 AI 巨頭之谷歌 DeepMind
    自從2016年AlphaGo打敗世界圍棋冠軍Lee Sedol之後,開始得到許多人的認可。 遊戲被記錄下來,在人們看到這些之後,他們開始信任這家公司。除此之外,他們還開發了另一個名為AlphaZero的程序,可以下西洋棋、日本象棋並取得了最佳成績。
  • 多圖詳解 DeepMind 的超人類水準星際爭霸 AI 「AlphaStar」
    據 DeepMind 介紹,AlphaStar 使用神族(Protoss),在 2018 年 12 月 10 日以 5:0 戰績打敗了 Team Liquid 的職業星際 2 選手 TLO,然後經過更多訓練後,在 12 月 19 日再次以 5:0 的完勝戰績打敗了來自同一個戰隊的職業選手 MaNa 。
  • DeepMind AI 關係推理超越人類:深度神經網絡模塊即插即用
    新智元編譯來源:deepmind.com;arXiv.org譯者:文強   【新智元導讀】DeepMind 今天發表官博介紹了他們的兩篇最新論文,稱其都在理解「關係推理」這一挑戰方面展示出了令人可喜的結果。
  • 生物版AlphaGo發威!DeepMind抗疫:預測新冠病毒相關蛋白結構
    該出來遛遛了~DeepMind新冠病毒相關蛋白結構預測下載地址:https://storage.googleapis.com/deepmind-com-v3-datasets/alphafold-covid19/structures_4_3_2020.zip
  • DeepMind 綜述深度強化學習:智能體和人類相似度竟然如此高!
    而正是這些關聯,使那些對人類和動物的行為與神經科學學習感興趣的研究人員,產生了豐富的聯想與假設,從而開始將目光轉向了深度強化學習。這樣的結果,也對那些關於一代 Deep RL 發負面評論發出了警告。看似深度強化學習和人類的學習方式完全不同:有人認為,這種差異在於二者的樣本效率(學習系統達到任何選定目標性能水平所需的數據量)。
  • 最強AlphaGo怎樣煉成?DeepMind團隊進行全面解讀
    (量子位註:和柯潔對戰的AlphaGo Master,用了和Zero版一樣的算法和架構,不同之處在於引入了人類對局數據和特徵。)Julian Schrittwieser:主要是因為改進了價值/策略網絡,訓練和架構都變得更好了,不同的網絡架構之間的對比如下圖所示:提問:你們為什麼一開始選擇用人類對局數據來訓練AlphaGo,而不是通過自我對弈來從0開始?