對話DeepMind創始人:AlphaGo 的下一步是什麼?

2021-02-15 中科院物理所

圍棋只不過是一個開始,AlphaGo 的開發公司 DeepMind 在遊戲、醫療、機器人以及手機方面都有規劃。The Verge 非常迅速地採訪到了 DeepMind 的創始人Demis Hassabis,他說自己也被 AlphaGo 咄咄逼人又膽大包天的下法驚呆了!在後面的採訪中,Demis Hassabis 透露了 DeepMind 的下一步。

DeepMind大敗圍棋界傳奇李世石,引發了對人工智慧的潛力的關注——熱度遠超近期的任何事件。但是Google下屬的AlphaGo項目並不是它唯一的計劃——甚至不是最主要的計劃。就像Deep Mind聯合創始人Demis Hassabis在前幾天說的那樣,DeepMind想要「破解智能」,而關於如何達成這個目標,他有許多想法。

Hassabis自己走的並不是尋常路,不過現在回顧起來似乎是最有意義的路。他小時候是一個象棋天才,在腦力奧林匹克運動會上5次獲得Pentamind冠軍,隨後在不大的年齡就與英國電腦遊戲開發工作室Bullfrog和Lionhead一起闖出了聲名,致力於開發偏重AI的遊戲(比如《主題公園(ThemePark)》和《黑與白(Black& White)》),之後他建立了自己的工作室Elixir。在2000年代中期,Hassabis離開了遊戲行業,攻讀神經科學Phd,並在之後的2010年聯合創立了DeepMind。

AlphaGo旗開得勝的第二天清早,Hassabis坐在了The Verge記者的面前。此刻,即使他的心思一點也沒有留給媒體,也不會讓人覺得奇怪。然而,他進入採訪室時,言辭溫和又讓人愉快。他談論了一會兒首爾四季酒店裡閃耀的裝潢,隨後當一位Google發言人告訴他一夜之間韓國媒體界湧出了超過3300篇關於他的報導時,他看上去非常驚訝。「這簡直難以置信,是吧?」他說道,「看著某種有點深奧的東西變得這麼流行真是相當有趣。」

除了AlphaGo,我們的訪談也聊到了視頻遊戲、次世代智慧型手機助手、DeepMind在Google中的角色、機器人、AI如何推動科研、以及其他的話題。深入——非常深度的談話。

| 圍棋是人工智慧的聖杯

 

The Verge:對於不太懂AI或是圍棋的人,你會如何談論昨天發生的事引起的文化共鳴?

Hassabis:我會有幾件事想說。圍棋一直以來都是完全信息博弈遊戲(perfectinformation games)的巔峰。從可能性的角度來說,它比西洋棋複雜得多,所以在AI研究領域中它差不多算是聖杯,或者說重大挑戰,特別是在「深藍」(破解西洋棋)之後。你知道,雖然已經投入了很多努力,但我們還沒有走到那麼遠的地方。蒙特卡洛樹搜索在10年前是一個很大的創新,但是我覺得我們對AlphaGo做的是,引進了神經網絡這種直覺層面的東西——如果你想這麼稱呼它的話——而直覺的確就是頂級圍棋棋手間的差距。直播解棋時MichaelRedmond甚至一度難以點清目數,而他是一個職業九段!我對於這一點感到相當驚訝,這也向你顯示了為圍棋寫一個評估函數(valuationfunction)是多麼困難的一件事。

The Verge:你有沒有被AlphaGo的哪一步棋震驚到?

Hassabis:當然。我們都驚呆了——我想李世石也是,從他的表情上來看——當AlphaGo在左側落子深入李世石的領地時。我覺得這是相當出人意料的一步棋。

The Verge:因為非常咄咄逼人?

Hassabis:既咄咄逼人又膽大包天!並且,它是在用李世石的方式與他對弈。李世石以充滿創造力的戰鬥方式而聞名,他也展示出了這一點,我們也預計到會有這樣的情況發生。棋局一開始他就在整個棋盤上四處落子,沒有真正停在哪一點經營局面。傳統的圍棋軟體對於這種打法都不擅長,它們在局部計算上不算糟糕,但是當需要全局觀的時候就不行了。

The Verge:舉辦這些比賽,首先一個重要的目的是評估AlphaGo的能力,它能打贏還是會落敗。你從昨天的比賽中看出了什麼?

Hassabis:我想,我們知道了我們沿著這個方向走到了超過——好吧,沒有超過我們的預期,不過就像我們希望得那樣遠。我們原來告訴大家,我們覺得比賽的勝率五五開。我仍然覺得這可能是正確的說法,什麼事都有可能發生,我也知道李世石再次面對AlphaGo的時候可能會採用不同的策略。所以我覺得結果會是非常有趣的。

剛才說了AI的重要性,回答了你第一個問題。另一件我想說的重要的事情是AlphaGo和深藍之間的區別。深藍是一個人工打造的程序,程式設計師們從西洋棋大師那裡獲得信息、提煉出特定的規則和領悟,而我們為AlphaGO注入的是學習能力,隨後它通過練習和研究學會圍棋,這種做法更像人類。

| 從遊戲行業到 DeepMind 


The Verge:如果AlphaGo繼續一路攻城略地,下一步會是什麼——未來會不會有另一場AI參與遊戲的賽事?

Hassabis:我覺得對於完全信息博弈遊戲來說,圍棋已經是頂峰了。當然,還是有一些其它的頂尖圍棋棋手可以讓AlphaGo與之對弈的,但是遊戲是沒有了——無限制的撲克牌遊戲非常困難,多人遊戲有獨特的挑戰,因為它是一個不完全信息博弈遊戲。然後,顯而易見有許多視頻遊戲人類都玩得比計算機更好,比如《星際爭霸》,另一個在韓國很火爆的遊戲。策略遊戲需要一種不完全信息世界中的高水平策略能力——這被稱為「部分可觀測」。對於圍棋來說,顯然你可以看到一切都顯示在棋盤上,所以這讓圍棋對於計算機來說顯得稍微簡單了一點。

The Verge:戰勝《星際爭霸》對你個人來說是一件讓你感興趣的事情嗎?

Hassabis:可能是吧。我們只對處在我們研究項目的主要軌跡上的東西感興趣。所以DeepMind的目標不只是戰勝遊戲,雖然這的確很有趣也很讓人興奮。你知道,我個人很喜歡遊戲,我曾經寫過電腦遊戲,但是這是因為它們作為測試平臺來說非常有用,在這個平臺上可以卸下我們對算法的想法、測試它們能做到什麼地步;這是一種非常有效的方法。最終我們想要把這個東西用在重要的真實世界問題上。

The Verge:1990年代後期,我在英國長大,從電腦雜誌上看到你的名字與一些非常雄心勃勃的遊戲聯繫在一起。後來當我第一次聽說DeepMind、看到你的名字在裡面的時候,我心想,「簡直太配了」。你可以說說你是怎麼從之前的遊戲行業轉到你現在做的事情上的嗎?

Hassabis:當然。像DeepMind這樣的東西一直以來都是我的終極目標。我為此策劃了超過20年,從某些方面來說。如果你回顧一下我做的一切,從最終我開始致力於AI研究來看,我的選擇就變得非常清晰了。如果你很熟悉我在Bullfrog工作室的事情還有後來一些別的事,你就會知道,對於我所寫的一切程序、我所參與的一切活動來說,AI是核心部分。顯然PeterMolyneux(Bullfrog工作室的創始人之一)的遊戲都是AI遊戲。當我16還是17歲的時候,我在編寫《主題公園》的程序,那對我來說是一段非常重要的時間,讓我意識到了如果我們真的試圖拓展AI的能力、它能強大到怎樣的地步。我們賣出了數百萬份《主題公園》的遊戲,有那麼多人都沉浸於玩這個遊戲,這是因為遊戲裡的AI能夠適應你玩遊戲的方式、做出改變。我們在此基礎上繼續前進,我也試圖在我接下來的遊戲生涯中繼續往這個方向開拓。後來我離開了遊戲行業,回到學術圈和神經科學界,因為我在2000年代中期感到我們在AI研究方面已經做到了極限——當你還需要真的做出一款遊戲的時候。AI研究難以繼續深入,因為發行商們只想要遊戲,是吧?

The Verge:所以那時只是因為AI最顯而易見的應用就是遊戲嗎?

Hassabis:當然,我是這麼覺得的,我也確實認為我們當時做的AI極為前沿、讓人幾乎難以相信。我覺得1990年代學術圈還沒有什麼動靜,而這些新技術——神經網絡、深度學習、強化學習——也還沒有真正得到推廣。所以事實上那時候最好的AI在遊戲行業。那不是我們現在致力於研究的這種AI,它更像是有限狀態機(finite-statemachines),但是相當複雜、也能自我適應。《黑與白》之類的遊戲中有強化學習——我仍然覺得這是強化學習用在遊戲中的最複雜的一個例子。但是,隨後在2004年、2005年左右的時候,很明顯遊戲行業走的路線與90年代不同了——90年代時它非常有趣也非常有創造力,你可以想出任何主意、然後實現它。但它後來變得更多的是在依賴於畫質、續作、還有FIFA足球遊戲等等,不再那麼有趣了——我在遊戲方面做了我能做的一切,是時候為了DeepMind的建立而去收集不同的信息了。那就是神經科學。我想要從大腦如何解決問題中獲得靈感,那麼還有比攻讀一個神經科學博士學位更好的方法嗎?

The Verge:這可能看上去是唾手可得的成果,不過如果你們現在將AI的進展應用到遊戲上,會怎麼樣?

Hassabis:我覺得應該會真的很驚人。最近EA有人聯繫過我…【渴望的語氣】我們應該會做的。有那麼多事情可以做!【笑聲】使用這些技術是非常通用的,我很想要做這件事。但是有帶寬的限制在,並且我們現在精力集中在醫療和推薦系統之類的方面上。不過可能到某個時間我們就會做這件事,製作一些智能的、有適應能力的AI對手,並且我覺得遊戲開發者們也會喜歡這樣的——不必再為每個遊戲都開發新的AI——屆時可能他們只需要通過他們的遊戲訓練出一個AI就好了。

The Verge:我剛才想像了一下你在家打視頻遊戲,在NPC面前比我還要疲於奔命的樣子。

Hassabis:當然【笑聲】是的,在MMG(大型多人遊戲)和類似遊戲裡這總是讓我很受挫。我從來沒有真的為這些遊戲著迷,因為NPC都太蠢了。他們沒有記憶,不會改變,不理解上下文。我覺得如果有了這種可以學習的AI,遊戲就完全上升到另一個層次了。

| DeepMind 的下一步:醫療

 

The Verge:這周你帶來的消息裡,AI未來主要的用途是醫療、智慧型手機助手以及機器人。讓我們來詳細聊聊。醫療方面,舉例來說,IBM的Watson在癌症診斷方面有所建樹——DeepMind可以帶來什麼?

Hassabis:好吧,現在還只是雛形。我們幾周前宣布了一項與NHS(英國國家醫療服務體系)的合作,不過這只是剛開始著手建立一個利用機器學習力量的平臺。我覺得Watson與我們做的事情非常不同,從我的理解而言——Watson更像是一個專家系統,所以它是另一種形式的AI。我覺得你能看到這類AI做的事情會是醫療圖像的診斷,然後可能有對於自我量化(quantifiedself)或是重要跡象的長期追蹤,幫助人們有更健康的生活狀態。我覺得這很適合用強化學習。

The Verge:在與NHS的合作中,你們推出了一款看上去沒有怎麼用到AI或是機器學習的app。這背後你們是怎麼想的?為什麼NHS要用這個app,而不是其他廠商推出的軟體?

Hassabis:NHS的軟體在我的理解中是相當糟糕的一個東西,所以我覺得第一步就是試著讓它進入21世紀。它們並不是移動端的,完全不是我們作為今天的消費者理所當然認為能看到的那種樣子。並且我覺得對於醫生和護士來說它用起來讓人覺得很挫敗,降低了他們的效率。所以我覺得第一步是,幫助他們用上更有用的工具,比如可視化和基礎統計信息。我們認為,我們會實現這樣的功能,然後看清我們到底需要什麼,隨後再將更純熟的機器學習技術運用其中。

The Verge:這一切有多簡單?醫療資金在英國顯然會是一個充滿爭議的話題。

Hassabis:當然,呃,好吧,我們正在免費做這件事【笑聲】這讓它變得很簡單!這與大部分軟體公司都有很大的不同。大部分時候是大型跨國公司製作這種軟體,所以他們不會真正把注意力放到用戶身上,而我們在設計它的時候更像是一種初創企業的方式,從用戶那裡傾聽反饋、從某種程度上來說與他們一起設計一個軟體。

| 未來的核心:智慧型手機助手

The Verge:那麼讓我們談談智慧型手機助手。我看到你第一天的時候演講PPT裡有一張圖來自電影《她(Her)》——這會是最終形態嗎?

Hassabis:不,我的意思是,關於智慧型手機助手是什麼樣,《她》只是一種盛行的主流觀點。我只是覺得,我們會想要讓這些智慧型手機助手之類的東西真正變得智能、理解上下文、對於你要做什麼有更深的理解。現在,大部分這樣的系統都極為脆弱——一旦你偏離了預先編程輸入的模板,它們就完全變得毫無用處。所以這意味著讓它們變得真正可以適應、變得靈活、也更穩健。

The Verge:為了改善這些,需要有什麼突破?

Hassabis:我們可以的,只不過我覺得你需要一個不同的方法。再說一次,這是預編程和學習的二分法。目前基本所有的智慧型手機助手都屬於特殊案例和預編程的,這意味著它們很脆弱,因為只能做預編程寫好的事。然而真實的世界非常混亂,用戶們也會在你無法提前知曉的情況下,做著不可預知的事情。我們對 DeepMind 的信念是,這也是最根本的原則,通往人工智慧的唯一道路,是從地基開始打起,而且變得通用。

The Verge:AlphaGo 從學習很多遊戲模式過程中順利起飛,這對於智慧型手機怎麼使用呢?它的輸入是如此的多變?

Hassabis:是啊,所有得有上萬噸的數據,而你可以從中學習到很多東西。事實上, AlphaGo 的算法,我們打算在未來幾個月嘗試的是,擺脫監督式學習的出發點,讓它完全自我發揮,從一無所有的狀態開始。它會需要更長的時間,因為當你採用隨機方法的時候,其中的審查和錯誤會需要更多的時間訓練,也許是幾個月。但是,我們認為有這個可能性,讓它從純粹的學習中起步。

The Verge:是因為算法現在能達到的程度,所以你認為這是可能的麼?

Hassabis:不是的,我們本來可以這樣做的。它不會使得程序更強大,它只是做著純粹的學習。所以會有一些非監督的部分。我們認為這個算法能夠在非監督的狀態下工作。我們去年做了 Atari 遊戲,在像素的層面玩遊戲,而不會受人類知識的禁錮,它會在屏幕中做一些隨機的動作,開始遊戲。

The Verge:對於 Atari 遊戲來說更加容易,是因為失敗的狀態更加明顯麼?

Hassabis:的確更加容易,因為分數更有規律。在圍棋中,不管最終贏得還是輸掉比賽,你也僅僅得到一個分數。這就是所謂的信用分配問題(Credit Assignment Problem):這個問題是,你在圍棋中走了幾百步,但不知道具體哪一步會為最終的勝利或失敗負責,其中的信號非常微弱。而在大多數的 Atari 遊戲中,所做的大多數事情都會給予分數,所以就得到了更多的麵包(獎勵)去仿效。

The Verge:你可以給個是時間表麼?當這些事情開始給手機市場帶來顯著性差異的時候。

Hassabis:我認為在未來的兩到三年會開始看到它。我的意思是,它在開始的時候是非常微小的,只有很小的部分會工作的更好。也許在未來的 4 到 5 年,甚至 5 年更多,你可以看到在功能上大的變化。

| 為何 Google 的支持非常重要

The Verge:你確定了未來各種各樣的可能性,而這件事是和 Google 聯繫在一起最明顯的事情。

Hassabis:是的。

The Verge:你有沒有得到任何指示,這些事情被期待如何納入到 Google 的產品路線圖或商業模式中?

Hassabis:不,在如何最優化研究進展方面,我們有很強的主導權。這是我們的使命,也是為什麼我們加入了 Google,這樣我們可以給研究進行渦輪增壓。這是發生在過去幾年的事情。當然,我們實際上也致力於很多 Google 內部的產品,但是他們是非常早期的階段,所以還沒準備好公布。當然我認為智慧型手機助手是非常核心的,我認為 Sundar Pichai 已經對此談了很多,這是 Google 未來的核心。

The Verge:Google 有另外的舉措,例如 Google Brain,它推出了機器學習的特徵,像 Google 圖片搜索和其他面向用戶的東西。

Hassabis:是的,幾乎無所不在。

The Verge:你的公司和 Google Brain 有互動嗎?你們有沒有重疊的部分?

Hassabis:當然,其實我們是非常互補的。我們每周都有交談。Google Brain 主要致力於深度學習,他們也有非常卓越的工程師 Jeff Dean,所以他們已經鋪開到公司的各個角落,這也是為什麼我們發明出了令人驚喜的 Google 圖片搜索。他們正在做著現象級的工作。另外,他們的團隊在山景城,所以他們離產品團隊更近,他們的研究周期也更像 12 到 18 個月。而我們有更多算法開發的工作,我們傾向於為需要兩三年研究的事情做研究,而且不需要在開始的時候就有直接的產品焦點。

The Verge:Google 對 AlphaGo 的支持有多重要?如果沒有他們,你們是否能做到?

Hassabis:這是非常重要的。AlphaGo 在比賽中實際上並沒有使用那麼多硬體,但我們需要大量的硬體來訓練它,做各種不同的版本,並讓他們在雲端互相比賽。這需要相當多的硬體才能高效完成,所以如果沒有這些資源,在這段時間內根本無法完成。

| 不看機器人,關注科學的進展

The Verge:讓我們來說說機器人。我平時在日本,並傾向於認為日本是機器人的精神家園。我現在在日本看到的機器人以兩種方式使用。我們有像發那科這樣的工業機器人,有一個確定的目的做著讓人驚訝的事情,也有像軟銀 Pepper 那樣的迎賓機器人,儘管使用有很大的限制,但他們在很多方面都是野心勃勃。對於這個領域現在的狀態,你有什麼想法?

Hassabis:是的,我認為你說的發那科,他們有很漂亮、很能幹的身體,但缺少了智慧。而迎賓機器人和智慧型手機助手更像,我見過的那些,反正都是預編程了很多針對模板的反應,但如果你做一些其他事情,例如去越野的地方滑雪,那他們會感到很困惑。

The Verge:所以我猜測,一個很明顯的問題是,機器學習會如何強化機器人的能力。

Hassabis:是的,這是完全不同的方法。你可以從頭開始建立學習新事物,並能應對突發事務的能力,我認為這就是當機器人或軟體應用程式在真實世界中和用戶交互時所需要的——他們需要擁有這種能力,並妥善使用。我認為學習曲線最終必須採用正確的做法。

The Verge:對於可學習的機器人來說,什麼是你看到的最直接使用案例?

Hassabis:其實,我們對此沒有太多的想法。顯然,自動駕駛汽車是一種機器人,但目前來說還是狹義的人工智慧,雖然他們使用了計算機視覺裡面一些可學習的人工智慧——特斯拉採用了一種基於深度學習的標準、現場的計算機視覺方案。我相信日本在老年護理機器人、家庭清潔機器人上面有很多思考,我認為這對社會會非常有用。特別是在一個人口老齡化的社會裡,我認為是一個非常緊迫的問題。

The Verge:為什麼在這些類型的案例中,一個更基礎的學習方法,能帶來如此顯著的提高呢?

Hassabis:那麼,你需要思考這樣的問題:「為什麼我們還沒有擁有這些東西?」為什麼我們沒有一個機器人,可以跟在你後面清理房子?原因在於,每個人的房子在布局、家具等方面有很多的不同,有時候它是混亂的,有時候卻很乾淨。因此,很難通過預編程的方法,找到整理你的房子的解決方案,對吧?而且你還得考慮,你的個人偏好,例如你會喜歡衣服怎樣被摺疊。這真的是非常複雜的問題。我們認為,這些事情對於人類來說很簡單,但實際上我們必須處理非常複雜的事情。

The Verge:出於個人興趣問一下,你有機器人吸塵器嗎?

Hassabis:額,我的確有一個,但是它不怎麼管用所以…(笑)

The Verge:我也有一個機器人吸塵器,它不是非常管用,但我發現自己能學習它奇怪的地方,並圍繞它工作,因為我是一個懶人,而它帶來的好處值得我這麼做。所以我想知道,我們什麼時候能有更先進的機器人,在「足夠好」的引爆點到來之前?我們會在有意義的達到人類水平的交互和圍繞這個奇怪的小玩意工作之前,就停止研發嗎?

Hassabis:是的,我的意思是,也許吧。我想每個人都會以合理的價格購買一個機器人,它可以疊好盤子,並清洗乾淨——這些啞巴吸塵器非常受歡迎,但無論如何,他們並沒有真正的智能。所以,我覺得其中的每一步,逐步的的進展,就會發明出有用的東西。

The Verge:那麼,你對人類、機器人和人工智慧在未來的交互,有什麼遙遠的期望?顯然,人們的腦袋能到達那些非常狂熱的科幻地方。

Hassabis:我自己對機器人沒多少思考。我自己對人工智慧的使用感到興奮的領域是科學,能夠推動它更快的發展。我想看到人工智慧輔助的科學,那樣會有一個人工智慧研究助手,它可以做很多乏味的工作,閱讀有趣的論文,從海量的數據中找到結構,並把它們呈現到人類專家和科學家面前,以實現更快的技術突破。我幾個月前在歐洲核子研究中心做演講,很顯然它們創造出比地球上任何地方都多的數據,我們都知道在它們海量的硬碟中,可能會有某個新的粒子發現,但沒有人能抽出時間做這件事情,因為這裡的確有太大了的數據了。所以我覺得,如果有一天人工智慧參與尋找到一個新的粒子,那麼是一件非常酷的事。

註:以上圖片均來自譯文。

本文由新智元公眾號編譯並首發英文來源:The Verge

近期熱門文章Top10

↓ 點擊標題即可查看 ↓

1. 為什麼物理不能理解愛情?(2016-2-14)

2. 中科院最美的玫瑰:她一生都是時間的敵人(2016-2-14)

3. 怪不得引力波看起來像太極,原來隱藏著一個驚天計劃!(2016-2-17)

4. 為什麼時間無法回頭?(2016-2-9)

5. 尊重夢想,更要尊重科學(2016-2-22)

6. 什麼是「量子」?(2016-2-15)

7. 看物理學家怎樣搞定交通罰單(2016-2-19)

8. 時間的起點到底在哪裡?(2016-2-1)

9. 拓撲為何?(2016-2-25)

10. 探測引力波如果證實意味什麼?(2016-2-12)

點擊公眾號內菜單欄「Top10」可查看過往每月熱門文章Top10

相關焦點

  • 無需人類知識,DeepMind新一代圍棋程序AlphaGo Zero再次登上Nature
    但 AlphaGo Zero 跳過了這一步,從自己完全隨機的下圍棋開始來學習圍棋。通過這種方式,它快速超越了人類棋手的水平,並且以 100:0 的比分打敗了之前戰勝世界冠軍的 AlphaGo。AlphaGo Zero 利用新型強化學習完成這樣的壯舉,在訓練過程中它是自己的老師。該系統的神經網絡最初對圍棋一無所知,然後它通過將該神經網絡與強大的搜索算法結合進行自我對弈。
  • 從AlphaGo到蛋白質摺疊,Deepmind在不斷捅破AI領域的天花板!
    #近日,又一世紀級難題被AI迎刃而解:谷歌旗下子公司Deepmind通過AI建立的算法模型,成功精準預測了蛋白質的摺疊方式,這將對人類了解重要的生物學過程和治療新冠等疾病起到十分關鍵的作用。Deepmind最初由三名科學家聯合創辦,就像其創始人兼CEO哈薩比斯(Demis Hassabis)所說的,它的性質更像一個科技研究院而不是創業公司,因為公司一開始並沒有任何產品,而是一直在通過遊戲來研究人工智慧算法。在被谷歌收購前,Deepmind通過人工智慧的無監督學習算法打爆了57個atari遊戲,即八九十年代國內也很流行的小霸王卡帶遊戲。
  • alphago 50盤自戰棋譜的簡單解讀
    烏鎮 alphago與柯潔,及其他國手對弈結束後,deepmind官方表示要送給棋界一個禮物,也就是50盤 alphago自我對弈的棋譜。
  • 不只是AlphaGo,谷歌DeepMind到底是何方神聖?
    此外,他們還開發了另一個名為AlphaZero的程序,該程序在西洋棋、將棋和圍棋方面下的表現出色。DeepMind獲得了相當大的資金支持,斯科特·巴尼斯特和伊隆·馬斯克這樣的人也開始加入了進來。這使他們除了從風險投資公司、維港投資和創始人基金以外,獲得到額外的資本補充。
  • AlphaGo已下線,AlphaGo Zero從0-1不帶人類尬棋了!
    今天凌晨,谷歌旗下Deepmind團隊在《自然》雜誌發表人工智慧界期待已久的論文《無須人類知識掌握圍棋》(Mastering the game of go without human knowledge),印證了一個人們已經猜到的事實
  • DeepMind創始人:AlphaGo破解圍棋3000年奧義,超越人類認知極限
    阿爾法狗去年贏了韓國職業九段李世石靠哪幾個絕招?今年年初拿下數位國際大師的神秘棋手Master究竟是不是阿爾法狗?為什麼圍棋是人工智慧難解之謎?對於不知道DeepMind公司的朋友,我做個簡單介紹,我們是在2010年於倫敦成立了這家公司,在2014年我們被谷歌收購,希望藉此加快我們人工智慧技術的腳步。我們的使命是什麼呢?我們的首要使命便是解決人工智慧問題;一旦這個問題解決了,理論上任何問題都可以被解決。
  • 重磅 圍棋之美-DeepMind發布AlphaGo視角對弈原始棋譜[附下載]
    Deepmind官網10個小時之前發布了這場棋局【AlphaGo】視角的原始棋譜重現,以AlphaGo的視角,更進一步還原了整場棋局的變化。此外,Deepmind還製作了在線互動棋譜,還原每一步行棋,並在右側配上專業解說來分析。
  • DeepMind又出大招!新算法MuZero登頂Nature,AI離人類規劃又近了一步
    但是人類有能力制定下一步的計劃和策略。我們第一次真正擁有了這樣的系統,能夠建立自己對世界運作方式的理解,並利用這種理解來進行這種複雜的預見性規劃,我們以前也在AlphaZero上實現過類似的能力。MuZero可以從零開始,僅通過反覆試驗就可以發現世界規則,並使用這些規則來實現超人的表現。
  • DeepMind AI破解「蛋白質摺疊」難題,攻克生物學50年...
    第二代AlphaFoldDeepMind聯合創始人兼首席,執行官Demis Hassabis表示:「 DeepMind的最終願景一直是構建通用AI,以此加快科學發現的步伐,幫助我們更好地了解周圍的世界」。
  • DeepMind悄咪咪開源三大新框架,深度強化學習落地希望再現
    下面我們開門見山,來看看這三種框架到底有什麼特別之處,以及如何使用。OpenSpielGitHub:https://github.com/deepmind/open_spiel遊戲在 DRL agent的 訓練中發揮著重要作用。與其他數據集一樣,遊戲本質上基於試驗和獎勵機制,可用於訓練 DRL agent。
  • AlphaGo後再出神作!DeepMind打造AlphaFold擊敗人類,精度碾壓人類專家!
    「對我們來說,這是一個非常關鍵的時刻,」DeepMind的聯合創始人兼執行長Demis Hassabis說。「這是一個燈塔項目,是我們在人員和資源方面,向解決現實世界中的重大基礎科學問題做出的第一次重大投入。」Hassabis表示,未來還有很多工作要做。目前我們還沒有解決蛋白質摺疊問題,現在取得的結果只是第一步。
  • 現場報導 | 讓天下三子,DeepMind官方解讀新版AlphaGo強大實力
    第一天比賽結束,DeepMind 創始人 Hassabis 表示,比賽進入了數子階段,AlphaGo 的優勢很小,柯潔完成了一場偉大的比賽。竭盡全力的柯潔表示,此次大賽之後不但不會再與機器交戰,也不會利用機器來練習,他「更喜歡與人類棋手下棋,這樣自己還有贏的可能。」
  • 再創新高:DeepMind一年燒掉6.5億美元,谷歌卻揮手免除15億債務
    DeepMind 於 2010 年創辦,創始人為 Demis Hassabis、Mustafa Suleyman 和 Shane Legg,2014 年被谷歌以 6 億美元收購。這家公司因其大量研究成果被社區所熟知,比如打敗圍棋世界冠軍的 AlphaGo、預測蛋白質結構的 等等。
  • AlphaGo教學工具上線!人人可用,柯潔稱要重新學圍棋
    △ 黃士傑博士的朋友圈也就是說,曾經擊敗過世界頂級圍棋選手李世石和柯潔的AlphaGo重出江湖,化身圍棋老師,開始教人類下圍棋了。五月烏鎮圍棋峰會上,谷歌DeepMind的創始人哈薩比斯就表示,開始研究用AlphaGo教人類更好地理解圍棋。半年過去,AlphaGo Teach真的推出了。項目主頁的介紹支持英語、簡體中文、繁體中文、日文和韓文閱讀ʘᴗʘ。在項目官網中我們看到,點擊棋盤上的彩色圓圈,或使用棋盤下方的導航工具,即可探索不同的開局變化,以及AlphaGo對於每一步棋的黑棋勝率預測。
  • 生物學50年難題被DeepMind解決了,蛋白質版「阿法狗」預測結構準確...
    △圖源:Deepmind兩年前,上一版本的AlphaFold便已經取得了裡程碑的突破,但是,仍然沒有完全解決蛋白質摺疊問題。而這次AlphaFold 2,則更進一步。這一巨大的突破,直接引爆了全網,Nature、Science紛紛報導,生物屆和AI大牛們也紛紛祝賀。
  • Google DeepMind 團隊發布新算法,下一個被 AI 虐哭的是誰?
    分別衡量了:當前位置好壞程度、最優策略以及上一步好壞的衡量。通過蒙特卡羅搜索樹,配合動力學函數和預測函數,考慮下一步的動作序列,同時利用了和環境互動時候收集的經驗來訓練神經網絡,在每一步當中保存之前的信息。這個似乎是一種無監督學習內的強化學習。其實它也不能說完全 「無規則」,它唯一的規則其實是我們在下棋當中常說的「走一步、看三步」,不管是什麼遊戲,它都給自己一個這樣的規則。
  • Tygem解密Master測試真相 李世石評價新版AlphaGo
    被譽為「AlphaGo之父」的DeepMind創始人戴密斯·哈薩比斯本月4日在推特中說:「Magister(P)是適用新原型版本的AlphaGo」,並公開了AlphaGo在Tygem(弈城)對弈的事實。李世石九段觀看了新型AlphaGo在Tygem打敗樸廷桓、柯潔等中韓頂尖高手的棋譜之後,評價說:「AlphaGo變得更強大了,在讀秒的情況下,沒有出現失誤。
  • Deepmind公布AlphaGo自我對弈慢棋棋譜 第1-50局
    Deepmind創始人哈薩比斯   5月28日,圍棋峰會在浙江落幕,賽後Deepmind在官網公布了50局AlphaGo自我對弈慢棋棋譜
  • DeepMind第四代:不學規則就能下棋玩遊戲
    發布詳情:https://deepmind.com/blog/article/muzero-mastering-go-chess-shogi-and-atari-without-rules
  • DeepMind破解蛋白質摺疊難題
    DeepMind聯合創始人及CEO德米斯·哈薩比斯(Demis Hassabis)表示:「DeepMind背後的終極願景一直是構建通用人工智慧,利用通用人工智慧來極大地加速科學發現的步伐,幫助我們更好地了解周圍世界。」谷歌CEO桑達爾·皮查伊(Sundar Pichai)在Twitter上為此次突破點讚。