谷歌和OpenAI新研究:如何使用達爾文進化論輔助設計人工智慧算法?

2020-12-05 機器之心Pro

選自QZ作者:Dave Gershgorn機器之心編譯參與:吳攀、黃小天、李亞洲

現代機器智能建立在模仿自然的基礎之上——這一領域的主要目的是在計算機中複製人類通過生物方式具備的強大決策能力。

30 年的發展取得了一些優秀成果,大多數腦啟發人工智慧技術的進展都圍繞著「神經網絡」,這一術語借用自神經生物學,其把機器思考描述為被稱作「神經元」的互相連接的數學函數中的數據流動。但是自然界也有其他好想法:現在計算機科學家正再次踏入生物進化這一研究領域,希望通過在人工智慧中植入生物進化元素的方式開發出更智能更有效的算法,恰如數十億年來生物進化塑造了人類大腦一樣。

但是,首先讓我們回到中學的生物課本上。簡單地說,進化(evolution)這一概念表述了有機體基因組中的隨機變化會為其生存帶來了優勢或劣勢的結果,該思想最早由查爾斯·達爾文據此提出,後人又對其進行了不斷的完善。如果有機體的基因突變使其獲得了生存和繁殖的機會,則該突變一直傳遞下去;如果沒有,則該突變會隨有機體一起消亡。在算法的世界,這被稱為神經進化(neuroevolution)。人工神經網絡是為了複製生物學習單個概念的過程,而神經進化則是試圖再現構建大腦的部分過程——即適者(強大的或聰明的)生存的過程。

儘管神經進化在 20 世紀 80 年代左右就已被提出,但隨著研究者在機器學習的不同視角上對其進行研究,它也正獲得新的關注。上個月,谷歌大腦和非營利性組織 OpenAI 分別就神經進化這一主題發表了還未經評議的論文,谷歌的論文是關於神經進化原理在圖像識別上的應用,而 OpenAI 的論文則是關於使用工作器(worker)算法讓一個主算法學會實現一個任務的最好方法。

為本已複雜的人工智慧研究領域引入生物進化的思想不免使人困惑。因此,如果想解決困惑,就把算法看作馬吧。馬一生之中都在學習,但是它們只在幾個不同的指標上進化,例如奔跑的速度。圖像識別的精確度不難獲得,只是一個數字而已,馬跑一圈所需要的時間量也是如此。但是真正使馬跑得更快的東西卻極為複雜——這是一個基於 DNA 的巨大網絡,它能賦予馬生長肌肉、持久奔跑甚至思考的能力。這種複雜性是算法底層參數的真實寫照——即一個圖像識別算法究竟是如何表現得好(或壞)的。如果你在本文之中的某處卡住了,做個深呼吸並想像一下馬吧(這也是一個好的人生建議)。

為了這一研究,谷歌團隊生成了 1000 個圖像識別算法,這些算法使用了現代深度神經網絡來訓練以識別一組特殊的圖像;接著,250 臺計算機中的每一臺選擇 2 個算法,並通過一張圖像的識別任務來測試算法的精確度。具有更高精確度的算法會被保留,表現欠佳的算法則被刪除。接著保留的算法被複製,並生成稍作改變的克隆算法(或「孩子」),就像人類 DNA 在生育期間隨機改變一樣。但是這次突變改變的不再是藍眼睛或是紅頭髮,而是新算法解讀訓練數據的方式。接著,把訓練親代算法的相同數據用來訓練克隆算法並將克隆算法放回到那 1000 個算法之中,並再一次開始這一過程。

谷歌的研究者通過神經進化培育出了一個精度高達 94.6% 的算法,並且在 4 次重複實驗中都取得了類似的結果(儘管並不完全等同)。能夠提升該算法的圖像識別技能的突變被保留(即這些算法存活),而引起了算法性能降低的突變則會被清除。正如自然界的情況一樣。

谷歌進行的 5 次實驗之間的不同也表明了一個持續存在的問題。谷歌研究者及該論文合作者 Esteban Real 說,該算法常常會在運行到一半時卡住,似乎不確定是要繼續進化還是停止突變重新開始。Real 說自然界裡翅膀的進化是這種情況的一個類比:一隻翅膀不會帶來太多幫助,但是一對翅膀可以使你飛翔。

現在谷歌的團隊正致力於使進化模型更全面地(為了打造一對翅膀)探索不同的突變。但是這有點棘手。這個團隊只想要算法以一種限定的方式突變,這樣能使該算法不會獲得一大堆無用的額外代碼。Real 解釋說:「最壞的情況是我們得到很多的單只翅膀。」

通過主要聚焦於圖像識別,谷歌不僅測試了神經進化解決那些生物大腦所擅長事情的能力,還測試了其解決現代問題的能力。另一方面,OpenAI 則使用了一種更純粹的進化形式來承擔一個不同的任務。

OpenAI 沒有訓練數以千計的算法以更好地解決一件事情,而是希望使用「工作器」算法來訓練一個主算法以完成一項未知的任務,比如玩一個視頻遊戲或在一個 3D 模擬器中行走。這一技術並非教機器如何做決策的主要方式,但卻是一種教機器更有效地學習特定知識的方式,OpenAI 研究者和論文合作者 Tim Salimans 解釋說。這種進化算法能夠監控工作器的學習方式,並且從根本上學會學習——即,從相同量的數據中提取更多的知識。

為了進行研究,該 OpenAI 團隊設定了 1440 種工作器算法來玩 Atari 遊戲。這些工作器會一直玩下去直到 Game Over,結束後這些工作器算法會向主算法報告各自的得分。生成最好得分的算法被複製下來(和谷歌的研究一樣),複製版本隨機進行突變。突變後的工作器然後繼續重複上述過程——有益的突變被獎勵,壞的突變被淘汰。

這種方法也有自己的局限性,最主要的是工作器算法只返回一個數值(高分)到主算法。有最佳得分的算法保留下來,但要讓主算法意識到任何明確的成功行為(move)將需要大量的計算能力。(可以類比為生物上的蟻群:工蟻出去尋找最優的解決方案,蟻后是信息中心。)換言之,OpenAI 學習的東西大都是關於成功的,零碎的其它東西則學得很少。

時間倒回到上世紀 80 年代,那時候神經進化和神經網絡研究領域的大小還差不多。中加州大學的副教授兼 Uber 人工智慧團隊的成員(Uber 收購了他聯合創立的 Geometric Intelligence)Kenneth Stanley 說:

很少有人思考過大腦是如何出現在世界上的,而大腦是智能在自然界中唯一的概念證明。一些人認為也許創造智能的最直接方式應該是在計算機中創造一種可以進化的、達爾文式的過程,使其成為小型的人工大腦。

神經網絡的騰飛始於三位計算機科學家。1986 年,David Rumelhart、Geoffrey Hinton 和 Ronald Williams 發表的一篇論文《Learning representations by back-propagating errors》描述了一種可以增強網絡從其錯誤中進行學習的能力的算法——反向傳播(backpropagation)。這個研究成果極大地提升了人工設計的神經網絡的效率,但一次即將到來的人工智慧冬天抑制了其進一步的發展——那時候因為人工智慧技術缺乏進展,研究資金被削減了。直到後來 Hinton 等人發表的論文使神經網絡變得太有誘惑力之後,更廣泛的計算機科學社區才放棄抵抗。他們的研究表明反向傳播能讓神經網絡實現極大的增長,反過來又使得這樣的神經網絡能理解遠遠更加複雜的概念。這種網絡被冠以「深度」之名——即「深度神經網絡(deep neural networks)」,且已經發展成了目前最受歡迎的人工智慧技術。

Stanley 說:「因此,對於類比大腦進化的神經進化這條線,人們的了解就出現了一些缺失。」

2002 年的時候,Stanley 的事業剛剛開始,他就寫出了 NEAT 算法,該算法可以讓神經網絡隨時間進化成更大和更複雜的版本。根據谷歌學術的數據,他的對應性論文《Evolving neural networks through augmenting topologies》已經被引用了至少 1600 次,而且自發表以來,就一直不斷地被深度神經網絡設計和神經進化方面的研究所引用。在 2006 年,Stanley 發表了一種可以實現更大規模的神經進化的算法 Hyper-NEAT,該算法的靈感來自於 DNA 的編碼能力——DNA 僅需大約 30000 個基因就能編碼帶有數萬億個連接的數十億個生物神經元。(Hyper-NEAT 的全稱是 Hybercube-based NeuroEvolution of Augmenting Topologies。)今天,Stanley 說他很欣喜地看到自己的研究又回歸成為了時代的思潮。

和 Stanley 一樣,OpenAI 和谷歌也正在研究來自這個領域的兩種不同的思想。谷歌的混合方法將經典的神經進化和反向傳播等技術結合到了一起,從而實現了現在非常強大的深度學習:教一個算法如何在世界中採取行動,讓其進化,而該算法的「孩子」將具有大多數積累的知識。OpenAI 的方法更類似於生物的進化方式。該團隊在每一代僅允許隨機突變來主宰該網絡提升或失敗的方式,也就是說其提升是完全通過隨機進化創造的。這兩項研究都有非常明確的目標——識別圖像或在遊戲中獲得高分(即使馬跑得更快)。該算法將如何實現目標就要看造化了。

以下是對谷歌和 OpenAI 的這兩項研究的摘要介紹:

谷歌論文:圖像分類器的大規模進化(Large-Scale Evolution of Image Classifiers)

連結:https://arxiv.org/abs/1703.01041

神經網絡已被證明能有效地解決困難問題,但它們的架構的設計難度可能非常大,甚至只是對單獨的圖像分類問題也是如此。進化算法(evolutionary algorithm)是一種能用於自動發現這些網絡的技術。儘管進化模型(evolving model)有顯著的計算要求,但我們的研究表明今天已經可以使用進化模型實現媲美大型的人工設計的架構了。我們在前所未有的規模上使用了簡單的進化技術來發現用於 CIFAR-10 和 CIFAR-100 數據集的模型,並且是從簡單平常的初始條件開始的。為了實現目標,我們使用了全新的和直觀的突變算子(mutation operator),其可以在大型搜索空間中尋找方向。我們要強調:一旦進化開始,其就不再需要人類的參與了,然後其會輸出一個完全訓練好的模型。在這項研究中,我們特別強調了結果的可重複性、輸出結果的可變性和對計算的要求。

OpenAI 論文:用作強化學習的可擴展替代的進化策略(Evolution Strategies as a Scalable Alternative to Reinforcement Learning)

連結:https://arxiv.org/abs/1703.03864

我們探索了進化策略(Evolution Strategies/ES)的使用,這是一類黑箱的優化算法,可作為 Q-學習和策略梯度等流行的強化學習方法的替代。在 MuJoCo 和 Atari 上的實驗表明 ES 是一種可行的解決策略,其可以很好地擴展到多個可用的 CPU 上:通過使用數百到數千個並行的工作器(worker),ES 可以在 10 分鐘內解決 3D 人形行走的問題,而且在一小時的訓練之後可以在大多數 Atari 遊戲上實現很有競爭力的結果。此外,我們還突出強調了作為一種黑箱優化技術的 ES 的幾個優勢:動作頻率和延遲的獎勵對其不會產生影響、能包容非常長的時間、不需要時間貼現(temporal discounting)或價值函數近似(value function approximation)。

相關焦點

  • 如何評價達爾文的進化論
    在達爾文之前,人們普遍相信創世說描繪的世界:上帝有目的地設計和創造的世界,有序、完善、永恆不變的世界。而達爾文為大家描繪了另一種景象的世界:沒有造物主,沒有預先的目的和設計,變化無窮的、充滿競爭的、不斷產生和消亡的、有過去的漫長和曲折的演變歷史、有不能預測未來的世界。
  • 達爾文和他的進化論
    恩格斯在總結十九世紀自然科學方面的成就時,指出有三大發現,即能量守恆和轉換定律、細胞學說、進化論。進化論就是由英國傑出的生物學家達爾文創立的。查理。羅伯特。這次航行,開闊了達爾文的眼界,啟發了他對自然奧秘的探索和研究;所得到的大量實際資料,為達爾文的科學研究奠定了堅實的基礎。有一個問題老是在達爾文的腦海中紫繞:自然界的奇花異樹,萬類昆蟲,千種動物,不同的人種,到底是怎樣產生的?怎樣演變的?彼此之間又有什麼聯繫?尊重實踐和科學的達爾文經過激烈的思想鬥爭,決定向上帝創造萬物的宗教迷信挑戰,以進化論來闡明物種起源。
  • 達爾文的「進化論」如何導向叢林法則?
    對任何一位受過基礎教育的讀者而言,達爾文的進化論絕非陌生的概念。「物競天擇、適者生存」,這八個字更可謂婦孺皆知。按理說,進化論屬於十九世紀偉大的科學發現,關乎人類起源問題。可在彼得·沃森看來,由此衍生的達爾文主義卻改變了現代人的思維模式,影響到了整個二十世紀的歷史進程。
  • 達爾文進化論漏洞百出?
    其實在「生物進化論」被提出之前的還有著一個生物「用進廢退」的理論,這個觀點最早是由法國生物學家拉馬克提出,其大意是說生物在新環境的影響下,生活的習性改變、為了適應環境生物的某些經常使用的器官發達增大,不經常使用的器官逐漸退化,並認為適應是生物進化的主要過程。
  • 進化論150年那些與達爾文 無關的「進化」(組圖)
    反思進化論在中國的種種,一直以來多的是稱讚其鼓勵變革的思想解放作用,然而對於其在社會思潮方面的負面影響卻甚少有人提及。  在今天一些學者看來,進化論當時在中國的有效傳播代表著一種中國古老的歷史循環論讓位於進步史觀,它當時更多地預示著一個新的軸心時代的到來。然而,面對當下,我們又該如何反思進化論呢?
  • 谷歌AutoML新進展,進化算法加持,僅用數學運算自動找出ML算法
    但自 20 世紀 90 年代後這類研究逐漸冷門,直到現在才重新得到重視。2018 年 3 月,谷歌大腦團隊即進行相關研究,使用進化的 AutoML 來發現神經網絡架構。如今,谷歌將這項研究進一步擴展,證明從零開始進化 ML 算法是有可能的。相關研究被 ICML 2020 接收,這項研究出自谷歌大腦團隊 Quoc V. Le 等學者之手。
  • 人類的演變:達爾文的進化論,人類如何進化?
    中國古代也有女蝸氏摶土造人的故事,大意是說女蝸神因缺少同伴而感到寂寞,一於是用黃土捏成和自己形象相似的小女孩,吹了一口氣,小孩活了,女蝸又使男人和女人結成婚姻,從此繁衍了人類。研究原始社會史,沒有文字可憑,主要依賴古生物學、古地質學、人類學、考古學的研究成果,但從古代的一些神話和傳說中,也可能追溯出原始社會的某些情景。
  • 生物的進化,繼達爾文以後的進化研究
    達爾文之後, 幾乎所有高水平的生物學家均承認進化是事實, 並且認可自然選擇是引起進化性變化的必要理論。但是, 追溯到18世紀或更早期, 獲得性遺傳則被認為是引起進化性變化的另一個可能性。獲得性遺傳曾被達爾文認為是進化中的一個極重要的輔助性因素。達爾文還指出, 獲得性遺傳是一個可以反證的假說。
  • 達爾文進化論過時了,看看「快感爆炸」進化論吧
    人類是如何進化的?甚至可以進一步提出「生物是如何進化的?」這個問題達爾文已經用進化論做出了解釋,那就是「適者生存,優勝劣汰,自然選擇」。一些專家學者對這一理論提出了質疑。今天我也來挑戰一下達爾文進化論,談談我對人類和生物進化的理解。
  • 為什麼主流科學家很少使用達爾文進化論,這說明了什麼
    一提到進化論,很多人會想到達爾文,因為是達爾文提出的進化論,其實在達爾文之前,進化論的思想已經有人提出了。不過今天咱們還是從頭開始了解一下進化論到底是什麼。現在我們知道,拉馬克的進化論存在著非常大的爭議,但拉馬克否認了神創論和物種不變論,為現代進化論提供了基礎。後來,當時被稱為博物學家的達爾文,由於隨船五年的經歷,積累了足夠多的生物物種素材,他發現許多生物有著相同的身體結構,和曾經滅絕的物種也有部分相似,因此他認為生物是連貫的,是一點點演化成今天這個樣子的。
  • 從達爾文到進化論
    說起恐龍讓我想到的是達爾文的生物進化論,從進化論的起源、發展、衍生,直到今天我們都無法確定,究竟是何時開始有的人類、何時有的生物。人類的起源到底是該相信進化論還是神創論呢?科學家與哲學家的PK一直持續至今,最後……誰將取得勝利呢?
  • 達爾文創立了自然選擇生物進化論,改變了我們對人類位置的看法
    「活力論」雖然承認生物種可以轉變,但把進化原因歸於非物質的內在力量,認為是生物的「內部的力量」即活力驅動著生物的進化,使之越來越複雜完善。但活力論缺乏實際的證據,是一種唯心的臆測。最有名的活力論者就是法國生物學家拉馬克。19世紀後期出現的終極目的論或直生論,認為生物進化有一個既定的路線和方向而不論外界環境如何變化。
  • 達爾文進化論是不是被推翻了
    達爾文進化論原文是什麼呢?準確的說,達爾文進化論是一個一直在發展的科學理論,從達爾文、華萊士、赫胥黎、胡克等,經歷了無數動物學、植物學、細胞學、遺傳生物學等研究,一步步不斷發展的學科。進化論是尋找生命演化規律的科學理論,所以其一直也在變化,一直在更新。可是達爾文的進化論卻一直被異化,尤其是社會達爾文主義。
  • 改變世界的思想——達爾文和他的進化論
    所有這些促使他通過自然選擇來發展他的進化論,但他花了數年時間研究和撰寫各種其他科學論文,尤其是關於小獵犬收集的。他的工作幫助他完善了他的理論,因為他越來越相信它的科學價值。達爾文是一個非常謹慎的人,他害怕被嘲笑和拒絕,這導致他把他的想法隱藏起來,因為他想收集儘可能多的證據,並儘可能完善它們。
  • 達爾文進化論找到新證據 加拉帕戈斯群島山雀仍在進化中
    美國科學家經過長期對加拉帕戈斯群島鳥類的研究證實,激發達爾文產生進化論思想的鳥類仍在進化中。這一研究成果也為達爾文的進化論提供了新的證據。14日出版的《科學》雜誌公布了這個研究成果。  由美國普林斯頓大學生物學家彼得·格蘭特領導的科研小組經過長期對加拉帕戈斯群島達芙尼島的中喙地雀和大型地雀進行研究後發現,地雀的進化仍在繼續。
  • 達爾文進化論再次得到證實!新發現與達爾文140年前理論不謀而合
    然而,由於進化論中存在多處假設存疑,且許多理論是「開天闢地」的,直至140年後的今日也依舊有許多人排斥進化論的真實性,其中最重要的觀點便是「猴子是人類的祖先」……近日,劍橋大學聖約翰學院人類學專業的Laura van Holstein發表了一項研究,證實了達爾文《物種起源》第3章中的假設,即哺乳動物亞種在物種進化過程中發揮的作用尤為重要。
  • 從酵母細胞入手,耶魯一項最新研究或向達爾文進化論發起挑戰
    ,不經常使用就會逐漸退化,同時生物對於環境的適應也會被遺傳。在過去的二十年中,研究人員也展現了物種和單個細胞的生物學特性都可以被環境塑造,即使沒有基因突變也可以遺傳,這一結果與達爾文理論的經典解釋之一相矛盾。但是,究竟這些表觀遺傳特性或非遺傳特性如何被傳遞下去,一直沒有清晰的解答。
  • 100多年過去了,為何達爾文的進化論仍是假說?
    世間萬物,包括人類在內,都是如何出現的呢?如果這個問題放在古代,人們會覺得是「神」創造了一切,東方的「女媧造人」、西方的「亞當和夏娃」,都大同小異的表示人類的出現,和「神」的創造有關,但是,事實上真的這樣嗎?
  • 漫談進化論——達爾文與華萊士的故事
    生物學巨匠達爾文說起達爾文大家應該十分熟悉,他是英國博物學家、進化論的奠基者,發表了震驚世界的《物種起源》。他曾經乘坐貝格爾號艦作了歷時5年的環球航行,對動植物和地質結構等進行了大量的觀察和採集。華萊士在馬來群島進行了六、七十次考察,行程約1.4萬英裡,收集了12.5萬個鳥類、甲蟲以及其它動物標本,包括5千多個新物種。其中最著名的是以他名字命名的「華萊士金色鳥翼蝴蝶」。他還最先提出區分亞洲和澳洲動物的分界線,這條線被稱為「華萊士線」。「進化論」撞車多年的考察讓進化論的種子在華萊士心中不斷生長。1856年,他在《博物學記錄》發表論文,初步表達了自己進化論的觀點。
  • 突破達爾文進化論解釋困境
    進化論的前提預設有待實證檢驗達爾文在《物種起源》一書中系統闡述進化論思想,其核心是「自然選擇原理」:一切物種都有過度繁殖的傾向,它們繁殖的後代保持著一部分親代特徵,同時又發生一些改變;而生存空間和資源卻是有限的,所以一切物種必須「為生存而鬥爭」。