尋找生命的基礎算法

2020-12-17 網易手機

(原標題:尋找生命的基礎算法)

編者註:為什麼說 「機器學習」 這個概念裡面 「機器」 是多餘的?有沒有主宰一切的主算法?圖靈獎獲得者 Leslie Valiant 在接受QUANTA 雜誌採訪時回答了上述問題

對於計算機科學家 Leslie Valiant 來說,「機器學習」 這個詞是累贅的。在他看來,姍姍學步的小孩笨手笨腳地玩橡皮球是學習,深度學習網絡對貓的圖片分類也是學習,把後面的系統叫做 「機器」 只是人為製造出來的區別。

哈佛大學的計算機科學家 Valiant 很難算是唯一一位認為人腦和計算機的能力基本相同的科學家。但他是最早正式提出這兩者可能關係的人之一:1984年,他的 「大概近似正確(Probably Approximately Correct,PAC)」 模型在數學上定義了可被稱為能 「學習」 信息的機械式組織的條件。因為這個模型促進了計算學習理論的發展,Valiant 獲得了計算機界的諾貝爾獎—圖靈獎。

Valiant 的概念突破並沒有止步於此。在他 2013年 出版的新書《Probably Approximately Correct》中,Valiant 把生物進化也納入到他的 PAC 學習框架裡面。

他把某個算法概念拓展成了 「ecorithm(生態法則)」,這是一種學習算法,其特別之處在於它可以 「運行」 在任何能與物理環境進行交互的系統上。按說算法應該是運用到計算機上的,但 ecorithm 卻可以應用到生物組織或者整個物種上。這一概念給個體學習方法與整個生態體系的進化在計算上劃上了等號。無論是哪一種情況,ecorithm 都用機械論的方法描述了適應性的行為。

Valiant 自己的目標是尋找 「學習與進化的數學定義,這種定義應該能夠涉及信息進入系統的所有方法。」 如果成功,Valiant 半帶玩笑的口吻說,那它就是 「萬有理論(theory of everything)」 了。但他的研究意義顯然非常重大—這相當於把生命科學與計算機科學的界限給模糊了。此外,我們對 「學習」 和 「智能」 的直觀定義也將擴展到非生物體和非個體上。「群體智慧」 將不再只是修辭手法而已。

針對 Valiant 化解生物學與計算之別以及進化與學習之別的努力,Quanta 雜誌對這位計算大師進行了採訪。下面是採訪摘錄的編譯。

你是如何想出 「大概近似正確」 學習這個主意的?

LESLIE VALIANT:我屬於理論計算機科學派,尤其是計算複雜性理論,不過我對人工智慧也挺感興趣。我的第一個問題是:人工智慧的哪個方面能夠變成定量理論?很快我就確定這一定是學習。

我當時開始做的時候(1980年 代),大家已經開始研究機器學習了,但大家對 「學習」 是個什麼東西還沒有達成一致。實際上,理論計算機科學界對學習這個東西完全是質疑的,認為它永遠都沒有機會被當作科學看待。

但另一方面,學習是一種可充分複製的現象—就像蘋果總會掉到地上一樣。每一天,全世界的兒童都會學習成千上萬個新詞。這是一種大規模的現象,必須有量化的解釋。

所以我認為學習應該要有某種形式的理論支撐。既然統計推斷已經存在了,我的下一個問題是:為什麼統計不足以解釋人工智慧?所以我的研究起點是:學習必須是某種可統計的東西,但同時還應該是可計算的。我需要某種理論能把計算和統計結合起來,對這一現象做出解釋。

那麼學習是什麼?它跟計算(computing 或 calculating)有何不同?

學習是計算(calculating)的一類,但它的目標是在一個沒有提前精確建模好的世界裡表現良好。學習算法會對世界進行觀察,然後利用該信息來確定做什麼並對自己的決定進行評估。我在書中提到的一個觀點是,個體所掌握的所有知識要麼是通過學習獲得的,要麼是通過進化過程獲得的,只能有這兩種可能。如果是這樣的話,那麼個體學習和進化過程應該有一套統一的理論來解釋它們。

因此你最終得出了 「ecorithm(生態算法)」 的概念。Ecorithm 是什麼?它跟算法(algorithm)又有什麼不同?

Ecorithm 也是算法,但它的執行要利用輸入來進行評估,而這種輸入是在一個相當不受控和不可預測的世界裡獲得的。而且它的目標是在同樣複雜的世界裡執行得好。你可以把算法看作是在計算機裡面運行的某個東西,但它在生物有機體身上也很容易執行。不過無論是哪一種情況,ecorithm 都是存活於外部世界裡,並且要跟那個世界發生交互的。

這麼說 ecorithm 是要消除我們過去對 「機器學習」 的那種錯誤直覺囉?那種認同 「機器學習」 與 「非機器學習」 有著根本不同的觀點是錯誤的?

是的,當然。從科學上來說,如果我們的大腦進行計算,然後如果我們能夠識別出產生那些計算的算法的話,我們就能在機器上面模仿它們,而 「人工智慧」 和 「智能」 就變成一樣了。這個觀點早在半個世紀以前就提出來了。但是實踐的難度在於確定人類大腦運轉的這些計算究竟是什麼。機器學習證明是繞開這種困難的有效方式。

對於機器來說,那些我們在進化過程或者從小趴在地上接觸和感受環境時掌握的行為所涉及的算法,是其中最大的挑戰之一。我們用這些方法所所得的知識是沒辦法書寫出來的。比方說,如果我把一個裝滿熱咖啡的紙杯給擠扁了,我們都知道會發生什麼,但是這種信息在網際網路上很難找到。但如果網際網路上有這種信息的話,那讓機器學習這一信息就容易多了。

對那些行為我們早已熟知的系統(比如太陽能系統或者晶體)的算法仿真是不是也可以稱為 「學習」?

我不會把那些系統看作是學習。我認為學習者需要有某種最低限度的計算性活動才行,如果發生了任何學習行為,這種行為必須能夠使得該系統更有效才行。直到 10、20年 前,機器學習才開始成為某種計算機可以執行的給人留下深刻印象的東西。除了生物系統以外,在這個宇宙中目前尚未有跡象表明其他東西具備學習能力。

學習理論如何能夠應用到生物進化這樣的現象上?

生物學是以蛋白質表達網絡為基礎的,隨著進化的進行,這些網絡也得到了改良。PAC 學習模型給那些網絡施加了一些邏輯限制,限制了這些網絡在經歷達爾文進化時會發生什麼事情,從而導致那些改良的產生。如果我們從生物身上收集更多的觀察,然後在這個 PAC 式的學習框架裡面進行分析的話,我們就應該能夠找出生物進化成功的方式和原因,而這可以讓我們對進化的理解更加具體並且更具預測性。

我們的進展如何?

在生物行為方面我們還沒有解決所面臨的每一個問題,因為我們還沒有找到那些特別的、生物用來產生這些現象的 ecorithm(生態算法)。所以我認為目前這一框架設定的問題是合適的,只是我們還不知道答案。我認為通過生物學家和計算機科學家之間的通力合作,這些答案是可以獲得的。我們已經知道要找什麼了。我們要找的是遵循生物學能夠且的確支持的達爾文約束的學習算法。這種算法將可以解釋迄今為止這個星球上所發生的導致進化發生的所有事情。

假設明天我們就發現了那個特別的支撐生物進化和學習的生態算法(ecorithm)。如果我們掌握了這種精確的知識後,我們能夠理解哪些過去無法理解的事情呢?我們有能夠做哪些過去無法做的事情呢?

嗯,首先我們能夠理解我們是從哪兒來的。但另一種外推會把更多的心理學內容帶進計算可理解的領域。所以對人性具備更多的理解會是另一個成果,如果這一程序能夠成果執行下去的話。

你的意思是說計算機可以可靠地預測人會做什麼事情?

這屬於非常極端的場景。預測你下一個小時究竟要做什麼我需要哪些數據呢?根據物理科學我們知道人是由原子構成的,我們也了解了大量的原子屬性,從某種理論意義上來說,我們能夠預測一組原子能夠做什麼。但這種觀點在解釋人類行為方面走不了多遠,因為人類行為是太多原子極端複雜的一種表現。我是說,如果有人能夠對大腦的運行機製做出高級的計算解釋,那麼我們離對人類行為做出解釋(這種解釋應該能夠與我們對其他物理系統的機械化理解相匹敵)這一目標就會更近一點了。原子的行為與人類的行為相去甚遠,但如果我們能夠理解大腦使用的學習算法,那麼這種算法就能提供與人類行為相近得多的機械論概念。而它們給出的你要做什麼、為什麼要做的解釋就能變得更加可信和可預測。

如果支配著進化和學習的生態算法是不可學習的怎麼辦?

這個問題的邏輯可能性是存在的,但我並不認為這種情況會出現。相反,我覺得這種算法應該是相當具體的,並且理解起來也應該相當容易。對於數學上的不解之謎我們一樣可以提出同樣的問題。你相信這些問題有解嗎?這些解是大家可以理解的嗎?還是說會超出人類的理解範疇?對這個領域我非常有信心—否則我就不會去追尋答案了。我認為自然使用的算法是有形的、可理解的,是不需要我們不具備的直覺才能理解的。

許多傑出的科學家對有可能出現我們不能控制的人工 「超智」 表達了自己的擔憂。如果你的生態算法理論是正確的,並且智能的確通過學習算法與環境的交互而出現的話,這是否意味著我們應該像對 AI 系統本身的編程一樣對部署 AI 的環境保持警惕?

如果你設計的智能系統是從環境學習的話,那就不知道了—在一些環境下系統表現出的行為可能是你根本就無法預見的,而這種行為可能是有害的。所以就這一點來說你是對的。但一般而言我對超智可能會導致人類歷史滅絕的說法不是太擔心。我認為智能是由具體的、機械化的、並且最終是可理解的進程構成的。我們會理解我們放進機器中的智能,就像我們對爆炸物的物理機制的理解一樣—也就是說,理解到足以讓它們的行為可預測,通常不會導致非故意破壞的產生。所以我不是很擔心,我覺得人工智慧跟其他現有的強大技術沒什麼兩樣。它跟其他技術一樣也是有科學依據的。

本文編譯自:quantamagazine.org,如若轉載,請註明出處:http://36kr.com/p/5043199.html

「看完這篇還不夠?如果你也在創業,並且希望自己的項目被報導,請戳這裡告訴我們!」

本文來源:36氪 責任編輯:王曉易_NE0011

相關焦點

  • 教你從生命靈數算法尋找命中宿敵
    生命靈數算法 將農曆出生年月日數值相加至個位。
  • 數據結構與算法:聊一聊在面試中被常問的那幾個基礎算法的理解
    前面我也說到:數據結構和算法是一對"相愛相殺的"組合,所以接下來要分享下我個人對於一些算法的理解和實現。本文將主要分享基礎的查找和排序(代碼基於python)既然要開始分享算法,那必然要先介紹下算法相關的一些基本術語,如下。
  • 算法基礎知識 目錄
    主要包含以下內容:1,實現基本數據結構(面試常考,而做題沒有)2,Java 源碼分析,Java 基礎補充(面試常考,而做題沒有)3,在做題中的應用(Leetcode 題目)4,Java 基礎(零基礎起步,一天搞定)5,做題技巧,做題模版雖說是「基礎知識」,但講的內容都是面試曾經考過的內容。
  • 關於圖算法 & 圖分析的基礎知識概覽
    圖搜索算法包括廣度優先搜索和深度優先搜索,它們是遍歷圖的基礎,並且通常是許多其他類型分析的第一步。路徑搜索(Pathfinding)算法建立在圖搜索算法的基礎上,並探索節點之間的路徑。這些路徑從一個節點開始,遍歷關係,直到到達目的地。路徑搜索算法識別最優路徑,用於物流規劃,最低成本呼叫或者叫IP路由問題,以及遊戲模擬等。
  • 算法基礎:五大排序算法Python實戰教程
    菠蘿妹原文連結:https://medium.com/@george.seif94/a-tour-of-the-top-5-sorting-algorithms-with-python-code-43ea9aa02889算法基礎
  • 生命曲線的一種算法
    當我們把生命的狀態作為一個參照系,生命內在狀態事實上就是能量狀態,參考情緒能量學,作為一個縱向的參照系,將時間,作為一個橫向的參照系。那麼一個人的人生的時間,就是在不同的生命狀態下高高低低的一個過程。那麼,我們可以構建神經網絡算法,把刺激和反饋進行模型化,當足夠多的刺激和反饋進行機器學習之後,我們相當於構建了一個人性格的行為反射體系。
  • 等你在2118:探索機器學習算法生命周期
    具體分析了「回歸」算法和「神經網絡」兩種算法未來的走勢。作者引經據典,主要藉助林迪效應(Lindy effect)分析算法的生命周期。本文的有趣之處不在於它給出我們一個確切的結論,而是作者能為自己的分析提供佐證。
  • 成像算法基礎課程淘寶已經上線
    spm=a230r.1.14.16.61ef4a450hCTST&id=614092513589&ns=1&abbucket=11#detail相機的發展速度越來越快,應用領域從手機拍照到車載,監控,機器學習領域越來越多.成像系統中算法是很重要的一環.成像算法不僅決定了成像的圖像質量,也是功能實現的基礎.很多工作如圖像質量調試,算法開發,軟體開發比以前更多的依賴於對於算法的理解
  • 用算法尋找腫瘤的分子弱點,代碼真的能治癒癌症?
    407 個轉錄因子可能在癌症中起到關鍵作用如今,他算法的基礎數據來自一種稱為RNA測序(RNA-seq)的方法。該方法通過對RNA分子進行測序來衡量細胞內的基因活性,因為RNA分子會在基因激活或抑制後產生。
  • 程式設計師算法基礎——貪心算法
    前言貪心是人類自帶的能力,貪心算法是在貪心決策上進行統籌規劃的統稱。
  • AI開放平臺推出零基礎算法開發的意義
    而現在通過AI開放平臺,可以利用各種自動化的工具,使得AI算法的開發過程,變得非常簡易。一個零算法基礎的用戶,可以在一個小時之內完成整個算法的訓練及部署。舉一個例子,比如一家連鎖商店的老闆需要通過AI技術檢測商鋪門口是否堆有垃圾,但商戶本身沒有任何技術能力。
  • 當人文主義遇到算法
    對於人類的制度建構而言,自由、人權等概念的發明,並不是基於人的生物基礎或生理機制,而是出於一種道德的和社會的理想。這些概念不必在生物學上去尋找基礎。如果按照這一方式思考,美、善等一系列觀念都是虛假的、無用的,那將走向徹底的歷史虛無主義,把人類文明引向深淵。「算法」橫行《未來簡史》將「算法」作為當代科學技術活動所共有的一種思維方式,並上升到一種具有哲學普遍性的思維方式。
  • Python 算法基礎班 | 從零開始學Python!
    :使用 Python學習常見的算法和數據結構,並且解決常見的 Python 算法面試問題。從零學習Python,算法和數據結構轉專業找CS工作的小夥伴有一些編程基礎,但算法基礎薄弱的同學想要從事人工智慧的同學國內TOP1名校畢業,資深Java工程師,5年Java與Android開發經驗,現在從事人工智慧,有豐富深度學習項目開發經驗。如何從零基礎開始在最短的時間內拿到offer?
  • AI人工智慧的幾種常用算法概念
    PSO 算法屬於進化算法的一種,和遺傳算法相似,它也是從隨機解出發,通過迭代尋找最優解,它也是通過適應度來評價解的品質,但它比遺傳算法規則更為簡單,它沒有遺傳算法的交叉(Crossover) 和變異(Mutation) 操作,它通過追隨當前搜索到的最優值來尋找全局最優。這種算法以其實現容易、精度高、收斂快等優點引起了學術界的重視,並且在解決實際問題中展示了其優越性。
  • 什麼是算法? - 《我的第一本算法書》
    ▌算法與程序的區別算法就是計算或者解決問題的步驟。我們可以把它想像成食譜。要想做出特定的料理,就要遵循食譜上的步驟;同理,要想用計算機解決特定的問題,就要遵循算法。這裡所說的特定問題多種多樣,比如「將隨意排列的數字按從小到大的順序重新排列」「尋找出發點到目的地的最短路徑」,等等。食譜和算法之間最大的區別就在於算法是嚴密的。
  • 算法基礎入門概述
    精確而言,算法是一個表示為有限長列表的有效方法。算法應包含清晰定義的指令用於計算函數。算法中的指令描述的是一個計算,當其運行時能從一個初始狀態和初始輸入(可能為空)開始,經過一系列有限而清晰定義的狀態最終產生輸出並停止於一個終態。一個狀態到另一個狀態的轉移不一定是確定的。隨機化算法在內的一些算法,包含了一些隨機輸入。
  • 通俗易懂講解SVM算法| 算法基礎(15)
    今天,你算法了沒關注:九三智能控,每天學點AI算法作者:劍曇說編譯&出處:CSDN支持向量機(SVM)算法通俗的理解在二維上,就是找一分割線把兩類分開,問題是如下圖三條顏色都可以把點和星劃開,但哪條線是最優的呢,這就是我們要考慮的問題
  • 機器學習基礎圖表:概念、原理、歷史、趨勢和算法
    四大會計師事務所之一的普華永道(PwC)發布了多份解讀機器學習基礎的圖表,其中介紹了機器學習的基本概念、原理、歷史、未來趨勢和一些常見的算法。為便於讀者閱讀,機器之心對這些圖表進行了編譯和拆分,分三大部分對這些內容進行了呈現,希望能幫助你進一步擴展閱讀。
  • 數據挖掘算法:常用分類算法總結
    分類算法NBC算法LR算法SVM算法ID3算法C4.5 算法C5.0算法KNN 算法ANN 算法分類算法分類是在一群已經知道類別標號的樣本中,訓練一種分類器,讓其能夠對某種未知的樣本進行分類。NBC算法NBC 模型發源於古典數學理論,有著堅實的數學基礎。該算法是基於條件獨立性假設的一種算法,當條件獨立性假設成立時,利用貝葉斯公式計算出其後驗概率,即該對象屬於某一類的概率,選擇具有最大後驗概率的類作為該對象所屬的類。
  • 尋找生命的火種
    消息傳回千裡之外的寧鄉沙田蘭馥衝,這處僻靜的山村裡瀰漫起沉重的氣息——尋找生命的火種王定國(資料圖片)1960年,謝覺哉(前排左二)與夫人王定國(後排左三)在湖南寧鄉考察時,與寧鄉縣委的同志合影。百歲不輟,難斷火種「我清楚地記得在漆黑的夜晚,在蜿蜒曲折的路上,我們點燃了火把,長長的隊伍像火龍一樣,把天地照得通紅……我一直在尋找這生命的火種。」1935年,22歲的王定國隨紅四方面軍參加長徵。火光沖天的那一晚,令她終生難忘。