李開復AI五講|深度學習是什麼:一張瘋狂調節閥門的水管網

2021-01-17 澎湃新聞
編者按:從驚呼「人工智慧來了」到察覺「人工智慧無處不在」,人類社會才走過寥寥數年。在提出建設國家人工智慧高地的上海,許多率先試水的應用在各行各業寫下了「AI+」的故事。此時此刻,我們更加要冷靜地思考自身與人工智慧的關係。我們真的知道什麼是人工智慧嗎?我們真的準備好與人工智慧共同發展了嗎?我們該如何規劃人工智慧時代的未來生活?

本月底,2019世界人工智慧大會將在黃浦江畔揭開序幕。澎湃新聞特邀李開復、王詠剛將著作《人工智慧》精編為系列短文,試析與AI相關的若干關鍵問題。

第三撥人工智慧熱潮源於深度學習的復興。那麼,到底什麼是深度學習?為什麼深度學習能讓計算機一下子變得聰明起來?

從根本上來說,深度學習和所有機器學習方法一樣,是一種用數學模型對真實世界中的特定問題進行建模,以解決該領域內相似問題的過程。

好了,好了,我知道一提「數學」二字,讀者就會跑掉一大半,更別說讓非理工科專業的人摸不著頭腦的「建模」一詞了。有沒有可能用非理工科專業也聽得懂的術語,解釋一下如今在人工智慧領域如日中天的深度學習算法呢?

首先,深度學習是一種機器學習。既然名為「學習」,那自然與我們人類的學習過程有某種程度的相似。

比如,很多小朋友都用識字卡片來認字,其實,要教計算機認字,差不多也是同樣的道理。計算機也要先把每一個字的源反覆看很多很多遍,然後,在計算機的大腦(處理器加上存儲器)裡,總結出一個規律來,以後計算機再看到類似的圖案,只要符含之前總結的規律,計算機就能知道這圖案到底是什麼字。

用專業的術語來說,計算機用來學習的、反覆看的圖片叫「訓練數據集」;「訓練數據集」中,一類數據區別於另一類數據的不同方面的置性或特質,叫作「特徵」;計算機在「大腦」中總結規律的過程,叫「建模」;計算機在「大腦」中總結出的規律,就是我們常說的「模型」;而計算機通過反覆看圖,總結出規律,然後學會認字的過程,就叫「機器學習」。

到底計算機是怎麼學習的?計算機總結出的規律又是什麼樣的呢?這取決於我們使用什麼樣的機器學習算法。

家長和老師們可能都有這樣的經驗:先教小朋友分辨「一」「二」「三」時,我們會告訴小朋友說,一筆寫成的字是「一」,兩筆寫成的字是「二」,三筆寫成的字是「三」。這個規律好記又好用。

但是,開始學新字時,這個規律就未必奏效了。比如,「口」也是三筆,可它卻不是「三」。我們通常會告訴小朋友,圍成個方框兒的是「口」,排成橫排的是「三」。這規律又豐富了一層,但仍然禁不住識字數量的增長。很快,小朋友就發現,「田」也是個方框兒,可它不是「口」。我們這時會告訴小朋友,方框裡有個「十」的是「田」。再往後,我們多半就要告訴小朋友,「田」上面出頭是「由」,下面出頭是「甲」,上下都出頭是「申」。

有一種名叫決策樹的機器學習方法,就和上面根據特徵規律來識字的過程非常相似。當計算機只需要認識「一」「二」「三」這三個字時,計算機只要數一下要識別的漢字的筆畫數量,就可以分辨出來了。當我們為待識別漢字集(訓練數據集)增加「口」和「田」時,計算機之前的判定方法失敗,就必須引入其他判定條件。由此一步步推進,計算機就能認識越來越多的字。

當然,這種基於決策樹的學習方法太簡單了,很難擴展,也很難適應現實世界的不同情況。於是,科學家和工程師們斷續發明出了許許多多不同的機器學習方法。

例如,我們可以把漢字「由」「甲」「申」的特徵,包括有沒有出頭、筆畫間的位置關係等,映射到某個特定空間裡的一個點。也就是說,訓練數據集中,這三個字的大量不同寫法,在計算機看來就變成了空間中的一大堆點。只要我們對每個字的特徵提取得足夠好,空間中的一大堆點就會大致分布在三個不同的範圍裡。

這時,讓計算機觀察這些點的規律,看能不能用一種簡明的分割方法(比如在空間中畫直線),把空間分割成幾個相互獨立的區域,儘量使得訓練數據集中每個字對應的點都位於同一個區域內。如果這種分割是可行的,就說明計算機「學「到了這些字在空間中的分布規律,為這些字建立了模型。

接下來,看見一個新的漢字圖像時,計算機就簡單把圖像換算成空間裡的一個點,然後判斷這個點落在了哪個字的區域裡,這下,不就能知道這個圖像是什麼字了嗎?

很多人可能已經看出來了,使用畫直線的方法來分割一個平面空間,很難適應幾千個漢字以及總計至少數萬種不同的寫法。很多年裡,人們不斷改進機器學習方法。比如,用複雜的高階函數來畫出變化多端的曲線,以便將空間裡相互交錯的點分開來,或者,乾脆想辦法把二維空間變成三維間、四維空間基至幾百維、幾千維、幾萬維的高維空間。

那麼,如何大幅擴展計算機在描述世界規律時的基本手段呢?有沒有可能為計算機設計一種靈活度極高的表達方式,然後讓計算機在大規模的學習過程裡不斷嘗試和尋找,自己去總結規律,直到最終找到符合真實世界特徵的一種表示方法呢?

現在,我們終於要談到深度學習了!

從數學本質上說,深度學習與前面談到的傳統機器學習方法並沒有實質性差別,都是希望在高維空間中,根據對象特徵,將不同類別的對象區分開來。但深度學習的表達能力,與傳統機器學習相比,卻有著天壤之別。

假設深度學習要處理的數據是信息的「水流」,而處理數據的深度學習網絡是一個由管道和閥門組成的巨大的水管網絡。網絡的入口是若干管道開口,網絡的出口也是若干管道開口。這個水管網絡有許多層,每一層有許多個可以控制水流流向與流量的調節閥。根據不同任務的需要,水管網絡的層數、每層的調節閥數量可以有不同的變化組合。

水管網絡中,每一層的每個調節閥都通過水管與下一層的所有調節閥連接起來,組成一個從前到後,逐層完全連通的水流系統。

那麼,計算機該如何使用這個龐大的水管網絡,來學習識字呢?比如,當計算機看到一張寫有「田」字的圖片時,就簡單將組成這張圖片的所有數字(在計算機裡,圖片的每個顏色點都是用「0」和「1「組成的數字來表示的)全都變成信息的水流,從入口灌進水管網絡。

我們預先在水管網絡的每個出口都插一塊字牌,對應於每一個我們想讓計算機認識的漢字。這時,因為輸入的是「田」這個漢字,等水流流過整個水管網絡,計算機就會跑到管道出口位置去看一看,是不是標記有「田」字的管道出口流出來的水流最多。如果是這樣,就說明這個管道網絡符合要求。如果不是這樣,我們就給計算機下達命令:調節水管網絡裡的每一個流量調節閥,讓「田」字出口「流出」的數字水流最多。

這下,計算機可要忙一陣子了,要調節那麼多閥門呢!好在計算機計算速度快,暴力計算外加算法優化(其實,主要是精妙的數學方法了,不過我們這裡不講數學公式,大家只要想像計算機拼命計算的樣子就可以了),總是可以很快給出一個解決方案,調好所有閥門,讓出口處的流量符合要求。

下一步,學習「申」字時,我們就用類似的方法,把每一張寫有「申」字的圖片變成一大堆數字組成的水流,灌進水管網絡,看一看,是不是寫有「申」字的那個管道出口流出來的水最多,如果不是,我們還得再次調整所有的調節閥。這一次,要既保證剛才學過的「田「字不受影響,也要保證新的「申」字可以被正確處理。

如此反覆進行,直到所有漢字對應的水流都可以按照期望的方式流過整個水管網絡。這時,我們就說,這個水管網絡已經是一個訓練好的深度學習模型了。

當大量識字卡片被這個管道網絡處理,所有閥門都調節到位後,整套水管網絡就可以用來識別漢字了。這時,我們可以把調節好的所有閥門都「焊死」,靜候新的水流到來。

與訓練時做的事情類似,未知的圖片會被計算機轉變成數據的水流,灌入訓練好的水管網絡。這時,計算機只要觀察一下,哪個出口流出來的水流最多,這張圖片寫的就是哪個字。

簡單嗎?神奇嗎?難道深度學習竟然就是這樣的一個靠瘋狂調節閥門來「湊」出最佳模型的學習方法?整個水管網絡內部,每個閥門為什麼要如此調節,為什麼要調節到這種程度,難道完全由最終每個出口的水流量來決定?這裡面,真的沒有什麼深奧的道理可言?

深度學習大致就是這麼一個用人類的數學知識與計算機算法構建起整體架構,再結合儘可能多的訓練數據以及計算機的大規模運算能力去調節內部參數,儘可能逼近問題目標的半理論、半經驗的建模方式。

指導深度學習的基本是一種實用主義的思想。實用主義意味著不求甚解。這真是一件特別有意思的事。有史以來最有效的機器學習方法,在許多人看來,竟然是一個只可意會、不可言傳的「黑盒子」。

由此引發的一個哲學思辨是,如果人們只知道計算機學會了做什麼,卻說不清計算機在學習過程中掌握的是一種什麼樣的規律,那這種學習本身會不會失控?

比如,很多人由此擔心,按照這樣的路子發展下去,計算機會不會悄悄學到什麼我們不希望它學會的知識?

另外,從原理上說,如果無限增加深度學習模型的層數,那計算機的建模能力是不是就可以與真實世界的終極複雜度有一比呢?

還好,關於深度學習到底是否有能力表達宇宙級別的複雜知識,專家們尚未有一致看法。人類至少在可見的未來還是相對安全的。

(本文來自澎湃新聞,更多原創資訊請下載「澎湃新聞」APP)

相關焦點

  • 「十四五」語境下的百度AI:正在織一張落地的網
    透過李開復的比喻和王海峰的結論,或許可以總結出這樣一個規律:人工智慧規模化落地的前提,在於人工智慧技術向標準化、自動化和模塊化的通用性技術演進,也將是「十四五」階段的首要賽點。百度正在織落地的網百度曾經用搜尋引擎喚醒了中文網際網路,在人工智慧落地的窗口期,百度並沒有臨淵羨魚,而是在織一張落地的網。
  • 李開復:AI「愛」人,向死而生
    如果把《人工智慧》這本書是面向大眾的入門科普書,李開復的新書《AI·未來》則可能是面向行業人士的工具書。尤其對於趨勢的把控,這本書給了產業上下遊一個相對明晰的路線圖。一言以蔽之,《AI·未來》講的是AI如何重塑個人、商業與社會的未來圖譜。
  • 凝結水去高加聯成閥什麼作用?(高加三通學習)
    某電廠高壓加熱器專題介紹機組運行中高加解列分析直流爐高加解列對汽溫的影響分析學習關於高、低加投退及跳閘的學習總結高加解列對機組影響及處理,學習一下值得借鑑!!單臺高加汽側投退經驗反饋從結構上講就是進口閥和旁路閥位於個殼體,且公用一隻芯。而出口閥就是一個逆止閥,靠給水壓力將門芯頂開或壓下。液控四通閥,給水由側面進入,向下出口進高壓加熱器,閥上方個出ロ與旁通管路相連。
  • 李開復:AI時代,努力工作就能買車買房的日子沒了
    攝像頭捕捉的是沒有深度的信息,是給人看的信息。但是我們希望捕捉的是讓人工智慧跑得更好,這個是不是需要有不同的攝像頭來採集信息?是不是需要有深度的信息,是不是要不考慮人去觀看它,而考慮它怎麼在深度學習可以產生價值。另外我們還有各種不同的新的傳感器,包括了在汽車上的雷射雷達等等,而且很重要的是要把成本下降。
  • 撫河路下水管改造鑽孔外牆高空作業服務
    撫河路下水管改造鑽孔外牆高空作業服務把埠和「竹節」連接,要反覆轉動,直到牢固。同樣的方法去連接另一端。一切OK後在接縫處再塗適量的膠水,確保不滲漏。家裡的水管接頭漏水,除了換個新的外,還有什麼好辦法?
  • 水管響聲消除方法有哪些 水管響聲是怎麼回事
    很多朋友們在生活中,對水管的使用都是比較重視的,畢竟水管的使用是關係家人用水的關鍵因素,在生活中如果遇到水管響聲的情況,不少朋友們會感覺到比較難聽,會覺得心裡不舒服,對於這種情況要及時的想辦法來進行解決。那麼水管響聲消除方法有哪些?水管響聲是怎麼回事?來了解一下吧。
  • 付煤公司開展深度溝通懇談打開思想閥門 釋放磅礴力量
    我的煤炭網>新聞>礦企資訊>付煤公司開展深度溝通懇談打開思想閥門 釋放磅礴力量 付煤公司開展深度溝通懇談打開思想閥門 釋放磅礴力量   棗莊礦業集團 發布日期:2020-12-09 00:01:57
  • DeeCamp2020大師課落幕,李開復、張亞勤等12位大師都講了什麼?
    崔同學:開復老師憑藉多年的經驗給我們講述了AI創業的難點與發展勢頭,雖然只講了一節課,但是感覺對未來的規劃都有了一些改變。王同學:李開復老師對於AI的產業應用前景有著深入的研究,對於未來的工作和創業都有著很大的指導作用。肖同學:李開復老師對於科學家和企業家身份轉變的探討讓我有了更清晰的個人定位。
  • 標準衛生間水管布置要點、注意事項(圖文)
    、電路都沒有頭緒,於是就找裝修公司、找58同城安裝水管、找百度安裝水管、找人介紹...但是師傅找到了,價格可能出現前後不一致的情況,不過這點也屬正常,有的地方工作難度大,但是不合理的收費還是要儘量避免。
  • 家裝水管的常用配件有哪些?有什麼作用?都是如何使用的?
    可是對於水管以及配件其實是有很多的,所以需要對這些內容也算了解。家居雜壇以下面的問題為例來給大家解答家裝水管配件的問題。水管有什麼配件?關於水管有什麼配件,在這裡主要就是問的我們家裝水路改造過程中所使用的水管以及所需要的連接的配件。
  • 深度學習 Facebook AI 負責人:深度學習技術趨勢報告(150 PPT,附解說)
    有合作和溝通請加小編微信:(txttiao) 小編按: 通信頭條團隊決定開始每周末推出深度長文和深度學習的內容,以便親粉們在如今這個已經完全碎片化的今天,必須要深度學習點東西,加強深度思考,深度琢磨,深度決定高度。
  • 當心水管!當心水管!
    1、南面陽臺水管、水龍頭、洗衣機進水龍頭     一般大家比較注意北面廚房間、衛生間防風保暖,南面陽臺關窗防風、保暖意識較差2、太陽能3、高層建築敞開式走廊的沿牆水管4、表後室外裸露的水管、龍頭對確已冰凍的水龍頭、水管,宜先用熱毛巾包裹著水龍頭,然後澆溫水,使龍頭解凍,再擰開龍頭,用溫水沿著龍頭慢慢向管子澆灑,使水管解凍,或用電吹風烘吹解凍。切忌用火烘烤或用開水直接衝淋,以免造成管道破裂。
  • 沒有管鉗怎麼擰水管 管鉗怎麼用
    水管的安裝是非常重要的一個步驟,後期出現什麼問題的話,我們也要自己去修理水管,如果自己不會修的話,就要找專業的人員來修理了,那麼,自己修的時候一定要看一下沒有管鉗怎麼擰水管,必須要把水關檸開,這樣的話才能修理,同樣的,大家也要清楚管鉗怎麼用的正確方法。
  • 西安水管漏水檢測維修
    西安水管漏水檢測維修 ,專業水管漏水檢測維修一般是怎樣一個流程?您家裡還在為給樓下漏水找不到原因而困擾嗎?【水管漏水檢測維修範圍】:1、精準測漏:供水管網漏水檢測、管道查漏、管道檢漏、管道測漏、漏水檢測、水管漏水檢測、消防水管道漏水檢測、地下管道漏水探測、自來水漏水檢測、水管漏水檢測、地下水管漏水檢測、地下自來水漏水檢測、
  • 2019年度十大閥門執行器品牌關注盤點
    為表彰2019年做出成績的企業,儀表網以「推動儀表品牌推廣」為主張,基於網絡傳媒大數據以及用戶評價,盤點出2019年度十大網絡媒體與網民關注的閥門執行器品牌(排名不分先後)。
  • 李開復:人工智慧已從「AI+」邁向「+AI」
    以下為系列研究的開篇內容:眾所周知,中國在人工智慧(AI)領域的發展世界領先,尤其在產業應用方面,中國的各行各業都開始嘗試在產業鏈條的不同環節應用AI,以最大化生產與服務的效率。除卻政府及資本市場的支持、充分的市場競爭與數據供給、勞動力紅利逐漸消退等因素,我們發現,有另一大因素至關重要——在中國,人工智慧有著明確的落地應用場景,大量AI企業活躍於這些垂直場景中,充當產業中傳統企業應用AI的橋梁,我們稱之為「改造者」。「改造者」通過傳授其AI技術和垂直行業理解,極大地打破了傳統企業應用AI的瓶頸。
  • Xilinx、Spline.AI、AWS 推出 X 射線分型深度學習模型和參考設計
    開源的自適應深度學習模型,助力醫療設備製造商和醫療服務提供商快速開發經過訓練的模型,面向臨床和放射醫學應用 賽靈思公司宣布推出全功能醫療 X 射線分型深度學習模型和參考設計套件,這是賽靈思與 Spline.AI 及亞馬遜網絡服務(AWS)強強攜手共同取得的合作成果。
  • 方李大戰升級:李開復被疑非歐巴馬同學
    約定三戰兩勝,但他大敗一局之後棄權,這與 1980 Moor與Inoue弈一勝五負完全不同。」回應與歐巴馬同學一事:「方先生也在美國留過學,也應該很了解:美國大學的專業不像中國大學那麼死板,無論專業是什麼,大家經常會選修和旁聽有興趣的課。所以我們在一個課堂上課沒什麼意外吧?
  • 家用暖氣閥門怎麼選?球閥和閘閥,選哪種?依據是什麼?
    我們家庭中的暖氣需要安裝很多的閥門。閥門的作用可以起到調節供回水的流量,還可以起到檢修時關閉水源的作用。所以暖氣系統中的閥門一定要選到合適的。那麼對於暖氣中的閥門,我們選擇哪種呢?家居雜壇就以下面的問題為例來給大家分析暖氣中閥門的選擇。家用暖氣是球閥好還是閘閥好?