編者按:本文來自微信公眾號"筆記俠「(ID:Notesman),作者:吳恩達,責編:戈多
內容來源:2017年9月11日,斯坦福,吳恩達為GASA大學作主題為「探索人工智慧」的分享。筆記俠作為獨家課程筆記合作夥伴,經主辦方審閱授權發布。
筆記君邀您,先思考:
1. 為什麼AI會突然在這幾年進步這麼快?
2. 人工智慧的戰略邏輯是什麼?
3. 企業如何面對AI的挑戰?
我在百度就在講這句話:「人工智慧是新電能」。100年前,電能給每個企業帶來新的改變。
當人工智慧技術足夠成熟之後,會給很多企業帶來非常大的改變。今天我主要講人工智慧的趨勢以及對大家會有什麼影響。
一、supervised learning(監督學習)
AI,這個詞對大多數人來說有一種魔術的感覺,但是它具體能做什麼?
它的技術非常複雜,有很多部分,這兩三年進步最快的一部分是 supervised learning(監督學習),也就是從a的input(輸入)到b的output(輸出),什麼意思呢?用具體案例來說明下。
比如,你輸入足夠多的電影影評,然後可以大概知道一個電影是好是壞;
輸入一種圖片,然後可以知道圖片的內容(圖片識別);
輸入一段語音,會輸出一個文本(語音識別);
輸入一段英文,會輸出一段中文(自動翻譯);
輸入一段文本,會輸出一段音頻(語音輸出);
輸入一筆費用,會輸出很好的回報(消費金融);
輸入一段傳感器信息,會輸出一個汽車的位置(自動駕駛)。
AI技術有很多不同的部分,進步最快的就是這個部分,今天有很多空間使用新技術,給企業帶來價值,比如語音識別對百度就非常有價值。
很多要做人工智慧工作的企業需要理解你自己的生意,才能決定如何放入人工智慧來創造價值。
不過這種技術有一個缺點,需要大量的數據,需要a,也需要b。
經常有人問我,AI可以做什麼?我跟很多團隊說,如果有哪個事情想一秒鐘就成功搞定,那麼就可以這個部分用AI創造價值。
為什麼AI會突然在這幾年進步這麼快?
如果你的橫軸是你的數據量(amount of data),縱軸是效率或準確度,當企業產生大量的數據,傳統企業按照過去的算法無法提供數據的計算效果,但如果訓練一個巨大的神經網絡,效果會非常巨大。
如果你要達到最好的效果,有兩個必要條件:
第一,要訓練一個巨大的神經網絡(NN);
第二,要有大數據。
今天很多企業有海量數據,但幾年之前沒有辦法訓練足夠大的神經網絡來實現計算。
今天,最好的人工智慧團隊都可以從算法(機器學習)和超級計算機架構入手。
supervised learning(監督學習)是人工智慧的一部分,我做人工智慧項目的時候,有時候也需要到Ai技術的不同部分。
為什麼通常講supervised learning(監督學習)和神經網絡(NN)?
supervised learning(監督學習)和神經網絡進步非常快,其他部分的進步沒有這麼快,只是慢慢增加,神經網絡這兩年有巨大的突破。
二、神經網絡
中國今天對深度學習和神經網絡有這麼大的興趣,我來分享下神經網絡這個詞具體是什麼。神經網絡,對於很多人也有魔術的感覺。我用具體的案例來說明。
如果你想預測一件房間的價值,橫軸是大小,縱軸是價錢,那麼輸入房間大小,輸出一個價格,這是一個最簡單的神經網絡。
在知道房間大小、睡房數量以及附近居住者的收入水平的前提下,如果買房子的人想知道房間可以住多少人,可以用一個神經元測算出來;也可以通過一個神經元測算是否需要駕車;還可以通過一個神經元測算附近學校的質量。
最後把這些神經元匯合到一起,再通過另外一個神經元輸出房子的價錢,這就是神經網絡。
最後分享一個細節來了解神經網絡的重要性:
如果輸入房子的特徵(a)和價錢(b),而且有大量的數據(a),它就可以自動學習這中間有什麼概念,不用去考慮和擔心這些神經元。
過去兩年,人工智慧的神經網絡進步這麼快,如果得到很多a,就能夠計算出很多正確的b。
就像語音識別,輸入語音a,輸出一個文本b,要做到高質量,需要一萬個小時的數據量,也就是10年左右的數據量,但要拿到這些數據的價錢也是不少的。
擁有比較準確的語音識別能力,用戶也會更願意使用。中國這幾年語音識別的用戶量增加得非常快,就在於現在語音識別比較準確。
今天很多人工智慧的企業都是開源的,技術本身不能作為壁壘。
要理解另外一個公司的技術並不太難。我在百度和谷歌工作過,對技術比較了解,知道技術是怎麼做的,但是如果我沒有數據,我就沒辦法帶一個團隊做搜索。
三、人工智慧公司的戰略邏輯:
數據-產品-用戶(Data - product - user)
如果你可以拿到一點點數據,你就可以通過神經網絡來做一個產品。
通常一個產品不用做得太好,只要用戶能夠接受,用戶慢慢會有活躍度,用戶就會為你產生數據,然後形成正循環,形成壁壘。
如果你有一個用戶可以接受的產品,卻又被巨頭用另外一個產品挖走,那麼你的數據就沒有辦法形成正循環。
人工智慧獲取的戰略已經越來越複雜,人工智慧團隊要想清楚信息獲取的戰略。
1.什麼是網際網路公司?
如果你要為一個傳統的購物中心做一個網站或者app,它們還不是一個網際網路公司。就像沃爾瑪網站,也不是一家網際網路公司。
你要做一個網際網路公司,不在於是不是有網站,最重要的是整個公司的組織是否具有有效利用網際網路的能力。
網際網路公司會做A/B測試,每天可以做一千次A/B測試,所以網際網路公司的學習速度會非常快。
網際網路公司也會在比較短的時間周期裡發布新產品,可以每天發布一個或者20個,傳統購物中心不能理解為什麼這樣做或者怎樣做。
網際網路公司做決定的能力不是只有CEO一個人,還有很多產品經理或工程師。因為在網際網路公司,技術和用戶行為比較複雜,沒辦法都交給CEO一個人做決定。傳統購物中心因為變動比較慢,由CEO做決定是沒有那麼大問題的。
因此,是不是網際網路公司不是看你有沒有網站。
2.什麼是人工智慧公司?
在人工智慧時代,一個傳統的網際網路公司+神經網絡技術,也還不是人工智慧公司。
一個公司要做成人工智慧公司,要組織整個公司有效地使用人工智慧的能力。AI現在還處於早期,人們還不能完全理解如何組織公司來使用它。
AI公司獲取數據的戰略非常複雜,有關戰略,我們有時候會討論好幾天或好幾星期。數據獲取的過程要好幾年,真的要一步一步來打。
最好的人工智慧公司都會把數據放在一個資料庫裡。
如果你的數據一部分在你個人電腦上,一部分在你辦公室電腦上,一部分在某一個資料庫裡,一部分在另外一個資料庫,你的工程師要做一個新的人工智慧的話,如何把這些數據放一起給人工智慧使用呢?
但如果你把數據放進一個資料庫,你的軟體或者工程師就可以利用完整的數據來訓練有效的人工智慧。
很多公司有很多數據,但是沒有辦法放在一起,數據的使用效率就會沒那麼高,你的工程師的工作效率就會慢很多。
在人工智慧公司工作的工程師,和傳統網際網路公司的工程師,工作描述的內容是不一樣的。如果你是百度公司的產品經理,你要做一個產品,就會畫一個圖,然後把圖給工程師,工程師再寫代碼,這樣的方式對網際網路公司是非常有效的。
但如果你要做一輛自動駕駛汽車,產品經理畫一張汽車圖,是沒有用的。在人工智慧時代,產品經理也需要理解怎樣獲取數據;也要理解怎麼和工程師溝通。
20年前,我們不知道A/B測試在今天會變得如此重要。今天,我們還沒有人能完全理解人工智慧這麼重要的概念,谷歌和百度的想法已經比較領先了,但還沒有人完全把人工智慧的概念講清楚。
這給了我們什麼機會?進入網際網路時代,很多新公司有了很多、很大的機會。進入AI時代,有一些傳統公司像谷歌、百度都做得非常不錯,也給很多新公司很多很大的機會。
四、使用AI的挑戰
AI技術發展這麼快,但是理解的人比較少。有效地使用AI來創造價值,就要跨行業,讓企業家和專家一起結合合作。
因此,從CEO角度,你怎麼安排有AI技能的人的工作呢?
很多公司的架構是由CEO和不同的事業部組成,那麼你怎樣通過AI改變他們的工作呢?
比如其中一個事業部是做禮品卡的,那麼是否可以通過AI改變售賣禮品卡的工作呢?但禮品卡的leader不懂AI,所以它內部很難建成一個AI團隊。
我經常對很多公司說,如果能夠找到一個獨立的AI團隊,就把這些有AI能力的人放到不同的團隊矩陣去。
今天懂AI的人才那麼少,他們不一定願意被不懂AI的人領導,所以可以等過幾年AI比較成熟,不需要一個單獨的AI部門之後,就可以把AI人才放到公司的不同事業部團隊內。
5、6年前,我們都不知道移動網際網路能做什麼,也沒有想到「定位」可以產生這麼大的作用,跨行業的團隊產生的作用很大。
今天,移動網際網路技術和手機技術很成熟,大家都可以理解網際網路能夠做什麼,這個時候公司就不需要跨行業團隊了。同樣,AI現在沒有那麼成熟,所以很需要跨行業人才。
不是每個人都要懂AI,也不是每個CEO都要懂AI,但如果可以找人來幫你建立AI團隊,可以讓你的團隊利用AI擁有不錯的機會。
我在谷歌帶谷歌大腦團隊的時候,做的第一個事情就是給幾百個工程師提供人工智慧課程。今天CEO的工作可以從外面選擇內容課程,或者找專家和人才來教育你的團隊。
AI的成熟速度比較慢,很多企業都有很多機會用AI去改變自己的企業。正如過去,大公司都沒有看到Uber和Airbnb的機會;在中國,大公司也沒有想到滴滴會做到這樣子。
謝謝大家!
關於來源:
GASA大學是一所以「科學復興」為使命,以「沒有受教,求知探索」為校訓,致力於給創業者、企業家培養科學精神的新型大學。