李彥宏:百度的人工智慧技術都能用在哪裡?

2020-12-06 網易新聞

網易科技訊 9月1日消息,2016百度世界大會在中國大飯店舉行。百度公司董事長兼執行長李彥宏在主題演講中展示了百度人工智慧應用的最新進展,已經可以用在實際生活中。

他著重介紹了百度在語音和圖像方面的進展。

其中最讓人興奮的應用是語音翻譯。李彥宏展示了一段中國計程車司機和外國乘客的對話。兩人都不會外語,計程車司機說中文,通過百度可以翻譯成外語,讓外國乘客聽懂。外國乘客說英文,百度也可以準確翻譯成中文。

這背後是百度的語音識別和語音合成功能在支持。他展示了語音識別和語音合成的技術,百度的語音識別可以比較準確地識別出一段營銷電話中銷售員和客戶的對話,同時百度用語音合成技術合成了張國榮向現場觀眾問候的話。

在現場,李彥宏還展示了百度自動駕駛汽車識別路況的過程。

還有一些正在探索中的應用。李彥宏也展示了與歐萊雅合作的嘗試,比如拍一個歐萊雅洗髮水,百度可以識別出洗髮水,並且可以展示洗髮水的主要原料。

他展示的還有自然語言處理。在去年的百度世界大會上,李彥宏曾展示通過度秘訂到咖啡,今年他展示了度秘獨立解說奧運籃球比賽決賽,度秘的語速比半月前它與著名籃球評論員楊毅合作解說奧運籃球比賽有所加快,較為流暢。(溫泉)

以下是李彥宏演講全文

李彥宏:各位來賓大家早上好!歡迎來到2016百度世界。

大家知道,百度世界是我們每年舉辦一次的百度技術創新大會。今年的主題我們聚焦在人工智慧,大家在之前收到的請柬上已經看到這個主題了。剛才開場視頻是以人工智慧為主題的,今天我的主題演講也將圍繞著人工智慧來展開。

今年6月份,我在百度聯盟峰會上講了一個概念,叫做網際網路的下一幕。下一幕是什麼意思呢?就是說,網際網路的發展在此之前已經經過了兩個非常重要的階段,第一個階段大概持續了十幾年的時間,就是我們講的PC網際網路階段。第二個階段是在最近四五年,我們把它叫做移動網際網路的階段。對於中國市場來說,隨著上網人數越來越多,上網人口的滲透率越來越高,現在已經達到了七億多,就是說已經超過了50%的滲透率,同時,每一個上網的人現在也基本都用上了智慧型手機。這意味著什麼呢?這意味著,未來網際網路的增長不能再靠人口紅利來驅動了,也就是說,移動網際網路的時代其實正在離開我們。這可能是很多人覺得難以接受的。我們國家現在進入了所謂的新常態,經濟的增長需要靠「網際網路+」行動計劃來推動,所謂「網際網路+」就是希望用網際網路的思維方式、網際網路的效率來推動各個行業、產業的繼續發展。但是,我們網際網路的從業者其實又深深地感受到了這其中的危機,這個危機就是因為過去的粗放增長階段已經結束了。

移動網際網路之後的下一幕是什麼?其實現在已經很清楚了,就是我們所說的人工智慧。人工智慧對於百度來說是核心當中的核心,我們也很幸運,在過去的五六年當中,百度花了很大很大的精力投入到人工智慧的研發當中。人工智慧對於百度來說意味著什麼呢?我可以用簡單的四個字來描述,就是百度大腦。百度大腦的概念我們其實在大約三年前就對外講過。那個時候我們講,百度大腦已經具備了大概兩三歲孩子的智力水平了。自此以後,不斷的有人來問我,尤其是今年人工智慧突然火起來了之後,很多人來問我說,你們這個百度大腦現在相當於多少歲人的智力水平了。

要回答這個問題其實還蠻難的,我也不知道它現在是多少歲了,因為畢竟人腦和電腦它還是有很大的區別,百度大腦雖然是一個人工智慧的大腦,但是它和人正常的發育的過程還是很不一樣的。

百度大腦到底由什麼構成的呢?它基本上是由三個大的部分組成的。第一個組成部分,就是人工智慧的算法。我們有超大規模的神經網絡,這是模擬人的神經元組成的網絡,但其實我們也不知道真正人腦工作的原理是什麼,只是想像當中應該是這個樣子。我們還使用了萬億級的參數,人腦的神經源大概是千億級的,我們也有千億的樣本和千億的特徵進行訓練。整個這些東西組成了百度大腦當中算法的部分。

百度大腦的第二個組成部分是我們計算能力。現在我們已經使用了數十萬臺的伺服器來進行計算,而這當中很多的伺服器不是傳統基於CPU的伺服器,而是基於GPU。早年的時候,GPU主要在遊戲等領域使用得比較廣泛,在人工智慧、尤其是深度學習起來以後,我們發現,其實GPU特別適合人工智慧的計算,尤其是深度學習的計算,一塊GPU可以頂100個CPU的計算能力。有關GPU的事情,我之後會請一位外部的嘉賓,就是NVIDIA的創始人和CEO黃仁勳先生,讓他給大家介紹更多有關GPU的,尤其是在人工智慧領域應用的情況。

百度大腦的第三部分是數據。數據也非常非常重要,而且這個數據量也是非常大的。比如說,我們已經收集了全網上萬億的網際網路網頁內容,這其中包括了很多視頻、音頻、圖像,這些數據也是數以百億級的。我們還有每天數十億次網民的搜索請求,而且還有每天數百億次的網民定位請求,就是說這個人在什麼地方,這樣的請求也比大家想像得多,每天都有好幾百億次這樣的定位請求。

有了算法,有了計算能力,有了數據,百度大腦就可以開始工作了。百度大腦又到底有什麼樣的功能?讓我們來看一看。

我們今天想重點介紹的四個功能:一個是語音的能力,一個是圖像的能力,一個是自然語言理解的能力,還有一個就是用戶畫像的能力。這幾個能力雖然都是屬於人工智慧中比較典型的應用,但是它的發展階段也是很不一樣的。比如說語音,現在就已經進入了相對比較成熟的階段,在很多很多領域中都開始進入實用階段,識別的準確率也已經很高了。圖像最近幾年也有了長足的進展。這兩者都屬於人工智慧當中認知的部分,所以深度學習的算法非常適合處理這些形式。

相對來說,自然語言的理解、或處理能力就更加難一些,並處在一個更加早期的階段,因為它除了認知方面的能力之外,還要求有推理、規劃等等能力,才能夠真正地理解自然語言。用戶畫像的能力,其實從傳統意義上來講並不是人工智慧的領域,但是由於近年來大數據的發展,尤其是大型網際網路公司有能力搜集很多用戶的數據之後,再用人工智慧的方法、用機器學習的方法,就可以把一個人的特徵描繪得非常非常清楚。所以今天,用戶畫像也變成了人工智慧、或者說變成了百度大腦的一個重要功能。

下面我就分別來講一下這幾個功能,這幾個百度大腦的功能。

我們先看一下語音,剛才也講了應該說今天人工智慧發展的最成熟的一部分能力,而語音又分成兩個方向,一個是語音的合成,一個是語音的識別。

我們先看看語音識別。今年MIT Technology Review(《MIT科技評論》)雜誌,把百度的Deep Speech 2評為「2016改變世界十大突破技術」,這就是百度的語音識別引擎,它已經到了第二代,主要就是使用了深度學習的能力。這樣的一個技術已經可以把語音識別的準確度做到多少呢?大概可以做到97%的準確率,這樣的準確率已經達到、甚至有時已經超過了人對語音的識別能力。當然,我們講這些能力不是為了簡單地去炫耀這個數字有多好,我更感興趣的是,當你有了這些能力時,它可以在什麼領域應用,又可以在哪些方面幫助到我們,這其實才是最最讓我們覺得興奮的地方。我個人的想像力很有限,整個百度幾萬人的想像力也是有限的,但是這些能力如果賦予到很多很多人,賦予給幾億人、幾十億人,這個可能性幾乎是無限的。先用我們比較有限的想像力來給大家舉一個例子。

這是一個銷售、電話銷售的例子,是一個2B(To B)的應用。這個應用是什麼意思呢?很多的公司其實都有電話銷售這樣的一個部門,都需要這樣做。但是銷售,尤其是電話銷售這個行業,大家知道流動性是比較大的,很多銷售都是新人,新人的話就會經過一定的時間培訓才能夠上崗,但即使是經過培訓的話,也不一定有那些有經驗的銷售那麼出活兒、出單。其實有經驗、最優秀的銷售和一般、較差的銷售相比,在效率上有非常大的差別。我們怎麼才能夠讓新手、讓沒有經驗的銷售,能夠具備最優秀銷售的銷售能力?過去的做法是,把優秀的銷售經驗總結成冊子讓大家去學習,讓這些銷售去背,但是怎麼活學活用還是需要一個過程的。而有了這麼高精度的語音識別能力之後,我們就可以徹底改變這樣一個狀況了,甚至可以讓一個剛剛上崗一個月的銷售就具備最優秀銷售的能力,也就是說,我們可以通過實時的語音識別甄別出用戶或客戶在問什麼問題,然後我們再實時地在屏幕上告訴新的銷售,最優秀的銷售是怎麼回答這個問題的。過去沒有實時的語音識別的時候,你需要線下學,學完了之後上去用、很容易就忘了,但是有了這個系統之後,我們就可以解決這樣的問題。

我們來看一下這個案例。

【播放語音識別技術演示視頻】

大家看到,在剛才的過程中,百度大腦一直在實時地識別雙方的對話,尤其是從電話裡面傳出來的聲音,有的時候並不是那麼清晰,對於人來說要完全聽清楚每一個字其實都是有一定難度的,但百度大腦的語音識別能力已經可以做到非常精準,並且可以根據用戶的問題、實時推薦下一步的工作要怎樣應對,這是一個語音識別應用在企業日常運作中的一個例子,就像我剛才講的,應該還有很多很多應用場景,大家可以根據自己的背景去想像。

語音識別是一方面,語音合成又是另外一個方面。語音合成是什麼意思呢?就是機器可以把文字轉換成語音,把它念出來、讀出來。今天的語音合成也有了和過去非常不一樣的體驗,最主要的就是,它可以用比較自然的人的聲音讀出來,而不是像過去機器一樣,每一個字之間的停頓都是一樣長,是勻速的、沒有表情的。這樣的自然體驗,當然對於用戶的黏性來說也是有很大的作用。

現在,百度每天要響應2.5億次的語音合成請求,這些請求用來幹什麼呢?比如說,過去人們看小說,今天可以在手機百度裡面聽小說。慢慢的人們聽小說的時間也更長了,過去每個人平均在小說頻道會花大概四十分鐘左右的時間,現在要花將近兩個半小時,就是因為把計算機合成出來的語音讀出來給我們聽,確實是一個很不錯的體驗,甚至是一種享受。那麼這種讀出來的小說,和我們平時聽到的廣播有什麼本質上的不一樣?其實非常不一樣。廣播是每一個人聽到的東西是一模一樣的,而今天的語音合成,它可以做到每一個人聽到的東西都是不一樣的,完全根據你個人的需求進行定製,這就是為什麼它的(用戶)黏性會很高,它能夠具備自然發聲的能力。不僅如此,其實我們可以想像一下,它如果能夠模擬一個自然人的表達方式或發聲能力,它就可以模擬任何一個你喜歡的人的說話方式。

不知道有沒有人注意到,百度地圖裡導航功能就是用語音來進行的,其中有一個選項可以用我的聲音進行導航。其實導航的那些話我並沒有說過,機器只是根據我平時說話的情況合成了一個李彥宏的聲音。這樣的聲音不僅在我身上可以做到,在很多其他人身上也可以做到。

我們現在來給大家展示一個合成的聲音。我們合成了一下13年前已經去世的張國榮的聲音,我們來放一段video。

【播放情感語音合成視頻】

為什麼給大家展示這個呢?一方面我知道,很多人是張國榮的粉絲,另一方面,其實合成張國榮的聲音比合成一般人的聲音要更難。為什麼呢?因為他的國語語料相對來說比較少,所以,我們能夠合成他的聲音,就一定能合成很多很多人的聲音。

對於百度來說,百度大腦的語音合成能力可以讓每個人都有自己的聲音模型,你只要按照我們的要求說50句話,我就學會了你說話的方式。當你擁有自己的合成聲音之後,比如說家裡的老人想經常聽你說一說,你把這個聲音合成出來讓他聽就好了。或者說你平時要加班,小孩睡覺之前想聽個故事,你合成自己的聲音給孩子講一遍這個故事,聽起來也會很親切。所以大家可以看到,這些語音的能力會帶來各種各樣新的可能性。

下面我給大家講一下圖像。用一個比較專業的術語來講,我們叫做計算機視覺。這也是現在廣義的人工智慧中非常重要的領域。說到圖像的識別,我想大家自然而然會反應出來一個什麼應用呢?應該就是我們通常講的人臉識別的應用。人臉識別的準確率今天已經達到了99.7%,已經非常非常準確了。現場的屏幕能夠識別出來我們一些嘉賓,根據他們的人臉,我們知道這個人是誰,這個準確率已經比較高了。剛才進來的時候,大家也可以看到一些人臉識別的展臺,我們是可以識別很多很多人的面孔的。

那麼,人臉識別這個技術是怎麼實現的?我們要對人臉的特徵提取它的關鍵點,把這些點打出來之後要做一些處理,把它連成一個面部表情,據此來識別這樣一個人。這就使得當一個人的表情發生變化的時候,我們仍然能夠識別出來這個特點是沒有發生變化的,比如他在哭,他在笑,他在憤怒,他在迷茫,他的表情是不一樣的,但是他的表情特徵是不變的,所以我們仍然可以很準確地識別出這樣一個人。

除了面部識別之外,圖像識別還在很多領域也有應用。我們再看一個,這是上海的一個全景圖,大家使用百度地圖有時候需要看這樣一個景,到一個陌生的地方之前,想看看到那看到的樣子是什麼。當然,這個圖不是一個簡單的圖像的採集,我們採集了圖像之後要對圖像中各種各樣的目標進行識別,這個大樓是什麼樣的大樓,那個路牌上面寫的什麼字,對寫的這個字識別的話,跟人臉識別還不太一樣,這裡面有一個特殊的圖像識別的技術就是OCR,這個是二十多年前我們的一個專利,到今天它的準確率已經非常高了,下面我們也是用一段視頻給大家看一下百度地圖是如何利用圖像識別的。

【播放百度地圖視頻】

這是百度地圖利用圖像識別的情況,其實還有一個很重要的領域也是非常需要圖像識別的技術,這個領域是什麼呢?這就是我們過去一年來講得比較多的無人駕駛汽車。無人駕駛汽車涉及到很多很多的技術,比如說我們需要計算機視覺的技術,需要高精度地圖,需要對環境的感知,需要定位,甚至需要語音的通話。但應該說,計算機視覺或者是圖像識別的技術是「最後一公裡」,無人駕駛汽車真的要變成沒有人,真的要能夠解決99.999%、甚至100%的情況,最終還是要依靠計算機視覺的能力,要識別各種各樣的極端的情況。

去年年底開始,我們給大家展示過百度的無人車在五環上跑,在高速上跑的情況,過去一年左右的時間我們也花了不少精力去提升我們在城市道路上運營的水平,下面我們也放一段視頻給大家看一下。

【播放無人車視頻】

大家看到左下角這是人能夠看到的視野,這個視野其實是比較窄的,主屏幕是無人車能夠看到的路面情況,大家可以感受到,它感知的範圍其實比人要寬了很多,很多比較遠的目標都可以感知到,每個目標都給出它唯一的編號進行識別。對面有什麼車過來了,遇到紅綠燈,遇到障礙怎麼辦,行人怎麼能識別出來,或者是樹木,周邊的汽車等等,每一個目標我們都進行了識別和編號,這就是實際的、一個百度無人駕駛汽車在城市道路中行駛的情況,上面的45是限速。

這是大致的一個車看到的世界是什麼樣的。這裡面涉及了很多計算機視覺或者是圖像識別的技術,尤其是這兩個技術:一個是我們叫做車輛的檢測,你行駛過程中怎麼能夠知道旁邊有車輛,這個車輛在哪?這個車輛的檢測我們現在按照國際權威的評測來看,車輛檢測的能力,百度無人車已經排名第一了。還有一個很重要的能力是車輛跟蹤的能力。這個不僅是全自動的無人車,即使是對半自動的、高度自動駕駛來說,也是一個很基本的能力。你怎樣能夠準確地跟著前面的車走,這個技術在包括準確性、全面性、連續性等六項指標中,我們已經有四項拿到了第一。

這是無人車對於圖像識別依賴的情況。我們再給大家展示一個領域,就是增強現實AR,AR其實也是非常依賴(圖像識別)。拿著手機拍一下現實的情況,我們要能夠識別出來這是哪,這裡面有什麼,然後才能跟用戶進行互動,才能產生真實世界和一些虛擬世界的完美的結合。那麼這個東西有什麼應用呢?我們也覺得很高興我們的周總、我們的廣告主非常敏銳地把握到了這麼一個機會,他說OK,我可以把現實世界中我的產品和虛擬世界中我希望用戶感知的東西結合在一起,這樣的一個做法也可以說是一種新型的廣告形式,下面我們就來看一個具體的例子。這是我們跟歐萊雅中國合作的一個例子。我們放視頻。

【播放歐萊雅視頻】

所以大家看到無論你拿手機拍一張明信片,還是拍一個實物的洗髮水,它都可以準確地識別出來這個東西,和用戶進行互動,這裡面不僅有圖像識別的技術,也很大程度上取決於廣告主的創意,如果創意和這個技術結合,對消費者的吸引力也非常大,所以我們也期待將來的時間和客戶很好地合作,把這個創意,把最優秀的想法和最優秀的技術結合起來,給消費者帶來實惠。

這是有關圖像識別方面的幾個例子。下面我們再看自然語言處理。自然語言處理其實我剛才也講了,它的成熟程度應該不如語音,甚至不如圖像識別,但是即使在目前的狀態下,它也能夠給大家帶來很多很多不一樣的體驗。最直接的例子應該是我們去年在百度世界大會上講的一個例子,就是度秘。度秘是一個個人智能的助理。這個個人智能助理今天我們可以在手機百度裡面找到,度秘跟用戶進行交互,現在已經有超過一半的交互是通過語音和圖像來完成的,去年我們也講了,語音和圖像將來會變成一個主流。

度秘除了它能夠識別語音和圖像之外,其實它更關鍵、更核心的技術,是能夠用人的語言來與人進行交流,並且能夠理解人的很多意思和意圖,儘管不是每一次都能理解。

過去這段時間我們也利用度秘的自然語言的能力做了一個比較有意思的應用,用度秘來解說奧運籃球,下面我們看一下視頻。

【播放度秘與楊毅合作解說視頻】

這個不是度秘單獨完成的一次解說,是他和著名籃球評論員楊毅先生一起合作做的一次奧運籃球比賽的解說。今天我們也很高興把楊毅先生請到了現場,現在請他上臺。

【嘉賓楊毅登臺】

楊毅:大家上午好,我是楊毅。

李彥宏:剛才我們看到很有意思。你跟度秘一起解說了一場籃球的比賽,而且我也注意到你的風格和度秘的風格還是很不一樣的,我想問你一下,作為一個籃球評論員,你覺得一個好的解說員應該具備什麼樣的能力?

楊毅:首先我覺得很難說我有資格來講一個好的評論員要具備什麼樣的能力,我相信很多行業都在不斷地前進和發展。而且對一個解說員,即使他解說了一萬場比賽,但他下面面臨的一場比賽也是新的。但我想,總的來說,一個解說要想很好地工作,首先你要對這個項目有非常深刻的了解,無論對它的項目特點還是歷史背景,第二個要有非常快速的現場反應能力,第三個我覺得要有出眾的語言表達能力,把你看到的、聽到的,能夠儘快地呈現給觀眾或者是聽眾。

李彥宏:對,這些能力度秘都在不斷地學習過程中,還有很多不完美的地方,我也希望度秘能夠從你的身上學到很多很多東西。剛才我們看到你和度秘合作的這樣一次解說,它跟你學習了一次之後,我們想讓它單獨做一次籃球比賽的解說,現在我們看一下度秘解說籃球奧運決賽的情況。

【播放度秘解說奧運籃球決賽視頻】

李彥宏:ok,這是度秘單獨的解說,也想請楊毅先生評論一下你的學生表現怎麼樣?

楊毅:顯然度秘比之前和它一起說的時候完成得更好了。其實我跟它說的時候,它的表現就是出乎我的預料的,我也聽說它學習過上百場甚至上千場的比賽,它對比賽的基本知識儲備是沒問題的,在這個行業裡面,它可能比我知道得還多,因為幾年前的比賽我可能已經忘了,但是仍然裝在它的電腦裡。上知天文,下知地理,什麼都明白,它的表達也是比較清楚的,在我跟它說的時候,我覺得只有一個小小的問題,我覺得它說話的速度確實是好慢。但是大家剛才看到,它說決賽的時候能明顯感到語速加快了,更符合體育競技的特點,更快速地將現場的情緒傳達給觀眾。

李彥宏:對,我其實非常同意。剛才聽的時候我也有點著急,它說的語速是比較慢的。但是像你剛才講的,度秘也有它的優勢,比如它的記憶能力是比人強的,它學習了幾百場的奧運籃球比賽,每個運動員的個人資料它都記得非常清楚,遇到這些知識型的問題,它可以非常迅速地、方便地回答。另外我們看解說本身,用戶是可以跟度秘進行互動的,你點一下「雙方三分球的對比」,馬上就出來各種各樣的數據了,這是度秘的優勢。但是度秘的劣勢就是它對人的語言的理解和人的語言的創造能力還有很多需要學習的地方,我們也非常希望楊毅先生能夠多給我們度秘提一些建議和提升的地方,也希望我們下次再有機會合作時,它說話至少快一點。

楊毅:我覺得它下面的這些功能是非常好的。你可以想像一下,如果它成為一個成熟的產品,在每個球迷收看比賽的時候在家裡身邊沙發上都能擺一個小機器人,一邊看著電視裡的比賽,聽著電視裡的解說,當然它可能在電視裡解說;同時他身邊也有個度秘,可以不斷地就他所關心的問題問身邊這個小機器人,能夠隨時給他進行解答,就真正成為了球迷在收看比賽時候的好朋友。

李彥宏:我相信這一天一定會到來的!而且對於度秘來說,籃球和其他的比賽沒有任何區別,都是學習知識,它主要的能力還是不斷地學習人的思維方式和表達方式。

楊毅:我相信它肯定會越來越好。

李彥宏:謝謝楊毅。

【嘉賓楊毅下場】

李彥宏:這是有關自然語言理解的一些介紹,下面再給大家展示一個自然語言理解的應用。這個應用的領域其實也不是特別新,就是自動翻譯。你要想把一種語言轉換成另外一種語言,你必須得理解這種語言在說什麼。它不是簡單的把語音轉成文字,更多的是需要你知道它是什麼意思。今天的百度翻譯已經可以支持27種語言、數百種不同方向的對譯了。現在我們來看一下百度翻譯有多大程度上能夠理解人的自然語言。

【播放百度翻譯演示視頻】

李彥宏:這其實不是一個演示,這是一個實際的例子。今天當大家打開百度翻譯,它已經具備了這樣的能力。所以我們看到對於自然語言的理解一旦能夠達到一定程度,它就又打開了很多新的可能性。

下面我們講百度大腦的第四個能力,就是用戶畫像的能力。用戶畫像也是基於百度的大數據以及機器學習的方式所獲得的一個能力。現在我們已經有接近10億的用戶畫像,其中對於他們的識別我們已經用到了千萬級的細分標籤。這些標籤主要在兩個維度上體現,一個是通用的維度,它的人口學特徵、短期的意圖、位置屬性;也有一些垂直行業的特徵,他在金融領域是什麼樣的情況,它在保險、醫療、旅遊、健康等領域都有什麼樣的愛好、習慣,這些東西都共同構成了我們的用戶畫像。

用戶畫像有什麼用途?首先給大家舉一個百度的例子。

最近幾個月大家可能注意到了手機百度,除了上面的搜索框之外,下面增加了各種各樣的文章。這些文章有時候是新聞,有時候不見得是新聞,但是確實是你感興趣的東西。之所以它能夠把你感興趣的東西推薦出來,就是因為我們利用了百度的用戶畫像。我知道你是一個什麼人,你喜歡看什麼樣的東西。有了這樣的個性化推薦,過去兩個月手機百度推薦的文章的閱讀量增長了10倍,這種能力就是靠百度給用戶打了60多萬個標籤,而每個用戶都是這其中某些標籤組合後描畫出來的,所以它可以做到千人千面,準確地講,不是千人千面,而是萬人萬面,億人億面,每個人對於百度來說都是不一樣的個體。所以,每個人看到的信息和文章都是不一樣的。

這是一個百度內部使用的例子,我們也認為用戶畫像可以在很多其他領域使用。我們再給大家展示一個外部的例子。這是6月份上映的電影《魔獸》,它的出品人是傳奇影業,他們就是利用了百度大腦的用戶畫像功能來提升它的票房。那麼它是怎麼做到的呢?我們也來看一個視頻。

【播放傳奇影業視頻】

這個做法很聰明,它把人群分成三類,一類人是不管怎麼樣都要看的,另外一類是不管怎麼樣都不會看的,這兩種人他們都不太關心。它關心的是它可以影響的人群,再通過用戶畫像把這些人從搖擺的轉換成真正去電影院看的。(原來)他認為如果有5%的票房提升就很滿意了,最後實際上提升超過了200%。當然這不是簡單的說百度你給我用戶畫像,它一用就實現了提升,他們也下了很大的功夫去設計整體的推廣過程。原版的video是比這個長很多的,大家有興趣可以聯繫我們的工作人員,看它完整的做法是什麼樣的。

講到這裡,我基本上把百度大腦幾個主要的大功能都已經呈現出來了。下面我想請一位大家都很熟悉的明星,和我一起回顧一下百度大腦的這幾個功能。這個明星就在我們這張照片中。我們首先用百度大腦的圖像識別功能把這位明星找出來。大家知道他是誰嗎?對,他就是著名演員胡歌

【嘉賓胡歌登臺】

胡歌:你好,Robin,各位尊敬的來賓大家好。我是胡歌。今天非常榮幸可以參加百度世界大會。剛才我在側臺也聽了非常精彩的演講,感受到了很多新的科技。之前我有聽說過人臉支付,以後如果可以像剛才那樣在一大群人中先進行人臉識別,再完成支付,這個真是太便捷、太智能了。

李彥宏:你是想搶著買單嗎?

胡歌:如果以後有機會我和Robin要一塊吃飯,到買單的時候,我肯定把臉轉過去,不跟你搶買單。(笑)

李彥宏:沒問題,我買單。剛才我們已經看到了百度大腦對你的面部的識別。我還可以給你展示一些其他的能力,比如語音合成的能力。這個能力是這樣的,當你念一首詞,你念它的上半部分,百度大腦念它的下半部分,但是它念出來應該跟你是一樣的,它學的是你的聲音。

胡歌:這麼厲害。

李彥宏:這首詞,是百度名字的來歷。你可以來念一下上闕。

胡歌:東風夜放花千樹,更吹落、星如雨。寶馬雕車香滿路。鳳簫聲動,玉壺光轉,一夜魚龍舞。

【情感語音合成技術現場演示】

胡歌:太神奇了,首先讓我震撼的是,它能把我的聲音模仿得這麼像。第二,它連百度錢包的代言詞都給我改了,真的挺智能的。

李彥宏:這是語音識別的能力,其實用戶畫像的能力對你其實也有用,為什麼有用呢?你的粉絲都是什麼樣的人。

【大屏幕展示粉絲用戶畫像結果】

李彥宏:這是根據你的粉絲的興趣偏好「畫」出來的東西。我還是有一點驚訝的,本來以為關心影視、音樂應該是最大的群體,但是我們看到旅遊出行、網絡購物是你這些粉絲群體特別特別喜歡的東西。

胡歌:我看到旅遊出行和餐飲美食可能是他們最感興趣的,那麼能不能在這兒根據這個興趣數據也為我的粉絲謀取一些專屬的福利呢?

李彥宏:好啊。那我們下來通過糯米或是其他的平臺給胡歌粉絲提供專享的優惠。百度大腦的這些能力都是今天已經實現的。剛才我也講到這個大腦一天一天都在學習和成長,它的能力也在不斷的進步。所以我完全可以想像有一天當你決定要接一部戲的時候,你只要在這個合同上籤一下字,剩下的事情就都交給百度大腦來幹,它可以合成你的聲音、可以合成你的圖像、可以做你的動作,以後演戲你只要說Yes,剩下的事我們就都給你辦了。(笑)

胡歌:科技在不斷發展,但是演戲對我來說還是我畢生藝術上的追求,我覺得百度大腦可以為我的生活帶來很多便利,但演戲這個事我還是自己來幹吧!(笑)我相信它可以做好,但是我更願意自己來做!

李彥宏:好的好的,以後百度大腦具有新的能力的時候,我及時通知你。這有可能是好消息,也有可能是壞消息。

胡歌:謝謝!感謝今天讓我感受到了這麼先進的科技,我也希望百度大腦能夠越來越強大,越來越智能。謝謝Robin!

【嘉賓胡歌下場】

李彥宏:謝謝胡歌!今天我們全面展示了百度大腦各種各樣的能力,我覺得,而在我自己和百度同學的想像範圍內,這些能力能做的事情已經很多了,但是更讓我興奮的是如果這些能力賦予到全社會的每個人,它能夠變換出來無窮無盡的可能性。所以,百度大腦會把語音、圖像、自然語言理解和用戶畫像等能力完全開放出來,並且在大多數情況下這些能力會是免費提供的。有了這樣的能力,有了開放共享,將給各行各業的人群帶來過去大家做不到的、不敢想的能力。我在這裡也邀請每個人重新想像你所在的行業,重新想像中國經濟,重新想像世界的未來。

謝謝大家!

相關焦點

  • 李彥宏:藉助百度AI優勢 賦能挖掘生命科學更多可能
    由於人工智慧技術的賦能,單細胞測序技術的普及,大量的生命信息被數位化,生物計算將大顯身手,新藥研發的速度將大大加快,人工智慧技術在疾病早篩、精準診療等方面都可以施展威力,給人類帶來福祉。」今年在疫情的影響下,人工智慧技術因在解決新藥研發、人類早期疾病診斷等人類健康問題的突出作用受到了廣泛關注,如何通過人工智慧推動生命科學的發展也成為科技企業布局和發力的重點。
  • 李彥宏:人工智慧就是「百度大腦」
    李彥宏隨著上網的人數越來越多,每一個上網者都用上了智慧型手機,李彥宏認為,網際網路的增長不能再用人口驅動,移動網際網路的快速發展正在逐漸遠離。
  • 百度重生之戰:李彥宏的矩陣革命
    外界猜測,王海峰此刻手握李彥宏的尚方寶劍,要全面整合百度的技術體系。 2018數字中國建設的峰會現場,王海峰接受了央視財經記者的採訪,他認為,人工智慧技術會是中國幾百年來第一次有機會站在最先進的科技發展的前沿。兵合一處,劍指一方,百度三軍聽命,全面進伐AI時代。
  • 李彥宏親自站臺,百度雲手裡有什麼底牌?
    一開始我們覺得雲計算是一個沒有技術含量的東西,但是隨著這些技術一樣一樣地出現,我們覺得它是有技術含量的。李彥宏如是說。中國最早的網際網路巨頭百度,如果只在雲計算領域拿到六十分,在公眾眼裡都是一種失敗。今天的發布會如同高考鈴聲,百度的答題時間正式開始了。我們關心的是——握著筆的李彥宏,有什麼解題的獨門秘籍呢?百度發布了神馬?我們先來看看百度究竟拿出了什麼產品。
  • 人工智慧滲透三大場景 百度金融的朱光速度
    朱光告訴記者,這些人不僅專業能力優秀,而且大家都能夠談得來,有共同的文化價值觀,有默契。&nbsp&nbsp&nbsp&nbsp除了業務前端的「高配」布局,背後他還時常得到百度總裁及COO陸奇以及百度董事長李彥宏特別助理馬東敏的支持。
  • 未來10年技術發展方向 李彥宏給了這樣的預判
    而蘋果也在蠢蠢欲動,宣布計劃於2024年生產客用自動駕駛車輛。國際巨頭搶佔市場,國內也不甘示弱,各大科技公司及傳統企業都下注智能汽車領域,如恆大、華為、百度等。尤其是百度,作為全球自動駕駛領域的佼佼者,在技術上已經步入完全無人駕駛階段,並相應地推出了5G雲代駕,確保自動駕駛的安全。
  • 李彥宏解讀人工智慧:「披著狼皮的羊」
    近幾年,人工智慧技術迅速興起,從衣食住行到醫療教育、從技術創新到產業升級,人工智慧正在全方位改變著人們的生活。  如今,在百度的帶領下,人工智慧技術顯然已經得到了長足的發展,甚至正在改變人們的生活。
  • 新物種百度:李彥宏推挖掘機,跟快手槓上短視頻,小程序追騰訊
    相比去年更多是展望願景,今年百度世界大會有了不少可以拿出來說的人工智慧落地故事。也許是信心更足,整場大會,李彥宏全程微笑著,神態放鬆。去年承認在五環上吃了罰單的他,在今年的百度世界大會上又創造了新的段子:「挖掘機技術哪家強,中國山東看藍翔——真正的挖掘機技術要靠百度的人工智慧技術。」除了廠長,很多高層都釋放了自己的搞笑氣質,大會不再乾澀。
  • 李彥宏:我們是實用主義者,而不是理想主義者
    百度人工智慧其實幾乎已經滲透到百度所有的產品線當中,比如說手機百度的語音搜索、鳳巢的推廣系統。早年百度大搜索用的基本上是詞頻統計、超鏈分析的專利。但是,近五年左右,百度的搜索自然結構功能的排序基本上都變成了機器學習。包括無人車,我們現在無人車是可以在比較複雜的路況上沒有任何人工幹預行駛。
  • 百度CEO李彥宏內部信:技術讓信息更加及時透明並緩解焦慮
    中關村在線消息:百度創始人、董事長兼CEO李彥宏在致全體員工的內部信中,呼籲百度「無論是高管還是基層員工,都要迅速的重新專注投入到工作中來」。百度CEO李彥宏內部信:技術讓信息更加及時透明並緩解焦慮李彥宏在內部信中指出,在國家抗擊疫情的特殊時刻,每個人都要「要苦練內功」「為國家的經濟建設貢獻更大的力量」「為國家解難,為民族排憂
  • 百度AI半年考:李彥宏如何做到「每臨大事有靜氣」?
    李彥宏的「靜氣」,或許是因為其一直以來對「技術」的敬畏和信仰。畢竟網際網路行業再風雲詭譎、變化莫測,技術都永遠是最底層的引擎。網際網路行業,沒有比技術更古老的過去,也沒有比技術更高遠的未來。2018年已經過去一半,回顧過往才能面向未來。
  • 異曲同工:馬斯克的第一性原理,李彥宏的人工智慧「樂高模式」
    1932年創立的樂高,或許連自己也沒有想到,其各種模塊隨用隨取的積木搭建方式,在88年後的今天,竟然成為了人工智慧底層基礎設施賦能開發者的最高效方式。這種方式,被百度創始人兼CEO李彥宏洞察和概括為了「樂高模式」。10月12日,在第三屆數字中國建設峰會上,李彥宏做了主題為「從潮起東南到百川追海」的精彩演講。「AI先生」李彥宏這次的演講仍然聚焦於人工智慧。李彥宏表示,「從整個智能經濟發展的角度來看,我們需要有一個好的基礎設施。基礎設施的智能化要通過技術的開源和開放來實現。
  • 百度大腦、Apollo、小度…數字中國建設峰會百度秀出智能經濟...
    在當天的峰會開幕式主論壇上,百度創始人、董事長兼執行長李彥宏在題為《「從『潮起東南』到『百川追海』」》的演講中表示,我們將人工智慧看作是一個能容納百川的「大海」, 這個「海」納百川,將在三個層面帶來重大的變革和影響。
  • 百度神秘智能音箱發布,Diss市面現有產品「都是捲紙垃圾桶」
    在2017百度世界大會的現場的開場演講中,李彥宏稱,「無人駕駛車有沒有吃到罰單」是過去四個月被問最多次的問題。「但是如果無人車的罰單已經來了,無人汽車的量產還會遠嗎?」李彥宏稱將在2018年量產無人駕駛汽車,而除了無人車,百度本次世界大會還重磅發布了第一款智能硬體產品——與渡鴉科技合作推出的智能音箱Raven H。
  • 旅遊過年新時尚,沒想到李彥宏的百度地圖還能這麼用
    作為AI體驗派的代表人物,長期關注如何將AI技術運用於大眾生活場景的李彥宏,這一次在自家王牌產品百度地圖的功能圖譜中,畫上了旅行這一分支。從選擇目的地、預定酒店、做行程攻略都親力親為的90後年輕人們,更是因為繁重的工作和對出行品質的高要求,衍生出了選擇恐懼症、無攻略不出發、資深路痴、自駕狂人等代表類型。  針對不同人群的習慣和差異化需求,百度發揮自身技術優勢,將地圖定位為「新一代人工智慧地圖」,在交互體驗、位置信息服務、出行服務與決策上進行變革。定位、語音對話、規劃路線……這都是百度地圖的基礎技能。
  • 百度搜索公司總裁向海龍離職 李彥宏發內部信強調「保持定力」
    此外,4月30日,百度人力資源高級副總裁劉輝離職,是第二位公開加入百度「高管退休計劃」的成員。劉輝卸任之後,百度人事工作由崔珊珊掌舵。2017年12月崔珊珊回歸百度,擔任百度文化委員會秘書長,並主導了百度OKR(即目標與關鍵成果法,一種員工考核方法)的落地實施。讓人意外的是,百度的另外兩位高級副總裁張亞勤、劉輝都進入了退休計劃,而向海龍並沒有進入百度的高管退休計劃。
  • 百度李彥宏登《時代周刊》封面:幫中國贏得21世紀
    在文章裡是這樣描述李彥宏和百度的:在2000年,李彥宏成立了百度,如今它已是僅次於谷歌的第二大搜尋引擎;百度20%的市場位於中國,這也使它成為全球第四大受歡迎的網站;這家公司的名字,來源於13世紀的中國詩詞;百度已經發展成了一家市值600多億美元的網際網路巨頭,在中國僅次於騰訊(社交媒體集團)與阿里(線上購物帝國)。
  • 來自食物鏈頂端的男人向李彥宏發起節目邀請
    除了技術,李彥宏最堅持的東西居然是……眾所周知,技術是李彥宏的信仰。李彥宏不止一次強調,無論是百度還是他個人,都相信技術可以推動社會的發展,可以造福人類。早在PC網際網路時代,百度就聚焦搜索技術,致力於讓人們最平等便捷地獲取信息找到所求。到了人工智慧時代,百度發力大數據、雲計算、深度學習。
  • 為什麼是李彥宏代表中國人工智慧登上《時代》封面
    去年一年中,看到關於人工智慧的演講,就很少不見到百度董事長李彥宏。見到李彥宏,就很難不聽到他關於人工智慧的見解。無論是其在首屆世界智能大會上的演講還是在第四屆世界網際網路大會的發言都清晰的表現出「All in AI」的意味。更可貴的是百度在人工智慧上的努力近期得到了《時代》周刊的烘託。
  • 正式進軍生命科學領域,李彥宏用百圖生科讓情懷變為現實
    在此,在恭喜李彥宏多年情懷終於實現落地的同時,作為業界觀察者,我們也需討論這樣兩個問題:一是生命科學市場究竟能有多大的潛力,二是百度生科進軍生命科學領域,又能否開啟AI新故事。可以說隨著人工智慧深度融入生物製藥研發全周期中,憑藉其強大的學習力、智能預測及可複製可追溯等特點,將有效改善生物醫藥行業一直存在的「高投入、高風險、長周期」行業痛點,在多方面促使生物製藥由勞動力密集型向智能技術型轉變。 這是人工智慧技術與生物科技領域相結合產生的奇妙化學反應,也是百圖生科進軍生命科學領域的驅動力量所在。