在今天舉行的全球人工智慧與機器人峰會上,小米科技聯合創始人黃江吉(kk),帶著對一系列小米智能家居設備的介紹,分享了小米對人工智慧技術發展的方法論。
絕大部分業內人士認為,人工智慧的成功歸功於大數據,而黃江吉認為人工智慧的發展離不開這三個前提:產品+大數據+機器學習。
首先,機器學習與大數據是離不開高活躍度的產品,這些產品包括常用軟體和類似如手環、電視、盒子、網路設備以及智能家居等智能硬體。
黃江吉提到,小米手機有兩億MIUI系統用戶,其中日活躍1000萬的應用有8個,而日活超100萬的有17個。這為大數據和機器學習能力的提升打好了基礎。
當高活躍度的產品落地時,就會產生大量數據,而建立高質量的數據,則通過數據採集,數據清洗,數據挖掘,數據智能等方式來實現。我們知道,任何數據最終都是為人服務,因此建立每個人的用戶畫像就顯得尤為重要。小米為建立用戶畫像收集了各個場景、以及各個碎片時間產生的數據,數據量共達200TB。
此外,黃江吉指出,他們了解用戶關注的內容需要通過搜索、推薦、導流、人工運營的方式來進行。最後有人向黃江吉提出以下兩個問題:
您認為小米目前最智能的產品是什麼?
黃江吉:你問一個公開的KK的話,我會告訴你我們的產品都很智能化了,如果你問了關門的KK的話,我會告訴你沒有一個產品真的做到又簡單,甚至是不用你的幹預它就可以把事情做得極值,這個有點苛求,如果你問我們智能化度做得最高的,毫無疑問就是我們的手機。
我不知道大家知道不知道小米的開發模式,你買了小米手機之後我們基本上的系統是每周都升級一次,從5年前開始第一款手機到今天我們基本上每一周更新一次,裡面的全部的更新大部分需求是來自用戶的,就是我們每周其實是可以讓他們告訴我們本周更新他滿足的前三樣東西是什麼,也告訴我們他不滿意的很爛的前三樣東西是什麼,每周給我們投票,我們做到今天手機是最成熟的業務,它的智能度也是相對比較成熟的。
小米的重點不是在前端,如果是在前端的話你做後面的數據分析有什麼用,怎麼產業化,怎麼賺錢?
黃江吉:我希望我今天的報告解決剛才的問題,如果你把一個事情做好了你就不用分前端、後端,雲端、中端。我們首先要把這個產品的硬體做好,然後把系統的軟體做好,才有真實的用戶願意去使用這個產品,然後才有雲端。
有雲端才可以產生數據,。產生了這個數據之後才可以去機器學習也好,怎麼樣去深度學習也好,讓它反過來變成一個數據模型,把你的產品做得越來越智能。裡面的商業化的才可以把它的體驗度做得越來越好。你真的要把智能落地的話,你不把每個圈落地的話,你是不可能做到智能化的。
以下是黃江吉演講實錄:(註:小標題是為了閱讀方便而加。)
各位專家各位來賓大家好,今天非常榮幸我可以代表小米在這裡做一個報告,這個報告是關於產品,關於用戶,關於機器學習,關於人工智慧。
6年前我們創辦小米的時候,我們有一個願景,我們是希望可以讓每個人都可以享受可以的樂趣,什麼意思呢?其實小米從創辦到今天我們的核心無非就是希望可以作出越來越好用的產品,越來越智能的產品,然後把這些產品帶給越來越多的用戶,來去滿足他們的一些真實的核心的需求,而且可以改變他們的生活。
也可以這麼理解,6年前我們創辦小米就是因為當時我們覺得有很多我們生活上用的產品還不夠智能,所以我們有這樣一個使命我們希望可以去把它做得更符合我們的要求,我們有這個想法。
今天很多專家已經提到了人工智慧如果要落地,它有好幾個前提,他們反覆的講到機器學習或者是人工智慧最大的一個基礎就是大數據,對嗎,我非常同意,但是從我們在做小米這幾年實踐的經驗我會把它再往下來推一層,我認為人工智慧是大數據,但是大數據的基礎應該是產品加上海量的用戶去使用這些產品真實產生出來的大數據,所以我認為在三個前提裡面我們應該從產品開始分享。
2 億 MIUI 用戶所以大部分朋友對小米最大的印象就是我們是從小米手機開始做的,我們從6年前開始創業,第一個智能產品就是手機,為什麼我們當時做手機,原因很簡單,就是我們這一群老男人,我們有時候開玩笑說小米就是一群老男人的創業公司,我們是一群發燒友,我們用了很多當時號稱的智慧型手機,但是其實每一個手機都有很多的體驗上面的空間,看你怎麼樣定義智能,雖然我們都叫智慧型手機,但是坦白講它不智能。
我們6年前的第一個產品就是做手機,我們從2011年推出第一部手機到今天其實做了兩個產品線,一個是小米手機,一個是紅米手機,我們做的這個手機是移動網際網路手機,我們怎麼評價它是不是一個高活躍度的產品,我們已經有超過2個億的 MIUI 用戶,但是他們到底有多活躍?這個是MIUI系統超過1000萬的用戶已經有8個了,日活躍超過100萬的用戶已經有17個了,你會看見他們平常在使用手機裡面的各種各樣的系統的應用。
他們的活躍對我們來講有兩個意義:第一是我們如何通過做產品跟用戶的反饋裡面得到他們真正需求。第二個是只有他們非常活躍使用這個產品的時候我們才可以獲取更多的數據,反過來把這個數據發揮起來,所以你看裡面的比如說瀏覽器,比如說音樂,比如說視頻播放器,智能家庭,甚至是天氣、閱讀等等,其實說明了用戶每天都在高度使用的產品是什麼功能。
IOT的兩個問題我們在三年前進入了更多的用戶生活上使用的一些功能。我們第一個進入的就是手環,當時出來之後變成了手機的最佳拍檔,在用戶的移動生活上面我們進一步的對他的生活有進一步的了解。
我們做了小米電視和盒子,因為在家庭裡面電視還有娛樂的視頻、電影這些需求是非常非常剛性的,所以我們在看了一圈當時的傳統電視我們認為同樣的理由,我們認為裡面的用戶體驗非常非常不智能,裡面有巨大的提升空間所以我們決定繼續認認真真的做電視和盒子。
我們兩年前也進入了網絡設備,一系列的路由器,在高配的路由器裡面有1T到6T不等的硬碟,其實它是一個數據中心。
接著我們通過生態圈的方式做了更多的用戶生活上需要的產品,比如說智能淨水器,燈、攝像頭、智能插座等等等等,我們在做這個的時候其實是IOT這個浪潮的爆發,其實我們在進入這個領域的時候我們要克服兩個核心的問題。
第一個問題是用戶當時覺得他們傳統的硬體產品其實沒有必要要智能化。更簡單的說法,是這些產品沒有必要去聯網。
第二個就是當時的所謂的智能硬體其實非常不智能,你要把它們弄好,再使用,其實比傳統的更難用,我們當時做了兩個事情去突破這兩個問題。
第一個事情:在我們進入這個領域的時候,如果你要你的智能硬體可以聯網的話你需要一個wifi,加上一個CPU,再加上一些memory,如果你是一個硬體開發商你要加這樣一個的話是60塊人民幣,你聽起來這個數字不是很高,但是我告訴你如果一個傳統的電燈的售價也就是十幾二十塊,一個傳統的插座也就是幾十塊的時候,你再加上一個60塊的Wifi基本上就把它一個一百多塊的產品,這個基本上在市場賣不出去,賣不出去後續的一系列的聯網、智能化基本上是不可能,所以我們進入到今天,我們已經一步步把wifi從當時的60塊做到今年的10塊,你說什麼意思,你要把它做到10塊有什麼核心目標。
其實我們的核心目標很簡單就是如何做到你只要做一個硬體產品的你想都不用想就影響把這個wifi加上去,你想都不用想就是讓你這個產品聯網,甚至你不知道為什麼要聯網,為什麼需要做這個智能功能的話您把這個加上去它才是真正智能化的,當我們做完這些,包括電飯煲都是可以聯網的,全部的電燈、攝像頭等等等等。
第二個事情:兩三年前IOT爆發的時候大家都覺得用戶的使用度不高,那是因為當時大家沒有把應用型做好,我們可以做到這樣的一個使用體驗,你買了一個淨化器也好,攝像頭也好,回去一開箱你不需要看說明書,你只需要把它往電上一插,你的手機就有一個說明,你允許不允許把它裝到你的家庭智能網絡,如果你選是的話,它就會自動的聯入你家裡的網絡,所以我們當時突破這個的時候,我們發現我們的智能硬體不單指它的聯網度非常非常高,真的是接近全量,更關鍵的是它的活躍度也是非常非常高。
3700 萬智能硬體和背後的數據工廠到今天,不算手機,全部的智能設備的出貨量已經超過了3700萬,這個數字未來有可能是遠大過智慧型手機,我們每個人可能是用一兩個手機,但是我們家裡面物理的產品加起來是十幾二十個,只是今天沒有真的被智能化,真的被聯網。
這個是你們關心的,當我們有這麼一系列的硬體產品他們全部都聯網,加上真的是可以產生各種各樣的數據之後呢,我們才有機會建立一個真正的大數據,每天全部的這些剛才我講過的產品是200個TB,我們也為這個數據量付出了巨大的成本,但是我覺得這個是最核心的基礎。我們從產品上進去的第一天我們就知道數據多麼重要,我們通過Wifi把它落地才有可能產生高質量的大數據。
這個其實就是剛才我給你們描繪的,我們全線的產品或者是業務他們的大數據基本上匯總到一個數據工廠,我特別認同剛才楊強教授講的一個點,你光有大數據,其實有可能不但只是沒有價值,因為它給你造成的成本是海量的,如果你存了大量的數據你不能夠發揮價值的話,還不如不存,所以在數據的處理上面我們首先要清晰掉,挖掘,如何用這個數據反過來訓練我們的算法,訓練各種各樣的產品,讓它可以做到真正智能化。
建立用戶畫像當你有海量的數據之後我們意識到,其實你必須要以人為核心,我們花了過去兩年的時間就是在建立一個用戶畫像,當然不同的公司有不同的用戶畫像,在小米我們對用戶畫像的定義其實就是圍繞這個用戶,他不管是在使用手機移動上面也好,或者是在看電視,或者是在家庭使用各種各樣的智能硬體,如何可以充分的把這個用戶的需求還有他的習慣,怎麼樣可以把他的特徵建立出來,只有當你比這個用戶更加了解和需求的話我們才可以為他提供更多的智能服務。
在這個畫像裡面包含了雲服務,MUI裡面的播放器,視頻播放器等等,他們產生的特徵真的是海量的,舉個例子,如果你使用小米多看閱讀的應用的話,我本身是一個很熱愛讀書的人,我認為我的讀書軟體真的要很深刻的知道我讀書的特徵它才可以很好的服務我,我們必須知道這個用戶喜歡哪一類數,他們喜歡哪一類作者,這些作者的哪一部分的書對他們有感覺的,他們是喜歡在什麼時候讀書,是在移動當中,還是在排隊,或者是在一些碎片時間去使用,我覺得只有你去到這樣一個畫像的顆粒度的時候我們才有可能為他提供智能度,如果你只是知道的非常表象,他每天知道閱讀多少次,他已經讀過什麼書,我覺得你只可以做一些很基礎的而且是很粗顆粒的推薦,我認為這個不可以超過用戶對智慧型手機的期望值。
我們今天已經有大概一千個用戶特徵,就是我對我的大數據團隊我跟他們說為什麼這個是一千,而不是一萬,因為我們還沒有把它更多的特徵整合起來。
我做細說一個有趣的事情,我們在建立用戶畫像的時候你會發現高質量的數據會被計算出來,你如果讓一個用戶去填寫他全部的特徵的話,這個是可以但是沒有用戶願意配合你做這樣的事情,怎麼樣可以在他已經有的部分的特徵裡面我們可以通過機器學習到底這個用戶是男的還是女的,他的年齡是什麼,如果可以保證在一個高的準確度,有時候要犧牲到我們的覆蓋率,如果我們不知道計算的精準度的話,我們甚至放棄這個特徵,這個還是回應剛才所說的高質量的大數據,我們可以通過足夠的大數據判斷用戶的性別—如果用手機的話他是完全不會告訴他你是 男還是女的,但是我們的準確率可以接近90%。
通過用戶畫像打擊黃牛用戶的真實性,可能大部分行業的朋友都沒有這個煩惱,但是小米每天都是跟黃牛在對抗的,大家罵我們說是飢餓營銷,是因為我們的產能跟不上,當產能跟不上的時候,我們的小米網上每天有大量的黃牛,他們模仿真的人各種技術手段來在網上搶我們的產品。我甚至懷疑他們有可能在使用深度學習模擬真人,把這個黃牛的工作做得極致。我們在半年前實驗了一把,我們如何用足夠的特徵把一個用戶的真實性判斷出來。傳統黃牛可以通過你的一個或者是兩個漏洞,讓你以為他是一個真實的用戶,其實你是防止不了他在某一些特徵裡面作弊,但是你會發現他不可能在30個或者是100個特徵裡面作弊,整個成本太高了,當我們使用了1000個用戶特徵之後,我們發現我們馬上把黃牛打到下風了。
除了我們對用戶越來越了解之外,我們其實也要對他們關注的內容越來越了解,所以在資源池裡面我們把他們的內容整理,在裡面提取足夠的特徵之後我們可以把用戶的畫像一起放進去我們的積極學習裡面,才可以作出全方位的一些推薦。
大家聽到我講到這裡其實可以知道,要落實一個人工智慧或者是機器學習真的不容易,我講了那麼長的篇幅我們才可以落地產品,才有可能產生真實的大數據。這些大數據之後如何可以被使用,真的把它智能化,這個對於我們這幾年在人工智慧還有機器學習上面,這個行業取得的一些彎道(意為「拐點」)。
產品開發新常態我們再來解剖這個圖,這個循環是未來我們看到的一個新常態,不僅是在過去人們在人工智慧領域的使用方式,應該成為一個新常態。只要你有一個產品,只要你的產品智能度,會大幅度提升他的用戶體驗;只要你通過這個產品產生大數據的話,我認為這個會變成一個新的常態。
首先你必須要有一個好的產品,你的產品必須要有足夠的用戶選擇使用,然後你才有可能開始產生大數據,這個大數據才可以通過機器學習反過去,把裡面智能的功能做得越來越職能,這個智能會提高這個產品的體驗,這個產品的體驗,可以讓更多的用戶去使用這個產品,或者是現有的用戶在裡面停留的時間會越來越高活躍,形成一個正循環,他的學習過程會把這個產品做得,未來一步一步的變得越來越智能。
我為了說明這個規律我就選了兩個產品,這兩個產品你之前可能不會想到有可能會使用人工智慧。
第一個IOT出來的時候每個公司都想做智能燈。但是甚至到今天為止都沒有一個燈是真的符合你的需求:在你想它亮的時候它自動亮,不想它亮的時候會自動關上。這麼簡單的一個需求,你會發現如果做出來真的很難。我們過去看智能燈的做法,如果你想把它智能化的話,你會用很多 Rule-Base(基於規則) 的方式,說只要這個用戶一回家,只要是晚上你就把這個燈打開,只要他一離開家裡一,這個門一打開有一個傳感器,這個燈就會滅,你會發現,如果把它做好,需要10、20個 Rule (規則)才可以把它做得靠譜一點。
這不就是機器學習要解決的問題嗎?你可以想像,機器學習就好像在我家裡面的攝像頭一樣,它只要看見我買了這個燈回來,我開始使用這個燈,使用了2個月,它每天就在那裡看著我在什麼時候會打開燈,或者是什麼時候關燈。是不是晚上回來,家人已經睡了,就不要打開燈,以免影響到家人;是不是有時候你出去倒垃圾你馬上就回來的話,你不要把那個燈又關又開了等等。其實機器只要給它足夠的數據,它完全可以搭配三、四十個不同的「特徵」,加上 Wi-Fi 連接的狀態,加上時間狀態,加上你自己在家裡走來走去的狀態,它就可以真的做一個智能的燈。這個是第一個例子。
(第二個例子是)手環,我們投資的生態公司做的手環,它是比較準確。但是其實要把這個算法做出來裡面真的是很困難的,去拍腦袋把這個算法做出來它才知道你在走路,這個動作是走路的動作。如果它想把這個動作做得更精準,或者是有不同的運動的方式,比如說跑步、跳繩、爬山、騎自行車,每個都要拍腦袋去做這個算法的話,我覺得這個是可以反人類的事情。我們可不可以最開始讓它做基礎的功能,因為通過大數據,我們知道他是在爬山、在跳繩、在騎自行車,我們就可以判斷他那一類的動作就是在爬山,在跳繩、在跑步。
你會發現好像我們做的某一個產品,都需要有這樣一個規律,才有可能達到真正的智能化。所以這個剛才已經提到過了,我們對數據的處理能力,哪怕是把一個燈做好你要處理甚至是上百個特徵。您會發現,你要處理的海量的數據是巨大的。這個數據爆發的時候,我們在這上面的投入也會越來越多。如何把這個數據使用好,當你有了這個數據之後,如果可以把它開花結果,真的通過深度學習把它落地到我們每個業務裡面。
你看見小米的業務,其實跟你們想像的人工智慧的理解,可能不完全一樣。它們都是很傳統的網際網路業務,比如說搜索、推薦、金融、廣告、雲相冊、智能助手,其實它們跟你們想像的 AI 不見得是完全一樣的,但是他們都可以得益於深度學習。這個就是,我覺得人工智慧和深度學習這幾年的突破,對我們這個行業的貢獻。可能,遠遠不止大家理解的語音、圖象處理。有可能是在每一個需要算法的應用和產品裡面,都能用得上。這才是機器學習對我們最大的意義。它完全改變了,我們一個工程師如何做產品的方法論。
從人機互動到內容推薦但是,確實,深度學習對視覺還有語言上面的突破,真的是讓我們有機會,可以做一些新的人機互動。在人機互動上面,真的可以把人工智慧做到無處不在。之前的張宏江博士幫我們打了很多廣告,我們在人臉識別,學術界研發了很多才有了這個成果。我們去年把它用在面孔相冊上面,效果真的很好。用戶有這樣的口碑分享的話,這就是我們做小米的原因,用智能化感動到每個用戶。在這個面孔相冊推出之後,到今天這個相冊還有使用它的功能的,已經達到了總用戶的1.5億。我們的照片的存儲量已經是500億以上,每天上傳的照片是1.5億,這個量是海量的,我們可以通過新的產品把這些量給發揮出來了。
自然語言處理。過去大家一想到這個,會想到你是不是要做聊天機器人,或者是語音識別,大家對這個的理解有誤區。我們做這個兩年時間。我們為什麼要做這個,我們是要把我們各個應用裡面的內容推薦和搜索,可以做得更極致。其實跟一個搜索公司裡面,為什麼要用深度學習,來把它的搜索結果優化,是同一個道理。我們只有知道了用戶的真正的意圖,知道了裡面的內容的不同的特徵,可以分析到文本的特徵的時候,才有可能把這些應用做的真的是智能,所以我們在小米視頻的信息流裡面大量使用了機器學習。只要某一個業務使用了這個效果好的話,它就可以很快的遍地開花。
他們的用戶畫像,又回到我們核心的用戶畫像裡面,把它做得越來越大。我們遊戲的信息流都是基於機器學習的。我們的內容推薦,我就不一一的介紹了。全局搜索,那個規模已經越來越高,我們把機器學習和深度學習使用了之後,它的轉化率和日活躍度會越來越高。這就是為什麼網際網路公司非常堅定的投入深度學習,因為它的效果是立竿見影。甚至是我們的電視都有一個按鍵,一按就可以說,幫我找最新的《奔跑吧兄弟》,直接播放,還有我們智能家庭裡面的智能攝像頭。
總結:把人工智慧帶入生活其實在過去的6年,我們很有幸的零距離的看見了幾個技術和產品的彎道(意為「拐點」)、爆發。從一開始的移動網際網路的爆發,基本上帶動了有可能每個用戶使用了他們第一個智能設備的手機,再到兩年前的IOT的爆發。直到現在的人工智慧,我覺得這幾個爆發和彎道(意為「拐點」),真的是我們整個行業的幸運。
但是我覺得那個目標依然是很清晰的,而且從來沒有改變過,就是我們有那麼多的技術的彎道(意為「拐點」),到最後其實我們的目標,依然是如何可以把產品,用戶真的需要的產品裡面的功能做得越來越好用,然後這些功能至少對於小米來講,我們的目標是希望把這些最前沿的功能帶入到千家萬戶,而不止是高大上的用戶可以用到。
我們希望跟行業裡面的科學家、專家,還有工業界的合作夥伴一起,看看在我們這一代裡面是不是可以落地人工智慧,把人工智慧真的是帶入到家庭的每個角落,無處不在。我在我的客廳裡面不用搖控器就可以控制電視,在我的洗手間裡面就直接跟我智能音響,直接告訴它現在要去哪,然後它自動下單,或者是我的冰箱會直接的講我沒有雞蛋了,然後它就可以下單。這是第一步。第二步,在我沒有說時候,它會自動的預見,做推薦,或者其他智能服務,如果是能做到,人工智慧是真的做到了生活上面。
我擔心的不是奇點(Singularity),不是人工智慧如何統治這個世界。我擔心的是,如何在我們這一代,工業屆和科學界一起,利用我們的技術把人工智慧帶到我們的生活。(完)
雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。