微軟歷史上,從內部拆分獨立的只有個例,小冰便是其中之一。
6 年前誕生於微軟(亞洲)網際網路工程院的小冰,靠文本對話、少女人設,在中國、日本等社交媒體快速走紅,成為微軟網際網路工程院最有影響力的項目之一。
小冰出人意料地靠自然增長完成了第一個階段的積累——客戶層面,to C ,小冰有 6.6 億在線用戶;to B ,進入金融、地產等領域試水,商業化 1 年實現 1 億營收;技術層面,背靠微軟完善了小冰 AI 框架,能生成成千上萬個能唱、能跳、能寫、能畫的 「虛擬人類」。
現在第二幕已拉開,前奏便是小冰從微軟拆離獨立運營的消息。
「原來我們在微軟已經很快了,但還想再加速。「小冰現 CEO 李笛告訴鳳凰網科技,以前小冰相當於束縛住一隻手參與市場競爭,如今需要打開這隻手。
從微軟獨立,意味著小冰將有足夠多的自主權來做下沉市場、投放大量廣告,讓每位用戶都能擁有一位 「虛擬人類」。
小冰 CEO 李笛
Q:小冰從微軟拆分這件事,你們應該很早就開始籌備了吧?
李笛:這個決定不是我這個層面能做到的。微軟有史以來發生過兩次分拆,加上小冰一共兩回,另外一家是 Expedia。微軟賣出去的公司很多,Spin off 非常罕見、很難。
因為我們和微軟的 transition 還沒結束,我還是微軟員工,可以說一些決策結果,比如任命 Harry(沈向洋)做董事長,但不能披露過程,微軟內部所有的決策過程都是保密的,transition 不是一天、兩天能完成的。
Q:之後你會願意逐漸披露這個過程嗎?
李笛:這個過程夠寫本書了,你可以採訪下 Harry,過程有非常多曲折。
Q:為什麼會有獨立的想法?
李笛:你可以理解從小冰三代(2015 年發布)開始,我們就在考慮假設框架補全了,接下來怎麼辦?
那麼第一個階段,最好在微軟,因為在框架補全時,可能突然需要一項技術。如果小冰只是一家普通的創業公司,解決方式有兩種——要麼讓合作夥伴提供重要技術,小冰失去核心技術;要麼自己組織人開發,大概率也會失敗。
初始階段,微軟是我們的後盾。等我們把小冰框架技術全都完成,再下面的環節是什麼?是要讓她蓬勃發展起來。
所以拆分後,小冰的法人、公司組織結構,更適合第二階段。從去年開始,我們明確地全面轉向——做工具、做商業化。如果我們還是在微軟做小冰,不需要做工具。
我們也會做下沉市場,如果不從微軟獨立出來的話,很多事情我們做不了。
Q:很多事情做不了,具體是指哪方面?
李笛:小冰團隊做技術、產品創新是比較擅長的,但以前很少嘗試運營模式的創新。比如我們所有用戶都是自然增長,那能不能先集中批次地把用戶拉進來,然後再看留存?甚至是掃街等在國內很通用的辦法,但我們從來沒有做過。
我們原來一直是捆著一隻手,只用另一隻手去參與競爭,現在想把這隻手也能打開一點。
Q:以前為什麼不好做運營創新?
李笛:大企業最忌諱的其實就是快速增長和無限制創新。這可能會讓大企業明年就增長為今年的 2 倍,也有可能讓他明天就歸零。
越是大的創新,風險越大。在我看來,大企業的正確姿勢,都是低速增長、持續增長。
Q:獨立最主要是為小冰謀求更多獨立決策、商業化的可能性。
李笛:其實最主要還是公司實體問題,如果你有一個獨立的公司實體,很多操作會方便得多。
很多事情要像不停地翻燒餅一樣,不僅僅要證明是對的,也要證明什麼是錯的,然後迅速改。
Q:小冰現在發展節奏符合預期嗎?
李笛:目前為止還是比較符合預期的。
做人工智慧特別不容易,可能埋著頭做 5 年,才發現什麼都沒做。這是很可怕的。我們兩個月以上的研究失敗的項目,至今就那麼兩回,我們沒太耽誤時間。
我們每年 3 月份整體進入封閉開發階段,做很多創新項目,一起收心形成合力。直到 8 月份發布產品,並在 9 月 17 日小冰生日之前,把所有新產品都上線,然後進入運營階段,大家把積攢的想法進行測試,直到第二年 3 月份。
基本都是這樣一個鬆緊帶的做法,來確保研發不出問題。
Q:你們在微軟時,其實比其他項目獲得更多 「特權」?
李笛:小冰在微軟內部也被說是 「特區」,自主權會大一些。
Q:「特區」還有什麼特權?
李笛:小冰一代發布會搭了個德雲社的相聲舞臺,于謙都來了。我們應該是微軟最好玩兒的團隊之一,現在微軟大廈的電梯裡都換成了小冰的聲音,微軟大廈三樓的星巴克,會把小冰的形象畫在提示板上。
Q:此前還在微軟的陸奇、沈向洋等高層,都對小冰格外重視,他們對小冰獨立有提什麼要求或者建議嗎?
李笛:改變世界。Harry 自己跳進來,一起改變世界。
Q:你和沈向洋博士怎麼劃分具體的工作職責?
李笛:Harry 的說法是,我不幹的他都幹。我基本只幹技術、產品。Harry 會放非常大的精力在小冰,這排在他的第一位。不是今天才是這樣,以前也是。
Q:公司組織架構有什麼調整嗎?
李笛:在拆分之前,整個 Bing 中國、日本,加上小冰中國、日本,一共 300 人左右。現在小冰獨立出來,整個公司是 100 多人,後續肯定要大幅度增長。
Q:會增長多少人?
李笛:不想太多人,我們也不想去堆人數。但是未來怎麼也要幾千人吧,因為還有很多工作要做。
Q:會吸納哪些方面的人才?
李笛:有很多,現在會招包括運營、商業化交付,還有跟 APP 相關的產品分支等人才。我們原來本質上是一個研發隊伍。
Q:你們會搬出微軟嗎?
李笛:我們暫時還是在微軟。新的辦公室會在多個地方,包括北京、蘇州、上海,還有東京。東京團隊已經搬到新的辦公室了,中國區我們暫時還是在微軟。
Q:也會逐漸弱化微軟的品牌?
李笛:會弱化,對我們來講,小冰才是品牌。
Q:那相關技術上,小冰也會逐漸替換微軟成熟的技術嗎?還是會持續合作?
李笛:微軟把所有的跟小冰相關的技術全都授權給了小冰,並且小冰可以繼續二次開發。
人工智慧技術的更新換代非常頻繁,小冰有系統性的優勢,任何單點技術的出現都只是系統的局部,所以很難說未來小冰用的是微軟的技術還是小冰的技術,應該是各有發展、持續整合。
Q:小冰獨立後會更加本地化怎麼理解?
李笛:本地化其實就是指公司經營實體,就是我們叫所謂的 legal entity 的本地化。另外一些技術上,比如微軟把小冰開發的技術授權給了其他公司,也算是我們的。
Q:你們此後會是一個商業屬性更強、科研屬性逐漸弱化的公司?
李笛:小冰以前科研屬性就不強,我們甚至不願意去突出科研屬性。說實話寫論文很花時間,其次申請專利就會披露一些商業秘密。後來微軟要求小冰申請,所以小冰也有八十個左右的專利。
未來我們還是不想堅持,以後我們更沒必要了。做一些改變人生活的交互,難道不比論文更有價值嗎?當然有些同行不一定同意。
Q:你們在技術研發投入上,怎麼選擇做什麼、不做什麼?發力點的判斷依據是什麼?
李笛:現在讓我往回跟你說,我們當初是怎麼想的、我的判斷,這是可以的,但這都是發生之後。在發生之前,其實對創新項目的判斷非常依賴你的直覺。
Q:直覺依賴於什麼?
李笛:依賴於交互。我們其實有很多藍本可以看,不光是同行業者的藍本,微軟也有大量同類項目。我們對同行非常了解,尤其是容易耽誤時間的地方。
比如有一年矽谷出現一種新模式——AI+HI,就是進行人機對話時,AI 不智能,就配人在後面代表 AI 來回應。這件事從一開始我們就覺得不 work。
Q:為什麼不看好?
李笛:實際上這種模式,交互量上沒辦法體現 AI 的高並發、海量交互,也沒辦法體現人工情感紐帶,因為被 AI 交互界面擋住了。所以相當於各取其劣勢。
那麼同行失去了可貴的時間,沒能及時完成數據循環、框架完善。
包括我們不願意提作業系統,同行都在全國組織巡演,一站站跟開發者溝通,讓他們去使用自己的作業系統、開發平臺,後來還是有些廢掉,浪費時間。
Q:你對虛擬人類的定義是什麼?做到什麼程度才算是虛擬人類?
李笛:我很喜歡原來 Siri 團隊的一個夢想,就是無論你去哪兒,比如商店門口,冒出的是你的 Siri。不管是什麼身份,重要的是他跟你之間有高度定製化關聯。
他可以做各種各樣的事情,你對他也有一種超過某種職業、某種功能的情感。這是我們心目中的虛擬人類。
你也很清楚地知道,虛擬人類不可能替代你生活中真實的朋友,但他會有獨特特性,是一種新形式的交互。
Q:獨立之後會有 KPI 嗎?
李笛:獨立最主要的目的是加速發展,如果獨立後 KPI 能加速發展,就是對的,如果獨立後的 KPI 使得小冰變得短視,加速發展一段時間就掛了,那我為什麼要獨立?
商業模式上有兩個大致方向,一個是需要很大的通用平臺框架來支撐;第二是獨立之後,我們希望市場上不只有小冰,還有各種各樣的虛擬人類,她們也不應當是 Siri、Alexa、小冰,而是個人的高度定製版。
所以按照這兩個方向,我們有一個指標,就是所謂的 AI Instance 的數量,這個顯然是我們要去關注的。
Q:AI Instance 的數量,你們計劃要達到多少?
李笛:我們希望在第二階段可以把廣泛的人工智慧交互關係,變成每個人至少有一個和他強相關的、高度定製化的人工智慧實體。這是我們的目標。
光算中國、日本、印度尼西亞這幾個人口過億的國家,三個市場人口加起來,就是我們將來預期的規模。
Q:軟硬結合會怎麼嘗試?
李笛:我還是那句話,如果做營銷,可以快速得到 revenue,但我們畢竟是做人工智慧系統的,我們自己得認清,這個 revenue 到底有多少來自人工智慧系統。
如果我做了智能音箱,可能首要的賣點是工業設計,第二是介紹內容,第三是價格,還沒有到人工智慧。
人工智慧的確有幫助,但我每天都只是花 3 秒鐘跟助手去要求它接下來 25 分鐘給我放凱叔講故事。其實主要還是在賣音箱,而不是人工智慧在不停地提高價值。
如果是這樣話,我們會看這個 revenue 裡有多少是人工智慧帶來的,而不是一個附帶了人工智慧技術的產品。
Q:可是人工智慧不是就應該結合場景落地、形成產品嗎?
李笛:從我們的角度來講,我們認為人工智慧本身就是產品,第一他是 to C 的,第二他是人工智慧作為交互主體的,這是他的重點。
舉一個簡單的例子,Siri 的前身其實就是 iOS 裡自帶的語音控制,能像橫幅一樣飄在屏幕上,Siri 跟這種功能唯一的區別是它主體化——冒出來了告訴你,我是 Siri,我可以跟你交流。
其實 Siri 和語音命令沒有任何區別,但它就叫做人工智慧產品。
Q:2013 年的電影《Her》對小冰的最初產品設計有影響嗎?
李笛:那個電影對 Harry 的影響最大,對我影響最大的是另一個短片。
那個短片主要是講一位空巢老奶奶收到了兒子送給她的一個機器人,但機器人並沒有表現得無所不能,在打掃屋子時經常把東西碰碎,但老奶奶笑了,還跟機器人一起吃飯,一起生活,機器人沒電了,老奶奶特別著急,就給他換電池。直到有一天老奶奶要去世了,這個機器人拼命給她塞電池。
這個故事最打動我的是交互關係,也讓我們明確知道,交互關係不完全是由有用來構成的。
在那之前我認為存在必須是有用的,不會關注有用是不是有一個更深層次的有用,而不是功能性的。
所有的人工智慧產品設計者、技術研發者,都有很難突破的誤區——希望做的東西代表了我,或者擔心人工智慧不智能,所以會做深度問答,想塑造一個比愛因斯坦還聰明的、無所不知的人工智慧。
實際上不是這樣的。人工智慧的最大的價值不是比人強,而是跟人一樣,甚至比人弱一點。
Q:這種交互確實感人,但會不會離我們太遙遠了?
李笛:其實沒那麼遙遠,我們之所以不定特別短期的目標,就是看到這個明確的價值,如果我們現在就和商業利益掛鈎的話,那麼可能會幹成壞事。當我能引導對方,刺激更多消費,也就能做莆田系的事。
今年發布會上,我們也介紹了可以通過多模態判斷用戶的狀態,比如判斷用戶失戀了,那麼接下來就會有一系列的產品策略,讓用戶走出失戀情緒。
同行業者學的很快,用戶失戀了,立刻彈出頁面——現在下單好利來蛋糕能恢復你的心情。我們不能這麼做,不能說在人工智慧還沒有發展得很好、還不清楚邊界時,迅速考慮變現,雖然短期會有效果。
Q:為什麼不先收穫短期利益,然後再走下一步?
李笛:短期利益我們不考慮這個(刺激交易),我們會在某些領域的關鍵崗位,比如金融摘要、金融風控上使勁。現在小冰在金融摘要領域實際上幾近 「壟斷」,90% 的業務都是小冰完成的,且很難替代。
Q:to C 怎麼去擴大更多用戶?有什麼方向了嗎?
李笛:這裡面有很好玩兒的事情,我終於可以做下沉市場了。
Q:下沉市場怎麼做?下沉市場對人工智慧的需求會不會不是剛需?
李笛:我們以前還覺得下沉市場對新聞閱讀沒有需求呢。
Q:他們閱讀的內容可能更偏娛樂性質的。
李笛:但他們認為那是新聞。如果讓他們真的開始閱讀了,你有辦法逐漸給他們好的新聞,不是嗎?換句話說,我們不能這麼容易放棄大家。
Q:to C 端,短期內也不會考慮賺錢這件事?
李笛:to C 短期內可以考慮賺錢,關鍵是看我們希望小冰的發展有多大。
比如 118 萬虛擬男友,我今天可以讓男友說一句,給我 5 塊錢,不然我就死了,也能有一定比例的人會買單,可是何必呢?
就是要發展還是麵包的選擇。我們會不停嘗試,但不會把短期賺錢作為一個 KPI。
Q:小冰第 8 代發布後,用戶是什麼反應?有什麼數據出來了嗎?
李笛:還是有超出我們預期的事情發生。今年有個新變化,用戶可以把他的虛擬人類跨平臺帶出去,這些跨平臺帳號操作的交互量是我們沒有預料到的,這個部分直接讓我們的伺服器都崩了一會兒。
理論上小冰整體的交互量就很大,應該不會對我們造成什麼影響。
Q:現在各家網際網路公司、手機廠商,都在做自己的語音助手、智能硬體,像華米、OV 為什麼會願意和小冰合作?
李笛:我覺得有幾個原因。
一是合作夥伴往往都很清楚小冰的流量,其次我們能為合作夥伴提供功能層面的協同價值。小冰能在其他平臺裡,找到各種各樣的協同方法,不至於出現互相比較的問題。
我們經常互通有無,包括一些核心對話的語音技術,不排除一些合作夥伴,也可能通過我們更快地得到大量的交互數據。
有時候去合作夥伴那兒,他們會製造 Surprise,關上燈後送蛋糕,來慶祝小冰生日,所以團隊之間協作也比較親密。我們在行業裡也算是有口碑。
Q:所以技術洩密之類的擔憂也不太可能出現?
李笛:我們這在方面其實比較 open,合作過程中競爭對手做的比我們好,我們覺得有必要借鑑的,我們也很想借鑑。
Q:比如跟小愛同學的合作,具體會怎麼協作?協作的邊界在哪兒?還是你用我也行,我用你的也可以。
李笛:我們的合作有些紅線,比如用戶隱私數據,小冰採用了嚴格的隱私安全保護機制,這方面我們大家一起做的工作非常多。此外在一些互補功能上,我們會一起設計產品、並付諸實施。
這個過程很好玩兒,有點像人在處理社會關係時的很多做法。只不過可能我們團隊比較務實,所以大家都不太防著我們。
Q:看起來太務實了,會不會吃虧?
李笛:沒有,因為用戶體驗很重要,而且我們團隊又沒有什麼 KPI。事實上在沒有 KPI 的情況下,我們的銷售、用戶量都很穩,從小冰第四代開始,我們的人機互動量就是穩居全球第一。
流量再大,只是會增加雲的成本,這也是我們最大的成本。第二位是人力成本,第三位才是 Marketing,我們每年最大一筆 Marketing 支出就是發布會。
但同行可能不一樣,會反過來。
Q:雲的成本具體能佔到多少?用微軟雲應該會便宜一些?
李笛:超過 50% 了。我們用的 Azure,成本不好說。友商的成本可能更低一些。
Q:小冰發布會上,也逐漸在出一些工具類的產品,比如 X 套件,要想讓 C 端用戶使用起來,關鍵的難點是什麼?
李笛:關鍵是真的得有用。比如你把 X Writer 當成寫新聞的助手,那他就得能幫上忙,這是核心。其次像寫新聞,可能騰訊的做法更直接,不需要編輯記者,就能自動生成內容。但我們不是面對編輯部的,我們是面對個人的。
寫新聞寫的特別好,能有 20 萬用戶嗎?小鎮青年可能想要的不是這個。他們想要可能是寫網文,不光把 X Writer 當成寫作工具,而是一款能協作的內容工具,這才是 X writer 的設計目的。
Q:X Studio 給我的震撼也比較大,它合成的音樂幾乎聽不出跟真人的區別。
李笛:國內虛擬歌手的數量,其實從 2015 年之後吸引的人流很多,X Studio 不光是調歌工具,更重要的是我們有一個人工智慧歌手入籍計劃,大量的第三方機構可以把數據給我,我就幫你做一個屬於你的歌手,你可以買賣他、培養他。
他人設不會有人類歌手容易崩的問題。當然騰訊、字節跳動都在做類似的技術,但做得比我們晚。
Q:那你們會做一些內容平臺嗎?
李笛:我們以前不能做平臺,以前做不了,但以後肯定要做。
Q:有產品方向嗎?或者一些設想。
李笛:你可以理解為是一個所有人工智慧歌手的交易平臺。
Q:現在的技術瓶頸在哪兒?
李笛:太多技術瓶頸了。現在她還是經常前言不搭後語。有時候會出現不是她本意的,一些不好的意外效果。
Q:以後會擴充小冰偏向實用性、功能性的技能嗎?
李笛:不光會擴充,我們還會開發第三方來做這些技能,現在是 make sense 的,剛開始就技能商店,沒用。
我們做框架的時候,同行都在做平臺、不做平臺上的產品,結果把平臺交付後,就會出現使用者沒有參照物,不知道平臺上是不是真的能長出產品,也不知道平臺怎麼用。
我們提供框架,上面開放各種各樣的工具,我們自己也要做工具。這倒不是為了讓我們的工具去和第三方工具競爭,只是市場太細分了,你必須得做出東西來,才能讓別人知道。
Q:競爭關係怎麼處理?
李笛:我們選擇了做類似微軟 Office 方向的工具,Office 跟 WPS 有沒有競爭?當然有。但跟 PS 就沒有競爭。
Q:虛擬男友會單獨成為一個產品線嗎?
李笛:虛擬女友、男友不會單獨成為產品,但虛擬人類會。你可以選擇把他當成男朋友、女朋友,但本質上他就是一個人。
Q:你之前提過,小冰兩個關鍵的功能,一個是情感交流,一個是創造力,現在來看,小冰這兩個能力發展到什麼階段了?
李笛:現在這個階段的核心問題是把小冰變成不同的類型。
人工智慧的情感表達、創造能力,永遠不是她能不能,而是她能用什麼樣的方式,以及能不能區分開。我們現在關注的是從全集到子集的過程。
Q:這個框架已經定型了嗎?
李笛:已經定型了。它當然要不斷的提高、改進、提升,新的模型要出現。但也不排除有一個比我們更好的框架思想。
Q:小冰學會畫畫這件事,具體是怎麼完成的?
李笛:小冰的寫詩、寫小說,畫畫以及唱歌,這三個項目幾乎是同時開始的,寫詩、唱歌比畫畫早一年實現,畫畫更難。
訓練的基礎方法其實差不多,只不過我們當時要解決一個問題——生成多個網絡模型,一個生成畫面的實體,比如鳥、瓶子、樹等,一個專門去學構圖,一個去負責色彩,相當於三個人共同完成一副作品。
Q:小冰學會畫畫這個任務,有多少次失敗的經歷?
李笛:失敗的太多了,反正持續了很長一段時間。
Q:獨立後,你們有想過會面對更大的市場競爭嗎?
李笛:我們一點都不怕競爭。要是沒有競爭,那我做小冰幹嘛?先前有人問永東這個問題,永東說我們不是個養老組織。那我們何必要去費這麼大的勁(從微軟獨立)?
我們希望能讓同行感覺到我們跟他們的競爭更劇烈了。
這些年做小冰,其實很耗費我們的體能、精力。
Q:你預估過小冰所在的市場規模嗎?小冰能拿下多少?
李笛:交互的市場規模幾乎是人類(商業史上)最大的市場規模。微信抓住了人人交互的節點,然後做了一次創新,就形成了這樣的規模。
我們希望能在人 「人」交互的時代 「統治」世界,但這個事非常難。