文/時代財經史成超
微軟小冰是陸奇在微軟做全球執行副總裁時拍板的項目,也是微軟另一個全球執行副總裁沈向洋最愛的「孩子」。在沈向洋治下,小冰在微軟(亞洲)網際網路工程院誕生並壯大,成為巨頭微軟裡屈指可數的孵化於國外分舵的重量級產品。
然而,繼2016年陸奇從微軟離職之後,沈向洋也於今年11月宣布離任,最有分量華人高管的離開,會讓小冰會失掉她的高光時刻嗎?12月6日,時代財經走進微軟亞太研發總部,與負責微軟小冰產品工作的彭爽聊了聊微軟小冰目前的規劃、壓力和期待。
彭爽現任微軟(亞洲)網際網路工程院小冰產品負責人。2014年起,她參與微軟小冰的項目孵化,肩負起微軟小冰產品團隊的職責,帶領團隊開展人工智慧產品和技術的研發,並建立了基於人工智慧的新生態環境Dual AI,與騰訊、小米、華為等多家合作夥伴建立合作並發布產品。
微軟(亞洲)網際網路工程院微軟小冰產品負責人彭爽
人生角色變化為彭爽帶來諸多職業靈感。項目冷啟動伊始,她意識到女性情感視角對產品早期情感計算框架的幫助,並將這種優勢應用於早期模型訓練。如今作為一名誕下可愛雙胞胎不久的職場媽媽,新的視角為她做兒童教育類產品打開了新的大門。
以下為時代財經對彭爽的專訪實錄:用多模態解決情感化探索的割裂
時代財經:每年小冰都會對外發布新一代產品的變化,公司內外預期會不會帶來很大的壓力?
彭爽:確實很大。具體節奏是這樣,每年春季開始做今年的發布會早期計劃,大概4、5月份進入封閉開發狀態。這時候目標會比較明確,把所有的人力、物力聚焦在這幾個重點方向上面使勁往前衝,目標是7、8月份可以有幾個明顯的交付。
當然,我們自己肯定有更長久的方案,可能方案裡面20%~30%沒有做出來,沒有關係,還有剩下的70%~80%可以說。但是每年的壓力都挺大。
時代財經:對你來說壓力最大的事情是什麼?
彭爽:整體長期來看,會越來越需要新的方法來尋求更多支持。因為小冰這個產品比較獨特,是一個從中國做起來的產品線,這樣的先例不多。
雖然中國市場已經很大了,但在美國說起微信、微博,大家還是會說,就是那個像Twitter的東西,因為他們並不能親身體會(產品的市場價值),需要一個美國本土的東西來呼應。
時代財經:Dual AI對小冰的產業化和商業化有什麼促進作用?
彭爽:小冰是通過Daul AI的方式登陸到合作生態平臺上的。一方面,跟用戶交互能產生數據的積累,另一方面可以起到示範作用,讓合作夥伴或者其他人看到,原來小冰可以做到這些,他們也就會信任我們的Avatar framework可以促使他們自己或第三方AI在情感交互做到類似的程度。
時代財經:「多模態」產品未來的形式是怎樣的?會不會是明年迭代的重點?
彭爽:多模態確實是越來越熱的方向,而且(AI產品)最終的形態一定是多模態的。因為交互這件事情,在人和人之間,本來就是多模態。所謂多模態,是既有視覺感官,又有語音感官,人工智慧發展原來是按照技術行業劃分,發展到一定階段就開始融合。
我們其實很早就開始探索,情感化的表達除文字交互形式外,怎麼通過語音交互體現出來。但之前的探索還是相對割裂的。一個更加低落一些的情感信號傳到語音,聲音就會更低沉,速度會更緩慢,但這其實是一個割裂的信號,因為這個信號和說的內容並沒有直接聯繫起來。
人並不是一下從這句或者這個字開始,聲音就慢了,就開始喪了,而是潛移默化融合在語言裡面,這個過程是一個多模態。相當於同時考慮NLP的輸出和voice的輸出,還要考慮這裡面誰是主導,誰是配合,當然加上視覺會更複雜。女性情感視角幫助產品冷啟動
時代財經:作為兩個1歲多孩子的母親,你平時是怎麼平衡工作和家庭的?
彭爽:我完全不能回到生小孩前的工作節奏,如果稍微晚一點回去,例如9點以後到家就看不到他們了。時間的平衡上,我還在學習和摸索,畢竟產假回來也才不到一年的時間。
一方面我會促使自己換很多的角度,比如我工作的方式、節奏和團隊合作的方式會做一些優化和調整,另一方面我看很多東西的感覺也會不一樣。
時代財經:視角的改變會對產品規劃有影響嗎?
彭爽:以前我們做小冰講故事或者一些陪伴型產品,會感覺我是一個鄰家阿姨。現在完全不一樣,會有一個更明確的對象在你面前,同理心、代入感會更強。
站在鄰家阿姨的角度,這個產品可以像平板電腦一樣塞給孩子玩,孩子玩了,家長放鬆了,就解決了看孩子的問題。但有了孩子會發現,這個事兒特別糾結,你不想讓他長時間看屏幕,但你確實有時候又很累,你希望他轉移一下注意力。
我也在學習過程當中,以前我們想到兒童產品,會想到第一把家長解綁,第二有教育意義,第三訓練好習慣。其實真正站在家長角度,就會很清楚有一部分功能其實你不希望有任何一個人替你做。
所以我們希望提供跟你配合起來的產品。例如你希望有一些內容在需要的時候幫你整理好,或者保證寶寶現在聽一會兒英語內容,再聽一會兒兒歌內容,或者我們倆現在聊個天,你給我個主意我們聊點什麼。
時代財經:小冰在產品中怎麼發揮這種優勢?
彭爽:小冰能做的比其他產品都好的是,它不是一個單純只有內容的播放列表,像播單一樣,而是帶交互的,而且交互可以雙向。市面上有很多偏教育型的產品,是跟著讀red apple,留個空檔讓小寶寶讀,但小冰是真的能夠跟對象進行交互,甚至能夠根據交互內容進行反饋。小冰可以協助寶寶成長,她是有智慧的,而不僅僅是一個規範俗成的東西。
時代財經:你曾提過女性視角在情感計算方面是有優勢的,這種優勢是怎麼表現出來的?
彭爽:我能明顯看出來在團隊裡面,從女性視角的輸入,特別是在情感理解上面的輸入,對冷啟動有非常大的幫助。我今天不舒服,如果有人跟你說多喝熱水,這在女生那裡絕對打分是不及格,但在很多男生會覺得挺好的。
人工智慧是算法驅動,核心算法是通過大量的訓練樣本訓練模型,使模型可以按照樣本規範進行理解和深度操作。我們做情感化交互的時候,其實需要判斷情感方向是什麼。簡單來說,就是對話中我說這句話合適還是不合適,因為不是任何一個人都能分辨出什麼樣的回答很貼心,什麼樣的回答很一般,甚至可能說出來就別做朋友了。
「直男」對這些東西就特別不敏感。所以在人工智慧的算法最早期,很多女性判斷標準會起到關鍵作用。這一點可能大家以前不會那麼想,或者沒有親手做,你不經過這個過程就不會這麼覺得。
時代財經:女性的優勢在人工智慧時代會發揮的更加充分嗎?
彭爽:往前到工業革命、信息技術革命,其實在做的一件事情,是把人從重體力或者需要體力的勞動中逐漸解放。所以男人和女人的區別,甚至大人和小孩兒的區別會越來越小。
我覺得人工智慧是繼續往這個方向去做。所以人工智慧最終的方向是更容易把你的想法、你的創意實現,而不僅僅是你有了想法和創意,還要學習非常多的技能或者其它長期訓練,才能把它實現。
所以我覺得可能本來不是女性特別擅長的事情,就可以規避她的劣勢,或者更好發揮她的優勢。整體來講,男性和女性會沒有那麼大區別。AI產品與技術的邊界會更模糊
時代財經:很多網際網路團隊是產品為導向,像直播、視頻、社交等。但人工智慧尚處於摸索階段,存在很多技術限制。這種情況下,團隊裡技術和產品之間的關係是什麼樣的?誰來提需求,誰來推動呢?
彭爽:以產品為導向隱含了一個點,就是需要的技術大部分已經成型。所以他思考的是我要完成什麼樣的東西,工程研發人員思考的是選哪些現有技術進行優化。
人工智慧的產品與上述產品最大的區別是有很多技術是在研發的,並沒有成型,所以我們會基於技術的先進性和局限性,有針對地設計產品。
例如,當我們去包裝一個跟圖像視覺能力相關的產品時,我們想了很多。人工智慧的模型能力在於根據海量數據渲染出不同模型,我們據此想到顏值的判斷因人而異,從這個角度出發,包裝出來所謂「不同人有不同的顏值觀」。所有競品都能做出給顏值打分,但當我們去打分時,我們會告訴你,你是日本青年人最喜歡的一類臉形,或者你是歐美人最喜歡的臉型。
總結起來,人工智慧方向產品發揮的橋梁作用,第一是契合了用戶對這個事情的認知,也讓他從體驗上更完整、更有趣,第二是能充分發揮背後這個技術的優點。
時代財經:人工智慧領域的產品人員怎麼去加強這種能力呢?
彭爽:還是得理解技術本身是怎麼來的。就像剛才說,你理解它是從什麼樣的數據集訓練得出來的,在什麼樣的邊界可能會有問題,這個東西可能是移動網際網路的產品經理不會太在意的。甚至我知道很多公司的產品經理,完全對技術不需要任何了解。他會表示,我不需要懂你的技術怎麼完成,我只要告訴你做123就好了。在人工智慧時代,我覺得這個邊界需要再模糊一點。
時代財經:整個科技行業,包括國內的華為,海外的谷歌等,都會有關於「年齡歧視」的討論,即隨著員工年齡增長,可能會喪失一些職場優勢。你怎麼看待這種現象?
彭爽:從從業人員的角度,這個問題更本質的是在超過一定年紀之後,公司提供的繼續成長的空間是不是還在?
剛剛入職的時候,這些企業很容易招到資質好的名校畢業生,他們有很好的專業基礎,頭幾年大家成長很快,但不斷累積的過程是一個金字塔,不可能人人平等。
當行業處於快速發展的階段,整個「大盤子」都比較年輕,越往上走,行業裡的人和行業期待人的發展速度會越來越有差距,這個差距帶來很多問題,有的是企業解決不好的問題,員工個人也會遇到挑戰。
說實話,我沒有答案。對個人來說,只能不斷提醒自己,我得持續學習,持續成長,思考怎麼去發揮更大的價值。
時代財經:你在微軟已經工作了14年,是什麼吸引你一直留下來?
彭爽:其實還是因為一直在做比較有意思的產品和方向。因為微軟足夠大,我不是一直在做一個東西,基本上3、5年會換一個方向。但做小冰的時間比較長,因為小冰自己的衍化性特別強。
我不用更換公司平臺,就可以一直尋找自己喜歡的方向來做,何樂而不為呢?
時代財經:你最理想的小冰形態是什麼樣的?
彭爽:最理想的形態不是小冰怎麼全能,或者多才多藝,而是說我們這套架構,真的可以成為每個人心中想要的,不管是人工智慧的陪伴,還是人工智慧的助手,甚至是某些特定用途的工具,其背後的一套架構和引擎。
微軟的使命和願景曾是每個人都擁有一臺PC,我們的使命願景沒那麼大,我們希望當每個人都有自己的人工智慧陪伴時,我們是背後的「大腦」和「心臟」。
來源: 時代財經