文/闌夕
關於人工智慧的想像有著兩種形態。
一種在傳媒及人文等公眾埠,呈現的是一種基於對未來科技躍遷的不可預測的恐慌情緒,匹配這些想像的有大量的文藝作品,比如威爾·史密斯主演的《我,機器人》、施瓦辛格主演的《終結者》以及丹·西蒙斯所著的科幻史詩《海伯利安》等,其傳遞的普遍憂慮在於人工智慧的失控是否最終會威脅到人類文明自身的生存。
另一種形態,是在學術和科研等專業埠,從業者們的困惑是奇點的閃爍使其隱瞞了真實的距離感,計算機的解題能力及其效率——比如微積分、海量計算甚至西洋棋——遠超人類極限,但是迄今為止沒有任何智能機器能夠精確辨認「貓」這種動物,這可是三歲的人類小孩就能輕易做到的事情。
美國最富盛名的計算機科學家之一唐納德·克努特是這麼說的:「人工智慧已經在幾乎所有需要思考的領域超過了人類,但在那些人類和其他生物不需要思考就能完成的事情,仍然差距巨大。」
在經歷人工智慧(AI)與智能增強(IA)——後者其實就是將計算機等科技作為人類行為的延伸,將智能放置在輔助角色上——兩大流派的漫長鬥爭之後,人工智慧從狂熱回歸務實的原因其實源於生物科學對人類大腦的研究逐步深入,人腦的神經元網絡儘管在傳輸速度上遠低於計算機的CPU,但超大型並行計算的規模和能力卻超過了計算機所能構成的物理網絡。
簡單來說,現有階段的人工智慧,要在單點勝過人類是很容易的,但是人腦擁有先天性的適應能力,它支撐著人類的複雜情感,比如安慰他人、書寫詩歌、臨場應變以及海闊天空的對話溝通,這讓機器很難模仿得來,因為後者只能遵循事先編寫的程序和規則行事。
於是,人工智慧領域開始將「深度學習」作為一種賦能,用於制定相關產品的標準。用Google前任CEO艾瑞克·施密特的話來講,「計算機無法複製一套人類大腦的神經元,我們只能讓機器儘量去學習。」
而與美日等國不同的是,中國網際網路在商業應用層面的發達,使人工智慧在被冠以「下一個風口」之名過早的置於商業市場,這種做法究竟是「快字訣」的偉大實踐還是又一次揠苗助長的泡沫製造,可能尚且有待觀察。
本文的主角,是處於風起雲湧的機遇舞臺中央,一家以「計算機之父」圖靈的名字命名的創業公司作品:圖靈機器人。
人工智慧的路徑分化
上周,三十歲的俞志晨在北京國家會議中心發布了一款以人工智慧為基礎的機器人作業系統:Turing OS,此時,距離他在3W咖啡面對不滿100人的觀眾宣布創建圖靈機器人項目,剛好一年。
圖靈機器人的前身,是搭載與智慧型手機系統的蟲洞語音助手產品,其與科大訊飛的業務相仿,試圖對接企業成為人機互動的技術支持。在拿到中國移動網上商城提供的獎金之後,他和團隊才有了註冊公司所需要的第一筆資金。
說是Siri帶動了整條語音交互產業也毫不為過——唯有用戶需求的大量激發才會驅使產業鏈不同環節的逐利跟進——蟲洞語音助手很快獲得了接入主流消費產品的機會,車載電腦、企業客服、智能家電均在合作對象的範疇以內。就在俞志晨戒掉微博之前,他還密切的測試HTC的語音助手「小hi」,與後者在微博上頻頻互動,並興致高昂的發布了「小hi PK 小冰(註:微軟的聊天機器人產品)」的話題。
但是,這種以信息服務匹配為核心的人機互動愈是普遍,其面目就愈是固化,可塑性的缺失是不可逆的,而人工智慧更是被人力運營取代,這個品類下的不少產品開始養起運營團隊,去和握有商業資源的網際網路公司交換數據,同時將未來寄托在O2O這種變現明朗的模式裡。
就像上文所言,學界通常警惕技術提早浸染商業的風險,認為這會偏離預定軌道,從而失去進步和突變的可能,即使是在Google這種商業公司裡,技術部門也都被戰略保護得相對較為純粹,毋須承擔貨幣化的使命。人工智慧在中國的「返祖」,也令人想起「土耳其傀儡」的故事:
十八世紀末,一個名為沃爾夫岡·馮·肯佩倫的奧地利男爵為了取悅王室,而設計出一個「擁有智慧」的巨型器械,這個器械的外型酷似土耳其傳統打扮的魔術師,肯佩倫聲稱它和人類對壘西洋棋。神奇的「土耳其傀儡」迅速走紅,被他在棋局上勝過的人甚至包括法國皇帝拿破崙和美國發明家富蘭克林。直到一百年後,才有媒體發現這個「土耳其傀儡」的運作原理其實就是在裡面藏了一個棋藝高手——通過魔術的障眼法使人們進行參觀和檢查時發現不到這個人的蹤跡——然後以磁鐵進行信息傳遞,告知裡面的人棋盤動向,再操作傀儡落子。
人工智慧不應重蹈「土耳其傀儡」的覆轍,它不應由人力來完善自身所長,而應擁有自我演化的基因,兼具人類的思維能力、情感能力和學習能力。得出這一結論之後,俞志晨以蟲洞語音助手為基礎啟動了新的項目,也就是圖靈機器人,他希望擺脫「助手」的工具設定,繼續探測人工智慧的「擬人」進程。
聽懂中文是最高的技術挑戰
俞志晨的年齡,很容易受到輿論質疑:在人工智慧這個仰仗積澱的行業,三十歲還是太過年輕,無論職業履歷多麼專注,都很難通過資歷來說服外界。
因此,在與資本接觸時,俞志晨只能反覆闡述圖靈機器人的成績:逾10萬合作方,響應請求量達1300億次,中文語義識別的準確率超90%……而在藍圖的規劃上,這個項目也表現出與同類產品脈絡迥異的想像。
圖靈機器人可被視作是蟲洞語音助手的升級版本,它是一個技術接口,主要作用是模擬人類的語言認知和交流行為,在對話問答、NLP知識庫和生活服務技能三個方向提供支持。在這個層面,響應品質是競爭的關鍵,俞志晨將圖靈機器人稱為「中文語境下智能度最高的機器人大腦」,其信心源自他在模糊數學和機器翻譯方面的研究。
俞志晨在北京交通大學的老師是賀仲雄,後者是中國模糊數學的奠基人。所謂模糊數學,其實指的是通過數學方法解決抽象問題的學科,它所對應的則是計算數學。一個姑娘的體重可以基於計算數學獲得,但她長得是否漂亮,這就成為一個模糊概念,機器很難進行準確判斷。相比英文體系,缺乏邏輯的中文詞性更具模糊特徵,這是開發人工智慧與中文對話時常會出現紕漏的場景。
根據俞志晨的說法,圖靈機器人在人機互動領域的對標,是IBM旗下著名的人工智慧系統Watson,後者是IBM在語義分析上重金投入的集大成之作,最大的特色就是能夠讀懂英文語言裡的隱喻、雙關甚至笑話。與之相仿,圖靈機器人目前可以通過記憶系統讀懂「主謂賓」預設的對話,比如在被詢問某處的天氣之後,用戶在下一次發問時只用說出或是輸入另一處地點,圖靈機器人會聯繫上下文做出「這是新的一次天氣詢問」的判斷,並回推結果。
而在圖靈機器人之外,俞志晨最近一年開發的拳頭產品,是Turing OS,這是一個在真正意義上服務機器人商品的解決方案。
作業系統的場景價值
一直以來,日本都是一個機器人大國。1999年,索尼推出的經典商品Aibo機器狗——Aibo就是「Artificially Intelligent Robot(人工智慧機器人)」的縮寫——這款昂貴的商品(售價600美元到2000美元不等)總計賣出了15萬套,而購買者多為缺少親人陪伴的孤巢老人,這也成為映射日本老齡化社會的一種特殊符號。在2014年索尼宣布終止為Aibo機器狗提供技術支持之後,日本甚至產生了仿生寵物醫療產業,專門用來服務那些「年限過高」的故障機器狗。
社會學家預言由於特殊的人口政策,中國在未來很有可能也會步日本後塵,但在現今,因為父母忙於事業而在幼年階段缺少陪伴的孩子仍然是一個社會性的隱憂。而俞志晨的解法,是將Turing OS這套基於人工智慧的作業系統授權給研發機器人硬體的企業,合力推動智慧機器人與人類的融合。
在發布會上,首款搭載Turing OS的硬體產品來自國內最大的動漫文化集團奧飛,後者坐擁鎧甲勇士、巴啦啦小魔仙等熱門兒童動漫IP,並推出了主打兒童陪伴功能的機器人硬體「樂迪」。
與多數人工智慧應用需要依靠版本迭代才能完成更新的規則不同,Turing OS可以吸收外部的聲音、文本、圖像甚至肢體語言來獲得自我學習的適應能力,並以情感思維與用戶發生互動。俞志晨希望這套作業系統能夠配合前端的硬體產品忠實履行「兒童玩伴」的職責,包括英文跟讀、擬真陪聊、知識傳授、信息查詢等功能,在一定範圍內彌補部分兒童群體早期社交不足的弊病。
俞志晨的實用主義,或許來自法國知名機器人公司Aldebaran的作為。Aldebaran旗下的三款機器人產品,皆以伴侶身份設計,「NAO」主打早期教育市場,曾被證明在幫助自閉症兒童克服病理性障礙上有著傑出表現,而「Romeo」是用於幫助缺乏自治能力的老人,在老人發生意外時可以做出及時的救助反映,「Pepper」則屬於日本軟銀公司的定製產品,功能均衡,既可被商家用來放在店鋪門口招攬顧客,也能進入家庭成為一個獨特的非血緣成員。
Turing OS與Aldebaran開放的人工智慧作業系統NAOqi OS有著相同的訴求,即以平臺級的生存方式充當底層,左邊銜接機器人等硬體應用,右邊管理功能性質的軟體應用,合力擴大機器人的使用場景。
以及……
俞志晨非常贊同經濟學家郎鹹平的一段發言:「人才需要被工序化,需要被制度化,如果人才的知識不被工序化和制度化,那麼當人才流失的時候,那麼科技就無法被積累,所以高科技所更應該重視的是工序和積累而不僅僅是創造。」在他看來,人工智慧永遠不會有決出勝負的一天,因為這個行業就像永恆的光影變化那樣沒有戛然而止的終點,只有無限的投入和多變的回報。
而在對競爭力的詮釋上,他只用了兩個詞語來概括:堅持和耐心。