Siri首次向全世界展示它招牌式的機敏,是在一場坐滿科技精英的媒體發布會上。
「你是誰?」蘋果公司的一位高管這樣問Siri。
Siri回答道:」我是一位謙遜的私人助理。」現場的觀眾們會心地笑了。
這場媒體見面會其實是Siri第二次與大家見面了。2010年,當Siri首次作為iPhone的第三方應用出現在蘋果的App Store裡。開發這個應用程式的是一個由24人組成的創業團隊,隨後,這個同樣以Siri命名的公司被蘋果收購。
那時,作為第三方應用軟體的Siri說起話來語調更加隨意,它能幫用戶完成的任務也更多。作為Siri公司的合作創始人和執行長,戴格·吉特勞斯(Dag Kittlaus)像作家塑造小說人物一樣仔細塑造出Siri的態度和身世。吉特勞斯創造出的這位個人助理」與眾不同」、」對流行文化有粗略的了解」,還有一點點」冷幽默」。
如果你向它打聽那裡有健身房,Siri會嘲笑你:「沒錯,你手機握得的確不太緊。」如果問它:」HAL最後怎麼樣了?」——HAL是斯坦利·庫布裡克(Stanley Kubrick)1968年指導的電影《2001:太空奧德賽》中一臺有頭腦(還有謀殺傾向)、會說話的電腦——Siri會不高興地回你一句:」我不想談這件事。」當時Siri的詞典裡居然還有「Fuck」這樣的詞。
最初版本的Siri,發布於2010年。
收購Siri後,蘋果糾正了它說髒話的壞毛病,在賦予它一些新能力的同時,也大大限制了其他的功能。在以1.5~2.5億美元的價格收購Siri公司16個月後,2011年10月,蘋果發布了新的Siri。這時的Siri已經學會了多種語言。它現在可以在多個國家工作,為上百萬用戶提供服務。新的Siri還可以直接用語音回答用戶的提問,而在此之前,它只能提供文字反饋。它還與iOS系統深度整合在一起,可以調用十幾個iOS內置工具來完成像安排會議、回覆郵件和查看天氣這樣的簡單任務。
雖然這些新功能十分引人注目,但許多用戶並沒有意識到,新版Siri失去了許多曾有過的功能。畢竟,這個軟體不只是一個普通的iPhone應用,它直接誕生於美國歷史上最大的人工智慧項目。這個項目由美國國防部資助,目標是構建一個可以推理與學習的虛擬助理。
2010年Siri首次推出時,它可以與42個網絡服務相連接——從餐館點評網站Yelp、售票網站StubHub,到電影點評網站Rotten Tomatoes和數學計算網站Wolfram Alpha——然後Siri會將各個網站上的信息整合在一起再回饋給用戶。無需打開其他的應用軟體,Siri就可以幫助用戶買票、訂餐館或叫計程車。它幾乎可以感覺到用戶的好惡,按照用戶的個性提供相應的建議。
在2010年的一場科技論壇上,Siri的共同創始人湯姆·格魯伯(Tom Gruber)展示了它的能耐。他告訴Siri,「我想找一家離公司不遠,情調浪漫的義大利餐館」,後者馬上把來自8個網站的信息完美地整合在一起,然後把最佳答案呈現出來。
在開發者的構想中,Siri應該是一個「任務引擎」。與呆板的搜尋引擎不同,任務引擎可以與用戶進行對話,然後給出相應的反饋。當你在酒吧裡喝高了的時候,用谷歌搜索找車送你回家並不是件容易事;但任務引擎則可以理解你口中含糊的 「我喝高了……回家……」,然後幫你叫車。Siri 公司的目標不是打造一個更好用的搜尋引擎,而是開拓一種使用網際網路的全新模式。在他們的設想裡,人工智慧系統可以主動提供用戶需要的答案,而不僅僅是找到相關的連結讓用戶自己做出選擇。如果說搜尋引擎定義了第二個網絡時代,Siri的創始人則相信任務引擎將開創第三個網絡時代。
任務引擎將成為你生活的夥伴——它可以預測你需要什麼,並在你提出要求之前就打點好一切。Siri的開發者曾有構想過一個還未執行的功能,來幫助遭遇突發事件的旅客:當你發現你的航班被延誤時,Siri早已為你準備好了其他備選航班、即將發車的列車班次和租車公司信息供你選擇。
這個Siri——曾經的那個Siri——讓我們看到了它的無盡潛能:越來越多的人工智慧助手將融入我們的生活。軟體開發者的目標,是創造出一個能幫助人們更好地生活的虛擬助手,它可以彌補人類大腦的局限,將我們從枯燥乏味的任務中解脫出來。
Siri的支持者們知道,蘋果手中的Siri還沒有發揮出它的全部潛能。「Siri的開發團隊看到了未來,定義了未來,並打造出了第一個可以使用的未來。」摩根泰勒投資公司——第一批投資Siri的兩家風險投資公司之一——的合伙人蓋瑞·摩根泰勒(Gary Morgenthaler)說,「所以對我們這些創始團隊的成員來說,Siri被收購後的發展速度很令人失望。」
但隨著越來越多的虛擬助理爭相在我們的手機上佔據一席之地,蘋果也開始面臨更大的壓力。他們需要充分利用手中的技術,把Siri重新打造成那個八面玲瓏、積極主動的小幫手。曾經的Siri讓我們看到虛擬助理的美好未來正在到來。也許現在的Siri只是iPhone的一個註腳,但也許用不了多久,iPhone就將成為Siri的註腳。
吉特勞斯說:「毫無疑問,一個善良溫和的HAL將出現在越來越多的手機上。現在的Siri只是個開始,未來遠遠不止如此。」
HAL走上銀幕35年後,將科幻作品中的想像正在一件件變成現實。而完成這一任務的,是美國國防部——也許只有他們的想像力可與喬治·盧卡斯和史匹柏比肩。
2003年,國防部下屬的投資部門先進科研項目局(DARPA)找到了一家非盈利的研究機構SRI International,委託他們領導一項長達5年、500多人參與的項目。這個項目的目標是打造一個虛擬助理,美國政府希望利用其研究成果來幫助軍隊的指揮官,處理大量的戰場信息和日常事務。雖然Siri並不是這一項目的直接成果,但這個叫做「可學習與組織的認知助理」(CALO)的人工智慧助理,最終為Siri的開發提供了靈感與模型。
就這樣,在國防部1.5億美元的資金支持下,上百名人工智慧領域的頂尖專家展開了一次雄心勃勃,但又前途未卜的探索:教計算機如何在自然環境中學習。這樣的項目對大多數企業研發部門來說是幾乎不可能的。這間實驗室(被SRI的研究者們戲稱為」技術宅之城」)的工程師們要創造的,是一套可以觀察用戶行為,同時收集與用戶的工作相關的各種信息,並從從中學習的助理軟體。CALO項目的一位研究員大衛·伊斯拉埃爾(David Israel)表示,這項任務「不論從哪方面講,都是史上規模最大的人工智慧項目」。
但在一些人看來,本該謹慎行事的聯邦政府,這次是把寶押在了只有小學生才會相信的科學幻想上。
「CALO項目啟動時,許多人並不看好人工智慧項目。」科技觀察家、史丹福大學的副教授保羅·薩佛(Paul Saffo)評論說,「在此之前的許多類似項目都失敗了,當時人們普遍對人工智慧的前景表示懷疑,很多人都覺得這個想法十分愚蠢。」
面對這些質疑,CALO項目用令人矚目的科學成就證明了它的價值。幾十年來,人工智慧領域的各個分支一直在獨立發展,各自為政。許多人認為,人工智慧系統的複雜性決定了不同分支之間無法有效合作。而CALO卻將各個領域整合在了一起。
這個項目還證明了,機器也能像人一樣從自己的經歷中學習。在此之前,人工智慧軟體都是在虛擬環境中開發出來的。研究者會使用一套固定的數據來測試他們的學習算法,然後根據不同算法處理信息的能力來判斷它們的優劣。而與之不同的是,CALO的每一個組成部分都要在真實的使用環境中學習如何利用無法預知的信息來完成任務。
在此之前,曾有許多科幻小說中的想像從SRI實驗室走入現實。1946年,史丹福大學的基金會創建了這間實驗室,以開展「有益於社會」的研究。1970年,SRI實驗室正式從史丹福大學獨立出來,並一直獨立運作至今。這家機構領導的研究項目大多由政府機構或企業資助。隨後,那些前景最光明的成果便走出實驗室,成為獨立的公司。SRI實驗室的眾多成就中包括噴墨印表機、液晶顯示器和迪士尼樂園。
這家位於加利福尼亞州門羅帕克市的研究機構,還因在這裡工作的眾多頂尖研究者而享有盛譽。他們中就有矽谷傳奇人物道格·恩格爾巴特(Doug Engelbart),他在60年代開創了電腦滑鼠,同時也預見了許多如今人們已經習以為常的基本電腦部件。
早在他著手開發Siri的原型之前,SRI實驗室的另一位工程師亞當·奇耶(Adam Cheyer)就已經被人們拿來與恩格爾巴特相比較了。這位有著深色頭髮、說話輕柔的工程師曾拿到過魔方大賽的冠軍,可以在26秒內還原一個魔方。他與恩格爾巴特的相似之處不僅在於創造力,還有他們都信奉的」以人為先」的科技理念。
恩格爾巴特認為機器應該被用來擴增使用者的智力與技能。伊斯拉埃爾說,使用機器的目的」不是為了在任何方面取代人類,而是要通過硬體和軟體來幫助人們更有效地完成他們的工作」。他記得奇耶和恩格爾巴特曾在SRI實驗室的餐廳裡進行長時間的交流。
令許多人厭煩的日常雜務,在奇耶看來卻是供虛擬助理軟體學習的絕佳機會。90年代在SRI工作時,當時剛剛拿到計算機碩士學位的奇耶就曾建造了一套虛擬助理原型。其中的廚房助手可以監控冰箱中的食品餘量,如果發現牛奶快要被喝完了,就會自動從網上訂購新鮮牛奶。
在SRI,奇耶的任務是將CALO項目下27支團隊建造出的不同組件組合成一個完整的助理。每年,這個虛擬助理都要接受一次測試,來檢驗它在這一年的時間中都學到了什麼。奇耶打造的這款」研究用」虛擬助理(名字也是CALO)十分簡陋,離消費者的電腦與手機還有很遠的距離。但CALO已經可以完成許多原來只能由人類完成的任務了。
舉個例子,如果你的同事在會議快要開始的時候取消了會議,CALO可以根據每個人在這個項目中所負責的工作來判斷是否要重新安排會議。如果需要的話,它會發出新的會議邀請,並預訂會議室。如果會議如期舉行,CALO可以整理出所有相關的文件與電子郵件以加快會議進程。它還會旁聽會議內容,並在會議結束後將每個人的發言轉換成書面記錄,同時列出會議中提到的具體任務。CALO還可以幫助用戶準備發言內容、整理文件夾、分類簡訊息、自動生成支出報告等。
這段時間,奇耶一邊訓練CALO,一邊在SRI的先驅者計劃中幫忙。先驅者計劃於2003年和CALO項目同時啟動,目標是幫助德國電信和摩託羅拉等公司探索智慧型手機的發展前景。先驅者計劃中的科研人員也開發了他們自己的虛擬助理原型。這個助理雖然沒有CALO那麼神通廣大,但可行性更高。
這個開發中的原型助理吸引了摩託羅拉公司一位經理的注意,這位經理就是戴格·吉特勞斯。
吉特勞斯是土生土長的中西部人,卻曾被人形容為」長著娃娃臉的北歐版布拉德·皮特」。日常工作之餘,吉特勞斯還經常參加一些驚險刺激的活動,比如追逐龍捲風和跳傘,他同時還是合氣道黑帶高手。他是科幻小說迷,是阿瑟·克拉克(克拉克曾幫助撰寫《2001:太空奧德賽》的劇本)的忠實粉絲。吉特勞斯後來還自己動筆寫過時間設定在遙遠未來的小說。
吉特勞斯曾勸說摩託羅拉採用先驅者計劃的技術,但沒有成功。於是他便辭了職,來到SRI任職。加入SRI後不久,吉特勞斯和奇耶,以及SRI的其他幾位同事一起到加利福尼亞度周末。他們的任務,是討論如何將CALO和先驅者兩個項目的精髓合併在一起,開辦一家公司把它發揚光大。
舊金山南邊一點有一個叫做半月灣的海濱小鎮,鎮上有家絲柏旅店。就是在這裡,Siri的故事開始了。正如恩格爾巴特所堅信的那樣,這個即將誕生的移動虛擬助理會將人們從低級乏味的日常事物中解脫出來。
這個助理的研發代號是HAL,而與之相對應的口號是「HAL回來了——這次是個好HAL」。
SRI實驗室的幾位主要人員合影。
一直以來,對於矽谷的夢想家們來說,「虛擬助理」這四個字就是他們的滑鐵盧。
1994年,野火通訊公司發布了一款基於電話的個人助理:「Wildfire」。這款軟體可以處理簡訊息、撥打電話和檢查語音信箱。雖然Wildfire知道如何用生動的回覆取悅用戶,也得到了不錯的評價,但真正使用這套軟體的人卻很少。幾年後,微軟公司隨新版Office軟體一起發布了Clippy,一個跳來跳去急於為用戶提供建議的回形針。《時代》雜誌後來將Clippy列為史上最爛的50大發明之一。1998年,通用魔力公司發布了Portico。這款軟體讓手機可以連接網際網路,並且可以靠語音操作完成閱讀電子郵件、發送簡訊息等任務。但不到四年後,這家公司就停止了對Portico的開發,並很快宣布破產。
十多年後的2007年秋天,智能助理軟體等待已久的機會終於到來了。更高速的無線網絡、更準確的語音識別、雲計算的快速發展和隨iPhone而來的各種全新的網絡服務,這些都讓智能助理成為了可能。
就在SRI的這幾位員工前往半月灣度假前,蘋果公司發布了iPhone。吉特勞斯們預見到這部手機將會培養出一大批隨時隨地都與網際網路保持聯通的用戶,但他們卻只能在手中小小的觸控螢幕上完成各種操作。這種情況下,一個可以語音操作的助理軟體似乎是完美的解決方案。這個助理可以幫助用戶完成各種各樣的工作,同時也免除了在狹小的觸控螢幕上點來點去和等待網頁加載完成的痛苦。
這幾位未來的企業家們還佔據著另一個很重要的優勢:他們可以使用CALO項目開發出的技術。根據1980年國會通過的一項法案,像SRI這樣的非盈利機構有權從政府資助的軟體項目中獲得收益。這項法案還允許創業公司用股權與SRI換取CALO項目核心技術的使用權。
雖然奇耶對能否將CALO項目轉化成有利可圖的生意還持有懷疑態度,吉特勞斯還是成功地勸說他的這位」創新夥伴」辭去了他在SRI的工作,一起成立了這家叫做Siri的公司。吉特勞斯在新公司中擔任CEO,格魯伯擔任技術主管,奇耶則是負責工程開發的副總裁。
按照Siri三位創始人的要求,所有想要加入這家公司的求職者都要閱讀麻省理工大學教授麥可·德圖佐斯(Michael Dertouzos)所著的《革命未完成》。德圖佐斯認為計算機應該」以人為本」,我們使用的各種設備」應該真正地為我們服務,而不是讓我們伺候它」。如果某個職位的申請者不同意德圖佐斯的觀點,那他就不適合在Siri公司工作。
Siri公司的三位聯合創始人。從左至右依次是:奇耶、吉特勞斯和格魯伯。
一旦被Siri公司僱用,新入職的員工會拿到一幅空相框,並在裡面貼上對他們啟發最大的人的照片。奇耶的相框裡的人,是另一位堅持」以人為本」的科技夢想家:道格·恩格爾巴特。
2008年初,Siri公司拿到了850萬美元的投資,而他們隨後幾個月裡的進展,用早期投資者摩根泰勒的話說是「絕對令人激動的」。肖恩·卡洛倫(Shawn Carolan)是門羅投資的合伙人,也是Siri的投資人。他回憶說:」每一次董事會議都有重大突破。」
幾位創始人將他們的Siri原型軟體放在他們自己設計開發的人工智慧系統裡面,教它如何理解和回答用戶的提問。當用戶向Siri提出一個問題,Siri會將用戶的語音信息傳送到數據中心的伺服器。這些伺服器上的語音識別軟體可以將語音信息「轉錄」成文字信息。
接著,Siri要搞清楚這些文字的含義——這一過程被計算機科學家們稱為自然語言處理。人們可以用許多種不同的方式來表達同一個意思。比如說「我現在想吃羊角麵包」、「這附近有沒有麵包店」和「現在要是有點法式餡餅就好了」其實都是在說同一件事。對於人類來說,搞清楚這麼多不同的表達方式並不算什麼難事,但計算機卻需要一套十分精巧的算法才能理解這些。
傳統的處理方法是靠識別句子裡的語法成分來做出判斷,但這個辦法卻經常出錯。Siri徹底拋棄了這套系統,轉而使用奇耶和他的同事們開發的另一套處理方法。他們的這套系統依靠識別句子中所指的事物來處理信息。比如當Siri聽到「我想看部驚悚片」這句話時,它會識別出「驚悚片」是一種電影類型,然後調出和電影有關的信息。
Siri可以將提問中的內容與可能有關的操作相對照,然後根據它對現實概念之間關係的理解,選擇看上去最穩妥的操作。(比如Siri知道一家餐廳應該有評價、地址、風格和價位等相關信息。)Siri還可以使用時間與用戶的偏好和位置等信息來選擇最恰當的回應,而當它無法作出決定時,它還會請求用戶提供更多的信息。
你可以把Siri想像成在一間嘈雜的酒店大堂工作的前臺服務員。「最近的咖啡店在哪裡?」這句話穿過人群後,很可能就變成了「最近的『快放電』在哪裡?」。但前臺服務員知道「最近的」這個詞更有可能和地點聯繫在一起,而且酒店裡的客人通常不會向服務員打聽關於電路工程的問題。據此,他可以推測出客人想知道的是去哪裡可以買到一杯咖啡。Siri也是這樣工作的。它會特別注意聽取那些僱主們經常會對私人助理講的詞,這樣它不需要聽清楚句子裡的每一個詞,就可以大概理解句子的含義。為了減少錯誤,用戶也可以將他們的問題用鍵盤打出來。
為了獲取關於咖啡館的信息,Siri可以調用超過40家網站上的信息。這些網站就像是Siri的眾多遠程大腦。和此前那些只可以完成一個領域工作的虛擬助理不同,Siri的能力更加全面。不管你是想打聽一本書還是想了解一棵樹,只要Siri有相關網絡服務的API,它就可以幫你找到答案。
一開始,開發者們沒有給Siri的功能添加任何限制。他們構想中的Siri可以連接到任何網絡服務。但他們也知道想讓Siri成功,這個虛擬助理不僅要聰明,還要風趣。
吉特勞斯和薩德勒知道用戶可能會向Siri提出各種無釐頭的問題,於是他們為Siri準備了許多生動的回覆。他們甚至想為Siri準備不同的「性格包」,讓用戶可以選擇是讓Siri變得貼心還是刁蠻。因為Siri可以識別出用戶說話方式的細微特徵,開發者們甚至希望有一天Siri可以模仿用戶的性格。「喂,夥計,最近有啥片兒?」Siri會回答:「哥們兒,克林特·伊斯特伍德的新片兒不錯。」
2010年2月,就在Siri首次作為獨立的iPhone應用發布三周後,吉特勞斯接到一個神秘電話。因為他的iPhone出了點小問題,他差點錯過這個電話。
給他打電話的是史蒂夫·賈伯斯。他想第二天和吉特勞斯見面。
第二天,Siri的創始人在賈伯斯家裡見了面。他們聊了三個小時,討論任務引擎的未來,以及用戶如何與機器對話(賈伯斯很喜歡Siri的小聰明)。很快,蘋果就表示有興趣收購這家剛剛成立不久的公司。
吉特勞斯回憶道:「按照賈伯斯的描述,他和斯科特·福斯特(當時蘋果移動軟體部門主管)一直對使用語音識別技術為iPhone打造一個語音交互界面很感興趣。他告訴我說,他覺得我們的會話式交互界面完美地解決了這個問題。」
Verizon公司也持同樣的看法。2009年秋,就在蘋果與Siri公司接觸前幾個月,Verizon與Siri公司籤了一份合同,準備在之後一年內發布的Android手機上全部預裝Siri應用。當蘋果突然出手收購Siri時,他們堅持只在蘋果產品上使用Siri,所以就終止了與Verizon的合同。要不是蘋果出手及時, Siri險些就成為他們在智慧型手機領域的最大競爭對手的賣點。(當時Verizon已經為Siri拍好了電視廣告,只等發布了。)
Siri公司的第一個,同時也是最後一個iPhone應用只存在了兩個月。如今的Siri和它的未來都屬於蘋果了。
「這就是故事的結局——當然,你也可以把它當成故事的開始。」吉特勞斯說。
人工智慧孤兒隨著Siri的一整支24人團隊在位於庫比蒂諾的蘋果公司總部安頓下來,這家科技巨頭馬上開始著手改進剛剛收購的產品。
蘋果強化了Siri的某些功能,但卻切斷了Siri與大部分網絡服務之間的連接,大大限制了Siri的功能。2010年Siri應用發布時的主要功能之一餐館預訂,直到2012年才重新與iPhone用戶見面。
科技產業內部人士說蘋果的龐大規模阻礙了他們與服務網站的合作。與一家還在嬰兒期的創業公司進行合作是件相當簡單的事,而與世界上最具影響力的科技公司籤訂一份協議則要複雜許多。這樣的合作風險相當大,因此需要經過無數次談判,通過大量的成本收益分析,在許多律師的協助下才能完成。 雖然以蘋果的技術實力,他們可以馬上將Siri與許多網站相關聯並投入使用,但他們還需要時間來說服潛在合作夥伴接受新的Siri。
同時,他們也想讓更多的人用上Siri。蘋果在全球100多個國家銷售iPhone,而要讓Siri在這麼多國家提供本地化的服務並不容易。為了讓Siri走出美國,蘋果需要教它識別幾十種不同的語言。設計計算機算法來理解人類語言需要相當長的時間。
用過Siri早期版本的用戶會抱怨說蘋果過分追求產品的外觀與質感,讓產品的設計掩蓋了Siri的真正實力。為了不讓用戶們失望,原來的Siri應用會在用戶每一次提問時顯示出幾個範例,告訴用戶他們可以問什麼樣的問題。而如今的Siri卻沒有明確告知用戶它可以做哪些事。蘋果為Siri設計的口號——「都聽你的」——讓用戶以為Siri可以滿足他們的任何要求,但當他們發現Siri的能力如此有限時,他們收穫的只有沮喪。
另一個蘋果不得不面對的事實是Siri的語音識別能力並沒有那麼強,尤其是在它最經常被使用的環境中。語音識別軟體在嘈雜的環境中經常出錯,而且你也不要指望能在開車的時候與Siri聊天,因為分析通過藍牙耳機傳輸的低質量語音信號時,Siri更是漏洞百出。不過這個問題只是暫時的,因為隨著Siri擁有更多的數據和更精巧的算法,它最終可以更準確地理解人類語言。
其實Siri已經在不斷進步了:在經過去年12月的一次測試後,投資銀行Piper Jaffray將對Siri的評級從「D」上調到了「C」。他們在測試中發現Siri可以理解91%的提問,並正確回答其中的77%。
但隨著Siri在蘋果公司內部逐漸失去支持者,它的前景也越來越黯淡。雖然史丹福大學教授薩佛曾警告說試圖了解蘋果公司的內部運作就像「試著搞清楚朝鮮在想什麼」一樣難,他還是表示在這家公司內部,Siri已經從「人工智慧助理」,變成了「人工智慧孤兒」。
Siri公司的三位聯合創始人中,只有湯姆·格魯伯還在繼續留守。吉特勞斯在蘋果重新發布Siri的三周後離開了這家公司,奇耶則在一年之後辭職。在發布會上首次向觀眾介紹Siri的iOS軟體主管斯科特·福斯特去年被解僱,賈伯斯則在Siri發布的第二天就離開了人世。代替吉特勞斯領導Siri項目的呂克·朱利亞則只在蘋果待了10個月,就草草以辭職收場。
推動人類發展Siri是市面上第一款可以理解人類自然語言,並將分散與網際網路各個角落的信息組合成一條回應的虛擬助理。Siri開創的這個模式,正在被越來越多的人工智慧工程師與企業家們所採用。
不斷面市的許多虛擬助理所提供的服務,與早期版本的Siri和在這之前CALO很相似。就連蘋果都在逐漸地恢復Siri曾經擁有過的許多功能,比如電影評論和餐廳預訂。
受到Siri的啟發,許多矽谷公司現在正利用CALO項目中的技術,來構建用途更專一的虛擬助理。Desti是一款專門處理旅行事務的人工智慧助理,Lola則是「金融領域的Siri」,而Kuato則正在利用CALO研究項目中的技術打造一個學習助理。
僅在2012年,就有超過6款與Siri相似的服務面市。三星發布了語音控制助理S-Voice。語音識別軟體供應商Nuance發布了「供應用程式使用的Siri」,Nina。兩個創業公司,Evi和Maluuba,分別發布了他們自己的虛擬助理應用。IBM正在將他們的超級計算機,Watson,改裝成超性能Siri,供醫生、農民、華爾街交易員和高中生使用。而谷歌也模仿Siri開發了他們自己的會話式虛擬助理,Google Now。
「我們需要的不僅僅是問虛擬助理一個問題,然後從它那得到答案。我們需要它與用戶對話,然後在對話過程中幫助用戶完成任務。」斯科特·哈夫曼(Scott Huffman)是谷歌的工程主管,分管谷歌的移動搜索業務。他的構想與Siri創始人最初的想法驚人得相似。
科技預言家與科研工作者們預測,有了像Siri和Google Now這樣的語音控制軟體,人類就不再需要學習怎麼使用科技,因為科技會學著理解人類。
「我們與機器之間的交互方式,正在越來越接近我們與身邊其他人進行交流的方式。」薩佛說,「科技發展的趨勢,是朝向越來越緊密的人機互動 。 而每經過一個階段,機器在我們生活中扮演的角色就會變得更重要一些。」
這些更加重要的任務從處理日常瑣事,到指導我們的生活。Siri的創始人曾計劃通過使用CALO先進的學習系統,讓Siri為用戶提供個性化的建議。那時的Siri不需要收到具體的請求,就可以主動幫用戶調集信息。
而谷歌的虛擬助理在這方面走的更遠。在用戶提問前,它就可以就主動提供信息。Google Now掌握了用戶的日常活動,因此可以主動為體育迷們提供比賽動態,或者建議用戶提前出發以免塞車。(谷歌公司主席埃裡克·施密特在2010年接受《華爾街日報》採訪時說得更直接:「(用戶)希望谷歌告訴他們下一步該做什麼。」)
幾年之後,在你逛街的時候,你的虛擬助理會根據你的衣櫥中的內容、當時的季節和你的銀行卡上的餘額,告訴你該去哪家店選購鞋子。當你走進鞋店時,你可以向虛擬助理諮詢該選哪雙鞋,它會小聲告訴你那雙小牛皮平底便鞋很不錯,但同時也會提醒你如果買了它,你這個月的開支就會超出預算。如果你真的想買,虛擬助理會建議你選擇預付現金,同時會主動聯繫你的銀行處理相關的細節。當你付款時,你的助理會想起你最近經常去博物館,便主動推薦最新的展覽動態。有了可以根據面部表情推測出用戶心情的情緒識別技術,虛擬助理能感覺到你的心情不太好,於是便講幾個笑話逗你開心。而辦公室則會由另一個虛擬助理接手。在你趕赴約會之前,第三位虛擬助理可以給你的感情生活提出些建議。
那麼那到時人類會變成什麼樣呢?
和許多人一樣,Siri的投資人肖恩·卡洛倫認為我們會變得更有效率。「虛擬助理可以在30秒內完成本來需要15分鐘才能做完的日常雜務。你只需告訴它你的想法,它就可以幫你完成。你的工作效率將是之前的30倍。」
憑藉其強大的影響力和Siri的軟體,蘋果完全可以讓任務引擎的夢想成真。如果蘋果使用Siri早期的架構,用網絡服務來不斷擴展Siri的功能,它將可以自動完成許許多多的任務。
摩根泰勒認為Siri可以像亞馬遜改變人們的購物方式一樣,改變人們的生活方式。在蘋果手中,未來的Siri將可以預訂機票、訂購鮮花或充當時尚顧問。按照前CALO項目主任詹姆斯·阿諾德(James Arnold)的說法,Siri將會變得和iTunes一樣強大,但它管理的不僅僅是音樂,而是一個人生活中的方方面面。被收購前,每當用戶通過Siri應用完成一次支付,Siri公司都會從中收取一部分的佣金。如果將來蘋果也這樣做,那他們將開啟一片全新的利潤空間。
阿諾德還認為虛擬助理會縮小人與人之間的智力差距。好記性也許將不再是一個明顯的智力優勢,因為智能助理將承擔起記錄名字、日期等零碎信息的任務。律師與醫生也不再需要牢記大量的法律案例或者病情特徵,因為智能助理將學會從不同的案件或者病人資料中找到不同尋常的聯繫。
吉特勞斯說:「將來,在虛擬助理的幫助下,我們不需要動太多腦筋就可以完成簡單的工作。虛擬助理的意義不在於幫助我們生存,而是幫助我們探索未知的世界。」
雖然這些任務引擎可以變得很高效,它們也有可能帶來巨大的風險。倫理與新興技術學會的埃文·塞林格(Evan Selinger)認為越來越容易的生活有可能「讓我們變得無意識」,同時也會減少讓人們審視道德問題的機會。「這些本應為我們服務的數碼助理將反過來主宰我們的行為,而我們自己甚至都意識不到。」
這些數碼助理將比我們自己更了解我們的放縱和陋習,並有可能濫用這些信息。虛擬助理提供的建議有可能助長人們過度飲食和過度消費的習慣,尤其是當這些建議背後有廣告商的身影時。你的家人了解你的心血管狀況,知道該怎樣勸你少吃牛排。但Siri呢?如果牛排餐館花大價錢在谷歌上做廣告,Google Now又會怎麼說?Siri會勸你做一個更好的人,還是會縱容與遷就你的自我膨脹?
如果虛擬助理可以將我們從日常生活的瑣事中解放出來,我們將有更多的時間與精力去實現更重要的目標。這樣的智能助理將推動人類進入一個從未有過的新高度。就像數學家和哲學家阿爾弗雷德·諾斯·懷特黑德(Alfred North Whitehead)觀察到的那樣:「人類的進步意味著我們可以把更多的事情置之腦後。」
但這樣的進步會走向何方?這也許就是虛擬助理無法回答的問題之一。
編譯自:《赫芬頓郵報》 SIRI RISING: The Inside Story Of Siri's Origins
作者:Bianca Bosker