當今的智能語音系統格局還是由矽谷三巨頭三分天下,分別是蘋果的Siri、微軟的Cortana,和谷歌的Google Now。不過國外的語音助手由於系統或是網絡服務問題,使得部分中國用戶不能使用,也因此造就了天朝中文語音助手的蓬勃發展。比如科大訊飛和國內眾多手機廠商聯合推出的智能語音助手,以及騰訊在微信5.0上內置了自家微信語音助手等。
語音交互過程通常分為三步,首先通過語音識別技術將語音命令轉為文字,然後通過語義識別技術將文字轉換為意圖,最後調用各應用API或者網頁來完成命令。
奇點機智CTO林德康告訴36氪,這種「對話框+後臺服務」接入方式對於開發者來說有三個弊端。比如將語音助手和應用API連接是個比較複雜的過程,需要軟體工程師完成。另外想要接入此類語音助手需要在功能方面進行一定的調整,符合其開放的API接口,這在某種程度上限制了應用設計的自由性。除了限制應用功能,此類語音助手還和應用開發商存在一定的經濟利益衝突。因為語音助手直接連接應用後臺,用戶流量被截取。
奇點機智針對以上問題推出了一款專為安卓生態打造的應用助理——「小不點」APP,同時小不點APP的語音開放平臺面向應用開發者開放。它最大的優勢在於不用任何第三方的API即可操作手機應用,進一步降低了應用開發商的開發門檻。
這項技術是基於安卓手機上的「輔助功能」,它可以將屏幕中的信息讀出來,本來是為了幫助視障人士使用手機的。「小不點」在最底層也是使用了這個輔助功能,用戶在激活「小不點」後,語音助手就可以幫助用戶進行點擊操作,就像用戶進行了點擊操作一樣。而且「小不點」適用於任何線上應用,且應用無需更改自身的技術框架。
另外「小不點」還具備學習能力,智能助手可以看到用戶的操作順序並記下來。在之後進行相同或者相似的命令就可以直接執行。
現在「小不點」已於今年8月在oppo、vivo、小米、聯想和華為應用商店上線。不過C端獲客成本較高,因此奇點機智正在聯合應用開發商推廣產品。應用開發商按照功能調用次數來付費給奇點機智。
但智能語音助手行業也存在一些通性問題。首先是語音識別率、語義理解力不足。在複雜真實場景下,語音助手的識別率和理解力也會進一步下降。這也是為什麼眾多的語音助手從智慧型手機轉向了智能家居行業,因為家庭場景相對簡單,而且命令和需求也相對固定。
二是智能語音助手的應用場景比較匱乏,不能實質解決用戶的需求。三是語音識別會通過雲端伺服器來返回結果,涉及到安全和隱私問題。
奇點機智成立於2015年初,曾獲得真格基金100萬美元天使輪投資,以及襄禾資本和NEA 500萬美元A輪投資。現在正在尋求A+輪投資,主要用於產品開發和市場拓展。
公司現有不到四十人,主要是開發人員。鄔霄雲,奇點機智創始人兼CEO,紐約州立大學計算機博士,北京市第十二批「海聚工程」創業類特聘專家,擁有1年雅虎實驗室、8年穀歌研究院工作經驗的資深科學家,擁有深度學習、自然語言處理、網際網路大數據、分布式計算的豐富經驗,回國前負責美國應用搜索公司 Quixey.com 搜索部門。林德康,奇點機智聯合創始人兼CTO,國際計算語言學學會會士(ACL Fellow),加拿大Alberta大學計算機教授,原Google研究院高級管理科學家,Google搜索問答系統創始人,自然語言處理及理解領域共發表90餘篇論文,研究總計被引用超15000次,曾任ACL2002程序委員會聯合主席、ACL2011大會主席、ACL2007北美分會執行委員。