7月份,CSDN TUP活動曾經舉辦過主題為「次世代人機互動接口及應用開發」的活動,分別展示了新興交互技術如語音識別、腦波接口以及體感技術的應用與實踐,受到技術人員的歡迎。
作為人機互動領域的關鍵技術之一,模式識別是指通過計算機用數學技術方法來研究模式的自動處理和判讀。隨著雲計算和移動網際網路的興起,模式識別技術也獲得了更大的發展契機。
這個在普通開發者看起來比較「偏學術」的技術領域,越來越多的被用於解決當前的實際問題。
9月10日下午,在中國科學院計算技術研究所一層報告廳,來自騰訊和盛大研究院的三位研究員,分享了兩大網際網路巨頭在模式識別與雲計算、新型終端結合所帶來的實踐心得。儘管是在中秋假期,外面還飄著小雨,仍有近3百人參加,現場互動也非常熱烈。
當模式識別遇上雲計算
騰訊研究院人機互動中心模式識別組研究員劉海龍的演講主題是「模式識別雲服務」,根據他的解釋,所謂模式識別的雲服務,就是指以雲端計算的方式,為終端提供所需的識別服務,終端只負責採集輸入數據和接收識別結果,而其他一些模式識別的步驟,包括特徵提取和分類等都交給雲端來完成。從模式識別技術發展的需要看,它也要從傳統的單機應用走向網絡應用,並和雲端的海量數據結合,才能更好的發揮作用。
騰訊研究院人機互動中心模式識別組研究員劉海龍
模式識別的雲服務不僅具有雲計算的普遍優點,如按需服務、資源利用率高,冗餘可靠性好、可擴展性強等等。而且針對模式識別任務來講,雲服務還有更重要的一些好處 :雲服務可以解決模式識別任務對大量的訓練樣本的需求問題。離線積累這些樣本往往是困難的。而且樣本標籤又可以通過用戶在終端所做出的交互操作來得到。這樣就可以用來錘鍊識別算法,持續改善其性能。
此外,雲端提供了終端不具備的計算和存儲能力。特別是移動終端。很多模式識別任務中的數據存儲於雲端。比如圖像搜索,人臉識別的應用,這就很自然的需要識別的雲服務。
而且劉海龍透露,之前騰訊研究院在向其業務部門提供模式識別技術支持的時候,往往是以算法庫的形式,不利於長久持續的在技術上積累改進。今後將從單純提供算法庫轉向提供雲服務。
新一代移動平臺下的模式識別應用
騰訊研究院人機互動中心模式識別組項目負責人陳波認為,移動無線網際網路帶來的是信息溝通的革命,手機已儼然成為人們各種感知器官的延伸。移動終端將成為人機互動和模式識別技術的主要戰場,雲計算和不斷增強的終端能力讓複雜的模式識別運算成為可能,而基於模式、不斷增加的移動應用將改善移動應用體驗。
騰訊研究院人機互動中心模式識別組項目負責人陳波
通過手寫、手勢和語音等多個方向,模式識別目前最成熟的應用在於改善移動終端的輸入體驗,陳波介紹並展示了騰訊的技術進展,例如騰訊的手寫識別技術去年就已經用在了PC端QQ輸入法、以及iOS, Android平臺的手機QQ輸入法上,目前的識別率在工整樣本上能達到99%,在一般的自由書寫樣本上能達到95%。
即將上線的雲語音服務支持中英文混合輸入,在中文中夾著簡單的英文都可以正確的識別出來。識別率在常用的聊天語測試集上可以達到字識別率80%。
中秋節後,將在AppStore發布的QQ慧眼是騰訊模式識別技術的集中體現,這款應用可以讓你的手機變成成熟的圖像掃描儀,具有文字識別即時拍照翻譯、人臉認證解鎖、解讀二維碼、條形碼和商品logo等。
陳波還著重講解了增強現實技術,移動增強現實系統可實時跟蹤手機在真實場景中的位置及姿態,並根據這些信息計算出虛擬物體在攝像機中的坐標,實現虛擬物體畫面與真實場景畫面精準匹配,在博物館導遊、地圖、購物指南、工業設計、炫彩遊戲、新一代的廣告模式等在移動網際網路應用領域的廣闊的發展前景。
模式識別在數字家庭娛樂上的應用
觀察當前幾大科技巨頭的動作,數字家庭娛樂已是兵家必爭之地。無論是在用戶接入端(IPTV機頂盒),或者節目發送和共享端(電視臺/視頻網站),還是在用戶移動端(智慧型手機),都不斷湧現出新的技術和應用。
盛大創新院多媒體主題院研究員路香菊博士
盛大創新院多媒體主題院研究員路香菊博士在會上分享了模式識別相關技術在數字家庭娛樂中的應用,包括KINECT技術在遊戲應用中的手勢識別及人臉識別技術,社交電視中用到的人臉/臺標識別、語音識別、視頻廣告識別等。
路香菊表示,數字家庭領域中互動電視是最近興起的新概念,以Google TV和雅虎TV為代表,其中雅虎TV通過和三星、LG大廠商合作,打造了自己的應用開放平臺,正向著行業統一標準邁進。模式識別在視頻中最重要的應用當屬視頻檢索了,和廣告和電子商務的結合都具有極高的應用前景,值得關注的相關應用有Snappy TV、Shazam、IntoNow等。
路香菊用了較多的時間來介紹微軟體感輸入設備Kinect,Kinect是微軟遊戲機XBOX360的外設,以增強XBOX360的人機互動能力。目前已初步顯現出在新一代數字家庭娛樂中最佳裝備的潛質。微軟還賦予它很好的擴展性,Kinect fub lab是微軟夏天新推出的互動娛樂體驗,其中有多種遊戲可供選擇,比如 kinect me 是把自己變成虛擬化人物,也就是avatar kinect中的自己。Build a buddy 是把現實中一個毛絨玩具虛擬化為3D玩偶,它可以受你身體控制,完成動作。
三場演講之餘,活動留出了論壇環節和充足的互動時間,從現場交流了解到,開發者最為關注這些模式識別的技術可否開放給業界調用,正如騰訊騰訊研究院人機互動中心模式識別組項目負責人陳波在演講中提到的,成熟並平臺化的基礎技術支持將給應用層提供了無限的創新和發展空間,模式識別技術也是如此。