在輸入法都打 AI 牌的年代,訊飛的先發優勢還在不在?

2020-12-06 雷鋒網

早在2016年10月錘子科技新品發布會上,訊飛輸入法就因羅永浩的現場演示火了一把,老羅在現場用很快的語速隨口說了一段內容,訊飛輸入法瞬間「打」出文字,識別結果一字不差。

當時,訊飛輸入法的語音識別率是 97%。而在昨天下午舉行的訊飛輸入法媒體見面會上,產品總監翟吉博宣布,這個數字變成了 98%

羅永浩介紹訊飛輸入法

此外,據市場品牌負責人李強軍介紹,訊飛輸入法用戶規模突破6億,語音輸入月覆蓋率達50%,語音滲透率保持逐年上升態勢。

至於準確率是否能夠達到百分之百,訊飛輸入法產品總監翟吉博的回答是:技術上目前還做不到

首先,同音字是個難題,只能儘可能提高命中率,這也是為什麼搜狗、百度、訊飛都要給輸入法加入語音修改功能的原因。其次,用戶非常口語化的表達機器無法精準識別,人機互動習慣需要磨合。此外,嘈雜環境下語音識別會受到環境音的影響。

訊飛輸入法產品總監:翟吉博

技術:DFCNN語音識別框架

訊飛輸入法從人腦神經科學入手對人類記憶進行仿生,實現大量無監督的數據去輔助有人工標註的數據。受圖像領域 CNN 應用的啟發,科大訊飛研發了深度全序列卷積神經網絡(Deep Fully Convolutional Neural Network,DFCNN)語音識別框架,使用大量的卷積層直接將語譜圖作為輸入,相比傳統語音特徵作為輸入,降低了信息損失,表達了語音的長時相關性。

同時,借鑑圖像識別中效果最好的網絡配置,每個卷積層使用 3×3 的小卷積核訓練更深的 CNN 模型,輸出單元直接為最終的識別結果(比如音節或漢字),將感知智能、認知智能等 AI 技術應用在輸入法上,一分鐘可識別 400 字,並支持多語種實時語音翻譯、超長語音輸入、耳語輸入、離線語音輸入等功能。

特色:提出方言語音解決方案

對於口音和方言識別的難題,訊飛輸入法提出方言語音輸入方案來解決。依託科大訊飛對 AI 技術及語言深度研究的積累,採用 Multi-lingual 多語言建模,通過多方言數據共享方式訓練;輔以 Global Phone全球音素集,從聲學層面的相似性統一各方言的音素定義,對方言「語圖譜」模型做進一步精進,從而有針對性地提升方言語種的識別能力。

目前訊飛輸入法支持 22 種方言,其中粵語、四川話、東北話等識別率均已超過 90%。2017年對外發起「方言保護計劃」,建立「中國方言庫」,積累海量方言數據,讓這些數據為深度學習提供素材。本月底,訊飛輸入法將新增蘇州話識別,方言識別語種將擴充至23種。

基於科大訊飛精簡和優化的 Hybrid-DFCNN 全新語音識別框架,6月底訊飛輸入法將上線 Hyper-CNN語音新引擎,隨之通用語音識別準確率將相對提升 15%,此外可以優化中英混合語音輸入、粵語等重點方言、標點判斷準確率,提升語音輸入的體驗。

重新定義鍵盤,新增面對面翻譯和 OCR 拍照

在百度輸入法的發布會上,AIG 負責人王海峰發表了他對輸入法的看法,認為即便現在有語音輸入的加持,其實還不足夠,未來的輸入方式一定是 AI 加持的「全感官輸入」。訊飛的判斷是,輸入法將不再局限於五筆、九宮格、二十六鍵、手寫固定鍵盤形態,從而推出「莫得鍵盤」、「語音鍵盤」、「VG 語音交互面板」等人機互動模式。

莫得鍵盤即「沒有」鍵盤,基於訊飛輸入法智能語音技術,支持語音輸入、語音口令控制,實現無鍵盤輸入。為語音重度用戶量身定製了語音鍵盤,呈現便捷的語音輸入形態,只憑一張嘴就能輕鬆打字、修改甚至自動加標點符號,不需學習其他技能。基於智能語音應用,打造 VG(VoiceGame)語音交互面板,利用 AI 在交互層面進行了嘗試。輸入過程等同「玩遊戲」,語速快慢、聲音大小等直接體現了創意交互。

訊飛輸入法將語音識別、語音合成以及機器翻譯等新技術融合在一起,新增面對面翻譯,支持中文與英日韓俄多語種即時翻譯,並且將面對面的交互方式引入語音翻譯應用中。例如,在對話雙方各講母語時,另一方就會同步看到翻譯結果。

基於用戶剛需,新增了 OCR 拍照輸入,可以識別書本、路牌、名片等印刷體上的文字以及手寫字體。手寫識別準確率也高達 90% 以上。

體驗:語音識別哪家強?

會後,雷鋒網分別試用了搜狗輸入法和訊飛輸入法。

訊飛語音可一次性不間斷輸入249個字,搜狗語音可輸入221個字。整體來看,訊飛識別率更高一些。

在對詩歌的識別方面,兩家輸入法都有很好的表現。讀者也可試試用自己家鄉的方言,看看這些有 AI 加持的輸入法能否精準識別。

隨著語音識別技術的發展,可能未來我們真的不再需要用手打字,至於訊飛對未來人工智慧語音輸入的展望,翟吉博的回答是:「現在的產品在省時高效和足夠簡單自然這些維度上並沒有做到極致。假如有一天技術成熟了,我們通過意念或者腦電波輸入文字,打開微信,盯著屏幕看兩秒,文字就發出去了,我想這會是一個更加極致的輸入法。」

AI普遍化後,訊飛需要尋找新的差異點

據速途研究院2017年調研數據顯示,輸入法市場上,搜狗以 63.6% 的市場份額遙遙領先,接下來是百度和訊飛。王海峰說,百度輸入法是百度 AI 技術應用的橋頭堡,新的 AI 技術將會首先應用在輸入法上。搜狗 CEO 王小川也表示將 AI 賦能升級輸入法列為搜狗 2018 年度 AI 戰略之一,並且輸入法不止可以打字,還將承載信息獲取和流量分發。在輸入法都打 AI 牌的年代,訊飛的優勢何在?

對此,翟吉博在接受雷鋒網的採訪時表示,訊飛一直以來聚焦於語音輸入,對於語音輸入的用戶場景體驗和未來發展有著更深的理解。此外, 在語音技術方面持續創新,會一直尋找新問題並用技術和產品設計解決。「我們永遠是往前多走一步,持續探索。」

但是,據雷鋒網(公眾號:雷鋒網)了解,目前用戶的輸入習慣主要還是以拼音輸入為主。速途研究院的數據顯示,六成多的用戶還是選擇拼音輸入,其中九宮格拼音輸入最接近用戶的輸入習慣,可以單手掌控輸入。

隨著技術的發展,語音轉化成文字的正確率越來越高,選擇語音輸入的用戶在不斷增多。對於語音輸入,訊飛輸入法支持 22 種方言,百度輸入法則提供了語音翻譯,支持 28 種高頻次語言同聲傳譯。


目前輸入法市場格局形成了一超多強的局面,搜狗輸入法長期保持市場第一,且不斷發展。百度輸入法借AI 之力奮起直追,訊飛等輸入法也在不斷差異化,努力加強個性化特色功能。在識別率方面,頭部廠商在語音識別準確率上均達到 97% 以上的高水準,而百度和搜狗都擁有得天獨厚的龐大搜索資料庫為深度學習算法提供燃料,語音輸入用戶習慣的養成卻尚待時日,主打 AI 語音識別的訊飛,可能還需要再繼續探索其他差異化策略。

相關文章:

搜狗輸入法醫生版上線,解決醫生群體打字難問題

百度輸入法 8.0 版本上線,王海峰稱其是「百度 AI 的橋頭堡」

為iPhone X加點料,搜狗輸入法iOS新版上線

CNCC 2016 | 搜狗 CEO 王小川:輸入法的未來是自動問答

訊飛輸入法iOS 6.1完美適配版放出

訊飛輸入法3.0: 支持英語語音輸入

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 國際殘疾人日:訊飛輸入法無障礙輸入點亮信息世界
    下面,一起來看看一位名叫「盲探-小龍蛋」的博主在視頻平臺分享他如何使用訊飛輸入法無障礙輸入的經驗。從小龍蛋的操作可見,訊飛輸入法說話同步轉文字,打字高效而準確,視障者只需長按空格鍵說話就能完成打字。如果不說普通話也能打字嗎?答案是肯定的。這款輸入法支持23種方言之多,能夠適應主流方言區的口音,不必擔心打錯或者無法識別,大大消除了與明眼人之間的溝通障礙。
  • 訊飛輸入法全新吉祥物藍大嘴正式亮相 網際網路神獸又添新品種
    近日,訊飛輸入法全新吉祥物「藍大嘴」正式公開亮相,中國網際網路領域再添「神獸」一枚。據了解,這位大嘴巴的藍色鸚鵡雖然性別不詳,但性格卻著實聰明、幽默並且愛說話,承襲了訊飛輸入法產「高效輸入,樂享溝通」的一貫理念。
  • 訊飛輸入法PC版全新上線 跨屏輸入為效率而生!
    前言:頗受誇讚的訊飛輸入法PC版在推出兩年之後便暫停了更新,那時曾有用戶如此惋惜道,「技術明明那麼牛,光靠語音識別的技術都能碾壓同行,稍微努努力就能把別的PC輸入法打倒了,為什麼就停更了?」好在,2020年的12月,訊飛輸入法PC版又神奇的恢復了上線。
  • 訊飛輸入法PC版評測:跨屏語音動口不動手...
    此番重啟的訊飛輸入法PC版和之前一樣,主打綠色安全,無廣告幹擾,界面清爽。在我們的實際體驗當中,訊飛輸入法PC沒有出現任何的插件、軟體捆綁行為,也沒有與輸入法無關的插件在後臺靜默運行。使用至今我們還可以確定,它不帶有任何得消息推送功能,只是單純的作為輸入法工具出現在用戶電腦上。
  • 如何設置訊飛輸入法鍵盤布局 上劃打出數字和符號?
    為什麼有的訊飛輸入法用戶可以直接在鍵盤上劃輸入數字和符號,而你卻需要切換到對應的數字鍵盤和符號鍵盤輸入?難道用的不是同一個訊飛輸入法嗎?其實差距僅在於鍵盤布局不同。由於每個人的打字習慣不同,所以對輸入法的要求自然也不同,統一的鍵盤布局勢必不能滿足個性化需求,所以訊飛輸入法提供了六款鍵盤布局,總有一款適合你。訊飛輸入法的六款鍵盤布局分別是:訊飛布局、默認布局、搜狗布局、雙鍵布局、懷舊布局和點劃布局。劃重點,其中訊飛布局、搜狗布局、雙鍵布局、點劃布局均已支持在鍵盤上劃輸入數字和符號。
  • 訊飛輸入法:安卓新版大幅提升武漢話語音識別準確率
    IT之家2月26日消息 根據訊飛輸入法官方的消息,訊飛輸入法團隊通過海量方言語音數據和機器學習技術,使武漢話識別準確率大幅提升。IT之家了解到,訊飛輸入法從中國方言庫積累的語料中篩選醫用和日常對話場景進行標註,將武漢話和普通話對應起來,並通過遷移學習模型訓練,有效提升方言轉普通話的性能。病友用武漢話表述症狀時,訊飛輸入法不但把武漢話轉為普通話的文字,還能通過普通話自動播報,從而方便幫助醫生準確地判斷病情,有效地及時救治。
  • 訊飛輸入法安卓V9.1.9575 加入「語音計算器」功能
    日前,訊飛輸入法發布Android V9.1.9575,強化語音輸入的「基本功」,大幅提升武漢話語音識別準確率,裨益武漢地區的遠程溝通。   無論一個人用手機編輯文字的速度有多快,手動打字過程總體所耗費的時間都比語音輸入要長得多。現實情況是中國各個地方方言不一樣,很多人喜歡用家鄉方言,增加了語音識別的難度。
  • 嘴快話多的小機靈鬼 訊飛輸入法吉祥物藍大嘴全新出道
    日前,訊飛輸入法吉祥物「藍大嘴」全新發布,中國網際網路領域再添萌寵一枚。這位大嘴巴的藍色鸚鵡性格聰明、幽默並且愛說話,體現了訊飛輸入法產品的定位和內涵。從工具到服務再延伸到內容,是網際網路的發展態勢,也是訊飛輸入法突破創新的方向。眼下,十年磨劍的訊飛輸入法已經成為展示個性、輔助智慧生活的助手,使暢快溝通無障礙;此外產品內建BiuBiu社區,讓用戶看到優質的UGC內容,與眾同樂。在A.I。
  • 神奇的訊飛輸入法超好玩 花式字體承包你與眾不同的美
    眾所周知,手機輸入法可以頻繁更換皮膚、聲音,是否也能換好看的字體呢?始終為用戶提供創新科技和人文關懷的訊飛輸入法精心打造了字體商店,給打字過程帶去更多樂趣與驚喜!在顏值即正義的時代,輸入法皮膚和字體都是顏值擔當的主力,換上一套全新皮膚,搭配好看的字體更是相得益彰。
  • 訊飛輸入法訴百度不當競爭 李彥宏內部信曾強調推廣公平性
    科大訊飛方面認為此舉構成商標侵權和不正當競爭,為維護自身權益,訊飛輸入法將百度公司訴至法院,要求停止侵權及不正當競爭行為、賠禮道歉、消除影響並賠償經濟損失100萬元。直白來說,百度方面利用自身的搜索地位推廣百度輸入法,當用戶搜索「訊飛輸入法」時,最前顯示的是「訊飛輸入法」字樣的百度推廣連結,當用戶點擊該連結時,會跳轉到「百度輸入法」的官方頁面。區別於百度的關鍵詞競價排名,百度此舉直接利用搜尋引擎推廣自家產品,掛「訊飛輸入法」之名,引導用戶進入「百度輸入法」頁面,而關鍵詞競價排名並不涉及「名鏈不一致」的問題。
  • 你覺得五筆輸入法和拼音輸入法,你更喜歡哪個?
    智能輸入法越來越先進五筆輸入法會不會消失淘汰?我覺得不會被淘汰,但是市場可能會減小,必定智能拼音輸入法、語音輸入法等等形式都是非常好用的,所以在電腦入門以及手機入門地段覆蓋了,所以佔據的用戶群體就比較多,而且學習五筆輸入法確實有一點門檻的,我記得當時我是學計算機的,當然是中專形式的計算機專業,當時還有一段時間刻意學了五筆輸入法,怎奈資質愚鈍沒有學會!
  • 五筆輸入法曾風靡全國,卻敗給拼音輸入法,為何現在幾乎沒人用?
    據艾媒諮詢近日公布的,《2020年秋季中國第三方手機輸入法市場監測報告》顯示,2020年預計我國第三方手機輸入法用戶規模為7.48億人。其中,百度輸入法、搜狗輸入法與訊飛輸入法佔據了這一市場95.9%的市場份額。
  • 保護瀕危語言優化方言識別能力 訊飛開啟「AI方言發音人」招募計劃
    來源:中國新聞網作者:${中新記者姓名}責任編輯:張楷欣     訊飛輸入法聯合創始人翟吉博  在當天召開的2018訊飛輸入法媒體見面會上,科大訊飛多語種高級研究員祖漪清講述了方言勢微的現狀,她表示,現在是人工智慧崛起的時代,利用人工智慧技術進行瀕危語言、方言系統的研究,實現對一個語言的完整「複製」迫在眉睫。
  • 訊飛發布「隨聲譯」輸入法:支持中英文同聲傳譯
    日前,主打語音輸入的訊飛輸入法同步更新了Android 5.2.2216和iPhone 5.2.1482兩個新版本,最大的亮點是新增了最新研發的「隨聲譯」,支持中譯英、英譯中「同聲傳譯」。用戶只要說出內容,就能將中/英文實時翻譯成文字。
  • iOS上最好用的輸入法你知道嗎?
    這一回,小編就不做什麼玄之又玄的測試,只做一些大家都能看懂並且都能自己跟著動手一起測測的簡單測試。讓大家也能參與到測試中,才能真正體會小編為什麼要這麼測試,而這麼測試的意義又何在,這功能上誰做得最完美。   測試中的配圖如無具體說明,從左到右分別是搜狗輸入法、百度輸入法和訊飛輸入法(排序的理由是,APP Stroe的市場佔有率從高到低)。
  • 老羅推薦的訊飛語音,有這些 know-how | 雷鋒網公開課
    究竟是什麼,讓2016年的語音輸入變得不一樣,讓訊飛的語音輸入變得不一樣?為了解答這個問題,雷鋒網請來了訊飛輸入法產品總監,或者用時髦的說法「訊飛輸入法之父」,為大家解解饞。 雷鋒網雷鋒網雷鋒網嘉賓簡介翟吉博,訊飛輸入法產品總監。
  • 輸入法暴露你的年齡:用五筆和九宮格輸入法的都是老年人?
    她沒有回答我的問題,並再次反問我,你手機用什麼輸入法啊?我回答說是九宮格,小姐姐一拍手笑著說,五筆加九宮格,老年人標配。無言以對的我只能尷尬的摸摸鼻子,心裡卻在吐槽:難道用五筆和九宮格輸入法的都是老年人?與智能抖音輸入法相比,五筆輸入法的歷史要古老一點。
  • 訊飛PC輸入法評測:語音+跨屏輸入 打工人必備生產力神器
    訊飛在發布了創新力十足的智能語音輸入法後,很多用戶「一用就回不去」,他們發現——原來打字只需要動動嘴,會比在瘋狂敲打鍵盤更加方便輕鬆。隨著技術的成熟,訊飛開始嘗試多終端互聯。最新版的訊飛PC輸入法便是在結合了拼音、語音、手寫三大輸入方式基礎上,還能讓手機端輸入的信息,實時同步到PC端。
  • 以前很火的五筆輸入法,為何會輸給拼音?
    根據第三方調研機構發布的數據顯示,國內第三方手機輸入法市場正在集中提高。在目前所佔據的市場份額中,搜狗和百度佔比差距僅有0.1%,前者以43.6%的佔比領先後者,而訊飛位列第三,僅有8.8%的市場份額。