凌空手寫、方言識別?百度搞的是噱頭還是創新?

2021-02-06 我的極刻

最近,小黑的一個小夥伴被他在百度輸入法裡新發現功能的震驚了,於是興衝衝跑來,要告訴小黑這個他看來很厲害的創舉:


百度輸入法現在有凌空手寫功能,還可以支持識別部分方言了喲!


對此,小黑本人的反應是:第三方輸入法啊……好久沒用了呢。


不過,既然小夥伴都這麼興致勃勃了,小黑也不好拂了他的意,恰好小黑也想試試好久沒用的第三方輸入法們到底長成什麼樣子了。那麼,就讓小黑再來當一次APP體驗官吧。

其實在輸入法領域,用戶認可度高的APP也就那麼幾個。小黑在App Store中搜索關鍵字「輸入法」,顯示的前三項剛好是國內用戶體量最大的三個輸入法APP。



那麼,這三款熱門的輸入法APP相比從前的版本,新增了哪些特別的功能,又好不好用呢?



在iPhone上開啟第三方輸入法的權限,大致都是同一個流程。雖然大家應該都知道,但小黑在這裡還是簡單地測試了一下。


以訊飛輸入法為例。當我們首次打開的時候,輸入法會出現一個提示頁面,提示我們將輸入法添加到鍵盤中,並選取「允許完全訪問」。


當然,搜狗輸入法還有一項額外提醒,就是導入通訊錄。



導入通訊錄的好處,是當你需要在使用時輸入朋友的名字時會比較方便。但基於目前國內的隱私保護大環境,小黑還是勸你不要導入。

雖然每家公司都告訴用戶我們不會收集用戶的隱私,但是,誰知道呢。


這三款輸入法的鍵盤布局大同小異,然而,從小黑的角度來說,問題就出在這「小異」上。


以小黑常用的全鍵盤拼音輸入法為例,iPhone原生輸入法、搜狗輸入法、訊飛輸入法和百度輸入法的界面依次是這樣的。



用慣iPhone原生輸入法的小黑在習慣大空格鍵、地球鍵切換中英文之後,遇到「中英文切換」鍵佔據空格鍵的設定就有些不適,時常會發生誤觸的情況。另外,訊飛輸入法和百度輸入法都將句號放置在空格旁,百度輸入法的空格這一行甚至還有語音識別按鍵,對小黑來說更增加了誤觸的概率。

對習慣原生輸入法的小黑來說,改變輸入法是一件需要重新培養習慣的事情,而對習慣其他輸入法的用戶來說,也是一樣。所以小黑的建議是:沒必要去選什麼「更好用」的輸入法,自己習慣的,就是最好的。


當然,在這三個第三方輸入法APP中,讓小黑覺得最方便的還是搜狗輸入法。特別是上滑輸入標點符號的功能,曾幾何時讓小黑愛不釋手。

至於輸入法的詞庫這一塊,測試的意義其實並不大,因為現在的輸入法都擁有智能學習功能,會自動學習用戶使用詞彙的頻次,從而適應每個用戶的使用習慣。

在進階功能這一方面,小黑主要會橫向對比這三個輸入法的一些獨有功能。


首先是搜狗輸入法。在搜狗輸入法的設置菜單中,特別有一項內容是「汪仔助手」。其中包含著表情推薦、資訊推薦、天氣推薦等內容。



這些功能通過點擊輸入法右上角的「汪仔」頭像就可以實現。例如,在沒有輸入任何字時點擊汪仔,輸入法會自動生成一句「尬聊」的話。



而當用戶在微信或者QQ中隨便打一個詞,再點擊汪仔,就提供一些相關表情讓用戶選擇。



不過,這些功能對超正經的小黑來說,都顯得比較尷尬,再加上設置中明晃晃的「表情推薦廣告」這一項,讓小黑忙不迭地關閉了汪仔助手。

此外,在快捷設置面板中,搜狗輸入法還有一些諸如錢包、營銷盒子之類的功能,讓小黑分不清它是一款輸入法還是一個營銷工具了。



訊飛輸入法並沒有那麼多進階功能,相對獨特的功能主要是語音便籤、面對面翻譯等相對實用的功能。



小黑測試了一下工具欄中的文字掃描功能,測試的結果有好有壞。

首先,小黑拿起了最近正在測試的一款產品的說明書進行掃描。或許是因為說明書字體太小的關係,掃描結果不盡如人意。

之後,小黑又用它掃描了一本攝影方面的書籍,掃描結果還是不錯的,除了一個標點沒有被掃描出來,其他文字基本正確。

百度輸入法的功能欄中,除了這次引起小夥伴注意的凌空手寫之外,沒有什麼特別的功能。至於方言輸入麼……搜狗和訊飛老早就實現了更多種方言的語音輸入,甚至還都支持多種語言的語音輸入和多語言翻譯,這早就不算什麼亮眼功能了。

許多科幻電影中,都有類似的裝置,只不過大多數的用途都不是寫字,而是進行功能操作。


小黑能想到的最近的例子大概就是人間大炮,哦,不對,上海堡壘了。


而小黑也在網上看到過不少宣傳文抓著這一點狂吹百度輸入法,比如下面這些。



不過,小黑始終堅信一句話:是騾子是馬,還是要牽出來遛遛的。

所以小黑實際使用百度輸入法的凌空手寫功能,為大家錄了幾段視頻。

首先,小黑測試了幾個簡單的字:「人」和「入」,百度輸入法非常輕鬆地識別了出來。當然,如果這兩個字都識別不出來,那它也就該狗帶了。


之後,小黑略微加大了難度,於是百度輸入法就懵逼了。小夥伴們也可以猜猜小黑究竟輸入的是什麼字。

從上面的測試結果來看,凌空手寫功能對稍複雜的字幾乎沒有識別能力。


造成這種狀況的原因,小黑覺得主要有兩點:首先,凌空手寫技術目前還無法判斷筆劃的轉換。例如上面的視頻中,百度輸入法並不能判斷出用戶收筆、落筆的時機,手指划過的每一個地方都被連在一起。


此外,物體追蹤的算法目前並不完善,即便是捕捉白牆前的手指,但只要手指動的快一點,就無法被即時追蹤到了。



不只是小黑的測試說明了這一點,網上許多用戶也都覺得:這項技術目前更大的價值還是在娛樂上。


根據小黑收集到的資料,凌空手寫技術其實早在2019年1月就已經上線了。


不過,這次新版本的凌空手寫技術則是升級後的第二代。

據稱,第一代凌空手寫技術必須要具有深度/紅外攝像頭的設備才能追蹤、監測指尖的運動軌跡。而升級後的凌空手寫技術則只需要有一個過得去的前置攝像頭就可以了,這也大大降低了技術的準入門檻,讓更多的用戶能夠體驗一番。


不過,如果要讓它實用、好用,卻並不簡單。正如上面的視頻所展示的一樣,凌空手寫功能目前的實用價值並不高,第一個難關就是在識別的準確率方面。


由於降低了對攝像頭的要求,凌空手寫對算法本身的要求反而大大提高了。物體追蹤的算法還只是最基本的部分,更重要的是在文字識別時,對用戶的書寫習慣的計算,這對任何一家公司來說,都是需要大量投入的事情。


不過,小黑倒並不覺得這只是百度的一個噱頭。


就像微博上的用戶反饋說的那樣,凌空手寫功能在目前主要還是為了好玩。無聊的時候玩個類似「我畫百度猜」這樣的小遊戲,似乎還是挺有樂趣的。



但小黑不禁聯想到,在Siri這一類語音助手剛出現時,大家呼出它,都只是為了各種「調戲」。但隨著技術的不斷進步,AI識別準確性的進一步提升,語音助手從原本的「陪聊」助手,也漸漸變成人們在生活中真正的助手,到現在更是成為了智能家居中的重要紐帶。


有了這樣的先例引導,我們大可放下目前對其「實用性」的討論,來想像一下凌空手寫在未來的實際應用。


事實上,小黑覺得,這項技術最大的用途並不是輸入文字。離開單個APP,放眼整個手機生態,它可以實現更多的功能:例如,當我們不方便拿起手機操作的時候,做一個手勢就可以點亮屏幕、操作手機,這樣想來,是不是有一種科幻片的感覺。


我們甚至還可以離開手機來暢想一下:當我們回到家裡,做個手勢,客廳的燈光就都打開了,窗簾也隨之關閉。回到臥室,再用一個手勢,電視上便出現了歡迎界面。換臺、調整音量和亮度,這些都可以通過手勢來完成。甚至當你想看哪一部電視的時候,也可以通過手勢輸入劇名完成搜索。


想到這裡,小黑不禁開始期待這一天的快點到來。

相比外界對這一功能的吹捧,百度卻相當清醒,只是將功能的入口放在快捷設置界面的倒數第二行。甚至在官網和微博上,關於這項功能的介紹也少之又少。

或許,在百度心中,原本就沒有將這一功能立即推廣的意思。正如小米透明電視等等現在看來「沒什麼用」的功能一樣,這些目前看來花裡胡哨的東西真正面向的,是未來。


我們沒有必要因為任何一項技術現在的狀態就無腦吹捧或者肆意嘲諷。況且,無腦這個詞,不正說明了這些吹捧的和嘲諷的人都沒什麼腦子麼?我們真正該做的,是在自己熱愛的領域,發揮自己的能力,讓這些技術真正變得有實用價值。到那時,我們自然會看到一個更美好的未來。

相關焦點

  • 百度輸入法上手體驗,準確率高還首創凌空手寫,掀起圈粉狂潮
    而且無論是年輕人還是長輩,經常手寫也是能有不少好處的。據我觀察,我爸媽寫字就很不方便,主要是因為語音視頻用習慣了,嫌棄字打得慢。長久以往,字也寫不好了。當我向他們推薦百度輸入法之後,好用強大的手寫功能,讓他們欣然接受。相信大家還是比較好奇,手寫功能真的好用嗎?下面跟著我一起來一探究竟吧。
  • 百度輸入法手寫體驗:AI加持出大招,準確率絕了
    還是說我有啥神秘加成?emmmm好吧,我單身是事實,但打字速度快與這無關好吧……你們別瞎說。其實我之所以微信回得快主要歸功於手機上安裝的百度輸入法。一般情況下,我採用的是拼音九宮格和英文全鍵盤的輸入布局。體驗了才發現手寫輸入這麼香至少在我看來這是一種高效的輸入組合,但是最近我發現,其實百度輸入法的手寫功能也挺好用的。
  • 手寫輸入又快又準 百度輸入法手寫功能顛覆網友的認知
    憑藉技術創新,百度輸入法藉助AI等先進的技術,大大提高了拼音打字的速度。同樣,藉助技術創新和不斷的探索,百度輸入法撕掉了手寫輸入慢,識別率低的標籤,打造了更快、更流暢的手寫體驗。  連寫疊寫齊上陣 手寫輸入大提速  如何提高手機輸入法手寫的速度,這是一件非常棘手的事情,也是手機輸入法面臨的一道難題。
  • 百度輸入法開啟AI時代,突破方言、中英文混合識別難題
    京比特試驗了一下,目前國內的輸入法的語音輸入多半只支持普通話,地方性語言則不能準確的識別出來。而中英夾雜、普通話夾雜方言、英語夾雜方言等這些混合性的語言更是不能夠識別出來。當前,國內的主要輸入法有百度、搜狗、科大訊飛、QQ等幾大輸入法。當然這些輸入法也意識到了自身存在的這些問題,並且一直在努力的改進,但到目前取得的成效並不大,甚至整個輸入法行業語音領域都陷入了困境之中。
  • 百度輸入法AI功能全新升級:不限方言,讓輸入更自由
    給我們帶來了更方便的輸入體驗,新升級的百度輸入法在"方言自由說"模塊裡新增了針對河北、昆明和武漢的三種方言,同時升級了針對福建、廣東、湖南、江西、四川以及吳語地區的重口味普通話的識別準確度,實現了對九種方言和多種口音的全方位識別,成為當前手機輸入法中獨一無二的存在。
  • 語音識別準確率行業第一,中英、方言混輸百度輸入法都沒在怕的!
    業內首創的流式截斷多層注意力建模使其在語音輸入功能精準度方面表現突出,實現了在線語音識別、離線語音識別、中英自由說和方言自由說四大能力突出的「最強語音輸入」,語音輸入準確率及綜合表現體驗方面均處於行業首位。(百度輸入法用戶語音輸入準確率及滿意度評分)據《報告》顯示,2019年用戶語音輸入頻率明顯增加,為輸入方式增長之首。
  • 領銜AI功能創新:百度輸入法加速產品服務智能化躍遷
    整體來看,在社交、購物、在線辦公、遊戲、娛樂、在線教育這六大主要場景中,AI創新功能以各種形式創造著服務的價值,例如社交場景下,有語音輸入、方言自由說、AI滑行輸入功能;在線辦公場景下,有語音速記、AI翻譯、圖文識別、方言識別功能;在線教育場景下,有智能糾錯、智能搜索、手寫輸入、圖文識別功能,等等。
  • 試了一圈,我選百度輸入法
    最方便的還是選擇適合自己的輸入法!今天給大家推薦一款最實用的的輸入法,看完之後保證你會get起來!據媒體諮詢數據研究顯示,現如今發布的第三方移動用戶輸入法市場份額主要是由搜狗、百度、迅飛三種主流手機輸入法構成,其中百度輸入法使用者佔40.5%,搜狗輸入法使用者佔據45.3 %,訊飛輸入法的使用者佔8.4%,三者佔總數的百分之九十,那到底哪種輸入法是最便捷好用的呢?
  • 跨越語音日均請求10億次的山和大海,百度輸入法的「平凡之路」
    說話有方言口音又怎麼辦?這些情況下,輸入法都能識別清楚嗎?很明顯這類說話習慣一旦養成,在短時間內既難糾正,更難改變,特別是一些年長用戶,讓他們改變幾十年來形成的口音,基本是一個不能完成任務,這時就要求輸入法不能只是被動的向用戶提供自己的輸入能力,而要主動「遷就」用戶,「聽懂」用戶的意圖。百度輸入法的「方言自由說」和「中英自由說」兩大功能就是這一產品設計思維下的產物。
  • 史上最強的語音輸入法誕生,百度是如何做到的
    但以百度輸入法為代表的拼音輸入法迅速崛起,五筆漸漸成為歷史。背後的邏輯其實很簡單,五筆終歸是一門新手藝,但漢語拼音近乎普及。而顛覆式創新從未停止,語音之於拼音、手寫亦是如此,近乎為零的學習成本帶來了「上手更快」。這就不難理解,為何百度的「新芽」是一款全盤押注語音的 AI探索版輸入法。
  • 雷州話傳承人:手寫編纂方言字典,孫輩幫助錄入電腦
    投搞、加拼車群
  • 翻譯器中的王者橫空出世,33種語言、方言識別、拍照翻譯、全球漫遊......
    中文與33種語言即時互譯翻譯結果屏幕顯示方言口音均可識別(粵語、河南話、四川話、東北話)(倫敦腔、日本味、印度味、紐西蘭鄉村味)拍照翻譯即拍即譯無需SIM卡全球漫遊網絡方言一樣可以輕鬆識別並翻譯基於訊飛強大的方言識別技術,就算是用方言或帶方言口音的非標準非標準普通話,也可輕鬆實現即時翻譯功能,目前已支持粵語
  • 翻譯器中的王者橫空出世,33種語言、方言識別、拍照翻譯、全球漫遊,中國人的驕傲!
    中文與33種語言即時互譯翻譯結果屏幕顯示方言口音均可識別(粵語、河南話、四川話、東北話)(倫敦腔、日本味、印度味、土澳味)拍照翻譯即拍即譯無需SIM卡全球漫遊網絡方言一樣可以輕鬆識別並翻譯基於訊飛強大的方言識別技術,就算是用方言或帶方言口音的非標準非標準普通話,也可輕鬆實現即時翻譯功能,目前已支持粵語、四川話、東北話、河南話等
  • 小米電視 4A 的語音助手是噱頭還是真實用?
    蘋果有 Siri、谷歌有 Google Assistant、微軟有 Cortana,三星的 Bixby 語音助手也剛剛發布不久,回到國內,也有百度度秘、訊飛語音等,就連支付寶 APP 也內置了語音助手,傳聞諾基亞和華為都加入了人工智慧語音助手的隊伍。
  • 百度輸入法:中英混說、方言都難不倒的輸入法,讓輸入隨心所欲
    但是百度輸入法在全面升級之後,它的語音輸入功能,不僅準確度更高,還做到了多功能、多語言識別。以往的輸入法一般針對升級的是識別普通話的準確度,而百度語音輸入法不僅識別普通話準確度很高,更重要的是它讓語音輸入變得更加隨心所欲,讓用戶更加自由。中英混說,一直是語音輸入法中難以邁過的一道坎,輸入法的語音識別是依靠AI語言模型,而傳統的AI語言模型很難自行分辨中英文的區別,經常鬧笑話。
  • 第三方輸入法三分天下,百度後來居上,搶佔新一線城市份額
    隨著搜狗輸入法的成功,也有出現了其他小眾輸入法廠商的模仿,不過畢竟只有模仿而沒有創新,這些小眾輸入法廠商並沒有對搜狗形成競爭,真正的競爭者一定要具備顛覆性創新,訊飛和百度的輸入法在2010年幾乎同期上線,憑藉自身積累的強大語音識別技術
  • 百度輸入法在功能上又出大招啦!
    最近百度輸入法通過不斷的AI賦能持續升級,全新上線了滑行輸入,而且進行了兩大重磅功能的升級主要包括手寫模型升級、方言自由說升級。接下來小編就來聊聊它的AI功能體驗。AI功能進行了升級主要體現在滑行輸入、手寫自由寫、語音方言識別、語音速記、離線中英自由說等等。
  • 艾媒報告:百度輸入法AI功能整體滿意度最高
    (百度輸入法創新功能盤點)還在被大會小會和遠程工作溝通支配得手忙腳亂?有百度輸入法的強勢助力,在線辦公中的許多難題都能被輕鬆解決。據《報告》顯示,在線辦公場景中,受訪用戶對百度輸入法AI創新功能滿意度更高。