Google 開發了一款語音轉文字的手機 app,這對他們很重要

2020-12-17 愛範兒

在 Google 研究中心,你或許會看到這樣一個場景:

一群人圍坐在一起交流,其中一個人總在別人發言時盯著自己的手機屏幕。隨著對方的發言,他的手機屏幕上出現了一大段字幕,而這些文字信息正是發言者正在說話的內容。

這其實是 Google 一名有聽力障礙的員工正在藉助一款手機 app 和同事交流工作的真實場景。

而幫助他「看」懂對方說話內容的手機 app 是今年 2 月 Google 在 Android 手機上推出的 Live Transcribe 應用程式。

據了解,目前耳聾及聽力障礙人群在正式的會議或商務活動中主要依賴人工轉錄服務來獲取現場的語音信息,而這類服務普遍價格高昂,且需要字幕員遠程參與,所以很難在日常場景中得到應用。

Live Transcribe 是 Google 針對耳聾及聽力障礙人群開發的一款免費 Android 無障礙服務,基於此前在自動語音識別技術(ASR)的研究,Live Transcribe 將自動生成字幕的功能引入了手機設備,只需一部手機,便可實現實時的語音轉文字功能。

▲ Google AI Research Group 產品經理 Sagar Savla 遠程講解 Live Transcribe 的工作原理

據 Google AI Research Group 產品經理 Sagar Savla 介紹,Live Transcribe 的實時轉錄功能同時依靠手機設備及雲端的神經網絡來支持運作:

手機設備上的神經網絡主要做聲音分類的工作,例如嬰兒的哭聲或玻璃破碎的聲音。而雲端的神經網絡則通過三種模型來幫助完成語音轉錄成文字的工作——首先通過聲學模型,可以辨別單詞中的不同音節;然後在發音模型下,將辨別出來的不同音節組成實際的單詞;最後依靠語音模型,根據識別出來的單詞增加適當的標點符號停頓。Sagar Savla 表示,之所以選擇在 Android 手機上開發這項無障礙服務,一方面是考慮到手機設備相比筆記本、平板電腦、小型投影儀等更日常便攜,同時相比可穿戴設備又有更廣泛的使用人群;另一方面,目前全球使用 Android 手機的用戶有 20 億人,由於 Live Transcribe 的大部分轉錄工作都在雲端完成,所以這項服務對手機設備的配置並無特別要求,只要有網,便可在大部分 Android 手機上進行運行。

Sagar Savla 還表示,Live Transcribe 目前支持 70 多種語言和方言的實時轉錄,即便是在網絡並不發達的第三世界國家,轉錄延時也不會超過 200 毫秒。

據悉, Live Transcribe 已在 Google Pixel 3 手機中預裝了此功能的最新版本,各國的 Google Play 商店也在分階段上架(國內用戶暫時無法下載使用)。

除了提供實時的語音轉錄服務,Live Transcribe 還與加拉德特大學(一所全部課程與服務都是為聾人或弱聽學生而設的大學)共同發起了用戶體驗研究,優化了產品其他方面的互動設計:

比如以前轉錄屏幕上普遍會用不同顏色來提醒用戶信息的準確度,黃色代表較高的準確度,而藍色則表示準確度較低。Live Transcribe 則取消了這個顯示,原因是通過他們的研究發現,用顏色顯示準確度不僅會分散用戶的注意力,且極易造成閱讀誤導,比如會讓用戶誤將兩個相同顏色的單詞認為是一個詞組。

▲ 用不同顏色顯示信息的準確度。

另外,Live Transcribe 團隊認為僅僅依靠轉錄功能可能存在一些隱患,比如嘈雜環境由於語音接收狀況不佳導致信息傳達錯誤,所以他們也在研究是否可以藉助語音以外的其他聽覺信號來改善用戶體驗。比如增加環境噪音的顯示,Sagar Savla 表示,這個功能不僅可以幫助用戶了解當前環境所處的噪聲級別,還可以引導用戶根據麥克風的接收狀況調整手機位置。

▲ 較亮的內部同心圓代表噪聲層,外部同心圓表示手機麥克風對說話人聲音的接收狀況。

雖然愛範兒的大部分讀者可能並非 Live Transcribe 這類無障礙服務的核心用戶,但據世界衛生組織(WTO)估計,全球有 4.66 億耳聾及聽障人士,到 2055 年將上升至 9 億人,而這個數字已遠超目前世界人口第三大國美國的總人口數(截止 2019.1 約為 3.3 億人)。

但目前我們使用的大部分科技產品並未將信息無障礙納入產品研發流程,正如 《IT 公論的》李如一此前說過,產品經理往往把信息無障礙視為產品中的一個「功能」。但凡功能總有優先級,換言之,功能未必是非有不可的。而如果你把信息無障礙視為用戶體驗的有機組成部分,就必須從定義用戶、構思產品的初期將它納入設計流程。

實際上,無論生理功能是否完整,任何人都享有使用一個軟硬體產品全部功能的權利。那些標榜「用科技改變生活」的科技公司們,也應該把推動信息無障礙作為一種責任,而非公益行為。

我們可以看到,除 Google 外,蘋果、微軟等科技巨頭也正在踐行和推廣這樣的理念。不僅自己研發設計無障礙、包容性的產品,還將信息無障礙指南與文檔開放給第三方開發者參考( Web 設計規範、iOS 程序設計規範以及 Android 設計規範 )。

而在很多歐美國家,信息無障礙屬於強制要求,如果因為沒有輔助功能而被起訴,很有可能面臨高額的賠償或者嚴厲的處罰。

去年,我國工信部批准發布了《移動通信終端無障礙技術要求》,越來越的國產手機廠商和第三方 app 也開始重視信息無障礙。

我們始終倡導,信息無障礙不是一種恩惠,而是屬於每個人的權利。希望這個理念能深入每一家科技公司。

相關焦點

  • 語音轉文字的軟體分享,推薦一款個人親測使用的app
    以前使用語音轉文字的人特別少,因為最開始開發的很多軟體轉換率低,錯誤率高所以很少有人使用,隨著時代慢慢的發展,現在很多語音轉文字軟體已經發展得很不錯了。很多做得不錯的軟體轉換率高,而且功能強大非常實用,那麼語音轉文字的軟體分享,推薦一款個人親測使用的app,我們一起來看看。
  • 語音轉文字評測:幾款語音轉文字app,你了解多少?
    語音轉文字有必要嗎?能用在哪裡?這是大多數人對於語記類app的疑問所在,今天為大家簡單介紹一下幾款實用的語記app以及簡單的應用描述。1.訊飛語記訊飛語記是訊飛旗下的語音轉文字產品,如我們所知,科大訊飛是國內最大的語音技術提供商,在智能語音技術領域有著卓越的成績。訊飛聽見優勢就在於有品牌後盾以及成熟的技術支持,光是「訊飛」就讓產品質量有了保證。
  • 有哪些省心的語音轉文字app?再也不怕整理會議記錄了!
    電腦端:風雲語音文字轉換器風雲語音轉文字軟體是一款很優秀的語音轉換器。風雲語音轉文字軟體最新版提供了簡潔的界面,允許用戶免費使用,支持免費軟體升級,免費軟體服務。同時,風雲語音轉文字軟體不限制音頻文件的大小,並支持批量轉換,可以大大提高工作效率。
  • 在線語音轉文字的方法推薦:如何實現在線語音轉文字?
    如何實現在線語音轉文字?前段時間,朋友小清向我訴說了一個煩惱:在大學課堂上,上課氣氛較為鬆散且老師講課比較隨心。稍不留神,她總會把重要知識點給漏聽掉,沒能記下來重要內容。因此,她最近在尋找能把課堂錄音轉文字的方法。
  • 在線語音轉文字的方法推薦:如何實現在線語音轉文字?
    如何實現在線語音轉文字?前段時間,朋友小清向我訴說了一個煩惱:在大學課堂上,上課氣氛較為鬆散且老師講課比較隨心。稍不留神,她總會把重要知識點給漏聽掉,沒能記下來重要內容。因此,她最近在尋找能把課堂錄音轉文字的方法。
  • Google文字轉語音下載_Google文字轉語音app下載-太平洋下載中心
    藉助 Google 文字轉語音功能,應用可以朗讀屏幕上的文字。讓 TalkBack 和無障礙應用在設備上讀出語音反饋 ? ...此外,該功能還適用於 Play 商店中的很多其他應用 要在您的 Android 設備上使用 Google 文字轉語音功能,請依次轉到「設置」>「語言和輸入法」>「文字轉語音 (TTS) 輸出」,然後,選擇「Google 文字轉語音引擎」作為您的首選引擎。
  • 文字轉語音在線轉換如何操作?一款文字轉語音助手就夠了
    文字轉語音在線轉換如何操作?一款文字轉語音助手就夠了 2019年04月19日 11:50作者:黃頁編輯:黃頁
  • 【訊飛聽見】語音轉文字
    不得不說科大訊飛在語音處理這塊是大佬啊為啥要給大家推薦這個APP呢?實在是這個應用解了我的燃眉之急。說起來也是不好意思,一個網絡課程要發布微課,原先這個微課是組內老師一起做的,每個人都錄音了,現在要用自己的聲音,但有好幾節課沒有錄音文字稿,聽一句錄一句的話效率太低,所以只能把他們的錄音文件導出來再轉成文字。
  • 手機語音轉文字原來這麼簡單!這2個好辦法,輕鬆在線語音轉文字
    比如會議中手寫記錄不僅跟不上會議的節奏,還會錯記漏記,這樣效率非常低下,不過現在可以使用語音轉文字方式進行會議記錄,不僅記錄準確,而且記錄也非常高效。並且語音轉文字也很簡單,筆者這裡分享2個好辦法,大家快來一起學學吧!1.
  • 手機如何語音轉文字,這個音頻轉文字方法很實用,堪稱會議神器
    手機如何語音轉文字,這個音頻轉文字方法很實用,堪稱會議神器 很多新入職的朋友,都遇到會議記錄這種事情,而你在會議記錄的時候還在手寫記錄或者電腦碼字,這樣不僅跟不上老闆說話的速度
  • 錄音怎麼轉文字?下載這款手機APP輕鬆搞定
    錄音怎麼轉文字?很多剛剛踏入職場的新人同事,對每次的重大會議總有著不可言說的抗拒。細問之後才發現,原來他們煩惱的是每次開會都要快速記錄領導的談話內容;即使開會過程錄音了,會後的內容整理也同樣麻煩。後來,我向他們推薦了一款能夠把錄音轉換成文字的手機APP——「錄音轉文字助手」,他們才終於沒有了這個煩惱。在手機應用商城搜索「錄音轉文字助手」,進入產品介紹詳情頁就可以免費下載啦。那到底應該怎麼做,才能把錄音轉換成文字呢?別著急,跟著小編往下看。
  • 4個語音轉文字工具,其中這兩個簡單好用,轉換文字必備神器
    在日常生活中,我們有時候需要轉換比較長的語音成文字,並且要將文字導出,方便後期編輯。那麼我們會找語音轉文字工具來幫忙。特別是做自媒體平臺的朋友,做短視頻的朋友,更是經常要用到語音轉文字工具,這篇就一起給大家整理出來。
  • 兩會上的這款神器突然火了,1秒語音轉文字!
    在這則視頻中裡,裡三層外三層的人們拿著手機、錄音筆、單眼相機等採訪設備將被採訪人層層圍住,而其中一人淡定地站在人群外層,手機的屏幕上卻在跟著現場的語音自動轉化為文字,完全不同於其他記者的緊張狀態。據悉,視頻中該記者使用的「採訪神器」為科大訊飛旗下的訊飛聽見APP——可以將現場語音一秒轉換成文字。
  • 語音轉文字工具:必備錄音轉文字助手,最新版語音轉文字神器
    現在越來越多的人,喜歡使用語音傳遞信息,既方便又快捷。但對於接收語音消息的人來說,長時間的語音信息真的讓人很煩躁。那麼,有沒有辦法將語音轉文字呢?當然是有的,接下來就給大家介紹一款語音轉文字工具:錄音轉文字助手,手機就能搞定語音轉文字。
  • 求推薦一款錄音轉文字APP,職場辦公的首選:錄音轉文字助手
    後來,同事向我推薦了一款好用的辦公軟體——「錄音轉文字助手」APP。現在小編就給大家分享一下,關於這款軟體的6大功能。如果你的手機還沒有這款軟體,可以直接在手機的應用商店搜索「錄音轉文字助手」,進入軟體詳情介紹頁面就可以免費下載、安裝啦。當然,大家也可以通過手機瀏覽器進行免費獲取。
  • 語音轉文字怎麼實現?如何在線語音轉文字
    語音轉文字怎麼實現?如何在線語音轉文字 2019年06月03日 17:35作者:黃頁編輯:黃頁 語音轉文字怎麼實現
  • 語音轉文字APP哪家好?教你一鍵錄音轉文字的方法
    語音轉文字哪家好?快速實現錄音轉文字的方法。這也許是大多數人對語記類APP的疑問所在,恰巧我對這方面有點研究,下面我就來為大家全面透徹的介紹語音轉文字的方式方法。錄音轉文字助手我之前就用的是【錄音轉文字助手】,整體使用過程還是非常滿意的。一款可將錄音迅速轉換成文字的工具,不管你是想要邊錄邊轉換,還是上傳之前的音頻再接著進行轉換都可以。在手機各大應用市場中均可找到,操作方法也很簡單。
  • 一款語音轉文字工具,對日常生活有什麼作用?
    手機的廣泛使用,讓筆記開始出現在手機端,便籤便是這樣的存在。手機端、電腦端的筆記記錄相比手寫,優勢在於記錄輕鬆、省時省力,同時手機是我們隨身攜帶的設備,方便我們隨時隨地記錄。拿起手機打字記錄這種方式更適合小段文字的記錄,遇到需要記錄長信息的時候,打字就顯示出了它的劣勢。
  • 【實用技巧】巧用Goolge翻譯語音轉文字功能(圖文)
    ,打開Google翻譯語音輸入,即可實現語音轉文字識別。一、方法簡介看了上圖,稍微有點理工科背景或修手機電腦的朋友就能明白,Goolge翻譯是支持語音輸入的,通過手機/平板/電腦的語音輸出作為語音輸出,就可以輕鬆實現實時的語音轉文字功能了。可能有些朋友會說,這沒有什麼呀,微信也支持語音輸入,可以按著語音轉文字,訊飛輸入法也支持語音輸出的,轉換文字準確度很高呀。
  • 語音轉文字怎麼做?才發現,錄音轉文字助手APP這麼好用
    語音轉文字怎麼做?才發現,錄音轉文字助手APP這麼好用 在現如今這個節奏飛快的社會,所有人都追求高效率。工作、學習、生活都是如此,每個人都想用最短的時間完成任務。