在 Google 研究中心,你或許會看到這樣一個場景:
一群人圍坐在一起交流,其中一個人總在別人發言時盯著自己的手機屏幕。隨著對方的發言,他的手機屏幕上出現了一大段字幕,而這些文字信息正是發言者正在說話的內容。
這其實是 Google 一名有聽力障礙的員工正在藉助一款手機 app 和同事交流工作的真實場景。
而幫助他「看」懂對方說話內容的手機 app 是今年 2 月 Google 在 Android 手機上推出的 Live Transcribe 應用程式。
據了解,目前耳聾及聽力障礙人群在正式的會議或商務活動中主要依賴人工轉錄服務來獲取現場的語音信息,而這類服務普遍價格高昂,且需要字幕員遠程參與,所以很難在日常場景中得到應用。
Live Transcribe 是 Google 針對耳聾及聽力障礙人群開發的一款免費 Android 無障礙服務,基於此前在自動語音識別技術(ASR)的研究,Live Transcribe 將自動生成字幕的功能引入了手機設備,只需一部手機,便可實現實時的語音轉文字功能。
▲ Google AI Research Group 產品經理 Sagar Savla 遠程講解 Live Transcribe 的工作原理
據 Google AI Research Group 產品經理 Sagar Savla 介紹,Live Transcribe 的實時轉錄功能同時依靠手機設備及雲端的神經網絡來支持運作:
手機設備上的神經網絡主要做聲音分類的工作,例如嬰兒的哭聲或玻璃破碎的聲音。而雲端的神經網絡則通過三種模型來幫助完成語音轉錄成文字的工作——首先通過聲學模型,可以辨別單詞中的不同音節;然後在發音模型下,將辨別出來的不同音節組成實際的單詞;最後依靠語音模型,根據識別出來的單詞增加適當的標點符號停頓。Sagar Savla 表示,之所以選擇在 Android 手機上開發這項無障礙服務,一方面是考慮到手機設備相比筆記本、平板電腦、小型投影儀等更日常便攜,同時相比可穿戴設備又有更廣泛的使用人群;另一方面,目前全球使用 Android 手機的用戶有 20 億人,由於 Live Transcribe 的大部分轉錄工作都在雲端完成,所以這項服務對手機設備的配置並無特別要求,只要有網,便可在大部分 Android 手機上進行運行。
Sagar Savla 還表示,Live Transcribe 目前支持 70 多種語言和方言的實時轉錄,即便是在網絡並不發達的第三世界國家,轉錄延時也不會超過 200 毫秒。
據悉, Live Transcribe 已在 Google Pixel 3 手機中預裝了此功能的最新版本,各國的 Google Play 商店也在分階段上架(國內用戶暫時無法下載使用)。
除了提供實時的語音轉錄服務,Live Transcribe 還與加拉德特大學(一所全部課程與服務都是為聾人或弱聽學生而設的大學)共同發起了用戶體驗研究,優化了產品其他方面的互動設計:
比如以前轉錄屏幕上普遍會用不同顏色來提醒用戶信息的準確度,黃色代表較高的準確度,而藍色則表示準確度較低。Live Transcribe 則取消了這個顯示,原因是通過他們的研究發現,用顏色顯示準確度不僅會分散用戶的注意力,且極易造成閱讀誤導,比如會讓用戶誤將兩個相同顏色的單詞認為是一個詞組。
▲ 用不同顏色顯示信息的準確度。
另外,Live Transcribe 團隊認為僅僅依靠轉錄功能可能存在一些隱患,比如嘈雜環境由於語音接收狀況不佳導致信息傳達錯誤,所以他們也在研究是否可以藉助語音以外的其他聽覺信號來改善用戶體驗。比如增加環境噪音的顯示,Sagar Savla 表示,這個功能不僅可以幫助用戶了解當前環境所處的噪聲級別,還可以引導用戶根據麥克風的接收狀況調整手機位置。
▲ 較亮的內部同心圓代表噪聲層,外部同心圓表示手機麥克風對說話人聲音的接收狀況。
雖然愛範兒的大部分讀者可能並非 Live Transcribe 這類無障礙服務的核心用戶,但據世界衛生組織(WTO)估計,全球有 4.66 億耳聾及聽障人士,到 2055 年將上升至 9 億人,而這個數字已遠超目前世界人口第三大國美國的總人口數(截止 2019.1 約為 3.3 億人)。
但目前我們使用的大部分科技產品並未將信息無障礙納入產品研發流程,正如 《IT 公論的》李如一此前說過,產品經理往往把信息無障礙視為產品中的一個「功能」。但凡功能總有優先級,換言之,功能未必是非有不可的。而如果你把信息無障礙視為用戶體驗的有機組成部分,就必須從定義用戶、構思產品的初期將它納入設計流程。
實際上,無論生理功能是否完整,任何人都享有使用一個軟硬體產品全部功能的權利。那些標榜「用科技改變生活」的科技公司們,也應該把推動信息無障礙作為一種責任,而非公益行為。
我們可以看到,除 Google 外,蘋果、微軟等科技巨頭也正在踐行和推廣這樣的理念。不僅自己研發設計無障礙、包容性的產品,還將信息無障礙指南與文檔開放給第三方開發者參考( Web 設計規範、iOS 程序設計規範以及 Android 設計規範 )。
而在很多歐美國家,信息無障礙屬於強制要求,如果因為沒有輔助功能而被起訴,很有可能面臨高額的賠償或者嚴厲的處罰。
去年,我國工信部批准發布了《移動通信終端無障礙技術要求》,越來越的國產手機廠商和第三方 app 也開始重視信息無障礙。
我們始終倡導,信息無障礙不是一種恩惠,而是屬於每個人的權利。希望這個理念能深入每一家科技公司。