聯合國發布的數據顯示,目前全世界超過70億人口中,約有10億以上的人,也就是相當於總人口約15%的人患有某種形式的殘疾。因為無障礙設施和服務的不完善,這些人常常更多地待在家中,遠離公共空間,難以融入社會。為了在社會和發展的各個領域促進和維護殘疾人的權利和福祉,並提高人們對殘疾人處境的認識,1992年,聯合國大會第47/3號決議宣布將每年的今天,也就是12月3日,定為國際殘疾人日。
在數位化和智能設備普及的時代,殘疾人應該能平等地享受科技進步的帶來的成果。正因如此,在開發產品和提供服務時,有越來越多的科技公司開始充分考慮殘障用戶的需求。例如,作為一家極為重視產品「包容性」和「無障礙優先」的設計思路的大型科技公司,Google開發的幾款應用程式和人工智慧模型,就結合了眾多先進技術,讓手機成為了盲人和視障人士的「眼睛」,耳聾和聽障患者的「耳朵」,並幫助聾啞人更好地在視頻會議中表達自己。
通過手機攝像頭識別商品
在商店或超市挑選商品,是日常生活中再普通不過的一部分,然而,對於盲人或者視力障礙人士而言,要想在包裝完全一致(盒裝、罐裝、瓶裝......),因而觸感也相同的商品中找到自己需要的那一款卻並非易事。Lookout是Google於2018年宣布推出的一款可以幫助這一人群識別周邊環境的產品,今年,為了讓他們能更快速、容易地處理日常事務,Google更新了這項應用程式,推出了識別食品標籤的功能。現在,當用戶將智慧型手機的攝像頭對準產品時,Lookout會自動識別產品上的文字,並可以播放出相關信息,如品牌名稱、產品規格、營養成分等。
這一功能得益於Lookout內置的帶有索引的產品檢測和識別模型,以及基於Mediapipe(Google開發的為實時和流媒體提供跨平臺、定製化機器學習解決方案的工具)的目標跟蹤和光學字符識別(OCR)模型。為了讓這項功能更加易用,Google專門構建了一個由高達200萬種的產品組成的資料庫,讓產品檢測和識別模型可以完全在設備上運行,降低延遲,同時減少對網絡連接的依賴。在光學字符識別方面,Google則選擇了利用神經網絡技術為每幅圖像生成一個大小僅有64位元組的全局描述符,與傳統的局部圖像匹配和文本匹配等方法相比,這一解決方案需要的存儲空間要小得多,讓應用程式能夠容納更多產品信息。
在此次更新中,Lookout還新增了掃描文檔功能,可以拍攝文檔快照,識別其中的文字,讓屏幕閱讀器可以朗讀出其詳細內容,方便盲人和視障人士瀏覽文檔和信件。
將語音準確轉錄為文字的應用
耳聾和聽障人士在社會交往中常常需要依賴價格昂貴、需要預約的人工轉錄服務。自動語音識別(ASR)技術的出現,讓智能設備可以將語音自動轉換為文本,給人們提供了與他人保持實時溝通的可能性。
為了讓耳聾和聽障人士更加獨立地進行日常對話,Google於2019年推出了免費Android應用Live Transcribe,可以為會話實時配上字幕。在這款應用中,Google構建了基於Google Cloud的自動語音識別系統,並添加了基於設備上神經網絡的語音檢測器,該語音檢測器可以檢測語音並自動管理與雲端ASR引擎的網絡連接,將長時間使用Live Transribe的數據流量消耗降至最低。由此,自動語音識別技術可以「走入尋常百姓家」,讓更廣大的人群受益。
同樣在去年發布的LiveCaption,則能自動為在Android手機上播放的音頻或視頻配上字幕,讓耳聾和聽障人士也能享受數字媒體帶來的便利和快樂。通過三個位於設備上的深度學習模型,這款應用可以在不連接網絡的情況下完成轉錄語音、生成標點符號、識別聲音事件(如「掌聲」、「音樂聲」等)等任務,進而準確、高效地輸出實時字幕。
讓視頻會議程序可以檢測手語
因為新冠肺炎疫情,視頻會議成為了各大公司普遍採用的一種工作方式。然而,大部分視頻會議程序的自動跟蹤發言人功能(也就是突出顯示發言人)只能識別出正在大聲講話的人,那些使用手語的殘疾人可能很難得到說出自己想法的機會。
為了應對這一挑戰,Google的研究人員構建了一個實時手語檢測系統,利用姿勢估計模型PoseNet,這一系統聚焦於用戶在使用手語時活動的主要身體部位,包括眼睛、鼻子、肩膀、手等,通過計算這些部位的光流,量化用戶的動作,判斷出用戶是否在使用手語。因為這一系統只檢測那些最必要的信息,所以它的體量很小,在運行中消耗的CPU周期也很少,可以很容易地整合進視頻會議應用中。
圖中黃色圖表即為系統對用戶是否在使用手語的判斷
在檢測到用戶正在使用手語後,它會通過虛擬音頻電纜向視頻會議程序發送人類聽覺範圍之外的超聲音頻,讓其將手語使用者判定為發言人。
我們可以從Google的這些工作中看到,科技的發展如何能幫助殘疾人消除生活中的障礙,縮短他們在生活中與普通人的距離。《殘疾人權利公約》確認,障礙的存在是殘疾問題的核心,對殘疾人的無障礙和包容性是所有殘疾人的基本權利,而一個殘疾人能夠全面地參與社會生活的社會,最終也將有益於所有人的進步和發展。