在《蝙蝠俠》系列的《黑暗騎士》影片中,布魯斯·韋恩通過攻擊數百萬部手機,打造了一套基於麥克風陣列的龐大監聽網絡(SONAR)。不過本周,微軟研究院展示了一項類似的技術,它就是 Project Denmark 。其允許使用手機和筆記本電腦中的麥克風,創建出一個虛擬的麥克風陣列,並用於高精度地收聽和會議轉錄。
(圖自:Microsoft Research)
虛擬麥克風陣列可將現有設備(如配備普通麥克風的手機或筆記本電腦等),動態組合成一個更大的陣列。
具體說來是,該系統基於連續音頻流對齊、盲波束成形、語音識別、分割聚類(Diarization)、以及系統融合等技術來實現。
(截圖 via MSPU)
藉助七組音頻流輸入,微軟研究院已實現 22.3% 的錯字率。在近距離麥克風的非重疊語段上,更是可以將錯字率控制在 3% 以內。
至於系統支持的用戶數量,則取決於區域內配備的麥克風數量。微軟指出,該技術可方便客戶隨時隨地地輕鬆轉錄會話內容,而不論其是否擁有專屬的麥克風陣列。