「老婆,開門」,如果隔壁老王對你的聲音模仿到出神入化

2020-12-18 雷鋒網

導語:「老婆,開門。」如果隔壁老王不懷好意,刻意練習你的口音……

本文作者:李勤

「老婆,開門。」

如果隔壁老王不懷好意,刻意練習你的口音,相信你能感受到「京中有善口技者。會賓客大宴,於廳事之東北角施八尺屏障,口技人坐屏障中,一桌、一椅、一扇、一撫尺而已」的同等效果。

▲隔壁王叔叔

不過,如果你家安裝的是擁有聲紋識別的智能門鎖,就算隔壁老王將你的聲音模仿到出神入化,這扇門也是開不了的。

雖然,雷鋒網編輯早就聽說過聲紋識別技術可以應用於智能門鎖,但是不親見,還真不能感受到它的威力。

幾天前,雷鋒網在清華大學的一棟大樓內,參加人工智慧與信息安全論壇暨得意音通信息技術研究院成立大會時,演講聽到一半,得意音通董事長鄭方突然讓工作人員把一張門和相關設備搬上了演講臺。

這是要搞事啊!

然後,兩個漂亮的小姐姐走上臺,一個扮演主人,一個扮演盜竊者。

主人在手機 App 中錄入了自己的聲音與門進行綁定後,開始了第一個回合:

小姐姐主人逛街回到家,打開 App,按照彈出來的數字密碼(實際生活中是隨機密碼,在演示過程中密碼簡化成了 12345678),直接念了密碼,順利開門了。

第二回合:手機丟了,被「小偷」撿到了。盜竊者用自己的聲音念密碼,嗯,門在意料之中地沒有反應。

第三回合:盜竊者不死心,在偷手機之前,就悄悄尾隨過主人,並錄下了她的聲音。然後播放給門「聽」——就算此時採用的是固定密碼,盜竊者播放了好幾次主人的聲音,門依然沒有開。

不過,第一,前文也提到過,聲音門鎖此前也有落地;第二,受眾接受度還有待考驗,畢竟還有指紋識別和人臉識別這種更方便的識別手段。

但是,鄭方和得意音通副總經理兼首席架構師肖永明介紹的以下這個場景,就讓雷鋒網(公眾號:雷鋒網)編輯十分期待了:

「像『給張三轉1000元』一句話,馬上可以做語音識別、意圖理解,得出指令,進行身份確認,最後進行銀行轉帳。一句話就可以銀行轉帳或購物等,非常方便。」

肖永明還告訴雷鋒網,目前他們正與汽車廠商合作,研製用於汽車的聲紋鎖和聲紋防盜。

這裡有一個背景需要交待:

得意音通和清華大學共同負責國家頒布所有聲紋識別相關行業標準的制定,涉及行業包括公安、金融等不同行業。手機銀行現在設定唯一一個生物特徵識別的標準就是聲紋的標準,也主要由他們起草。

其實,聲紋識別作為密碼驗證手段之一,早就在銀行服務中出現過。2015年,已有語音識別廠商與銀行聯合發布「聲紋+人臉」p2p轉帳產品。

2016年,建行手機銀行推出了聲紋驗證服務。

2015年,螞蟻金服技術團隊相關負責人稱,人臉登陸有希望在年內上線,同時,螞蟻金服研發的聲紋技術也很有可能繼人臉識別之後應用於登陸、轉帳等場景中。

後來,大家都知道,今年支付寶果真推出了「刷臉」服務。當然,還沒推出聲紋服務。

綜合來看,這意味著,鄭方提出的未來一句話可以轉帳這種事情還是靠譜的,而肖永明提到的汽車聲紋鎖,也在 2015 年時見諸報導,只是也是作為未來應用的展望領域之一。不過,雷鋒網了解到,得意聲通確實在與相關汽車廠商就聲紋鎖進行研製。

但是,回到問題最初,雖然看上去都是酷炫的黑科技,我能相信聲紋識的安全性嗎?為什麼上面這種智能門能認出老王是老王,你是你?為什麼就算是你的聲音,錄音播放也無法開門?

--下面才是技術秀--

在雷鋒網的的一次硬創公開課中,曾有專家給出了以下不同聲音的聲紋圖,可以看到,不同的聲音,呈現出的畫面是迥異的:

▲1個月大嬰兒的哭聲聲紋

▲男人的口哨聲聲紋

▲下雨打雷聲聲紋

▲人聲和槍聲聲紋

真是不好意思,專家還給出了一張接吻聲的聲紋圖,就說你們接吻時不要咂巴嘴,你看這小畫面,是不是特別像日出時的海面:

還有,被視為軍事機密的核潛艇聲紋:

不同的物體發出的聲音有不同的聲紋,不同的人聲音的聲紋更是頗具奧秘,科學家的目的,就是在各種人聲中找出一個人的聲音特性,從而判定「你是你」。

接下來問題來了,第一,用什麼方法可以判定「你是你」?

鄭方告訴雷鋒網,聲紋識別是一類典型的模式識別問題。完成聲紋特徵提取後,接下來就需要選擇合理的聲紋建模和識別方法。

上述是一張聲紋識別技術發展簡圖。

從1930年開始,科學家用最樸素的語音波形進行比對,看誰「浪」得不一樣。

現在的主流方法是高斯混合模型-通用背景模型(GMM-UBM)、基於GMM-UBM發展起來的i-vector,以及深度神經網絡等。

所謂高斯混合模型(GMM),就是用高斯概率密度函數(正態分布曲線)精確地量化事物,它是一個將事物分解為若干的基於高斯概率密度函數(正態分布曲線)形成的模型。

哎呀,學渣聽上去還是不懂,怎麼破?

借用某網友的一個生動解釋是:

GMM——道生一一生二二生三三生萬物。GMM是人們認識自然萬物相生相剋的規律,是大腦對自然認識後的長時間歸納與沉澱。GMM的核心思想就是任意形態的函數形式(不管是可見的光,圖像,還是抽象的多維度變量模型,比如經濟金融危機模型),都可以用多個高斯函數加權混合得到。那麼什麼是GMM-UBM?它是對傳統GMM模型的改進,因為在實際應用中不可能採集到足夠的語音以覆蓋所有的聲學現象,因此在背景模型(UBM)的基礎上通過MAP自適應得到新說話人的GMM模型。

如果看上去實在有點複雜,你就簡單地把它理解為幾種不同的算法吧……

看上去簡單得不能更簡單的聲紋識別門鎖其實很「複雜」。

鄭方說,上述演示的智能門鎖將聲紋識別和語音識別結合起來,實現了對「Who Spoke What」的識別判斷,也就是說,「門」不但知道你是誰,還知道你說了什麼。

他們還利用了新老技術的結合,比如,將GMM-UBM與i-vector方法結合起來,利用動態時序信息在文本提示聲紋識別中得以應用,基於深度學習的聲紋特徵提取方法與傳統動態時間規整算法結合起來,對文本進行相關聲紋識別。

第二,不小心感冒了怎麼辦?家裡的小朋友長大了幾歲,聲音發生了變化怎麼辦?開門的時候心情不好,哭著想開門怎麼辦?再或者,好不容易下定決心去了趟泰國,回家想開門怎麼辦?

「門」還能認出誰是親生主人嗎?

(年度最佳戲精,花式來開門)

人的聲音還具有易變性,易受身體狀況、年齡、情緒等的影響。若在環境噪音較大和混合說話人的環境下,聲紋特徵也是很難提取和建模的。

鄭方說,他們一直以來都在努力地克服這些難題,全方位地提升聲紋識別系統的魯棒性。

魯棒性是什麼?和魯班是親戚嗎?

NONONO

魯棒是Robust的音譯,也就是健壯和強壯的意思。它是在異常和危險情況下系統生存的關鍵。比如說,計算機軟體在輸入錯誤、磁碟故障、網絡過載或有意攻擊情況下,能否不死機、不崩潰,就是該軟體的魯棒性。所謂「魯棒性」,是指控制系統在一定(結構,大小)的參數攝動下,維持其它某些性能的特性。

鄭方解釋,科學家通常從技術和工程兩個角度並行處理。

例如,對於聲紋時變問題(人的聲紋隨時間變化),一方面從人類發音機理和人耳聽覺感知出發,尋找語音信號中對時間魯棒的信息,從中提取時變魯棒的聲紋特徵;另一方面根據用戶使用情況,設計了多種聲紋模型自動重建與更新的框架,時刻保證聲紋識別系統的穩定性與準確性。

針對情感和噪音問題,其也進行了相關研究,例如,採用特徵映射與補償、降噪自動編碼器等方法在一定程度上解決了其所帶來的困擾。

還有,你以為為什麼在密碼設定過程中,要用數字的動態驗證碼形式而不是隨便叫一聲「老婆」?

因為在聲紋認證應用中使用動態數字密碼形式,以及其他一些專利技術(如聲紋時變魯棒性、聯合因子分析等),可以有效抵消身體狀況、年齡、情緒等的影響。

你哭就哭吧

,記得念準數字就好。

這樣還不夠,為了確保不會因為上述變故發生認不出親生主人的么蛾子,鄭方和他的科研團隊想出了這些辦法:

1.研究了十餘種典型發音方式變化對聲紋的影響,「你滴鵝幾在我搜上」

也許也在分析行列中;

2.錄製了全世界規模最大、時間跨度最長的用於研究年齡變化對聲紋影響的語音資料庫,用於研究解決年齡對聲紋的影響;

3.開展情感語音的聲紋識別技術研究。開展情感語音的聲紋識別技術研究。比如,一個妹子說你「討厭」,一定要根據語境和語氣來分析:她到底是叫你起開,還是叫你過來。

4.環境噪聲、混合說話等對一般性的聲紋識別影響較大,所以要通過多次測試保證識別的穩定性。

雖然已經進行了這麼多研究工作,讓「門」能認出你是你,隔壁老王是隔壁老王也並非易事。

鄭方稱,未來聲紋識別有三個有意思的研究方向。

第一,如何解決聲紋黑客攻擊問題,我們雖然已經有了針對錄音重放的檢測技術,但是黑客的手段也會不斷增多、水平不斷提高,需要更全方位的研究黑客對聲紋識別系統的攻擊手段,並提前研究出有效的防攻擊措施。

第二,如何構建網際網路複雜環境下的統一聲紋平臺。當前整個網際網路中充斥著各種編碼格式、信道、噪音的語音,因此如何在此類複雜環境下準確高效的完成聲紋識別和身份認證也是一項巨大的挑戰。

第三,如何解決「雞尾酒舞會」(多說話人)問題。在實際應用中,語音信號通常會同時夾雜著多個說話人,因此如何實現多說話人場景下的實時說話人檢測也將是一大研究難點。若該問題得以解決,其將在許多領域得以應用,如公安刑偵中的快速目標說話人檢測。

雷鋒網文章,轉載請至雷鋒網官網申請授權。歡迎熱情討論,轉發分享~

相關焦點

  • 女子不穿內褲去遊樂場玩結果悲劇了 隔壁老王好生惋惜
    女子不穿內褲去遊樂場玩結果悲劇了 隔壁老王好生惋惜時間:2016-08-05 12:50   來源:股城網   責任編輯:毛青青 川北在線核心提示:原標題:女子不穿內褲去遊樂場玩結果悲劇了 隔壁老王好生惋惜 好漢該出手時就出手,好老公腿功也不能落後。
  • 《水滸傳》的「隔壁老王」為什麼要幫西門慶?原來是二人交換條件
    隔壁老王,全世界大部分華人認識的人物之一。他有多種身份,可以是你老婆婚外情的對象,也可以是你家小孩的爸爸,也可以是你作為洩憤的對象,還可以當作笑話的主角。因此「小心隔壁老王」,就成了一句流行語。在《水滸傳》中,也有「小心隔壁老王」,不過這裡的「隔壁老王」,變成了王婆,幹起了撮合姦夫淫婦的勾當,一步步將潘金蓮引入彀中。真是「一入套路深似海,從此節操似路人」啊!潘金蓮,非常漂亮,從對武松使出渾身解數來看,也不是消停之人。
  • 隔壁老王也想家!這一次真的隔壁沒敢有故事!
    隔壁老王□非花非霧從小王少年意氣盛,到老王豪情轉頭空。西風烈,風塵僕,跋涉的腳步駐留在貴陽。思想裡,一縷微笑,從此,淡然人生。初識貴州到熟悉貴州,逐漸融入當地的風土人情,逢與當地朋友老家的山村竹寨,婚喪嫁娶,大家都會不遠幾百裡聚集在一起。朋友圈子裡,基本上都是創業的年輕人,他們習慣老王、老王的叫;有詼諧開玩笑的,見面就是:隔壁老王。老王也是樂呵呵默認,順口答應。
  • 開心一刻:隔壁老王的靈魂到了天堂之後…
    醜女乙:「在你心目中,好男人的定義是什麼?」醜女甲想了想,說:「從現階段來看,願意娶我的男人,就是好男人!!」開心一刻:老王的靈魂到了天庭,見了玉帝。玉帝說:「你就是隔壁老王?」老王:「正是小民!」玉帝:「你不該自稱小民,因為你已經成神了。!」老王問:「什麼神?」玉帝:「送子觀音!」開心一刻:神仙可以大致分為四類第一類,儒雅派,如太上老君,玉黃大帝,元始天尊,溫文爾雅,能量很大。
  • 「毀三觀」的阿德利企鵝,為了「房子」出賣色相,隔壁老王有話說
    如今在這個年代裡,對於很多男性來說,沒有房子或者沒有房子是很難娶到老婆的,畢竟首先丈母娘那一關就很不好過了。在中國,房子對於組建家庭的新婚夫婦而言是很重要的。其實,這種事情也不僅僅會發生在人類社會中,對於一些動物來說,它們也很看重「房子」,甚至有一些動物會為了得到「房子」而採取一些骯髒的手段,最明顯的一個例子就是阿德利企鵝了。
  • 隔壁老王的放羊之道
    老王:忍著!很快就到了我承諾給你們的草地了,那裡水草豐美,風景如畫,那草甘之如飴,而且永遠都吃不完!只要到了那裡,就到了完美社會,一切都那麼美好,永遠都那麼完美!值得為之奔波、辛苦一番! 羊B:可我們忍了好久了,體弱的都餓死了、渴死了,怎麼還沒到那片草地?
  • 海底撈和「隔壁老王」的商標糾紛,餐企到底該怎麼避免?
    這次,連海底撈也「中招」了,是時候覆習一下餐企商標保護的這套「組合拳」了。本文轉載自餐飲法務官(ID:fawuguan007)海底撈這樣一個巨無霸,也怕自己的商標被偷用。此前,它甚至把「河底撈」當成了「隔壁老王」發起訴訟,誰知卻敗訴了。敗訴的海底撈一邊心裡苦,一邊加快自我保護的腳步。最近一段時間,它密集註冊商標,大有防火防盜防「老王」的態勢。
  • 隔壁老王!侵權?建水這家奶茶鋪被麗江一家公司告了!
    生活中 ,很多人喜歡拿「隔壁老王」說事。譬如,「你家的孩子長得真像『隔壁老王』。」這些玩笑話大家聽聽也就過去了。不過,「隔壁老王」可以開玩笑,卻不能隨便拿來用。這不,建水縣「隔壁老王家的奶茶鋪」就被麗江宴語餐飲管理有限公司告上了法院,理由是未經允許使用了「隔壁老王」的商標。
  • 「雪公主」「隔壁老王」酒店開房交易 原來是打著「外幣兌換」的...
    隨後,他在QQ上搜索到了和「外幣兌換」關鍵字有關的多個聊天群,出於好奇和利益的驅使,申請加入了多個QQ群。在QQ群內,王先生很快結識了一個暱稱叫「大怪」的中介,「大怪」在聊天中向王先生介紹了一個專門收韓幣的,暱稱名為「隔壁老王」的網友,並稱此人「長期居住在江蘇南京」,有需要的話可以聯繫。
  • 「隔壁老王」在上島咖啡喝咖啡居然發生這樣的事情......
    其他也沒什麼好說了,(跟上島借根蘋果5s充電器一個男服務員說押金100)我真的看哭了,上島應該算是上虞最不和諧的店了吧,折騰老王了。來源:論壇網友「隔壁老王」看看其他網友怎麼說:@xiaoniuniu:很多點包廂都有保底消費啊,茶室、曼妙午後什麼的都有保底消費!
  • 在賓館裡半夜被隔壁聲音吵醒是什麼體驗?
    在賓館裡半夜被隔壁聲音吵醒是什麼體驗?當我到甲方辦公室時,甲方看了看我的眼睛,悠悠地說道,你是不是在網吧打了通宵遊戲?工作要重視啊,年輕人!你說冤不冤?難受不難受?我們東隔壁是一對退休的老幹部 大概實在受不了啦 打了110 警察叔叔來叫開門。居然不是小三 警察也沒有辦法 只能告訴他們不許擾民。出事啦他們負責。因為退休老幹部有心臟病 所以沒有幾天就搬走了這個是一種情況 還有去旅遊 出差碰到的情況多了 有的人喝多了可以唱2--3個小時 有的人在你隔壁轟趴。有的在你隔壁打牌會突然吵鬧起來 反正形形色色都有。
  • 廣西一神秘裸男飛簷走壁,網友戲稱:隔壁老王!
    不過他為什麼有這樣的行為,為什麼我們五樓鎖著門的,他還進得去,我也不懂,你說一個人光溜溜的突然出現在你家,當然嚇人了,太不堪入目了。」確實是太嚇人了!網友戲稱:一定是隔壁的老王挨老發了!小編切咧不管你是不是隔壁的老王,又或者是捉姦在床,這樣的行為始終是不妥當的,光天化日之下一絲不掛出現在人家家的陽臺,換了是你能不被嚇!?你覺得小編說的對嗎?
  • 智者老王的幸福生活——你理解的幸福是什麼?
    小時候幸福就是希望自己快快長大,能夠和大人一樣想吃冰棍吃冰棍,想吃雪糕吃雪糕;上小學後的幸福就是希望沒有作業,沒有考試,也沒有家長會,高興了就去學校有老師和同學陪著一起快樂遊戲;上中學後的幸福就是希望自己和同桌的那個「她」有點交集,哪怕是打掃操場的時候兩個人一個小組;高中時候的幸福就是希望哪天不小心被哪所重點大學看好提前保送,可以免去昏天黑地的痛苦學習,在操場打著籃球,看著教室裡埋頭學習同學們豔羨的眼神;大學後的幸福就是希望隔壁院系的漂亮女同學在食堂吃飯的時候能夠和自己坐對面
  • 痛風好了,「滿月臉」、「水牛背」出現了,隔壁老王后悔不已
    隔壁老王最近沒管好自己的嘴, 幾次夜宵攤上的啤酒加海鮮讓沉寂了很久的痛風又發了。老王找到我,我告訴他按常規用藥,使用非甾體類抗炎藥+新型降尿酸藥物。二天後,我在電梯裡碰到老王,老王看樣子好得差不多啦,和前面呲牙咧嘴的樣子判若兩人。
  • 豬蹄放入電飯鍋,不加一滴水,燜1個小時出鍋,飄香到隔壁老王家
    豬蹄放入電飯鍋,不加一滴水,燜1個小時出鍋,飄香到隔壁老王家說起這個豬蹄,很多人是又愛又恨,因為它好吃,還能美容養顏,但是它脂肪含量高,吃了容易長胖。豬蹄的膠原蛋白豐富,女人多吃點可以美容豐胸呢,但是女人怕胖,所以每次都要掙扎中吃。
  • 全民隔壁老王曬香蕉牛奶,粉絲一張圖瞬間汙了起來
    這兩年最火的行業無疑就是直播了,很多主播也借著行業東風成功實現了逆襲,全民直播的隔壁老王就是其中之一。或許從小就比較土豪的原因,老王成名後做的最多的就是給粉絲們發福利和在微博分享心情了,前兩天他就在微博上傳了一張自認很好喝的皮卡丘香蕉牛奶圖,結果卻慘被粉絲的一張圖片汙掉了整個畫風。其實老王的微博還是比較正常的,唯一的槽點可能就是曬香蕉牛奶的真正目的是在於炫車了。
  • 每日一笑:洗澡,還是去隔壁老王家的比較好用
    每日一笑TOP1我:二狗,你怎麼了,怎麼被人抱著走,真是條懶蟲。二狗:別他M廢話那麼多了,我被綁架了,他們看上我的美色,快幫我報警,晚了的話,去玉林都找不到我。TOP2我:你是叫小黑還是小白呀?狗子:給你提個醒,我出生那天頭頂烈日,身處黑暗,所以我叫黑白不分。TOP3我去隔壁老王家洗澡用的浴霸都是可以冷熱切換自如,怎麼我買回來的浴霸是出火花呀?
  • 【文青學堂】跟隔壁老王學門店設計
    原因顯而易見,你的門頭太LOW了。可能有很多老闆苦於沒有經驗和參考樣板,那麼今天村哥帶你一起來跟隔壁老王學門店設計,開一開腦洞。一盞普通的照燈,刷上一層黃色的油漆,連門前的桌椅都黃漆沾染了。你能不進去看看嗎?不能麻木不仁啊
  • 隔壁老王之往後餘生
    老王的員工號2010開頭,迄今剛好10個年頭。在這小小的倉庫,每天與各種單據朝夕相處,日子竟過得如此之快。少年白了頭,手指肚磨出薄薄的繭子。臉上從青青草原到溝壑縱橫,僅僅只是膠原蛋白流逝的問題。但是老王就不一樣了,休息的時間屈指可數,年終盤點的時候通宵兩天,每日12小時的長白班,一周之內起碼需要四個晚上加班。二胎政策開放之後,老王家新添小寶。每周單休的一天,用來陪伴小兒子。這奢侈的一天,總會放鴿子。於是老王擁有了新的技能,在家裡安裝了攝像頭,遠程操控家裡的一切。
  • 如果給月薪3萬,讓你到另一個城市上班,每周回家一次,你願意嗎
    但是老王已經在深圳安家了,老婆在家附近上班,有一個女兒,正在上小學。因為此事,老王很是煩惱,不知道該不該去珠海上班。因為去了珠海,就意味呢,每周一到周五要住在公司,只能周末回一次深圳的家了!關於此事,我給老王的建議是: