聲紋識別目前已被用於部分銀行 聲音會被模仿,聲紋還可靠嗎

2021-01-10 天眼新聞

聲紋識別目前已被用於部分銀行 聲音會被模仿,聲紋還可靠嗎  配音演員模仿其他人的聲音,雖然聽覺上相似,但也無法模仿說話者最本質的特性。從聲紋特徵分析上還是會有差異。  繼「刷臉」之後 聲紋識別也已進入我們的生活。近日,平安科技和金融壹帳通聯合項目組與廣發銀行籤署了聲紋核身項目,將在銀行預防欺詐、提供優質服務方面發揮作用。此前,市場監管總局、人民銀行兩部委發文,決定將支付技術產品認證擴展為金融科技產品認證,並確定了《金融科技產品認證目錄(第一批)》,該認證目錄中也包括聲紋識別系統。  那麼,什麼是聲紋?它會被模仿導致識別設備誤判嗎?  頻譜、韻律、語言特徵均有差異 聲紋具有唯一性和獨特性  聲紋是生物識別特徵的一種,是在說話人發聲時提取出來的,可以作為說話人的表徵和標識,能與其他人相互區別的語音特徵,以及基於這些特徵或參數所建立的語音模型的總稱。聲紋識別又稱為說話人識別,是從說話人發出的聲音頻譜圖中提取身份特徵信息和聲紋特徵,再把聲信號轉換成電信號,用計算機通過相關算法進行比對識別的技術。  清華大學信息技術研究院教授鄭方說,語音信號之所以被形容為「形簡意豐」,是因為聲音包含有內容、身份、情感、年齡及健康狀況等豐富的信息。再加上人類語言的產生要經過人體語言中樞與發音器官間複雜的生理物理過程,理論上說,每個人說話時的短時頻譜、聲源、時序動態、韻律、語言學特徵等都有差異。因此,聲紋就像指紋一樣具有唯一性和獨特性。  與人臉、指紋和虹膜識別相比,聲紋識別有著諸多優勢,比如聲紋語料收集方式自然,無須進行眨眼、擺動臉部等特定動作,不受光線或隱私等特定場景的約束,人們接受度更高;聲紋識別可以隨機改變朗讀內容,即便曾在網上或其他地方留下語音信息,也不易被複製或盜用。「被識別人不需要近距離接觸識別設備,聲紋可以通過電話、APP等渠道傳達語音到後臺進行識別,並且可以在用戶語音對話過程中自動完成識別,使用成本低而且方便快捷。」平安科技聲紋領域專家告訴科技日報記者。  聽起來相似不等於聲紋相似 聲紋識別準確率已超過99%  登錄手機銀行APP,開啟聲紋驗證,用戶只要準確說出隨機動態碼,系統錄製語音信息、驗證聲紋及隨機動態碼後,就能進行轉帳、支付等交易……目前,聲紋識別已經在部分銀行開始使用了。  不過,生活中聲音相似的人有很多,有些配音演員還可以模仿他人的聲音,用聲紋作為金融產品認證會不會很不安全?對此,平安科技聲紋專家解釋說,總體來說,聲紋是穩定的生物特徵。除了人一生中的某些年齡段如少年變聲期,聲紋可能會有所變化,大多數情況下聲紋特徵是穩定的。  由於每個人在說話時使用的發聲器官,如舌頭、牙齒、口腔、聲帶、肺、鼻腔等在尺寸和形態方面有所差異,以及年齡、性格、語言習慣等多種原因,在發音時千姿百態,導致這些器官每個人發出的聲音必然有著各自的特點。特別是,每個人在說話過程中所蘊含的個性特徵,如發音習慣等幾乎是獨一無二的,就算被模仿,也改變不了說話者最本質的特性。  「因此,配音演員模仿其他人的聲音,雖然聽覺上相似,但也無法模仿說話者最本質的特性。從聲紋特徵分析上還是會有差異,是可以區別開來的。」  根據測算結果,公安部發布《GA/T 1179-2014安防聲紋確認應用算法技術要求和測試方法》標準,聲紋科技產品依據該標準進行數據採集。目前,用戶如果按照事先指定的文本讀出內容,聲紋識別準確率已達99.8%;如不照讀事先指定的文本內容而隨意發聲,聲紋識別準確率也能達到99.1%。「雖然準確率不低,但還是存在誤判的可能,在設計使用場景和流程時,需要考慮到聲紋識別並非100%準確率的現實。」平安科技聲紋專家說,聲紋作為金融產品的認證,需要看具體場景。對於輔助核實身份、名單識別、防欺詐、聲紋鎖登錄等場景使用是合適的;但在大額支付類的場景中,如果將聲紋作為唯一的認證手段,就需要充分評估風險。  目前,除了金融領域外,聲紋正在進入公共安全、智能家居、智慧教育、智能社區等行業,並根據不同應用場景的特點進行針對性開發。如冒領養老金的事件時有發生,如果要求高齡老人必須親臨現場驗明正身才能領取養老金,又會非常不便。聲紋確認技術具有遠程操控屬性,社保局通過預裝聲紋身份認證系統,就可對領養老金者開展遠程身份認證,實現「信息多跑路,群眾少跑腿」。目前,貴州省黔東南州等地正在開展相關試點。(記者 李禾)  相關連結  聲紋識別技術發展「三步走」  以語音作為身份認證的手段,最早可追溯到17世紀60年代英國查爾斯一世之死的案件審判中。1966年,美國法院第一次採用聲紋進行取證。隨著研究手段和計算機技術的不斷進步,聲紋識別逐步由單純的人耳聽辨,轉向基於計算機的自動識別。   聲紋識別技術發展大致可以分為3個階段:第一階段,基於模板匹配的方法。像人臉一樣,聲紋要先做註冊,再做驗證,註冊時說的內容要和驗證時是一樣的。比如註冊時說了「密碼」二字,驗證時也必須說「密碼」,這相當於驗證時被限制了,只是比較這兩個聲音像不像;第二階段,2000年開始的基於概率模型研究。如有的人說話快,有的人說話慢,聲音是有時間長度的,要把可變長度的向量變成物理程度,這是基於高斯模型概率統計的,這時的聲紋識別準確性會受到噪聲、幹擾等影響;第三階段,2012年左右開始,深度學習給人工智慧發展帶來了巨大的影響,同樣也快速推動了聲紋識別的發展。

來源  新華網

編輯 程星

編審 李劼

相關焦點

  • 鄭方:聲紋是最好的生物特徵識別方式
    未來跟中醫合作還有病理信息,聽聲就可以治病,信息非常綜合,很簡單的形態但是包含很多信息,這裡可以看到,聲音是變的,跟其他的特徵不一樣,我們把不變的身份信息放在變的形式裡面,從這裡提取出不變的身份信息,這個使得模仿非常難。利用語音的識別就是對內容的識別和情感的識別,可以防止假冒,可以進行真實意圖的檢測。
  • 指紋識別不再唯一,動態聲紋識別與人臉識別能取代嗎
    但由於成本控制,良品率等綜合因素,導致了目前屏幕指紋解鎖技術只在部分旗艦機中出現。此時,一個疑問浮現腦海,是否有同樣便捷但性價比高的解鎖方式呢? 回顧手機解鎖方式的發展,從功能機時代的密碼解鎖,到智能機的圖案解鎖,指紋解鎖,以及近來廣泛應用的臉部解鎖,無論是安全係數還是便捷程度,都有長足的發展。
  • 東進金融聲紋驗證機:聽音辨人守護安全
    據了解,聲紋識別的理論基礎是每一個聲音都具有獨特的特徵,通過該特徵能將不同人的聲音進行有效的區分。因此不同的人雖然說同樣的話,但是聲音的頻率分布是不同的,聽起來有的低沉有的洪亮。比如在生活中,我們可以模仿別人說話,模仿別人的語調和音色,從人耳的聽覺上幾乎可以以假亂真,但這只是表象上的相同,本質上騙不了計算機的識別系統。
  • 得意音通鄭方:對聲紋認證的三類攻擊可以防範
    聲紋技術如今在您的帶領下已經發展得非常成熟了,我有幾個問題想請教您,首先在銀行領域,聲紋技術如何與應用場景相融合,將帶來怎樣的智能體驗?  鄭方:聲紋識別用在銀行領域,其實主要是用於遠程身份認證。因為現在從信息安全角度講,像數據安全(如存儲、傳輸)、網絡安全(如防火牆)等等安全技術,都已經比較成熟了,一些保障也做得比較好。
  • 語音轉文字已是紅海,「VoiceAI」從「聲紋識別」切入安全解決方案
    此前,為了確保受益人尚且在世、避免養老金冒領等不合法操作,印尼居民需要去銀行、養老機構等地進行現場認領,效率低下。如今,居民可以在線上選擇指紋拍照、人臉識別、聲紋識別三種方式之二進行認證。與合作夥伴一起拿下該項目後,VoiceAI負責其中的聲紋識別部分。
  • 【語音算法系列】聲紋識別助力身份認證
    在語音識別中聲紋特徵有助於語音識別,而在聲紋識別中語義信息反而會影響聲紋特徵的提取,因此在這句話的聲紋識別中乾脆不要比較「小」和「貝」,直接都比較同一個字「貝」好了,這樣更容易分析出聲紋的差異。所以,根據聲紋識別是否比較同一批字也可以將聲紋識別進行應用上的分類,將在下一節進行詳細介紹。
  • 準確率可達99%,中科昊音如何運用聲紋識別「聽聲識人」?
    武漢昊音通是中科昊音的前身,目前其主營業務都已轉移至中科昊音。中科昊音擁有Cmfmc2.0信道和格式轉換引擎等多項自主智慧財產權的核心技術,Cmfmc2.0技術使聲紋識別技術可以迅速落地應用,基於Cmfmc2.0技術的電話聲紋識別準確率達到95%~99%。將聲紋識別運用至禁毒工作中,這為緝毒辦案提供了可靠的技術支撐。
  • 聲紋識別技術助力遠程身份認證
    圖1為聲密保系統的處理流程圖,聲密保系統通過對動態密碼語音中的密碼內容及請求人身份的雙重識別,實現對操作人身份合法性的雙重驗證。當需要認證時,系統會隨機產生一組動態碼(如6位或8位數字)要求用戶朗讀,系統對用戶讀出的聲音進行語音識別並將識別的內容與發出的動態碼數字進行比對,同時系統對用戶的發音進行聲紋比對,兩種認證手段都通過時才判斷通過。
  • 聲紋識別公司Speakln獲近億元融資 IDG領投
    5月28日消息,聲紋識別人工智慧公司Speakln及其全資子公司國音科技,宣布已於5月完成近億元人民幣融資,是目前聲紋識別領域最大金額單輪融資。本輪融資由IDG資本領投。
  • CHINADAILY | 聲紋識別可能是密碼的另一種選擇
    「現在隨著人工智慧技術的迅速發展,傳統的聲紋識別方法也得到了顯著的改善。」李亞桐說,「我們的AI系統可以在1秒鐘內將1條聲音的聲紋與100萬條聲紋進行比對。」更重要的是,他還表示,基於其獨有的算法,現場人聲與錄製聲音可以區分出來。 他還提到該技術在實際應用中的準確率已達到99.5%,而市面上公認的生物識別技術可商用的準確率需要至少達到95%。
  • 聲揚科技CEO李亞桐:用聲紋尋找身份識別安全和便捷的黃金比例
    目前網絡可查的聲紋識別初創公司,還有多家,更不用提蘋果、微軟、百度、科大訊飛等知名巨頭。然而,在技術的研發和產品的商用上,聲揚科技展現出其超過初創公司的成熟。相比起步得較早、商用較廣的語音識別,目前聲紋識別的大規模應用正在加速跑,但是首先要解決最現實的難題:信道影響(比如手機麥克風影響)和噪音影響。李亞桐介紹,聲揚科技除了研發出上述的防錄音攻擊技術,還攻克了4大難點:1、短語音的識別;2、文本無關識別;3、跨信道識別;4、環境噪音影響。首先是短語音的識別能力。聲紋識別包含註冊和測試。
  • 聲紋識別產業研討會成功召開 我國首個聲紋識別產業白皮書發布
    4月22日下午,由中國計算機學會(CCF)與得意音通信息技術研究院聯合主辦的「聲紋識別產業發展與創新研討會」在清華舉行。行業大咖分享主題演講中國科學院語言聲學與內容理解重點實驗室主任、中科信利創始人顏永紅,中國網際網路金融協會業務三部副主任陳則棟,解放軍陸軍工程大學副教授孫蒙,清華大學-得意音通聲紋處理聯合實驗室副主任、清華大學副教授徐明星以及CCF語音對話和聽覺專業組副組長、清華大學人工智慧研究院聽覺智能研究中心主任、得意音通信息技術研究院院長鄭方,分別從聲紋識別的不同維度發表了主題演講
  • ...編碼把聲紋識別和其他語音關聯任務有機聯繫起來?|CCF-GAIR 2020
    李明副教授提到,基於深度編碼的聲紋識別與傳統的參數化建模方法從結構上有一定的類比性,比如卷積神經網絡用於特徵提取,編碼層網絡用於計算統計量並得到固定維度的特徵向量,全連接網絡用於後端分類等。在李明副教授看來,基於深度編碼的聲紋識別是在傳統技術上的升級:一方面,基於深度編碼的聲紋識別更準確,效果更好;另一方面,聲紋深度編碼還可以被用於說話人日誌,多說話人合成,特定人變聲,特定人語音分離等一系列關聯任務中。最後,李明博士也介紹了幾個基於聲紋深度編碼的語音處理關聯任務。
  • 如何三步搭建一套聲紋系統
    背景介紹聲紋檢索,顧名思義就是說話人識別,通過聲音來驗證或者識別說話人的聲音。聲紋識別的關鍵步驟就是聲音向量化,將說話人的聲音將其轉化成結構化的向量。阿里雲AnalyticDB向量版,提供了一套聲紋驗證檢索的解決方案。用戶只需要使用簡單的幾條SQL命令,三步之內就可以搭建一套高精度的聲紋檢索驗證服務。
  • 什麼是聲紋分析?--財經--人民網
    另外,這項技術還曾用於一種意想不到的暢銷商品。 近年來,隨著大數據的利用機會日益增多,聲紋也像指紋、基因信息等那樣作為「個人數據」對待的討論越來越活躍。對其也從多個角度進行了研究。 聲紋可表現出發聲器官的差異 那麼,什麼是聲紋?從事聲音鑑定、研發和諮詢等業務的日本音響研究所網站對此有詳細的介紹。
  • 第二屆聲紋產業研討會成功召開,白皮書2.0重磅發布
    11月22日,主題為「場景驅動,融合創新」的第二屆聲紋識別產業創新與發展研討會在清華大學成功召開。主持人李蓀在本次研討會中,張鈸院士首次公開發表了名為《第三代人工智慧與聲紋識別產業》的主題報告,他回顧了第一代和第二代人工智慧的局限性(即不安全、不可信、不可靠、不可擴展),指出第三代人工智慧發展的任務和四大要素
  • 百度發布Deep Speaker:大規模聲紋識別的端對端系統
    日前,百度美研院宣布了其在聲紋識別上所取得的突破性成果。研究表明:利用深度學習的方法比傳統的i-vector方法在識別準確率上獲得了顯著的提高。聲紋識別算法尋求從音頻中識別說話者的身份。兩個常見的識別任務是確認(說話者是不是他宣稱的那個人)和說話者身份識別(在一群未知的說話者中確認聲音的來源)。該項技術已經有了各種應用。例如,聲紋可以用來登錄設備。
  • 小度聲紋怎麼設置有什麼用 小度聲紋識別開啟關閉方法
    小度聲紋怎麼設置有什麼用 小度聲紋識別開啟關閉方法  小度怎麼開啟聲紋識別?小度音箱為了方便使用,想要開啟聲紋識別,該怎麼開啟和關閉這個功能呢?下面我們就來看看詳細的教程,需要的朋友可以參考下。  想讓你的小度智能音箱快速識別你的身份,防止他人喚醒小度可以在開啟聲紋識別功能,也快速推薦精選音樂。而開啟聲紋識別之後不滿意又怎麼刪除?
  • 聽聲辨人靈雲聲紋識別能力平臺讓移動金融服務更安全、更可靠
    在此背景下,中國人民銀行於前不久發布《移動金融基於聲紋識別的安全應用技術規範》,標誌著以聲紋識別為代表的生物識別技術開始正式為我國的移動金融保駕護航。捷通華聲運用國際領先的深度學習算法到打造出新一代靈雲聲紋識別技術,擁有超高的識別準確率,響應速度達到毫秒級別,各項性能均大大優於《技術規範》中標準要求。
  • 揭秘錄音資料鑑定司法鑑定人:聲紋同指紋一樣 也能幫警方破案
    面前的四個電腦屏幕上,閃動著或黑白或五彩的譜圖,再加上一堆密密麻麻的數據,在坐在屏幕前的錄音資料鑑定司法鑑定人(以下簡稱「鑑定人」)眼裡,這些譜圖和數據會「說話」,它們正「講」著秘密,還原著事件背後的真相……   近日,外地發生一起販毒案,幕後「老闆」通過電話對「馬仔」進行遙控指揮,並用變音軟體改變了聲音。