科大訊飛源頭技術創新再接力,14篇論文被國際語音頂會INTERSPEECH...

2021-01-07 CSDN技術社區

2020年10月25日-30日,備受全球關注的第21屆INTERSPEECH2020 國際會議將在上海舉辦,科大訊飛作為本屆頂會的獨家Founding贊助商,全程支持頂會在華順利落地。

據了解,INTERSPEECH 是國際語音通訊協會(International Speech Communication Association,ISCA)主辦的頂級國際會議,也是全世界公認的語音領域兩大頂會之一。

此次會議共接收有效論文投稿總數2140篇,錄取1022篇,覆蓋語音、信號處理、口語語言處理等多個方面。其中,科大訊飛研究院聯合中國科學技術大學語音實驗室共發表收錄14篇論文,覆蓋語音識別、語音合成、語音增強、語音情感識別、聲音事件檢測、說話人識別等多個技術方向的創新,這些論文將受邀在線上展示,「讓機器更好傾聽」再次展現科大訊飛源頭技術創新力,產學研用深度融合孕育撬動未來的力量。

在語音識別方向,科大訊飛重點針對說話人自適應技術進行研究。這是語音識別中的關鍵技術,目的是讓算法模型根據每個說話人不同的發音特性,進行快速自適應,從而達到更好的識別效果。

在《Speaker Adaptive Training for Speech Recognition Based on Attention-over-Attention Mechanism》論文中,針對這一技術難題,研發團隊提出了一種是基於層疊注意力(Attention-over-Attention)機制的方法,以提升句子級別的說話人表達的準確性與穩定性。該方法在SWB英文數據集和AISHELL-2中文數據集上相對說話人無關模型提升了8%以上,相對傳統的基於句子級別的d-vector自適應方案提升幅度超過6%,而相對基於幀級別注意力機制的自適應方案提升了4%。

在語音合成方向,非平行性語音轉換任務是學界研究的熱點和難點問題。語音轉換的目標是對輸入的源語音進行一定處理,使輸出聽起來像目標人的語音,並在這個過程中保持語義信息不變。它在個性化語音合成、娛樂應用、聲音匿名化處理等方面有廣泛的應用場景。

研發團隊在《Recognition-Synthesis Based Non-Parallel Voice Conversion with Adversarial Learning》中,提出了一種結合對抗學習的識別-合成非平行語音轉換模型。通過聯合優化識別合成模型,並引入對抗學習目標,使得語義特徵和說話人音色特徵更加解耦,從而提升語音轉換的相似度。

在語音增強方向,研發團隊將深度學習技術和傳統麥克風陣列算法進行結合,在CHiME-6(CHiME,國際多通道語音分離和識別大賽)雞尾酒會場景的語音分離和識別效果上取得了顯著的提升。 《A Space-and-Speaker-Aware Iterative Mask Estimation Approach to Multi-channel Speech Recognition in the CHIME-6 Challenge》論文中,研發人員提出一種基於空間-說話人同步感知的掩蔽信號迭代估計(Spatial-and-Speaker-Aware Iterative Mask Estimation, SSA-IME)的方法,對語音分離性能有顯著提升,並且在該任務所有提交系統中實現最低的詞錯誤率。

在說話人識別方向,如何獲取準確的說話人標籤一直是說話人識別的難點。研發團隊提出了結合說話人確認和說話人分類的方法,減少了算法模型對於精準標註數據的依賴,提升說話人識別的準確度。

這些源頭技術創新將進一步增強科大訊飛的智能語音能力,不但能夠賦能訊飛翻譯機、訊飛聽見、訊飛學習機等產品,使其不斷優化迭代,為用戶帶來更便捷、更優質的服務;還能賦能醫療、金融、司法、教育等行業領域,推動A.I.+行業的創新應用。

【免責聲明:CSDN本欄目發布信息,目的在於傳播更多信息,豐富網絡文化,稿件僅代表作者個人觀點,與CSDN無關。其原創性以及中文陳述文字和文字內容未經本網證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本網不做任何保證或者承諾,請讀者僅作參考,並請自行核實相關內容。凡註明為其他媒體來源的信息,均為轉載自其他媒體,轉載並不代表本網贊同其觀點,也不代表本網對其真實性負責。您若對該稿件由任何懷疑或質疑,請即與CSDN聯繫,我們將迅速給您回應並做處理。】

相關焦點

  • 京東深耕語音技術研究 4篇論文入選國際語音頂會INTERSPEECH 2020
    其實,在這些常見場景之外,京東的語音技術也已經擁有成熟的應用領域,例如京東智能客服和京東物流大件外呼,語音技術的相關研究也取得了重大進展,並獲得國際認可。  備受全球關注的第21屆國際語音通訊會議INTERSPEECH2020在上海召開。
  • 科大訊飛搶跑A.I.規模化應用落地,加碼大灣區核心源頭技術創新
    「動嘴」就能控制展廳全場景,離線保障數據更安全  面向指揮調度中心、展廳等場景,科大訊飛華南研究院研發的」監控值班環境語音識別控制系統」頗受關注,管理員只要動一下嘴巴,物聯繫統通過語音識別技術識別出「開啟展廳」的指示後,大屏幕、音響、攝像頭、燈光、空調都自動調到預設狀態。
  • 雲知聲原創技術獲肯定:多篇論文被國際語音頂會 INTERSPEECH 2020...
    薛剛   2020-10-23/11:31 近日,全球語音頂會
  • 科大訊飛江濤:用技術創新,讓世界聆聽中國的聲音
    「從做語音起家,到在國家『863』計劃語音合成比賽中奪冠,再到創辦科大訊飛,08年登陸深交所上市,成為中國最早的大學生創業上市公司……」回想起數十年的創業歷程,江濤感慨萬千。 用他自己的話來說,「創業初期,很多人都認為我們在痴人說夢,一個草臺班子大學生團隊就想在中文語音領域打敗外國企業,簡直不可能。
  • 再發「最強音」,科大訊飛喜獲國際口語機器翻譯評測大賽冠軍
    再發「最強音」,科大訊飛喜獲國際口語機器翻譯評測大賽冠軍 繼斬獲今年八項「世界第一」之後,科大訊飛再度發力,在剛剛結束的 2018 年國際口語機器翻譯評測比賽中,科大訊飛在英德方向語音翻譯任務端到端模型比賽中
  • 語音合成技術再次創新突破 科大訊飛虛擬主播酷似真人
    語音合成技術再次創新突破 科大訊飛虛擬主播酷似真人時間:2019-06-11 10:23   來源:搜狐   責任編輯:莫小煙 川北在線核心提示:原標題:語音合成技術再次創新突破,科大訊飛虛擬主播酷似真人 要說5月21日在上海舉辦的科大訊飛2019新品發布會最大的亮點非虛擬主播莫屬了,科大訊飛虛擬主播利用訊飛的語音合成
  • 智能語音技術選擇哪一家!科大訊飛智能翻譯機不可錯過!
    智能語音技術選擇哪一家!科大訊飛智能翻譯機不可錯過!擁有雄厚的實力就在前不久,並且說道對企業在智能語音領域的創新開發方面給予了非常高的期待,並初步形成了科大訊飛中文語音產業國家隊的基本共識。科大訊飛自創立以來,逐漸成為了國內智能企業中的領頭公司,這完全是它憑藉著自己雄厚的生產實力,先進的技術,優良的生產設備,不斷迎來迅猛發展。
  • 科大訊飛2016年報:技術國際領先 業務全面開花
    作為國內智能語音和人工智慧產業的領導者,2016年,科大訊飛持續保持智能語音及人工智慧核心技術國際領先,同時在各重點行業市場和應用產品中,率先把人工智慧技術落地應用,源頭技術驅動的戰略布局成果正在不斷顯現。
  • 科大訊飛語音合成技術再獲突破!
    Blizzard Challenge 2019 國際語音合成大賽剛剛落下帷幕,中國選手科大訊飛與中科大語音及語言信息處理國家工程實驗室聯合提交的系統再度摘下多項指標的第一。這是自2006年科大訊飛參賽以來,在這項語音合成界最具權威性和影響力的國際賽事上的十四連冠,可見科大訊飛的語音合成技術在全球勁敵面前依舊是領跑。
  • 沸騰新十年 | 中國語音產業江湖和科大訊飛的前半生
    這是一款基於IBM研發的語音識別系統ViaVoice研發的中文語音系統,用上了科大訊飛多年來語音合成領域的技術積累,定價一千多元,功能上相當於電腦上的Siri,藉助語音方便電腦操作,還打出了「會說話就會用電腦」的廣告。
  • 科大訊飛再牽手廣州,參與「數字政府」建設
    6月28日,科大訊飛牽手廣州市政府籤訂戰略合作協議,雙方將在數字政府、教育、醫療、車載、商圈、人工智慧開放創新平臺等八個方面全方位合作,為粵港澳大灣區數字新基建的發展全面提速賦能。根據協議,科大訊飛將通過人工智慧全面賦能廣州的城市建設與治理,用智能語音引領新型智慧城市的建設。
  • ...科大訊飛成為北京2022年冬奧會官方自動語音轉換與翻譯獨家供應商
    再獲認可! 科大訊飛將為北京2022年冬奧會和冬帕運會提供自動語音轉換與翻譯技術和服務,涉及語音識別、語音合成和機器翻譯等。科大訊飛通過語音識別、語音合成和機器翻譯等關鍵技術的突破,進一步提升語音翻譯的可用水平,並推出面向日常應用的可攜式硬體產品, 為不同語言使用者之間的跨語言溝通交流提供語言翻譯服務。
  • 從智能語音、圖文識別到認知智能 科大訊飛:用AI技術啃最難啃的...
    這個由科大訊飛(002230)研發的診療AI系統,已覆蓋全國150個區縣的1.5萬餘家基層醫療機構應用,日均提供超40萬條輔助診斷建議,有效提高了基層的診療服務水平。  作為人工智慧的「國家隊」,科大訊飛憑著「板凳要坐十年冷」的姿態和堅守,從智能語音向圖文識別、認知智能持續探索延伸,將AI技術創新應用在最難啃的「硬骨頭」上。
  • 科大訊飛舉行CES媒體發布會 18年十二項技術大滿貫 翻譯和轉寫產品...
    +轉寫、iFLYOS等系列產品接連亮相,科大訊飛副總裁、消費者BG副總裁李傳剛博士為大家分享了訊飛A.I.的發展過程、重點應用產品以及A.I.+生態的理念,多家國內外媒體到場體驗。源頭技術創新,推動更多A.I.
  • 搜狗奪食科大訊飛語音識別
    DNS奪冠,醉翁之意不在酒作為語音領域尖端組織之一,INTERSPEECH一直代表著國際語音技術領先水平,並在全球範圍內擁有極大影響力。而DNS挑戰作為INTERSPEECH2020的競賽主題之一,其比賽結果就代表了企業在業界的語音識別技術最高水平。
  • 植入智能語音技術,科大訊飛翻譯機翻譯語種全體驗好
    但現在不一樣了,很多人在出發之前便準備好了一臺科大訊飛翻譯機,無論是點餐還是問路或者是購物,都能和當地人輕鬆溝通。通過人工智慧技術的植入,科大訊飛翻譯機展現出了更加多出色的性能,滿足了用戶的個性化翻譯需求。首先,在實時翻譯這一方面,科大訊飛翻譯機翻譯的速度更快,智能識別的效果也更好,在強大的8核CPU的運作之下,訊飛翻譯機可以帶給用戶更暢快的翻譯體驗。覆蓋近200個國家和地區高達59種語言種類,讓你可以放心無憂的走遍全球。
  • 劉慶峰:時代需要源頭技術創新,而不是在別人的院子裡建大樓
    「在今天這個時代,無論從國際大背景還是自身發展需要來說,都需要真正開放心態的、國際頂尖的源頭技術成果,否則我們所有的開發和創新都將是在別人的院子裡建大樓。」科大訊飛(002230)董事長劉慶峰在「首屆世界聲博會暨2018年科大訊飛全球1024開發者節」上做了以《頂天立地,共創未來》為題的演講。
  • 科大訊飛怎麼樣?訊飛智能錄音筆用技術實力詮釋國潮精品內涵
    國產品牌這一系列的變化與近年來國內企業在技術上的創新密不可分。科大訊飛怎麼樣?以科大訊飛為例,其語音識別和人工智慧技術已達到國際領先水平,在今年更是發布了一款集錄音、轉寫、標記、編輯、分享等功能於一體的硬體產品—訊飛智能錄音筆。 科大訊飛技術創新,驅動語音轉寫硬體產品落地 科大訊飛怎麼樣?
  • 科大訊飛成為北京冬奧會官方自動語音轉換與翻譯獨家供應商
    發布會上,韓子榮向科大訊飛頒發北京2022年冬奧會和冬帕運會官方自動語音轉換與翻譯獨家供應商銘牌。科大訊飛成立20年來,長期從事語音及語言、自然語言理解、機器學習推理及自主學習等核心技術研究,並保持了國際前沿技術水平。在語音合成、語音識別、機器翻譯等方面,處於領先地位。
  • 亮劍INTERSPEECH 2020,思必馳10篇論文被收錄
    國際頂級的語音技術圈會議INTERSPEECH 2020於10月25-30日在中國上海舉辦,本次會議主題為「Cognitive Intelligence for Speech Processing」。思必馳作為國內領先的對話式人工智慧平臺公司參加該國際頂會,支持大會在這不平凡的2020年順利舉行,致力推進產學研用的一體化進程。