科大訊飛DCASE挑戰賽奪冠,「A.I.+工業」前景廣闊

2021-01-10 南方新聞網

  南方網訊 (記者/陳偉峰)近日,科大訊飛A.I.研究院聯合中科大語音及語言信息處理國家工程實驗室(USTC-NELSLIP)在聲音事件定位與檢測(Sound Event Localization and Detection,Task 3)任務中摘得桂冠。

  在DCASE 2020挑戰賽的Task3任務中,科大訊飛-中科大聯合團隊脫穎而出,在聲音事件檢測F-score、檢測錯誤率、定位錯誤率三項指標中均取得較大優勢並最終奪冠。

科大訊飛A.I.研究院聯合中科大語音及語言信息處理國家工程實驗室(USTC-NELSLIP)在Task3任務中奪冠(截圖來源:DCASE挑戰賽官方網站)

  這意味著,科大訊飛在人工智慧領域尤其是聲音定位與檢測技術上又有了長足進展,這也為實現「聲學照相機」和「工業聽診器」等「A.I.+工業」的應用場景落地提供了強而有力的技術支撐。

  攻克兩大難關奪得冠軍

  DCASE挑戰賽是由IEEE(Institute of Electrical and Electronics Engineers)舉辦的聲音場景識別和事件檢測競賽,自2013年組織發起以來,至今已舉辦了六屆,是目前聲音事件領域最權威的競賽。

  本屆DCASE 2020挑戰賽,共設置了六個任務,吸引了包括亞馬遜、英特爾、三星、索尼等國際公司和清華大學、新加坡南洋理工大學、香港中文大學、英國薩裡大學等頂級高校在內的共138支隊伍、473個有效系統參賽。

  本次科大訊飛-中科大聯合團隊參加的聲音事件定位與檢測任務(Task 3)要求對一段音頻內發生的聲音事件進行準確的時間點檢測、事件類型分類與方位角定位。

  這就要求系統不僅要檢測出每一幀的聲音,還需要給出對應聲音的空間位置。如下圖,在1秒到3秒檢測到鋼琴聲,位於水平角15°、高度角20°處。

  這個任務的最大難點在於聲源的位置是快速變化的,並且存在很多相似聲音,比如敲門聲與腳步聲、警報聲與手機鈴聲等,還伴有一定的混響與噪聲。

(Task 3任務中科大訊飛-中科大聯合團隊對聲音事件的檢測結果)

  面對這一難題,科大訊飛和中科大聯合團隊拿出了兩個「殺手鐧」:一個是「聲音事件空間位置仿真算法」,通過模擬不同空間位置的聲音,訓練模型,提升深度學習模型對聲音空間位置的適應能力,從而讓模型具備舉一反三的能力;另一個是「序列區分性訓練法」,通過對相似聲音事件進行更精細化的建模,有效提升了易混淆聲音事件的檢測準確率。

  比賽結果顯示,聯合團隊在檢測「有沒有聲音」(聲音事件檢測F-score)、「有什麼樣的聲音」(檢測錯誤率)、「聲音在哪個方位」(定位錯誤率)這三項指標上獲得優秀成績,並最終奪冠。

  「工業聽診」應用前景廣闊

  有了A.I.,工業界的「醫生」也能隨時隨地為機器「望聞問切」,通過機器發出的聲音辨別機器是否質量合格、是否可以正常工作。聲音定位與檢測技術日趨成熟,也為行業帶來廣闊的應用前景。

  基於領先的聲音事件定位和檢測技術,科大訊飛已經研發出「聲學照相機」和「工業聽診器」等產品,並陸續在電力、水利、軌道交通、汽車製造等行業領域發揮效用。

  其中,訊飛聲學照相機可以利用高精度麥克風陣列技術定位聲源位置,再配合攝像頭,實現可以直接在設備上看到聲源位置,方便工作人員的日常設備檢修。目前,訊飛聲學照相機已陸續在國內多個地區、項目中進行試點和應用。

工作人員手持訊飛聲學照相機對變電站絕緣子做檢測,距離地面高度約10m。檢測結論:圖示絕緣子的檢測指標在指定區間範圍內,即正常運行,不存在放電等異常情況。

(訊飛聲學照相機應用場景圖)

  此外,依託聲音定位和檢測技術,訊飛工業聽診系統可實現實時檢測設備聲音,避免設備故障導致生產中斷,還可通過聲音監測產品質量,避免不良品流向市場。

(訊飛工業聽診系統應用場景圖)

  持續深耕核心源頭技術創新

  2018年至今,科大訊飛已獲得26項人工智慧國際競賽的冠軍,涵蓋語音識別、語音合成、機器閱讀理解、手勢識別、圖像識別等諸多領域。在2020年,科大訊飛在人工智慧國際賽場上也捷報頻傳。

  1月17日,在德國The 20BN-Jester Dataset手勢識別評測中科大訊飛以97.26%的準確率斬獲冠軍,並刷新世界紀錄;

  5月4日,科大訊飛和中科大聯合團隊再次奪得第六屆國際多通道語音分離和識別大賽(CHiME-6)中給定說話人邊界的多通道語音識別兩個參賽任務上的冠軍,打破自身紀錄,取得三連冠。

  5月21日,哈工大訊飛聯合實驗室與河北省訊飛人工智慧研究院聯合團隊再次在多步推理閱讀理解評測HotpotQA全維基賽道中奪冠。

  未來,科大訊飛將繼續堅持核心源頭技術研發創新,用A.I.賦能各行各業,讓機器能聽會說,能理解會思考,用人工智慧建設美好世界。

相關焦點

  • 科大訊飛摘得ICFHR 2020數學公式識別挑戰賽冠軍
    提起科大訊飛,人們總津津樂道於「讓機器能聽會說」的先進智能語音技術。其實除此之外,科大訊飛的「攻城獅們」也一直致力於讓機器「能看會認」。近日,科大訊飛A.I.研究院聯合中科大語音及語言信息處理國家工程實驗室,以顯著優勢獲得ICFHR 2020 OffRaSHME數學公式識別挑戰賽冠軍。
  • 科大訊飛承建國內首個認知智能國家重點實驗室
    中證網訊(記者 任明傑)日前,科技部正式設立第一個人工智慧國家重點實驗室——認知智能國家重點實驗室,這一實驗室交由科大訊飛股份有限公司來承建。  「科大訊飛承擔建設認知智能國家重點實驗室,將藉助更高的平臺和勢能,進一步在全球範圍內整合認知智能領域的源頭核心技術、科技人才和行業數據資源,助力我國在認知智能的技術和產業走在世界前列,為我國成為世界主要的人工智慧創新中心貢獻自己的力量。」 科大訊飛副總裁、研究院院長胡國平告訴記者。
  • 科大訊飛狂攬25冠 翻譯機再次雙平臺奪冠
    此次購物節大戰中,科大訊飛表現搶眼。雙十一期間(11月1日至11月11日)科大訊飛智能硬體產品體系斬獲三大平臺25項冠軍,累計銷售額同比增長56%。科大訊飛消費者業務已連續三年保持超過30%的高增速,受到了業內以及消費者的高度認可。此次雙十一,科大訊飛辦公系列產品表現不俗。
  • 從CVPR到ICDAR 科大訊飛橫掃2019年度計算機視覺頂級會議多項冠軍
    從計算機視覺頂級會議CVPR的物體檢測挑戰賽DIW 2019到文檔分析與識別頂級會議ICDAR的手寫數學公式識別挑戰賽CROHME、場景文本視覺問答挑戰賽ST-VQA,這個6月不乏有一些計算機語言與人工智慧專業比賽陸續落幕。在這些行業賽事中,自然少不了科大訊飛的身影。
  • 科大訊飛1024開發者節啟幕,A.I科技樹化身能力星雲服務百萬開發者
    10月23日,2020科大訊飛全球1024開發者節盛大開幕。今年這場盛會的主題為「AI煥新·更美好」,旨在通過「開放·合作·生態·共享」的理念,共建人工智慧新生態。其中,科大訊飛AI研究院常務副院長劉聰為大家帶來了一場A.I.技術的盛宴。
  • 科大訊飛:人工智慧技術的「中國聲音」
    (改革開放40年·調研行)科大訊飛:人工智慧技術的「中國聲音」中新社合肥12月11日電 題:科大訊飛:人工智慧技術的「中國聲音」中新社記者 張俊一年後,劉慶峰和當時一起參賽的5名同學籌備創業,並最終組成18個人的團隊創辦了科大訊飛。「上大學的時候,最興奮的事情就是參加比賽,因為我們要拿第一。」劉慶峰說,「不畏競爭、挑戰權威、勇爭第一」這樣的價值觀在科大訊飛一路傳承。
  • 二十芳華正茂 回顧科大訊飛發展之路 展望A.I.未來
    這家名為科大訊飛的公司和這群年輕人一樣充滿朝氣但是稚嫩。科大訊飛股份有限公司成立一個草臺班子能撐得起語音技術研究的重擔嗎?這家蝸居在民房裡的公司能存活多久?沒有人知道答案。在2001年,科大訊飛舉行一場名為「半湯會議」的重用會議,在這個會議上,科大訊飛堅定了語音的發展方向。半湯會議後,科大訊飛出了一個很稚嫩的《科大訊飛發展戰略規劃》,聯想投資人的評價是「雖然寫的漏洞百出,但主題思想還是明確的。」而科大訊飛董事長劉慶峰迴憶當時這個會議決定表示:「我們當時明確了目標,第一是這個產業未來有100億的市場空間,第二是我們能成為這個領域的第一。」
  • 科大訊飛有哪些子公司_網友中的科大訊飛怎麼樣
    科大訊飛有哪些子公司   前身安徽中科大訊飛信息科技有限公司,成立於1999年12月30日,2014年4月18日變更為科大訊飛股份有限公司 ,專業從事智能語音及語言技術研究、軟體及晶片產品開發、語音信息服務及電子政務系統集成。擁有靈犀語音助手 ,訊飛輸入法 等優秀產品。
  • 618終極福利時間 快入手科大訊飛A.I.黑科技
    618年中大促接近尾聲之際,作為亞太地區知名的智能語音和人工智慧上市企業,科大訊飛迎來了「終極福利」時間。6月18日晚19:30-21:20,科大訊飛執行總裁胡鬱在天貓、京東、蘇寧三大電商平臺的科大訊飛旗艦店開播,並有價值萬元現金的京豆大禮包和訊飛A.I.明星產品錄音筆、翻譯機、辦公本、學習機等多重好禮相贈。
  • 不止於A.I.+教育,科大訊飛黑科技如何提升消費者幸福感?
    作為亞太地區知名的智能語音和人工智慧企業,科大訊飛就曾被《中國青年報》以一篇名為《戰「疫」時刻,A.I.+教育成為新常態》的文章報導過A.I.+教育的相關經驗,其中重點介紹了C端產品訊飛智能學習機。不得不說,自2016年成立消費者事業群以來,秉承著「有AI生活用訊飛」的品牌主張,科大訊飛研發的C端產品涵蓋了辦公、教育、生活三大領域,正從生活工作等多場景為消費者提供便利。
  • 180萬次A.I.輔診意見,「搞定」95%基層病種,科大訊飛劉慶峰揭秘A.I...
    但是科大訊飛說,2019年是人工智慧的應用價值兌現年,將在今年迎來規模化應用落地,開始進入應用紅利兌現年。」5月21日,科大訊飛董事長劉慶峰在以「你的世界 因A.I.而能」為主題的科大訊飛2019新品發布會上表示。
  • 科大訊飛A.I.能唱歌、會變聲,還能給「雙馬」當翻譯
    作為「產業發展」主論壇的壓軸環節,科大訊飛董事長劉慶峰用一首改編版《童年》為人工智慧的未來發展送上美好祝願。歡快的熟悉音律久久迴蕩在大會內場。不過這首《童年》可不僅限於此,它還有一個特別之處。讓我們一起來看下科大訊飛——飛飛同學現場發回的特別報導。  A.I.會唱歌,這次大會有點不一樣猜猜這首歌是WHO唱的?
  • 樓陽生與科大訊飛 泛城控股 雲上飛鷹通航公司董事長舉行工作會談
    樓陽生與科大訊飛 泛城控股雲上飛鷹通用航空公司董事長分別舉行工作會談9月4日,省委書記樓陽生分別與科大訊飛董事長劉慶峰、泛城控股有限公司董事長陳偉星、雲上飛鷹通用航空有限公司董事長賀焱舉行工作會談,就深化合作進行深入交流。
  • 訊飛翻譯實力顛覆想像,《流浪地球》中A.I.黑科技竟成現實
    現在已經有一些產品, 比如科大訊飛旗下的訊飛翻譯機2.0就可以實現多語種間的翻譯,可翻譯的語言覆蓋近200個國家和地區,只不過不是同聲而已:需要訊飛翻譯機先聽對方講話, 然後翻譯成使用者母語,以電子合成音和屏幕顯示文字的形式同時傳遞給使用者,響應速度最快時低於1秒。
  • 科大訊飛副總裁李世鵬:語音領域訊飛沒有對手
    【TechWeb】國內首批上市的人工智慧企業隊伍中,科大訊飛獨樹一幟,專注語音賽道並保持長久領先狀態。2017年科大訊飛上半年淨利潤1.07億元,同比下滑58.1%;2018年,全年營收79.17億,同比增長45.41%;年淨利潤5.42億,同比增長24.71%。
  • 北師大攜手科大訊飛發布「訊飛教育腦計劃」!
    二十多家聯盟成員單位齊聚北京,科大訊飛攜手其他聯盟單位重磅發布「訊飛教育腦計劃」,聚焦腦智科學前沿,分享年度研究成果,研討未來重點工作,以更好地服務國家基礎教育重大需求。1科大訊飛聯合中國兒童青少年腦智研究全國聯盟其他單位重磅發布「訊飛教育腦計劃」科大訊飛聯合北京師範大學等聯盟其他成員單位,發起了「訊飛教育腦計劃」,該計劃聚焦研究兒童青少年腦與心智發育和提升的新機制與新機理,探索個體學習與課堂教學的新方法與新形式。
  • 5G賦能,科大訊飛A.I.醫療助推中國智慧醫療建設_新華報業網
    (科大訊飛與人工智慧與數字經濟廣東省實驗室(廣州)籤約合作)  作為亞太地區知名的智能語音和人工智慧上市企業,科大訊飛近年不斷在  瞄準基層醫療痛點,科大訊飛推出智醫助理  中國醫師協會的數據顯示,目前全科醫生距離實現2030年城鄉每萬名居民擁有5名合格全科醫生的目標,還有將近40萬的缺口。在邊遠貧窮地區,優質醫療資源問題更加突出,本科以上醫生佔比鄉鎮衛生院4.6%,村衛生室佔比只有0.4%。科大訊飛針對這一供需矛盾,推出智醫助理來解決問題。
  • 科大訊飛承建全球中文學習平臺正式落戶
    DoNews 12月4日消息(記者 丁凡)2020年12月3日,全球中文學習平臺落戶暨科大訊飛未來港啟幕儀式在青島市科大訊飛未來港隆重舉行。此次儀式在教育部國家語言文字工作委員會指導下,由科大訊飛股份有限公司主辦。
  • AI教育築夢校園|科大訊飛劉慶峰:未來屬於掌握了人工智慧的新人類
    本次大會由中央電化教育館與北京師範大學、科大訊飛共同舉辦。 2019年3月,科大訊飛的研究團隊在史丹福大學發起的國際權威機器閱讀理解評測SQuAD 2.0挑戰賽中登上榜單第一,在全部兩項指標上均超過了人類平均水平,一舉創下比賽紀錄;同年6月,在文檔分析與識別國際會議(ICDAR 2019)舉辦的手寫數學公式識別挑戰賽CROHME中,訊飛-中科大聯合團隊取得全部兩項任務冠軍。2020年截至現在,科大訊飛已獲得了10餘項冠軍。
  • 劉慶峰再談AI「人機耦合」:科大訊飛研發路徑下一步
    (圖片來源:全景圖片)經濟觀察網 記者 沈怡然繼回應外界所傳「AI同傳造假」事件後,11月13日,科大訊飛(002230)董事長劉慶峰在首屆麻省理工學院中國峰會上再一次談起「人機耦合」的概念,他稱,在人工智慧領域達成人機耦合的模式是科大訊飛未來目標,通過腦科學等多學科訓練,為每一個人研發出