12種方言秒轉文字!用一支錄音筆撬動的AI革命,科大訊飛贏在哪?

2020-12-23 智東西

智東西(公眾號:zhidxcom)文 | 韋世瑋

智東西5月27日消息,今日,科大訊飛針對其訊飛智能錄音筆進行錄音、轉寫和編輯三大性能升級,新增支持聲源定位、12種方言和10種語種轉寫、支持智能摘要等13項功能,進一步為用戶帶來更便捷高效的錄音體驗。

去年5月,科大訊飛一槍打在了傳統錄音筆市場創新賽道上,推出業內首款帶屏錄音筆——訊飛智能錄音筆SR系列,直接催生了一個潛力不可小覷的新品類市場。

至今,SR系列已覆蓋媒體、商務、教育、律政等應用領域,進入全球115個國家、646座城市的市場,並拿下2019年雙11天貓&京東雙平臺錄音筆品類和單品銷售額第一的成績。

如今,隨著今年全國兩會如火如荼地召開,訊飛智能錄音筆亦成為人民網、文匯報、齊魯晚報、21世紀經濟報導4家媒體記者團,報導兩會的指定錄音筆,協助記者等專業團隊提高報導效率,更好地記錄民聲民意。

實現這一系列成果,訊飛智能錄音筆只花了一年。

在這背後,既是訊飛自2016年成立消費者事業群以來,在To C市場不斷摸索和布局,也是訊飛智能語音技術21年來的技術積累,在轉寫賽道上不斷研發創新。

在這個千萬級規模的錄音筆市場下,訊飛哪來的信心和底氣選擇以帶屏錄音筆殺入這個幾乎飽和,卻玩家擁擠的市場?自敲開錄音筆新品類市場後,訊飛在過去一年又取得了哪些重要的成績?市場又發生了哪些變化?

為此,智東西再度獨家對話科大訊飛聯合創始人&執行總裁胡鬱、科大訊飛副總裁兼消費者事業群副總裁李傳剛,在直擊訊飛三大重磅升級的同時,進一步揭開這些答案的真實面紗。

一、三大升級亮點:支持超20種語言語種,遠程拾音準確率提升30%

「作為AI錄音筆的龍頭廠商,我們應該儘快讓用戶體驗到AI技術與錄音筆融合的真正效果。」胡鬱談到,在過去一年,訊飛不斷地對錄音筆AI性能進行優化和升級,選擇在今天進行重要的三大升級,也是為了讓原有的錄音筆用戶率先體驗更新穎的智能化功能。

▲科大訊飛聯合創始人&執行總裁胡鬱

此次,訊飛智能錄音筆主要圍繞智能錄音、語音轉寫和智能編輯三個方面,進行13項重要升級,包括聲源定位、方言轉寫、語義分段、個人詞庫等功能。

1、智能錄音:360度聲源定位,準確率提升30%

針對錄音的專業性,訊飛智能錄音筆新增了錄音聲源定位、非人聲過濾和高增益降噪三項功能。

一是聲源定位,錄音筆能夠通過判斷聲源方位,實現更好的拾音效果;二是非人聲過濾,其與AI算法相配合,可將錄音中空白或嘈雜等無用聲去掉,保留有用人聲;三是高增益降噪,在5至15米的錄音範圍內,轉寫準確率提升30%,人聲也更加清晰。

▲科大訊飛副總裁兼消費者事業群副總裁李傳剛

2、語音轉寫:支持22種語言+語種,7大專業領域轉寫

這方面升級中的最大亮點在於新增了粵語、河南話、雲南話和重慶話等12種方言轉寫,維吾爾語和藏語兩種少數民族語言轉寫,以及西班牙語、越南語、俄語、英語、日語和韓語等8種語種轉寫,進一步擴大錄音筆的語言應用場景。

同時,針對不同領域的專業術語轉寫,訊飛還更新了7大專業領域的轉寫支持,覆蓋IT科技、財經貿易、文化體育、醫療、政法、運營商和教育領域。同時,還新增中英文混合轉寫功能功能。

3、智能編輯:個性化詞庫,文字編輯更清晰

面對不同錄音場景、多個說話人和口語表達習慣,訊飛在智能編輯方面新增了智能語義分段、自動區分講話人、口語規整、個人詞庫和智能摘要5項功能,讓錄音筆能更智能地進行文字編輯。

例如,在區分講話人方面,錄音筆採用了訊飛的聲紋識別技術,能根據錄音及轉寫結果,自動區分並標註講話人。

「這次三大方面的功能升級,不僅能更加滿足消費者的需求和體驗,也更利於我們對市場的開拓和認知。」李傳剛說。

三大升級之於訊飛智能錄音筆,不僅是對產品性能和體驗的進一步豐富完善,提升訊飛在錄音筆新品類市場的優勢和競爭力,同時它之於錄音筆之上的訊飛消費者事業群,亦為其深入布局AI+辦公這一細分市場提供了新的技術儲備和解決方案。

「拳頭」升級,訊飛打響的帶屏智能錄音筆新戰局再度升溫。

二、21年深耕與積累,訊飛智能語音技術的硬核力量

羅馬並非一日建成。訊飛智能錄音筆能在短時間內站穩市場,並佔據一定身位的領先優勢,是其長達21年的智能語音技術迭代和積累。

「過去幾年,我們的智能語音技術曾經歷了三次較大的革新與升級。」胡鬱提到,這主要集中在語音識別、方言識別,以及多語種的錄音轉寫、翻譯上,而這些技術性能亦是訊飛大舉進攻細分市場的差異化競爭點。

在語音識別領域,訊飛語音識別模塊採用了基於深度全序列卷積神經網絡的語音識別框架,識別準確率達98%,同時還通過多麥克風陣列去混響和多麥克風波束成形,進一步提升信噪比。如今,其麥克風陣列與錄音筆回傳的數據進行疊加後,能夠在幾十米的範圍內獲得更好的拾音效果。

在多語言識別領域,不管是中國方言的識別,還是全球多語種的錄音轉寫和翻譯,訊飛都下足了功夫。

簡單地說,針對方言識別,訊飛採用統一的建模技術,通過少量的方言數據,進一步提升錄音筆在方言語境場景的錄音效果;另一方面,訊飛通過語音識別技術的不斷研發和優化,將多語種的轉寫和翻譯性能效果都實現了提升。

尤其在多語言識別方面,胡鬱透露,目前中國科學院專門支持中國科學技術大學開展了一項多語識別先導項目,目標研發超過50個語種以上的核心技術,涉及語音識別、語音合成以及自然語言處理等技術。

「這是目前國內投資規模最大的多語種研發項目,現階段還沒有任何一家公司有這樣的資源和能力,對這種規模的多語種系統進行研發。」胡鬱談到,這將進一步促進訊飛在多語言技術領域的研究。

如今,訊飛智能錄音筆的研發團隊已突破百人規模,包括硬體、軟體、UI交互等均由訊飛的核心研發力量設計。

值得一提的是,隨著訊飛在智能語音領域長達21年的布局和深耕,已打下了堅實的技術根基,技術儲備力量不斷豐富。

其中以語音識別技術為例,早在2016年,訊飛就已在國際多通道語音分離和識別大賽CHiME-4中,一鼓作氣拿下了三個項目第一。在2020年CHiME-6上,訊飛不僅在給定說話人邊界的多通道語音識別任務中奪冠,更刷新了自己在CHiME-5中的語音識別錯誤率記錄,從46.1%降至30.5%。

這二十餘年的技術成果與積累,無疑為訊飛敲開錄音筆市場新品類的大門,帶來了十足的信心與底氣。

三、打響帶屏錄音筆市場第一槍,技術融合下的小爆發

一面是人工智慧不斷賦能各行各業的技術浪潮,一面是當下傳統錄音筆和錄音技術的轉寫痛點,訊飛澆灌了21年的智能語音技術,終於在帶屏錄音筆這塊新市場中破了土,發了芽。

訊飛入局錄音筆市場的第一槍,為何瞄準了帶屏錄音筆?

「加入訊飛前我就在想,AI作為未來的一個技術發展方向,除了在手機、智能穿戴設備和智能音箱等智能硬體方面賦能,還能在哪裡找到突破口?」李傳剛談到,作為北大MBA的導師,他經常到北大與學生們進行案例討論,當時他發現,學生幾乎人手備有一個傳統錄音筆,主要用在對知識的記錄與鞏固上。

但問題是,他們常常需要自己再花時間重複聽一遍錄音,才能將內容記錄下來。這一大量的時間和人力成本,讓李傳剛抓到了新的突破口——傳統錄音筆與AI的技術融合。

在與胡鬱進行了一番溝通後,李傳剛發現訊飛也正在考慮這一方向,兩人一拍即合。經歷將近半年的硬體研發與打磨,2019年5月,訊飛智能錄音筆SR系列終於面世。

一石激起千層浪,SR系列的推出直接點燃了傳統錄音筆市場的熱情。

一方面,訊飛智能錄音筆SR系列一上市,就在2019年京東「618」中獲得錄音筆品類成交金額第一的成績,目前已進駐全國超2000家線下門店;另一方面,現階段SR系列也已拓展至國際市場,進入全球115個國家,646個城市中銷售。

「訊飛智能錄音筆SR系列最大的創新性並不在於帶屏,而在於將它是一個獨立的智能錄音設備。」在胡鬱看來,在不同的場合下,用戶對錄音筆的心理依賴程度不同。

一個單獨的錄音筆,並不會像手機錄音軟體一樣受到各種幹擾,它能持續獨立地使用,同時又能通過統一的帳號在手機和PC上進行後臺處理。基於後臺操作的需求,才進而衍生出大屏的需求,讓用戶的操作更加便捷。「一個獨立的能夠進行智能轉寫的設備,這才是它的顛覆性所在。」胡鬱說。

隨著訊飛智能錄音筆SR系列的推出,訊飛消費者事業部的智能硬體產品線得到了很大的豐富。除了SR系列智能錄音筆外,訊飛聽見系列也正逐步朝更大的市場邁進,同時與錄音轉寫相關的硬體設備也在預期中迅速增長。

在此影響下,訊飛的AI廣告和內容服務業務,以及與政府、國企之間的業務也在加速發展。據科大訊飛2019年財報,在2019年度,訊飛的營收首次突破100億人民幣,達到100.79億元,同比增長27.30%。其中,消費者業務營收36.25億人民幣,同比增長43.99%,佔總營收比進一步攀升至35.96%。

To B+To C的雙線戰略驅動下,訊飛正加速發展。

四、創新=藍海,訊飛消費者業務的三駕馬車

從一支小小的錄音筆,到如今多了一塊屏幕與AI技術協同發展成一個新品類,在訊飛智能錄音筆SR系列推出後的短短一年內,錄音筆市場經歷了翻天覆地的變化。

「對於整個錄音筆市場來說,我們打開的並不是一個存量市場,而是一個新的增量市場。」李傳剛說。

一面是整個行業在思考錄音筆市場的未來走向,不斷解決消費者的多樣化轉寫需求;一面是傳統玩家與新玩家攜手,共同建立產業聯盟,以加速推進包括轉寫技術、智能語音識別技術在傳統錄音筆中的融合發展。

隨著玩家的不斷轉型和創新發展,又將會給訊飛帶來哪些挑戰?

「整體上看,更多玩家的加入我覺的是一件好事。」胡鬱談到,由於現在從傳統錄音筆向智能錄音筆轉換的過程中,最大的障礙仍然是用戶教育——如何讓用戶意識到使用智能錄音筆更有價值。

儘管訊飛開拓了新的錄音筆品類市場,但縱觀整個產業的發展,它仍是一個螺旋式上升的過程,智能化發展也將是這一產業逐漸演變的方向。在這一過程中,既要靠消費者消費習慣的轉變,也需要靠傳統錄音筆廠商自身的轉型推動。

「不管有多少玩家加入,訊飛在這市場中仍是一個龍頭地位。」胡鬱說,訊飛非常有信心在這個市場中持續保持自己的領先優勢,這一信心也來自於訊飛所提供的多樣性服務,例如面向政府部門的會議寶,以及涉及面向教育、商務和律政等應用場景下的智能硬體產品。

據產業研究機構新思界最新發布的《2019-2023年錄音筆行業深度市場調研及投資策略建議報告》,2018年,我國錄音筆行業的產量約為452.12萬臺,出貨量與2017年的431.97萬臺基本持平。

整體來看,我國錄音筆市場出貨量較為穩定,市場規模仍較小。那麼,在這之下的AI+錄音筆市場又將如何發展呢?

「創新永遠是藍海。」李傳剛談到,傳統錄音筆市場的需求在過去二、三十年並未產生太大變化,但隨著AI技術的賦能,錄音筆除了錄音之外,還將具有智能轉寫、智能翻譯和智能編輯等更多功能,市場規模也將進一步擴大,激發出更多原有錄音技術不足而未開發的市場。

市場仍在潛滋暗長,科大訊飛的下一步在哪裡?

縱觀訊飛的消費者事業群,胡鬱談到,訊飛將持續以平臺(iFLYOS作業系統)、硬體(智能硬體)、服務(廣告和運營商網際網路服務)為發展重心,進一步拉動「AI+翻譯」、「AI+辦公」、「AI+教育」三駕馬車同時往前走。

往後看,是訊飛在智能語音領域長達21年的技術基因和積累;往前看,是訊飛在AI技術熱潮下敢於嘗試技術跨界與融合創新的信心和勇氣。

結語:以AI為刃,傳統錄音筆市場的創新與變革

回顧智能錄音筆市場過去一年的發展,科大訊飛按下的,不僅是自身消費者業務加速布局智能市場的「快進鍵」,也是錄音筆行業與AI技術跨界融合下催生新市場的「啟動鍵」。在這一節點下,訊飛智能錄音筆三大技術的升級,也將為公司以及市場競爭的發展添加新的差異化競爭優勢。

談及智能錄音筆的未來,胡鬱認為將有兩條路,一是與手機APP等結合,朝著極簡的方向發展,二是向更高端、更專業的定製化獨立設備前進。這條路究竟走向何方,我們尚不得而知。

但我們能看到的是,在當下傳統錄音筆結合新興技術的轉型下,有越來越多的玩家投入這片藍海市場,他們單打獨鬥也好,互相結盟也罷,同一個目標無疑都是搶下這塊蛋糕。在這場愈發激烈的長跑賽道上,最終誰將真正拔得頭籌?我們拭目以待。

相關焦點

  • 科大訊飛推出訊飛智能錄音筆 支持錄音實時轉文字
    驅動中國 2019年6月11日消息 今日,CES Asia 2019在上海新國際博覽中心隆重開幕,科大訊飛攜訊飛智能錄音筆驚豔亮相據了解,該款錄音筆具有錄音實時轉文字,1小時錄音5分鐘出稿,準確率高特點;同時,還具備中英文邊錄邊譯,麥克風專業級降噪,人聲更清晰等優勢;能夠進行智能標記、語音檢索等,從而讓分享編輯變得更容易。此外,該款錄音筆安全耐用,續航能力強,且擁有極簡的外觀設計和一體化觸控。
  • 用AI技術提高生產力,科大訊飛發布智能錄音筆SR502|鈦快訊
    12月1日,科大訊飛線上發布新一代訊飛智能錄音筆SR502,售價2299元,作為訊飛智能錄音筆的熱賣機型之一,SR502基於上一代暢銷產品SR501進行了軟硬體全面升級。 全新升級的訊飛智能錄音筆SR502搭載科大訊飛行業首發的離線轉寫功能,支持用戶在無網環境下使用轉寫並保障隱私內容安全,同時新增OCR文字提取功能。
  • 一聲不落、終身免費文字轉寫,科大訊飛AI智能錄音筆SR701體驗測評
    這種問題沒什麼好解釋的,如果您聽過錄音筆錄製出來的聲音之後,我想你就不會再問這種小白問題了,否則,那些記者何苦用錄音筆做採訪記錄呢,人人都有手機的時代,直接用手機不好麼?原因還是錄音筆錄製出來的品質太香了。作為會議記錄用途,錄音筆的作用也非同小可,尤其在較大的會議廳內,如果我們真的用單反或者手機來記錄,那恐怕由於空間迴響、錄音的位置、以及底下人聲的輕微噪雜聲,都會影響到聲音的記錄。
  • 待機長續航強,科大訊飛智能錄音筆B1內核實力毋庸置疑
    用過錄音筆的人都知道,雖然錄音功能可以完整的將文字內容全程錄下音來,但是後期的文字整理工作卻是相當費時費力的。針對這一行業痛點,科大訊飛先後推出了多款智能錄音筆,不僅可以完整的錄音,還可以實現實時文字轉寫,錄音1小時5分鐘即可出稿,效率得到大幅度提升。而今天要為各位職場人士介紹的這款訊飛智能錄音筆B1與以往的智能錄音筆又有什麼不同之處呢?
  • 翻譯精準,用科大訊飛智能錄音筆B1參加國際會議完全不用擔心
    訊飛智能錄音筆B1作為、「外掛級」生產力工具,除了時尚有顏的外觀和便攜輕薄的設計,更是性能出眾的實力派,以強大智能科技逐個擊破職場痛點。  訊飛智能錄音筆B1支持PC端實時轉文字在線編輯,錄音1小時,出稿只需5分鐘,更支持二維碼、連結分享實時轉文字結果,效率大大提升。生僻口音和外語混讀讓語音識別經常卡殼?
  • 訊飛智能錄音筆B1評測:外語方言都聽懂
    像語音轉寫、外文翻譯、方言識別等更多的衍生功能成為了錄音筆的賣點,而AI技術對這些新應用的效果更是起到了舉足輕重的作用。說到AI和語音,就不得不提科大訊飛。作為國內AI和智能語音行業的領頭羊,科大訊飛不僅掌握著核心技術,自己也有著各種面向消費者的軟體和服務推出,在硬體領域也開疆擴土,充分發揮自己軟硬體及核心技術三位一體的優勢,帶來了許多優秀的錄音筆產品。
  • 訊飛AI錄音筆SR702用過之後,你絕對不會後悔
    訊飛AI錄音筆SR702用過之後,你絕對不會後悔 2020-12-18 13:10
  • AI轉寫體驗全面升級 訊飛智能錄音筆SR502上市
    12月1日,科大訊飛線上發布新一代訊飛智能錄音筆SR502,零售價2299元。全新SR502於12月1日00:00-12月9日23:30 預售,12月10日00:00至12月12日23:59支付尾款。天貓科大訊飛旗艦店、科大訊飛錄音筆京東自營旗艦店同步上市。
  • 打破工作效率低下難題,科大訊飛智能錄音筆B1值得擁有
    職場人士每天面對電腦要做很多的計劃書和攻關策略,還經常需要參加公司的各種會議,會後還要進行文字整理,既繁瑣又耗時。如果在開會期間帶上科大訊飛智能錄音筆B1這樣的記錄神器,既省去了會後文字整理浪費的時間,還能讓你的工作效率得到大幅度提升,可謂一舉兩得。
  • 禮品科大訊飛A1錄音筆 超長待機 345元
    【中關村在線長沙行情】科大訊飛A1錄音筆 ,目前該款機器在商家「湖南秋毫(廠家授權專營)」智能錄音筆A1存儲容量32GB錄音時間1200分鐘控制按鈕開關機按鍵,錄音按鍵傳輸接口(單白色)處理器:炬芯ATS2837各錄音通道錄音的頻響相差值:小於等於±3dB音頻採集:16kHz採樣率,16位量化精度拾音距離:有效拾音距離5m,全向拾音運行溫度:-10~50℃工作溼度:10%—90%其他特點實時轉文字,音頻轉文字,翻譯,準確率98%,雙麥克風陣列
  • ...實時轉文字熱銷-科大訊飛 SR301 Plus_濟南錄音筆行情-中關村在線
    科大訊飛SR301 Plus增加了錄音即時轉換成文字功能,相當實用方便。即時轉換的準確率不算很高,如果錄音後上傳雲空間統一轉換,準確率就相當高了。不僅如此,訊飛錄音筆SR301 Plus版還支持標記重點、多終端同步等智能化輔助編輯功能,打通了從錄音到轉寫、再到分享和後端查找編輯的全鏈路。
  • 訊飛AI錄音筆居然可以翻譯方言
    訊飛AI錄音筆居然可以翻譯方言 說到AI錄音筆很多人都會覺得自己用不到,其實AI錄音筆可以適用的場景有很多,有些場合用手機不方便,就可以直接使用AI錄音筆啦。在眾多錄音筆產品中,訊飛AI錄音筆SR501受到了廣大消費者的喜愛,它既可以是會議、培訓的錄音   原標題:長見識了!
  • 360°全向收音,科大訊飛智能錄音筆B1最遠拾音距離達10米
    職場人士每天面對電腦要做很多的計劃書和攻關策略,還經常需要參加公司的各種會議,會後還要進行文字整理,既繁瑣又耗時。如果在開會期間帶上科大訊飛智能錄音筆B1這樣的記錄神器,既省去了會後文字整理浪費的時間,還能讓你的工作效率得到大幅度提升,可謂一舉兩得。
  • 雙11限時搶購僅需309元,快來體驗科大訊飛智能錄音筆B1
    而科大訊飛智能錄音筆B1的面市,也讓不少職場人士感慨:原來記錄和學習也可以如此簡單!  訊飛智能錄音筆B1作為一款「外掛級」生產力工具,除了時尚有顏的外觀和便攜輕薄的設計,更是性能出眾的實力派,以強大智能科技逐個擊破職場痛點。  訊飛智能錄音筆B1支持PC端實時轉文字在線編輯,錄音1小時,出稿只需5分鐘,更支持二維碼、連結分享實時轉文字結果,效率大大提升。生僻口音和外語混讀讓語音識別經常卡殼?
  • 優質AI錄音筆:訊飛智能錄音筆SR702文字工作者的好助手
    文字工作者在工作時,任何一點內容都可能成為創作的源泉。為了牢記每個創作靈感,大部分文字工作者都會隨身攜帶AI錄音筆,記錄靈感迸發的瞬間。不過在這個品類的選擇上,商務人士到底應該買哪一款錄音筆,今天筆者就來推薦一款比較受大眾喜愛的AI錄音筆——訊飛智能錄音筆SR702。
  • 用訊飛智能錄音筆B1測試日語電影自動翻譯,沒字幕也能看懂劇情!
    如果能有一個自動將聲音轉換成文字的錄音筆,是不是能夠大大提升工作效率呢?訊飛智能錄音筆B1就是這樣的一款辦公利器,值得一提的是,他不僅支持普通話,還支持常用的多種方言和外語。它不但支持錄音的同時實時轉換文字,甚至可以實現多語種實時翻譯,在錄音完成後,還能通過雲端將錄音轉換成文檔。這款錄音筆用起來效果如何呢?讓我們一起來看看吧。
  • 打工人的商務好搭檔:訊飛智能錄音筆B1
    作為AI語音智能領域的領軍企業,科大訊飛一直專注語音識別和技術應用,推出了一系列經典的產品,訊飛智能錄音筆B1就是以便攜為特色智能錄音筆產品。基礎的錄音筆只會提供高靈敏度的錄音功能,而基於訊飛技術,該錄音筆提供了錄音、轉換文字、翻譯、分享一體化解決方案。
  • 訊飛AI錄音筆SR702擁有多語言轉寫功能,轉寫準確率高
    訊飛AI錄音筆SR702擁有多語言轉寫功能,轉寫準確率高 電子觀察說 發表於 2020-12-18 10:29:38 說起訊飛AI錄音筆,相信熱衷於AI產品的朋友都有所了解
  • AI錄音筆訊飛智能錄音筆:一筆在手,辦公無憂!
    2019年我們就可以很明顯地感知到這些變革,比如說AI錄音筆的應用,備受推崇的訊飛智能錄音筆就是把辦公人員從繁雜的記錄工作中解放出來,讓職場人士更多的專注於更富創造性的工作,從而為企業和社會的發展帶來更多的價值。訊飛錄音筆改變不僅僅是工作效率,更是工作的精準性。
  • 訊飛智能錄音筆B1,了解下又一值得入手的職場神器
    作為第二代智能錄音筆產品,更是在錄音記錄的基礎上增加實時轉文字、實時翻譯、音頻轉文字等非常「智慧」的功能,這次筆者就體驗的品牌就是智能錄音筆中的佼佼者--科大訊飛,一遍短小的體驗文章來感受一下智能錄音筆為工作學習帶來的便利。 科大訊飛智能錄音筆B1