訊飛連發三款智能錄音筆!可離線轉寫拍視頻秒配字幕,首推智能TWS耳機

2021-02-22 智東西
看點:連發三款硬核智能錄音筆後,訊飛宣布要入局TWS耳機市場了!

智東西9月1日消息,剛剛,科大訊飛連發三款訊飛智能錄音筆新品,型號分別為SR901、SR702和SR101,以及首款智能TWS耳機iFLYBUDS。其中,SR901和SR702首次搭載離線轉寫功能,支持OCR文字提取,進一步延續了SR系列在智能轉寫、AI高清降噪和智能編輯等方面的優勢,SR101是訊飛首款500元級錄音筆,相比同價位產品也有著硬體優勢和軟體功能上的突破。訊飛還面向商務人士的溝通和記錄需求,推出首款立體聲無線耳機(TWS)iFLYBUDS,擁有通話實時轉寫、智能撥號識別、通話譯文三大核心AI功能。

自2019年5月訊飛首款帶屏錄音筆——訊飛智能錄音筆SR系列推出後,國內錄音筆市場隨之掀起了以AI技術為依託的品類創新浪潮。作為今年科大訊飛的首場線下新品發布會,此次訊飛不僅補全了智能錄音筆SR系列從入門到旗艦、再到尊享版市場的拼圖,同時其首款TWS耳機的發布,也意味著訊飛智能語音和轉寫技術業務邊界的突破。「秉承著高效辦公、智慧生活的理念,訊飛消費者業務已實現連續三年大於30%的增速,甚至今年逆勢增長,在618中獲得22項單品冠軍。」科大訊飛聯合創始人&執行總裁胡鬱在現場談到。在他看來,訊飛在AI轉寫賽道上,不僅希望能為文字工作者的記錄場景賦能,更希望成為每個人的知識管理工具。讓每一位用戶在忙碌之中,依然可以輕鬆地備忘信息、捕捉靈感、記錄觀點。「讓我們一同開啟高效記錄新時代!」胡鬱信心滿滿地說到。那麼,這次訊飛將會給我們帶來它在智能轉寫賽道上的哪些技術和場景應用創新?這些創新背後又展露了訊飛哪些行業創新的戰略和思考?來看現場發布乾貨給我們的答案。

讓錄音筆長眼睛:首推離線轉寫與OCR識別功能
與上一代產品相比,訊飛SR901和SR702智能錄音筆的軟硬體性能在轉寫、降噪、智能編輯等方面都有了明顯升級,同時還新增了不少小而美的AI新功能,如OCR能力、圖片拍攝識別文字、拍攝視頻實現字幕等。為了幫助用戶進一步解決在無網絡環境下轉寫,以及隱私內容轉寫的需求,SR901和SR702錄音筆升級了語音轉文字引擎,行業首發離線轉寫功能。讓用戶無需在4G/Wi-Fi網絡下就能實現語音實時轉寫並立即保存轉寫文字針對多語言、多語種的無縫切換識別和轉寫,訊飛推出新一代識別(轉寫)引擎——端到端新引擎,優化迭代了端到端語音識別框架。除了純中文與純英文模式識別外,端到端新引擎還支持中英混合識別場景,以及普通話-部分方言識別。三款錄音筆在方言和語種轉寫,以及專業領域轉寫方面也進行了升級,支持粵語、河南話等12種方言轉寫;藏語、維吾爾語2種少數民族語言轉寫;中、英、日、韓等8種語言轉寫;財經貿易、醫療、IT科技等7大專業領域的轉寫。

2、拾音降噪:最遠拾音15米,可實現超遠距離錄音與轉寫

硬體方面,SR901採用2顆哈曼MEMS定向麥克風+10顆全向麥克風,SR702採用2顆定向麥克風和6顆矩陣麥克風,SR10採用1顆定向麥克風+2顆矩陣麥克風,且支持AI拾音降噪。據稱,訊飛錄音筆最遠拾音距離為15米,並且還能根據不同場景自動匹配場景算法。同時,它還採用非人聲過濾,能夠自動跳過沒有人聲的冗餘錄音,節約用戶整理錄音的時間。

實際上,訊飛錄音筆還採用了前端降噪技術,基於自研神經網絡與傳統信號處理深度結合的降噪算法(SSA-IME),不僅能有效降低環境幹擾噪聲,還可消除幹擾說話人的聲音,從而大幅降低語音識別的處理難度。

據了解,該技術使訊飛錄音筆在無喇叭的情況下,3-10米遠距離轉寫效果提升30%;有喇叭的情況下,超遠距離(20-50m)演講場景轉寫效果為90%以上,這也體現了訊飛在遠距離降噪轉寫技術上的領先性。針對多人交談會議場景,訊飛錄音筆上線了其與ASR聯合建模的說話人分離方案。

4、絕招:看圖識字,還能給視頻配字幕

除了聲音記錄和轉寫之外,訊飛在三款新錄音筆上也添加了圖像方面的創新應用,如支持OCR文字識別、圖片拍攝識別文字、拍攝視頻實現字幕等。硬體方面,訊飛智能錄音筆SR901為後置三攝,包括1300萬高像素主攝像頭、800萬像素120°超大廣角攝像頭、800萬像素長焦攝像頭;SR702為800萬像素數字變焦後置單攝。功能方面,SR901和SR702錄音筆能夠提取並實時記錄圖片上的文字內容,還可錄製視頻,進行實時收音。有意思的是,訊飛錄音筆拍攝完成並導出視頻文件時,支持自動生成字幕和後期編輯字幕,為錄音筆增添了新的圖像/視頻交互體驗。

解密:訊飛如何突破離線轉寫技術難點?
在這次訊飛智能錄音筆SR系列的小爆發背後,是其長達多年的技術積累和創新。據智東西了解,此次發布中最大的技術亮點在於離線轉寫功能。不過,由於離線轉寫對硬體和算法方面都有著較高的要求,因此實現這項技術並非易事。離線聽寫多以短語音為主,數據是偶爾性調用,對瞬間運算能力有較大要求;離線轉寫多以長語音為主,數據調用一般持續1小時或數小時以上,對硬體的長時間算力、CPU功耗和散熱情況等要求更高。軟體方面,離線轉寫需適配訊飛的離線轉寫算法,實現與雲端相當的實時性和準確性。同時,還要確保整機在長時間的轉寫過程中,溫度始終維持在合適範圍內,這也是離線轉寫算法的關鍵難點。針對這些難點,訊飛的轉寫技術主要從兩個方面進行了優化和創新。一方面,訊飛錄音筆採用CPU主頻自適應調整、線程數動態調度等方式來緩解設備發熱情況,以確保設備處於離線轉寫運行時工作頻率始終保持穩定。這樣不僅能保障離線轉寫的實時性和準確性,還能保證整機溫度的適宜。另一方面,訊飛離線轉寫採用和在線轉寫幾乎相同的核心算法,針對錄音筆硬體的特性與指標進行裁剪與適配,包括模型蒸餾、定點化運算、多幀並行等技術,以實現流暢運行的目的。基於這些突破,訊飛離線轉寫功能在此次新推出的智能錄音筆上實現了首次落地。據了解,與雲端轉寫相比,訊飛錄音筆離線轉寫所損失的準確率低於相對10%。

訊飛首款TWS耳機iFLYBUDS的三大核心亮點
訊飛的創新發布不僅僅是智能錄音筆,還有智能TWS耳機iFLYBUDS。作為訊飛的首款智能TWS耳機,iFLYBUDS在誕生之初就將目標瞄準了商務應用市場,滿足商務人士在自駕、通勤和會議等多場景中,進行高效記錄和溝通的需求。

具體來看,訊飛智能TWS耳機iFLYBUDS有三大核心優勢,分別為通話實時轉寫、智能撥號識別、通話譯文。

iFLYBUDS通話轉文字的功能,均支持iPhone和安卓手機,並不需要獲得手機的通話錄音權限,只需聲音通過耳機即可在App上實現通話語音的轉寫。iFLYBUDS支持常規電話和網絡電話,包括微信語音、騰訊會議和釘釘語音等。在多人會議場景下,iFLYBUDS還支持自動區分講話人,方便用戶快速查找通話內容。通話時,用戶可隨時通過一鍵錄音功能,將通話過程轉文字,轉寫準確率達98%;通話結束後,iFLYBUDS將形成智能摘要,自動提煉通話重點內容,並支持對通話內容的多終端(手機端和電腦端)分享和編輯。

2、智能語音撥號

針對商務人士通訊錄中聯繫人重名、同音等情況,iFLYBUDS支持用戶通過多種方式區分人名,以快速找到正確聯繫人,提升撥號效率。一方面,用戶可通過純語音交互,只說聯繫人姓名即可撥號;另一方面,用戶還能通過詞語舉例、歸屬地名稱區分的方式讓耳機快速撥號,如「章子怡的章、立早章」、「北京的章總」。在外貿商務交流場景中,用戶時常會遇到專業詞生僻等語言溝通障礙。為了解決這一用戶需求,iFLYBUDS在用戶進行英語通話時,能變身「翻譯官」,幫助用戶將通話內容實時轉譯為漢字,輔助用戶英語溝通。

除了三大核心功能外,iFLYBUDS在音質、連接、延遲、續航和降噪方面也有著自己的特色。

其中在續航方面,iFLYBUDS支持2.5小時通話時長,4小時聽歌時長,若搭配充電盒使用,可實現最長通話10小時,最長聽歌20小時。在極限使用場景下,iFLYBUDS同時進行通話+錄音+轉寫的續航為2小時,搭配充電盒的最長使用時長為6小時。降噪方面,iFLYBUDS的智能降噪功能採用雙麥克風拾音,CVC降噪算法,保證用戶在機場、健身房等嘈雜環境中的清晰流暢通話體驗。此外,iFLYBUDS還支持智能語音助手、自定義輕擊耳機交互和佩戴檢測等功能。

結語:訊飛消費者業務擴軍智能錄音筆,新玩法押注TWS賽道
回顧過去幾年錄音筆行業的發展,一面是傳統錄音筆市場的破局,一面是AI技術的迅速發展與落地。科大訊飛作為一家國內老牌智能語音企業,緊緊地抓住了傳統行業變革與新技術迸發的發展機遇,與過去自身長達20餘年的語音技術基因相碰撞,從而催生出AI錄音筆的新品類市場。這既是訊飛的優勢,也是它的挑戰。從最初簡簡單單的錄音筆到一塊帶屏智能錄音筆,再到如今訊飛智能錄音筆SR系列的補全,訊飛圍繞語音技術的AI布局始終具有創新性和挑戰性。尤其是訊飛首款智能TWS耳機的誕生,不僅實現了AI轉寫等技術在多個設備的落地和創新應用,還進一步擴張了自身AI戰略版圖,將智能語音和轉寫賽道的邊界拓寬到錄音筆行業之外。至此,訊飛以智能語音為基礎的產品品類在AI轉寫賽道的布局,已愈發地多元化。同時,訊飛基於這些技術所帶來的跨邊界融合,也給整個錄音筆和可穿戴設備行業的創新應用與發展,提供了一個新的思考路徑和解決方向。未來,訊飛消費者業務或將繼續打破不同模態技術之間的應用與融合,將自身業務的邊界拓寬到更遠的領域。(本文系網易新聞•網易號特色內容激勵計劃籤約帳號【智東西】原創內容,未經帳號授權,禁止隨意轉載。)

相關焦點

  • 科大訊飛新品發布:首款TWS耳機支持實時轉錄、智能錄音筆配四攝
    科大訊飛要親自下場做TWS耳機了。這是今年科大訊飛在京舉辦消費類新品發布會前,已經放出的消息。這不是 tws 第一款採用科大訊飛語音技術的耳機。早在2018年,科大訊飛就與 migoo 共同推出了莫比斯耳機。
  • 行業首發離線轉寫+提取圖中文字 訊飛智能錄音筆SR702評測
    而這次訊飛最新推出的旗艦級智能錄音筆SR702,不僅行業首發離線轉寫功能,可以做到錄音實時轉文字,將離線轉寫功能首次應用在了錄音筆設備上,同時通過機身後方的攝像頭,還可把照片中的文字提取出來,甚至還能將拍攝的視頻加上字幕,真正開啟錄音筆全新的使用體驗。
  • 訊飛智能錄音筆SR502:職場人必備的錄音轉寫神器
    川北在線核心提示:原標題:訊飛智能錄音筆SR502:職場人必備的錄音轉寫神器 提起錄音筆,很多人還刻板的以為它只是專業媒體從業人員的工作神器,但其實,在諸多智能黑科技的加持下,好的錄音筆設備已經可以覆蓋諸多工作學習的場景,對於致力於提升工作學習效率的人來說,它有著立竿見影的效果
  • 科大訊飛智能錄音筆SR901、SR702、SR101正式發布 支持AI離線轉寫...
    9月1日,科大訊飛在京正式發布訊飛智能錄音筆SR901、SR702和SR101三款新品,其中尊享版SR901定價5999元,旗艦版SR702定價3699元,入門版SR101定價599元。即日起SR702、SR101在電商平臺同步開啟預售,SR901將在9月下旬開啟預售。
  • AI轉寫體驗全面升級 訊飛智能錄音筆SR502上市
    作為訊飛智能錄音筆的熱賣機型之一,SR502基於上一代暢銷產品SR501進行了軟硬體全面升級,在高性能轉寫、高階降噪、智能編輯、超長續航等優勢基礎上,新增科大訊飛行業首發的離線轉寫功能,並內置了高素質攝像頭以支持OCR文字提取,同時能夠為錄製的視頻資料實時生成字幕。
  • 持續提升轉寫體驗 訊飛智能錄音筆SR502煥新上市
    作為訊飛智能錄音筆的熱賣機型之一,SR502基於上一代暢銷產品SR501進行了軟硬體全面升級,在高性能轉寫、高階降噪、智能編輯、超長續航等優勢基礎上,新增科大訊飛行業首發的離線轉寫功能,並內置了高素質攝像頭以支持OCR文字提取,同時能夠為錄製的視頻資料實時生成字幕。
  • 親身體驗訊飛智能錄音筆SR702:離線轉寫功能強大
    好在我有訊飛智能錄音筆SR702,高達98%的轉寫準確率給我的工作帶來了極大的便利。三、轉寫:離線轉寫+OCR文字提取, 中英文混讀也能分得清而且它超強的轉寫能力極大地改善了我的工作效率,以前每次我採訪完回來
  • 錄音筆哪個好?訊飛智能錄音筆SR702給你帶來全新體驗
    像我自己就是,因為工作原因,我經常需要進行一些記錄工作,比如記錄一些大型會議或者是發布會的總結文案,因此選擇一款功能上或者是實用性上都比較出色的錄音筆是很有必要的。前一段時間我就入手了一支訊飛智能錄音筆SR702,作為一款旗艦級智能錄音筆,它不僅功能強大,實用性強,使用體驗感也很不錯。在聯網情況下,它的轉寫準確率高達98%,此外,它還有行業首發的離線轉寫功能和OCR圖文識別功能。
  • 錄音筆哪個好?訊飛智能錄音筆SR702穩站C位
    像我自己就是,因為工作原因,我經常需要進行一些記錄工作,比如記錄一些大型會議或者是發布會的總結文案,因此選擇一款功能上或者是實用性上都比較出色的錄音筆是很有必要的。前一段時間我就入手了一支訊飛智能錄音筆SR702,作為一款旗艦級智能錄音筆,它不僅功能強大,實用性強,使用體驗感也很不錯。在聯網情況下,它的轉寫準確率高達98%,此外,它還有行業首發的離線轉寫功能和OCR圖文識別功能。
  • A.I.錄音筆怎麼樣?訊飛智能錄音筆錄音轉寫兩不誤
    平時總覺得自己用不到錄音筆,被按頭安利訊飛智能錄音筆後忍不住感嘆:真香!不僅可以邊錄音邊轉文字節省「二指禪」時間,還支持非人聲過濾、自動區分講話人、智能摘要、智能語義分段等等酷炫的智能功能。俗話說得好,「工欲善其事必先利其器」,訊飛智能錄音筆不僅能輕鬆記錄語音,還能對語音進行轉寫,自動轉成文字。作為一支A.I.錄音筆,在轉寫方面,訊飛智能錄音筆1小時錄音、5分鐘即可出稿。同時支持跨行業多語種轉寫,大大提高了訊飛錄音筆在各種場景下的適用範圍。
  • 錄音筆哪個牌子好?超全錄音筆選購指南:科大訊飛、搜狗、索尼、飛利浦、紐曼、愛國者數碼錄音筆/AI智能錄音筆推薦
    現在的錄音筆已經是加入AI智能,能夠實現實時翻譯,同聲傳譯,文字轉寫等多種功能,能夠幫助人們在學習工作生活上節省時間,越發便利。但大多數人對錄音筆的選購,還是不太了解。本篇將從使用場景、功能、價位三個方面來為大家推薦適合自己的那款錄音筆。
  • 錄音轉寫性能全面升級 訊飛智能錄音筆SR502評測
    相比傳統錄音筆,智能錄音筆的應用場景更廣泛,不僅可以提供像錄音轉文字、智能編輯、快速分享甚至是中英互譯等豐富功能;對於需要經常處理會議紀要的職場人士來說,一款好用的智能錄音筆更是可以讓你事半功倍,快人一步。
  • 訊飛智能錄音筆新升級,新增12種方言和8種外語轉寫
    雷鋒網消息,5月27日,科大訊飛召開媒體溝通會,宣布訊飛智能錄音筆SR系列進行了全面升級。據悉,新功能升級主要包括錄音、轉寫、編輯三個方面,將於5月29日推送升級。在錄音方面,訊飛智能錄音新增支持錄音聲源定位,通過判斷聲源方向,實現更好的拾音效果。
  • 離線也能用,號稱「落字有聲」的產品,訊飛SR502體驗分享
    而近期,訊飛也推出了一款面向演講或會議用途的智能錄音筆,結合2000元左右的售價,值得大家嘗鮮一試。這款智能錄音筆正式名叫科大訊飛AI智能錄音筆SR502,採用的是鋁合金材質配合鏡面玻璃背板的設計,我覺得設計真的好像iPhone X手機,有一種在用手機的錯覺了。而這款產品的名字太長了,文後我們簡化一點,稱它為訊飛錄音筆SR502。
  • 訊飛智能錄音筆SR702——AI錄音界的全能小助手
    確實國內很多領域、行業但凡涉及到做語音識別業務的廠家多數都會選擇和科大訊飛合作,由此可見訊飛在語音識別技術上已經非常成熟。而最近經過升級推出的這款訊飛智能錄音筆SR702也稱得上是集各種人工智慧技術於一身的黑科技好物。「識別準、錄得遠、語種全、錄的清」是這款訊飛智能錄音筆SR702最值得稱讚的地方。
  • 錄音筆什麼牌子好 訊飛智能錄音筆SR702值得推薦
    從最開始只能單純的語音記錄,逐漸發展成具備離線轉寫、OCR識別、智能降噪等多種功能的智能錄音產品。而科大訊飛智能錄音筆SR702就是這樣一款集多種功能於一身的前沿科技產品,它的實時轉寫準確率高達98%。
  • 訊飛智能錄音筆SR702值得推薦
    而科大訊飛智能錄音筆SR702就是這樣一款集多種功能於一身的前沿科技產品,它的實時轉寫準確率高達98%。 在使用傳統的錄音筆時,很多人都是採用反覆聽的方式來將錄音內容轉換成文字的,但這種方式不僅耗時耗力,而且還很容易出錯,漏掉重要的信息點。針對這一問題,科大訊飛智能錄音筆SR702搭載全新升級的轉寫引擎,帶給用戶不一樣的高效體驗。
  • 讓高效記錄隨身攜帶 科大訊飛發布全系列錄音筆以及真無線耳機
    錄音筆系列產品SR101主流熱門產品SR101是一款針對年輕用戶準備的錄音筆設備,採用1+2麥克風陣列和1.4英寸觸控螢幕,錄音筆體積相對比較小巧,能隨身攜帶,在教室,辦公室公家車等場景下清晰錄製音頻,並且這款錄音筆支持終身免費的轉寫功能
  • 離線翻譯能力是對手的9倍?多角度揭秘搜狗訊飛誰更能打
    AI語音技術的高速發展,讓錄音筆的定義早已不再是傳統印象中那個單純的錄音設備,拾音轉寫、全能翻譯等功能的運用,賦予了智能時代AI錄音筆的新使命。市面上作為新一代錄音筆的領軍品牌,搜狗和訊飛憑藉其自身的技術優勢,推出了它們的代表型旗艦機型產品搜狗AI錄音筆S1和訊飛701/702。
  • 錄音筆怎麼選 訊飛智能錄音筆SR701親測好用
    從性能和外觀兩個方面,都顯示了一支錄音筆的專業性。其次訊飛智能錄音筆SR701功能也十分強大。智能錄音筆最常用的功能就是語音轉文字,像我平時就會通過錄音轉文字的方式來記錄演講或者培訓記錄之類的東西。以前使用過很多錄音筆,但都出現了轉寫出來的語句不連貫的問題。