訊飛連發三款智能錄音筆!可離線轉寫拍視頻秒配字幕,首推智能TWS耳機

2020-09-04 智東西

智東西(公眾號:zhidxcom)

文 | 韋世瑋

智東西9月1日消息,剛剛,科大訊飛連發三款訊飛智能錄音筆新品,型號分別為SR901、SR702和SR101,以及首款智能TWS耳機iFLYBUDS

其中,SR901和SR702首次搭載離線轉寫功能,支持OCR文字提取,進一步延續了SR系列在智能轉寫、AI高清降噪和智能編輯等方面的優勢,SR101是訊飛首款500元級錄音筆,相比同價位產品也有著硬體優勢和軟體功能上的突破。

訊飛還面向商務人士的溝通和記錄需求,推出首款立體聲無線耳機(TWS)iFLYBUDS,擁有通話實時轉寫、智能撥號識別、通話譯文三大核心AI功能。

科大訊飛副總裁兼消費者事業群副總裁李傳剛

自2019年5月訊飛首款帶屏錄音筆——訊飛智能錄音筆SR系列推出後,國內錄音筆市場隨之掀起了以AI技術為依託的品類創新浪潮。

作為今年科大訊飛的首場線下新品發布會,此次訊飛不僅補全了智能錄音筆SR系列從入門到旗艦、再到尊享版市場的拼圖,同時其首款TWS耳機的發布,也意味著訊飛智能語音和轉寫技術業務邊界的突破。

「秉承著高效辦公、智慧生活的理念,訊飛消費者業務已實現連續三年大於30%的增速,甚至今年逆勢增長,在618中獲得22項單品冠軍。」科大訊飛聯合創始人&執行總裁胡鬱在現場談到。

在他看來,訊飛在AI轉寫賽道上,不僅希望能為文字工作者的記錄場景賦能,更希望成為每個人的知識管理工具。讓每一位用戶在忙碌之中,依然可以輕鬆地備忘信息、捕捉靈感、記錄觀點。「讓我們一同開啟高效記錄新時代!」胡鬱信心滿滿地說到。

那麼,這次訊飛將會給我們帶來它在智能轉寫賽道上的哪些技術和場景應用創新?這些創新背後又展露了訊飛哪些行業創新的戰略和思考?來看現場發布乾貨給我們的答案。

科大訊飛聯合創始人&執行總裁胡鬱

一、讓錄音筆長眼睛:首推離線轉寫與OCR識別功能

與上一代產品相比,訊飛SR901和SR702智能錄音筆的軟硬體性能在轉寫、降噪、智能編輯等方面都有了明顯升級,同時還新增了不少小而美的AI新功能,如OCR能力、圖片拍攝識別文字、拍攝視頻實現字幕等。

1、智能轉寫:支持無網轉寫及12種方言

轉寫功能的創新升級可謂是訊飛此次發布的重頭戲。

為了幫助用戶進一步解決在無網絡環境下轉寫,以及隱私內容轉寫的需求,SR901和SR702錄音筆升級了語音轉文字引擎,行業首發離線轉寫功能。讓用戶無需在4G/Wi-Fi網絡下就能實現語音實時轉寫並立即保存轉寫文字

針對多語言、多語種的無縫切換識別和轉寫,訊飛推出新一代識別(轉寫)引擎——端到端新引擎,優化迭代了端到端語音識別框架。除了純中文與純英文模式識別外,端到端新引擎還支持中英混合識別場景,以及普通話-部分方言識別。

三款錄音筆在方言和語種轉寫,以及專業領域轉寫方面也進行了升級,支持粵語、河南話等12種方言轉寫;藏語、維吾爾語2種少數民族語言轉寫;中、英、日、韓等8種語言轉寫;財經貿易、醫療、IT科技等7大專業領域的轉寫。

2、拾音降噪:最遠拾音15米,可實現超遠距離錄音與轉寫

硬體方面,SR901採用2顆哈曼MEMS定向麥克風+10顆全向麥克風,SR702採用2顆定向麥克風和6顆矩陣麥克風,SR10採用1顆定向麥克風+2顆矩陣麥克風,且支持AI拾音降噪。

據稱,訊飛錄音筆最遠拾音距離為15米,並且還能根據不同場景自動匹配場景算法。同時,它還採用非人聲過濾,能夠自動跳過沒有人聲的冗餘錄音,節約用戶整理錄音的時間。

實際上,訊飛錄音筆還採用了前端降噪技術,基於自研神經網絡與傳統信號處理深度結合的降噪算法(SSA-IME),不僅能有效降低環境幹擾噪聲,還可消除幹擾說話人的聲音,從而大幅降低語音識別的處理難度。

據了解,該技術使訊飛錄音筆在無喇叭的情況下,3-10米遠距離轉寫效果提升30%;有喇叭的情況下,超遠距離(20-50m)演講場景轉寫效果為90%以上,這也體現了訊飛在遠距離降噪轉寫技術上的領先性。

3、智能編輯:上線多人會議說話人分離

針對多人交談會議場景,訊飛錄音筆上線了其與ASR聯合建模的說話人分離方案。

此外,三款訊飛錄音筆升級了6項智能編輯功能:

  • 智能語義分段:根據語義上下文進行分段,提升用戶針對轉寫文檔的瀏覽體驗;
  • 自動區分講話人:根據錄音及轉寫結果自動區分標註講話人,針對多人討論場景,用戶還可快速檢索目標說話人數據;
  • 口語規整:可過濾語氣詞、重複詞、無意義詞,優化轉寫內容;
  • 智能摘要:對錄音內容進行全面的語義理解與分析,自動抽取關鍵信息,形成摘要結果;
  • 個人詞庫:用戶可提前輸入專屬詞彙,實現轉寫時的智能編輯優化;
  • 文件分享:支持文件分享功能,用戶可自定義多種導出格式或模板,同時在文件編輯結束後,可選擇文件分享至郵件。

4、絕招:看圖識字,還能給視頻配字幕

除了聲音記錄和轉寫之外,訊飛在三款新錄音筆上也添加了圖像方面的創新應用,如支持OCR文字識別、圖片拍攝識別文字、拍攝視頻實現字幕等。

硬體方面,訊飛智能錄音筆SR901為後置三攝,包括1300萬高像素主攝像頭、800萬像素120°超大廣角攝像頭、800萬像素長焦攝像頭;SR702為800萬像素數字變焦後置單攝。

功能方面,SR901和SR702錄音筆能夠提取並實時記錄圖片上的文字內容,還可錄製視頻,進行實時收音。

有意思的是,訊飛錄音筆拍攝完成並導出視頻文件時,支持自動生成字幕和後期編輯字幕,為錄音筆增添了新的圖像/視頻交互體驗。

二、解密:訊飛如何突破離線轉寫技術難點?

在這次訊飛智能錄音筆SR系列的小爆發背後,是其長達多年的技術積累和創新。

據智東西了解,此次發布中最大的技術亮點在於離線轉寫功能。不過,由於離線轉寫對硬體和算法方面都有著較高的要求,因此實現這項技術並非易事。

硬體方面,離線轉寫與離線聽寫有著很大差異。

離線聽寫多以短語音為主,數據是偶爾性調用,對瞬間運算能力有較大要求;離線轉寫多以長語音為主,數據調用一般持續1小時或數小時以上,對硬體的長時間算力、CPU功耗和散熱情況等要求更高。

軟體方面,離線轉寫需適配訊飛的離線轉寫算法,實現與雲端相當的實時性和準確性。同時,還要確保整機在長時間的轉寫過程中,溫度始終維持在合適範圍內,這也是離線轉寫算法的關鍵難點。

針對這些難點,訊飛的轉寫技術主要從兩個方面進行了優化和創新。

一方面,訊飛錄音筆採用CPU主頻自適應調整、線程數動態調度等方式來緩解設備發熱情況,以確保設備處於離線轉寫運行時工作頻率始終保持穩定。這樣不僅能保障離線轉寫的實時性和準確性,還能保證整機溫度的適宜。

另一方面,訊飛離線轉寫採用和在線轉寫幾乎相同的核心算法,針對錄音筆硬體的特性與指標進行裁剪與適配,包括模型蒸餾、定點化運算、多幀並行等技術,以實現流暢運行的目的。

基於這些突破,訊飛離線轉寫功能在此次新推出的智能錄音筆上實現了首次落地。據了解,與雲端轉寫相比,訊飛錄音筆離線轉寫所損失的準確率低於相對10%。

三、訊飛首款TWS耳機iFLYBUDS的三大核心亮點

訊飛的創新發布不僅僅是智能錄音筆,還有智能TWS耳機iFLYBUDS。

作為訊飛的首款智能TWS耳機,iFLYBUDS在誕生之初就將目標瞄準了商務應用市場,滿足商務人士在自駕、通勤和會議等多場景中,進行高效記錄和溝通的需求。

具體來看,訊飛智能TWS耳機iFLYBUDS有三大核心優勢,分別為通話實時轉寫、智能撥號識別、通話譯文。

iFLYBUDS通話轉文字的功能,均支持iPhone和安卓手機,並不需要獲得手機的通話錄音權限,只需聲音通過耳機即可在App上實現通話語音的轉寫。

1、通話實時轉寫

iFLYBUDS支持常規電話和網絡電話,包括微信語音、騰訊會議和釘釘語音等。在多人會議場景下,iFLYBUDS還支持自動區分講話人,方便用戶快速查找通話內容。

通話時,用戶可隨時通過一鍵錄音功能,將通話過程轉文字,轉寫準確率達98%;通話結束後,iFLYBUDS將形成智能摘要,自動提煉通話重點內容,並支持對通話內容的多終端(手機端和電腦端)分享和編輯。

2、智能語音撥號

針對商務人士通訊錄中聯繫人重名、同音等情況,iFLYBUDS支持用戶通過多種方式區分人名,以快速找到正確聯繫人,提升撥號效率。

一方面,用戶可通過純語音交互,只說聯繫人姓名即可撥號;另一方面,用戶還能通過詞語舉例、歸屬地名稱區分的方式讓耳機快速撥號,如「章子怡的章、立早章」、「北京的章總」。

3、通話譯文對照

在外貿商務交流場景中,用戶時常會遇到專業詞生僻等語言溝通障礙。

為了解決這一用戶需求,iFLYBUDS在用戶進行英語通話時,能變身「翻譯官」,幫助用戶將通話內容實時轉譯為漢字,輔助用戶英語溝通。

除了三大核心功能外,iFLYBUDS在音質、連接、延遲、續航和降噪方面也有著自己的特色。

其中在續航方面,iFLYBUDS支持2.5小時通話時長,4小時聽歌時長,若搭配充電盒使用,可實現最長通話10小時,最長聽歌20小時。

在極限使用場景下,iFLYBUDS同時進行通話+錄音+轉寫的續航為2小時,搭配充電盒的最長使用時長為6小時。

降噪方面,iFLYBUDS的智能降噪功能採用雙麥克風拾音,CVC降噪算法,保證用戶在機場、健身房等嘈雜環境中的清晰流暢通話體驗。

此外,iFLYBUDS還支持智能語音助手、自定義輕擊耳機交互和佩戴檢測等功能。

結語:訊飛消費者業務擴軍智能錄音筆,新玩法押注TWS賽道

回顧過去幾年錄音筆行業的發展,一面是傳統錄音筆市場的破局,一面是AI技術的迅速發展與落地。

科大訊飛作為一家國內老牌智能語音企業,緊緊地抓住了傳統行業變革與新技術迸發的發展機遇,與過去自身長達20餘年的語音技術基因相碰撞,從而催生出AI錄音筆的新品類市場。

這既是訊飛的優勢,也是它的挑戰。從最初簡簡單單的錄音筆到一塊帶屏智能錄音筆,再到如今訊飛智能錄音筆SR系列的補全,訊飛圍繞語音技術的AI布局始終具有創新性和挑戰性。

尤其是訊飛首款智能TWS耳機的誕生,不僅實現了AI轉寫等技術在多個設備的落地和創新應用,還進一步擴張了自身AI戰略版圖,將智能語音和轉寫賽道的邊界拓寬到錄音筆行業之外。

至此,訊飛以智能語音為基礎的產品品類在AI轉寫賽道的布局,已愈發地多元化。同時,訊飛基於這些技術所帶來的跨邊界融合,也給整個錄音筆和可穿戴設備行業的創新應用與發展,提供了一個新的思考路徑和解決方向。

未來,訊飛消費者業務或將繼續打破不同模態技術之間的應用與融合,將自身業務的邊界拓寬到更遠的領域。

相關焦點

  • 高準確率離線轉寫 訊飛智能錄音筆SR502重磅上市
    天貓科大訊飛旗艦店、科大訊飛錄音筆京東自營旗艦店同步上市。作為訊飛智能錄音筆的熱賣機型之一,SR502基於上一代暢銷產品SR501進行了軟硬體全面升級,在高性能轉寫、高階降噪、智能編輯、超長續航等優勢基礎上,新增科大訊飛行業首發的離線轉寫功能,並內置了高素質攝像頭以支持OCR文字提取,同時能夠為錄製的視頻資料實時生成字幕。
  • 辦公效率提升300% 訊飛旗艦智能錄音筆SR702體驗
    其實關注訊飛產品的消費者對於該系列智能錄音筆一定不會陌生,早在去年推出SR501之後,訊飛的智能錄音筆就受到了大量用戶的追捧;而到了新一代SR702,在轉寫功能、麥克風降噪效果、多語言識別、產品設計工藝等方面,都帶來了全面提升。接下來,筆者就和大家詳細聊聊這款產品的使用體驗。
  • 持續提升轉寫體驗 訊飛智能錄音筆SR502煥新上市
    天貓科大訊飛旗艦店、科大訊飛錄音筆京東自營旗艦店同步上市。作為訊飛智能錄音筆的熱賣機型之一,SR502基於上一代暢銷產品SR501進行了軟硬體全面升級,在高性能轉寫、高階降噪、智能編輯、超長續航等優勢基礎上,新增科大訊飛行業首發的離線轉寫功能,並內置了高素質攝像頭以支持OCR文字提取,同時能夠為錄製的視頻資料實時生成字幕。
  • AI算法降噪,科大訊飛智能錄音筆最遠拾音距離超過15米
    科大訊飛智能錄音筆的亮相便是最好的例證,打通了從錄音、轉寫、編輯、分享、查找編輯的全鏈路,為職場人士提高工作效率帶來了新的可能。遇上英文會議,它在記錄英文錄音的同時,還自動將英文翻譯成中文並呈現在屏幕上,連結耳機即可直接聽到錄音筆的翻譯。就算沒有翻譯隨行,商務人士也能輕鬆應對每一場雙語會議/商務場合。此外,對於經常出差在外的職場人士來說,科大訊飛智能錄音筆也是非常實用的,在滿電情況下可工作10小時,同時還支持快充功能,充電5分鐘可使用2小時。
  • 訊飛智能耳機評測:職場人的最佳耳機外設,iPhone的得力助手
    訊飛智能耳機iFLYBUDS才實用! 筆者認為iFLYBUDS是耳機業內第一款針對商務人士推出的TWS耳機,最大的亮點就是加入了「通話實時轉寫」以及「通話譯文對照」。這兩個功能具體擁有什麼樣的黑科技呢?先別急,簡單的開箱一下。
  • 同步聲音的速度 訊飛智能錄音筆高效記錄「博鰲時間」
    事實上,此次訊飛智能錄音筆來到博鰲現場,並非訊飛智能錄音筆的首次亮相,早在今年兩會期間,訊飛智能錄音筆就參與到了兩會的報導工作中,訊飛智能錄音筆以同步聲音的速度,幫助兩會新聞工作者在兩會期間完成了信息及時轉寫的工作,把更精準的信息傳遞給廣大人民群眾。
  • 錄音筆+音樂播放器+同聲翻譯機三合一,搜狗S1智能錄音筆體驗點評
    狗今年推出這款的S1智能錄音筆,同樣也是主打的AI功能,但相比於C1智能錄音筆,S1智能錄音筆在外觀設計、硬體配置和功能上進行了巨大的提升,一是S1智能錄音筆有獨立3.5英寸高清顯示屏,無需藉助APP即可查看轉寫結果;二是S1智能錄音筆可連接WiFi使用,同時也可以插入SIM卡使用;三是S1智能錄音筆存儲空間由C1智能錄音筆的32G提升到了64G;四是S1智能錄音筆可外接
  • 618終極福利時間 快入手科大訊飛A.I.黑科技
    訊飛智能學習機X1 Pro訊飛翻譯機3.0,翻譯語言覆蓋全球近200個國家和地區、支持8大行業A.I.翻譯、5種方言翻譯、6種語言離線翻譯、13種語言拍照翻譯等,近期又新增漢語與藏語、維語的離線翻譯,和在線會議字幕功能,讓跨語種溝通交流無障礙。
  • 新時代的智能黑科技――訊飛智能錄音筆SR702
    訊飛錄音筆SR702上也搭載了這些先進的技術語音轉寫準確率高達98%,大大的提高了人們日常工作的效率。精準拾音,智能編輯一支錄音筆最重要的就是錄音功能。科大訊飛錄音筆SR702採用2顆定向麥克風和6顆矩陣麥克風組合的模式。
  • 新年必備好禮 訊飛AI生產力好物助力效率提升
    在這方面,科大訊飛C端產品就非常有發言權。作為國內知名AI企業,科大訊飛將深耕21年的人工智慧與智能語音技術應用到C端產品中,這些AI生產力好物致力於提升效率,為消費者帶來高效工作智慧生活。在細分場景及需求下,訊飛智能錄音筆、訊飛智能辦公本、訊飛、訊飛智能學習機和訊飛翻譯機均可滿足消費者的多種效率提升需求,相信能在新一年的工作生活中,成為大家的效率神器。
  • 用訊飛智能錄音筆B1測試日語電影自動翻譯,沒字幕也能看懂劇情!
    多數情況下,會議內容都需要轉換成文字記錄下來,這時候無論是使用手機錄音還是使用普通錄音筆錄音,都得手動來轉換成文字,工作效率很低。如果能有一個自動將聲音轉換成文字的錄音筆,是不是能夠大大提升工作效率呢?訊飛智能錄音筆B1就是這樣的一款辦公利器,值得一提的是,他不僅支持普通話,還支持常用的多種方言和外語。
  • 拒絕噪音,有科大訊飛入門級智能錄音筆A1記錄又快又全
    超具個性外觀設計,主宰顏值新時代小巧可愛又迷你的外觀設計是筆者特別喜歡這款訊飛入門級A1錄音筆的原因之一。輕巧方便的設計,整體機身大小55*32*15mm,僅重 30g,在校學生可以直接輕鬆地揣進口袋,書包裡,攜帶輕便無負擔,工作族隨意持握,毫無壓力。
  • AI效率神器非他莫屬,科大訊飛智能錄音筆行業高水準不可匹敵
    很多用戶接觸最早的智能語音是從訊飛輸入法開始的,對這款應用有著極高的評價。而科大訊飛在智能語音領域早已推出了多款產品,比如,訊飛智... 很多用戶接觸最早的智能語音是從訊飛輸入法開始的,對這款應用有著極高的評價。
  • +教育,科大訊飛黑科技如何提升消費者幸福感?
    +辦公作為科大訊飛的強勢領域,集齊了訊飛多款口碑產品——錄音轉寫高效精準的訊飛智能錄音筆SR系列、訊飛智能錄音筆A1,以及支持會議記錄、手寫筆記的訊飛智能辦公本,均深受職場人士歡迎。作為2020年人民網兩會記者團指定錄音筆,訊飛智能錄音筆SR系列定義了AI旗艦錄音筆行業四大標準——識別準、錄得遠、錄得清、語種全。
  • 智東西晚報:我國推全球神經元規模最大類腦計算機 福特被曝擬在北美裁員1000人
    9月1日消息,近日,浙江大學聯合之江實驗室共同研製成功了我國首臺基於自主智慧財產權類腦晶片的類腦計算機(Darwin Mouse)。1、科大訊飛連發三款訊飛智能錄音筆新品智東西9月1日消息,剛剛,科大訊飛連發三款訊飛智能錄音筆新品,型號分別為SR901、SR702和SR101,以及首款智能TWS耳機iFLYBUDS。
  • 「IT之家評測室」科大訊飛錄音筆 B1 體驗:小巧便捷,功能豐富
    11 月初,科大訊飛上市了一款智能錄音筆 B1,支持語音轉文字、實時在線編輯、翻譯等智慧功能。這樣一款錄音筆是否好用,能否滿足職場人士記錄信息的需求呢?IT之家目前已經拿到了這款科大訊飛智能錄音筆 B1,現在就通過評測和大家一探究竟。
  • 1+4麥克風陣列+智能主動式降噪?科大訊飛AI智能錄音筆SR301測評
    而且出於禮貌和便攜,錄音筆的體積一般不能過大,另一方面,體積小巧的錄音筆一般都有足夠的續航能力支撐,這在使用上面也能給錄音者提供很大的方便。而我一直都在使用的這款科大訊飛AI智能錄音筆SR301就非常不錯,不僅外觀纖薄,而且識音準確,下面就為大家深度測評一下,看看它到底有哪些過人之處。
  • 優勢明顯,科大訊飛翻譯機展現強大的智能語音技術
    自科大訊飛翻譯機面市以來,很多曾經苦練英語的人心裡難免有些不平衡,辛辛苦苦學了N年的英語,現在一下子感覺還不如一臺翻譯機,真的很委屈。但是不得不承認,隨著智能語音技術的不斷進步,人工翻譯的確受到了嚴重的挑戰。那麼,這款科大訊飛翻譯機真的能夠做到翻譯精準無誤嗎?
  • 咪鼠2019新品發布會首發智能雷射筆,「實時文字上屏」等功能引發熱議
    這款智能雷射筆是傳統翻頁筆的的升級產物,是基於科大訊飛語音技術,融合咪鼠自身人機互動技術的完美作品。只需一句語音口令,即可完成PPT演示場景下的所有需求,可為主講人節省大量時間。在咪鼠智能雷射筆的世界裡,一句口令就能操控所有。從頭開始、結束放映、順序播放自然沒問題,跳轉翻頁也完全不在話下,任何順序的翻頁需求都非常ok。而且咪鼠雷射筆還有其他更閃亮的功能。如果你在演講中途有插播多媒體視頻的需求,也可以通過語音命令打開文件、跳轉超連結。
  • 二十芳華正茂 回顧科大訊飛發展之路 展望A.I.未來
    發展到今天,科大訊飛主要的研究院已經有三個,分別是AI研究院、雲計算研究院和大數據研究院。這次發布會上科大訊飛一口氣帶來了訊飛翻譯機3.0、智能辦公本、智能錄音筆、訊飛學習機、訊飛轉寫機、IFLYOS在內的6款重量級產品。20年的深耕,6款重磅產品落地:  科大訊飛在成立20周年之際舉行了發布會上帶來了6款重磅的產品,我們也看到了科大訊飛在TO C方向上開始發力。