百度發布了人工智慧新產品,一位 「計算機速記員」

2020-12-08 虎嗅APP

百度用人工智慧技術做了新產品。


百度矽谷實驗室(SVAIL)周一上線了網頁應用 SwiftScribe,基本的功能是把音頻資料轉錄成文字。在一篇博客文章中,項目主管 Tian Wu 說他們解決了一個重要的「痛點」:消耗大量時間的逐字聽寫轉錄。


SwiftScribe 目前還處在內測階段,並未開放,不過你可以通過一個演示示例了解它是怎麼工作的。SwiftScribe 支持上傳時長 1 個小時以內的 wav 或 mp3 文件,目前只接受英文。接下來它需要花點時間生成文字,官方說法是,1 分鐘的錄音需要不到 30 秒、1 小時的錄音需要 20 分鐘左右。


接下來你會在網頁上看到轉錄好的文字,但這並不意味著轉錄結束。文本不會區分大小寫、沒有標點符號,更沒有分段,你需要在文本框中手動編輯,然後再做導出。這個過程也會被百度記錄,就像所有的人工智慧學習過程一樣,它用來幫助算法糾正錯誤,提高準確率。



文本框底部有一排工具欄,播放按鈕開啟,一個高亮的標識會跟隨語音標出閱讀的進度,方便你停下來查看這個單詞對應的語音。這個工具欄還有變速、標記的功能。


這個過程就相當於用機器算法取代了速記員、聽寫員的工作。「SwiftScribe 會在廣泛的領域內帶來積極影響,提高生產力,包括醫療機構、法律、商業和媒體。」Tian Wu 在博客中說,專業領域的人工聽寫效率低,1 小時的錄音往往需要花費 4-6 個小時,每分鐘語音的成本在 1 美元,SwiftScribe 能把完成工作的時間平均縮短 40%。


Tian Wu 在接受採訪時表示,他們以後還會增加對視頻文件的語音識別支持,也會添加自動插入標點符號等功能。


語音識別並不是什麼新鮮事物,你手機裡的各種語音助理比如 Siri、Cortana 都基於此,用戶關心的唯一問題可能是到底識別的準確性有多高。


按照 Tian Wu 的介紹,SwiftScribe 基於他們的最新研究成果 Deep Speech 2。2014 年百度的首席科學家吳恩達剛剛入職百度不久,就帶著一個 10 人的團隊開發 Deep Speech,一套語音識別系統。

當時的研究重點在怎麼提高嘈雜環境下的英語語音識別準確率。百度收集了 9600 個人 7000 小時的語音樣本,添加了 15 種噪聲,把樣本擴充到 10 萬小時。吳恩達說這套系統的錯誤率比同期的微軟 Bing Speech、Google Speech API 等競爭對手低 10%。


2015 年,矽谷人工智慧實驗室又發表論文公布了 Deep Speech 2 ,這個系統開始學習漢語,也提高了對不同英語口音識別的能力。


到 2016 年,百度利用 Deep Speech 技術推出基於 Android 的語音輸入應用 TalkType,強調輸入法對「語音優先」。同一年,Deep Speech 2 還入選了《MIT 評論》評出的「 2016 年十大突破技術」,入選的理由是「語音識別技術讓智慧型手機變得更易操作」。


可以確定的是,百度之後還會花費更多的精力、更多的錢來支持人工智慧的研究,這是李彥宏反覆提及的最新故事。


上個月的財報電話會議上,李彥宏說會壓縮百度糯米和百度外賣的補貼和營銷費用、公司的未來在人工智慧領域:「人工智慧是改變網際網路和傳統工業的一個巨大機會。」


與之對應的是,百度 2016 年的營收漲了 6.3%、淨利潤少了三分之二。這是百度自成立以來,年度淨利潤首次下跌。而百度總收入中,依然有九成以上來自廣告業務。

相關焦點

  • 一文回顧百度人工智慧2020上半年,王海峰:百度AI助力新基建提速
    7月23日,百度AI 發布了2020年上半年總結,從AI戰「疫」、AI新基建、產業智能化三大方面詳述了過去半年的努力和突破。過去半年,百度AI是戰「疫」大旗下的科技奇兵,是新基建浪潮裡的中堅力量,作為人工智慧基礎設施,步履堅定,在喧囂中快速成長。
  • 人工智慧領域突破百度發布在線翻譯系統
    日前,百度在機器翻譯技術上取得重大突破,發布了融合統計和深度學習方法的在線翻譯系統。該系統藉助海量計算機模擬的神經元,模仿人腦「理解語言,生成譯文」,同時結合百度已有的統計機器翻譯技術,使得機器翻譯質量實現了質的飛躍。百度,再一次站到網際網路前沿技術的領先位置。  機器翻譯一直被公認為是人工智慧領域最難的課題之一。
  • 李彥宏:人工智慧就是「百度大腦」
    (原標題:李彥宏:人工智慧就是「百度大腦」)
  • 百度王海峰:人工智慧是新一輪科技革命的核心驅動力
    來源:中國經營網原標題:直擊烏鎮|百度王海峰:人工智慧是新一輪科技革命和產業變革的核心驅動力量本報實習記者 陳溢波 記者 張靖超 烏鎮報導10月21日,第六屆世界網際網路大會在水鄉烏鎮繼續隆重召開。在當天下午召開的人工智慧分論壇中,百度首席技術官、深度學習技術及應用國家工程實驗室主任王海峰作了一場題為《人工智慧進入工業大生產時代》的演講。《中國經營報》記者從現場了解到,已經開放216項能力,每天調用次數已過萬億次,上面有150多萬名開發者,有大量的模型發布出來。
  • 國家首個人工智慧實驗室成立 百度肩負國家AI使命
    此次深度學習技術及應用國家工程實驗室的建設,將強化產業技術原始創新能力,搶佔深度學習技術及應用技術發展制高點」,孫偉談到,面對深度學習技術及應用產業當前形勢,進行技術創新、產品創新、體制創新和機制創新,必將推動深度學習技術及應用產業進一步快速有序發展。  張鈸表示,人工智慧發展到今天若想實現新的突破,產生新的應用,必須要有新的技術創新,這就需要強大的研究力量或者工作的支持。
  • 人工智慧時代的家庭影院百度再發AI新物種小度電視伴侶
    作為AI領域的新物種,小度電視伴侶定位於「人工智慧時代的家庭影院」,憑藉出眾的音質與視頻播放能力,全語音遠場交互能力以及全面接入的小度人工智慧助手,讓你徹底擺脫遙控器;而小度在家系列智能視頻音箱再推新品——小度在家1S,它擁有全新外觀設計與硬體配置,升級了頗受好評的兒童模式,並在內容資源上獲得進一步擴展。
  • 百度人工智慧地圖生態全景亮相
    日前,百度地圖生態大會在京召開,「新一代人工智慧地圖」生態全景首次公布。會上,百度地圖聯合九大頂級科研院所和高校成立智能交通聯合實驗室,並發布了行業首個地圖開發者發展趨勢報告。百度首席技術官王海峰表示,百度地圖已經成為AI時代刻畫真實世界的重要基礎設施,不僅支撐著數以億計的用戶每天的出行服務,同時也支持著所有合作夥伴的智能化升級。目前,百度地圖日均位置服務請求次數突破1200億次,日均軌跡裡程20億公裡,註冊開發者數量達180萬,服務超過50萬個移動應用,已成為中國最大的智能化位置服務平臺。
  • 百度、滴滴出行、商湯……十大人工智慧實驗室「安家」中關村
    1.百度搜索 該中心位於北京海澱區西北部的百度科技園內,是百度在人工智慧領域研發工作的核心。 這家搜索巨頭在7年多前就致力於人工智慧的研究,如今已贏得了「黃浦人工智慧軍事學院」的稱號,因為它已成為培養人才的搖籃,其中一些人成功創業。2017年,百度被挑選為領導國家人工智慧研究工作。
  • 2020中國高校計算機大賽—人工智慧創意賽啟動 百度大腦提供賽事平臺
    來源標題:2020中國高校計算機大賽—人工智慧創意賽啟動 百度大腦提供賽事平臺 人工智慧技術目前正處於加速向各行各業實際場景落地滲透的關鍵階段,與之相對應,人工智慧教育也在往貼合產業需求的方面轉變。
  • 百度推出AI音頻轉錄工具SwiftScribe,讓你20分鐘搞定1小時的錄音 |...
    鈦媒體快訊 | ,一個利用人工智慧,讓用戶能快速將音頻快速轉成文字的免費網頁工具。 百度在近年一直在持續改善其新一代深度語音識別系統DeepSpeech2。DeepSpeech2系統由百度矽谷人工智慧實驗室(SVAIL)研發,並在去年被麻省理工科技評論評為2016年十大突破技術。 「百度在語音技術領域不斷進步,語音接口更為實用和有效。用戶可以愈加便利地與身邊的設備進行互動。
  • 人工智慧時代,百度地圖的思考與布局
    同時,地圖本身也代表著基於地理位置大數據的能力,不僅僅是在地圖產品上,實際上在人工智慧領域,比如用到很多空間位置信息時,我們都可以提供非常好的服務。圍繞這個定位我們在業務重點方向也做了一些調整。極客公園:百度地圖如何與 AI 相結合?李瑩:首先是 AI 的能力。
  • 如果百度的人工智慧失敗了, 那麼百度將何去何從?
    人工智慧的分支方向不少,沒有人能預測下一波浪潮的突破點在哪個領域優先爆發。在百度內部,人工智慧的投入也分布在不同的組織架構之下。究其自身發展,百度在海外業務的發力不夠,非常容易被獵豹等企業超車。百度國際事業部負責人提到,要將百度AI技術尋找海外落地場景,企圖利用AI技術提升、優化現有產品的體驗,從而鞏固百度在海外的市場。
  • 百度神秘智能音箱發布,Diss市面現有產品「都是捲紙垃圾桶」
    這是百度入局智能家居的重要動作。陸奇稱這是一款能夠帶回家的AI大腦,百度打造自己的硬體產品是建立平臺生態的一部分。本次百度世界大會定位明確,Bring AI to Life,在硬體和生態上還發布了一系列重要動態:大會的主題是技術創新和產品創新,李彥宏陸奇等相繼登場,介紹了百度AI產品化,以及商業化落地的進程。
  • 百度CES發布Apollo 2.0 英偉達發布自動駕駛晶片Xavier
    2、英偉達發布自動駕駛晶片 與百度大眾合作  1月8日,車東西報導,英偉達在CES發布無人車晶片Xavier,Xavier採用12nmFFN工藝,內建90億枚電晶體,配備特製8核CPU、全新512核Volta GPU、全新深度學習加速器、全新計算機視覺加速器以及全新
  • 百度地圖季永志:新一代人工智慧地圖釋放AI新勢能 打造極致出行體驗
    在AI技術加持下,百度地圖實現了90%數據生產環節AI化,並基於強大的產品實力全新升級生態全景2.0,正值百度地圖十五周年、開放平臺十周年之際,為2020年呈上了一份優異的成績單。百度集團副總裁、百度集團首席信息官(CIO)李瑩出席大會並致辭,她表示:「在2020這個不平凡的一年,作為AI技術典型落地場景的百度地圖,實現了從國民出行工具到新基建數字底座的重要躍遷,未來將繼續以新一代人工智慧地圖開創者的姿態,扛起社會責任的大旗,引領中國人工智慧地圖創新發展。」
  • 2020年人工智慧專利申請與授權排名,百度榜首,華為第二;中國首次...
    自2017年以來,藍皮書已連續四年面向全球發布。、新實踐、新態勢、新進展。儘管今年新冠肺炎疫情爆發,但我國人工智慧技術創新卻並未因此受阻,截至今年10月,我國人工智慧專利申請共計69.4萬件,同比增長56.3%。
  • 2017百度世界大會11月16日舉行 會上將發布AI硬體
    上周四,李彥宏在中國科學院大學與同學們對話時,國科大人工智慧學院的肖俊副院長向他提問「百度接下來有什麼『黑科技』是可以透露下的?」
  • 蔡康永收了一位非正常人類做學生,這新學生是人工智慧
    早前,小度智能官方微博曬出了百度將舉行小度新品發布會,並附上蔡康永形象的海報,引得各路媒體紛紛討論,百度這一次將會發布的是什麼的智能產品?同樣引發很多猜想。duang,duang,duang今天下午,小度智能在其官微正式宣布,其要發布的智能AI新品就是:小度智能音箱!
  • 搜索營銷仍被看好,人工智慧成為百度推廣加速動能
    前不久百度發布了智能營銷解決方案,再一次將人工智慧推到公眾面前,而9月1日第十一屆百度世界大會的主題也是人工智慧(AI is the electricity),意指通過人工智慧賦能全行業,以科技驅動改變大眾生活。實際上,2016年接連被媒體報導的百度人工智慧項目將之前神秘的人工智慧技術推到了公眾生活、市場營銷層面,這是人工智慧不斷落地的表現。
  • 走向人工智慧時代,百度的延承和蛻變
    從百度發布了2017年財報來看,總營收達到848億元(約合130.3億美元),較2016財年增長20%;移動營收在百度2017財年總營收中佔比為73%,高於2016財年的63%。業已爬出谷底,走向頂峰。