李彥宏談「百度大腦」語音合成功能:可根據個人需求定製

2020-12-06 網易財經

(原標題:李彥宏談「百度大腦」語音合成功能:可根據個人需求定製)

李彥宏現場展示運用情感語音合成技術還原張國榮聲音視頻

中國網財經9月1日訊(記者 劉小菲)2016百度世界大會今日在北京召開。百度董事長兼執行長李彥宏親臨現場並發表主題演講。李彥宏在現場揭秘了基於人工智慧技術打造的「百度大腦」,李彥宏稱,「百度大腦」不僅擁有語音識別功能,還具有另一種語音能力——語音合成。值得一提的是,這種語音合成可以根據個人需求進行定製,形成自然發聲的能力,模擬任何一個你喜歡的人的說話方式。

李彥宏稱,基於大數據與深度學習技術優勢,百度的新型情感語音合成系統能夠讓機器擺脫平鋪直敘的發聲,為用戶帶來更自然、更接近真人朗讀的聽覺體驗。目前,百度每天響應的語音合成的請求達到了2.5億次。在情感語音合成技術上線後,用語音聽小說的百度用戶從過去平均每天聽0.69小時,增長到現在的2.21小時。語音合成的能力對用戶的App使用黏性的提升是非常顯著的。

李彥宏還表示,今天的語音合成可以根據個人需求進行定製,形成自然發聲的能力,模擬任何一個你喜歡的人的說話方式。李彥宏透露,百度地圖中有一個李彥宏導航語音包,其實就是根據他日常的語音合成的。

另外,李彥宏還在現場展示了運用情感語音合成技術還原張國榮聲音的視頻。以張國榮在影視、電臺等留存下來的原聲進行建模,通過情感語音合成技術實現與粉絲的「隔空對話」。實際上,任何一個人只要用30分鐘按照要求錄製50句話,就可以用百度大腦的語音合成技術模擬出來這個人的聲音。人人都可以擁有自己的聲音模型。

(責任編輯:李喬宇)

本文來源:中國網 責任編輯:王曉易_NE0011

相關焦點

  • 李彥宏:人工智慧就是「百度大腦」
    李彥宏表示,過去五六年間,百度花了很大的精力投入到人工智慧的研發當中,人工智慧就是「百度大腦」。三四年前,百度大腦就相當於兩三歲孩子的智能。但是人腦和電腦還是有很大區別的,而百度大腦主要有人工智慧的算法、計算能力和數據這三大板塊。其中人工智慧算法由超大規模神經網絡、萬億級參數、錢一樣本和遷移特徵訓練組成。計算能力由數十萬臺伺服器以及中國最大GPU集群組成。
  • 中文語音合成最高水平,百度語音技術打造全球首款地圖語音定製產品
    9月19日,百度地圖「『音』為有你,更有『AI』」語音定製功能發布會召開,重磅推出全球首個地圖語音定製產品。該功能科技範兒十足,用戶只需在百度地圖App上錄製20句話,最快20分鐘,即可生成個人完整語音包。換句話說,當你之後出行使用地圖功能時,就可以用自己的家人甚至寶寶的定製化語音導航,十一旅遊還可以聽自己聲音的景區解讀。
  • 李彥宏:百度的人工智慧技術都能用在哪裡?
    李彥宏展示了一段中國計程車司機和外國乘客的對話。兩人都不會外語,計程車司機說中文,通過百度可以翻譯成外語,讓外國乘客聽懂。外國乘客說英文,百度也可以準確翻譯成中文。這背後是百度的語音識別和語音合成功能在支持。他展示了語音識別和語音合成的技術,百度的語音識別可以比較準確地識別出一段營銷電話中銷售員和客戶的對話,同時百度用語音合成技術合成了張國榮向現場觀眾問候的話。
  • 百度大腦震撼發布 自然語言處理成熟度尚不及圖像處理
    百度大腦震撼發布 自然語言處理成熟度尚不及圖像處理  語音合成是李彥宏的下一個演示。現場出現了張國榮的合成音,並按照正常人的語調播放了出來。 圖像演示在現場出現了一個笑點。李彥宏表示,現在人臉識別的準確率已經達到了99.7%,大屏幕上突然出現了現場視頻,並在一片笑意中由百度大腦順利識別出了百度副總裁朱光等人。
  • 李彥宏:百度大腦「智商」已相當於兩三歲小孩
    隨著計算成本的飛速下降和計算能力的飛速提升,未來十幾二十年,這樣的大腦或許比人腦還要聰明。」昨日,百度董事長兼CEO李彥宏表示。  「人們會習慣忽視量變,但質變的時候會被打得措手不及。」李彥宏說。他的一番表態從某種程度上,更像是對近來外界批評百度在巨頭之爭中「掉隊」的回應。
  • 百度世界2020大會硬核來襲!百度智能語音交互技術重磅迭代
    在當天的百度大腦分論壇上,百度語音首席架構師賈磊重點講解了百度端到端語音交互技術。年啟動語音合成研發,歷經參數合成、拼接合成、深度學習語音合成和端到端的語音合成,到如今全新升級為包含個性化、多風格多角色、單人千面的語音合成系統,百度語音合成技術始終處於升級迭代中。
  • 從語音、視覺、語義到算法,百度大腦 5.0 全方位升級
    合成方面,針對現階段面臨風格遷移、音色模擬和情感擬人的三大挑戰,百度推出語音合成技術Meitron,可以將語音中的音色、風格、情感等要素映射到不同的子空間,在使用時,不同要素可以任意組合,靈活的控制合成語音的風格。同時降低語言合成門檻,僅需20句話就可以製作一個人的專屬聲音。
  • 自研晶片+自主AI框架,百度CTO王海峰攜百度大腦6.0亮相
    剛剛,百度用AI技術帶我們體驗了一把「穿越」的感覺,面對20年前的自己。今天「百度世界大會」首次與「央視新聞」合作,總臺央視主持人康輝和百度創始人、董事長兼CEO李彥宏、百度CTO王海峰,「5個人」進行了一次特殊的對話。明明只有康輝、李彥宏和王海峰三人,為何會變成「5個人」的對話呢?
  • 百度重生之戰:李彥宏的矩陣革命
    調兵遣將的李彥宏,希望這些新提拔的戰將,能成為主導百度下一代技術和業務的扛旗先鋒。一位智能語音團隊的高級工程師回憶了這樣一個細節:2018年百度世界大會的時候,海峰老師堅持要在現場演示小度最新的智能語音交互技術——Endless Conversation,由於現場環境嘈雜,太多不可控因素,擔心演砸了。
  • 百度大腦產品上新&技術升級:圖像處理、智能寫作平臺、語音識別
    百度大腦一月一次的最新技術&產品盤點來了。在這裡,與百度大腦一起成長,見證 AI 的力量。您可以從 PC 端訪問百度 AI 開放平臺(ai.baidu.com)申請邀測,或使用最新產品。新開放 AI 技術能力語音識別語音識別極速版支持60秒內音頻使用 REST API 方式進行調用,簡單易用。
  • 百度地圖推出定製語音包 可AR導航 還能幫車主找充電樁
    目前百度依託於百度大腦、百度智能雲建立了百度地圖全景生態,在打車、物流、金融、旅遊、通訊服務方面都能提供幫助。百度地圖事業部總經理李瑩表示,百度地圖可以提供語音定製系統,用戶可以錄製自己的導航語音包,百度地圖還會提供城市街景AR導航功能。目前百度已經和多個網約車平臺建立了合作關係,百度地圖將能夠提供更加合適的打車平臺和出行路線。
  • 2019百度AI開發者大會前夕,解讀百度大腦的半年「豹變」
    而在北京海澱公園,有一種智能垃圾箱卻成為網紅,你只要將垃圾放到攝像頭識別區域,它就能對垃圾圖片進行智能判斷,顯示垃圾是否可回收,並打開對應箱體的擋板。垃圾分類原來如此簡單!這種智能垃圾箱的背後,是百度大腦的AI技術。北京分形科技使用百度大腦EasyDL制化訓練及服務平臺,識別準確率高達99%。
  • 百度大腦遠場語音開發套件評測—快速上手,超讚語音交互體驗
    我也是大概在18年末開始接觸到百度AI社區,通過使用文字識別、圖像識別等百度AI技術,逐步感受到了AI技術的強大,同時也感覺到了百度AI技術的進步:AI技術領域範圍越來越廣泛,識別速度越來越快,識別準確度越來越高。這次,有幸收到百度遠場語音開發套件的測評邀請,作為一個非測試專業人員,這裡我就自己的百度遠場語音開發套件使用過程及在使用過程中遇到的問題和大家分享一下,如有錯誤,請多多指教。
  • 外媒:百度日本推出AI服務 發布Simeji語音輸入功能
    作為全球人工智慧技術的領導者之一,百度正在推動人工智慧應用產品造福全球消費者。據外媒報導,百度日本近日發布了用於流行日文輸入法應用Simeji的語音功能,可以快速準確地將用戶說出的語音轉換為文本,並能自動添加標點。該署名文章對此認為,百度的這一技術已經全面超越了谷歌等競爭對手。
  • 百度地圖伴留學生開啟美好2020 定製語音包緩解「每逢佳節倍思親」
    每次年關將近,百度面向海外學子的招聘工作便也如火如荼地拉開序幕。此次,百度地圖聯合百度校園招聘,特別面向這些「千裡之外的行客」介紹了「聊以寄相思」的「語音定製功能」,並結合該功能從親情、友情、愛情三個角度拍攝了「世界那麼大,我想聽你說」系列短視頻,講述著關於千裡之外,「化思念為陪伴」的故事。故事中,百度地圖用聲音傳遞「AI」的語音定製功能,引起了留學生群體的強烈共鳴。
  • 李彥宏親自站臺,百度雲手裡有什麼底牌?
    我們再回到李彥宏的語境中。人工智慧技術其實是一個範圍非常廣泛的技術,它不僅涵蓋了語音識別、圖像識別、自然語言理解、用戶畫像,它其實越來越和大數據、雲計算的界限在變得模糊。當這些東西全部都糅合在一起為企業去提供技術服務的時候,它的想像空間還是非常大的。不難看出,李彥宏對百度的核心技術——人工智慧,在雲上的應用非常看好和倚重。人工自能的基礎有兩個:數據收集能力和算力。
  • 百度地圖新功能!能把女朋友的聲音設置為語音導航!趕緊學起來!
    於是:9月19日,百度地圖APP上線行業首創的語音定製功能。只要打開百度地圖APP,呼喚「小度小度」,說出「錄製我的語音」,或點擊百度地圖首頁的「出行助手」後選擇「語音定製」便可進入語音定製頁面。你的「人氣」語音包還有機會獲得百度地圖官方推薦,成為地圖「好聲音」!過去,製作地圖語音包需要在專業錄音棚錄製大量語料,再經過長達數月的製作才能生成,流程複雜、耗時長的問題讓地圖語音包一度只是「明星專屬」。現在,有了百度地圖的語音定製功能,人人都是「大明星」!甚至自家寶寶的聲音也可以收錄到百度地圖裡!
  • 百度大腦AI加持語言教育,智能語音糾正口語發音、指導朗讀背誦
    而為實現在英語互動中,更準確的識別用戶所講,銀月網絡接入了百度大腦語音識別和語音合成技術,讓識別準確率提升至97%,大大提高了人與設備對話的體驗,這也讓用戶在英語口語練習上更科學,更準確,更專業。 (若發音有誤,百度大腦語音合成技術將提供正確讀音)據介紹,銀月網絡基於百度大腦語音合成和語音識別技術升級的《戀愛口令》以校園浪漫的愛情故事為題材,講述一名轉校生來到新學校後發生的「浪漫邂逅」。
  • 百度大腦這樣思考:模仿人類大腦神經網絡
    ——編 者   能做什麼   提高語音識別、圖像搜索準確率,助力大數據應用推理預測   德國奪冠率17%,阿根廷奪冠率12.9%……打開百度的大數據引擎,點開世界盃預測一欄,可以看到每個參賽隊伍的奪冠概率分析——這都是根據大數據實時分析得出的結果。
  • 91Reading接入百度大腦語音技術,朗讀功能使用量已超越閱讀
    K12英文原版閱讀產品91Reading在接入百度大腦語音技術後,實現了「閱+讀」一體化的語言學習模式,為這一問題提供了「科技範」十足的答案。對此,91Reading推出朗讀測評功能,但問題也來了,孩子們的「讀」該由誰評判?打分標準如何保持一致?教學中堆積如山的朗讀作業如何高效處理?面對一系列問題,91Reading將目光投向了百度大腦。