AI晶片、框架、語言與知識、量子計算……百度大腦6.0發布

2020-11-29 機器之心Pro

9月15日,科技界年度盛會「百度世界2020」線上開幕。今年的百度世界大會由百度與「央視新聞」聯合呈現,上午剛剛結束的主論壇精彩紛呈,反響熱烈,花式登上熱搜:百度創始人、董事長兼CEO李彥宏與央視主持人康輝「虛擬人」亮相、顛覆搜索形態的「度曉曉」、去安全員的「全自動駕駛」……這些炫酷的背後離不開百度大腦的支撐。

百度大腦分論壇帶來這些「黑科技」的全面揭秘,展示了百度大腦的技術升級與演進。百度CTO王海峰發布了百度大腦6.0,升級為「AI新型基礎設施」。「知識增強的跨模態深度語義理解」讓百度大腦的理解能力更加強大,飛槳深度學習平臺與百度崑崙晶片的升級則為開發者提供了更優的算法開發平臺和更強大的算力。國內首個面向疫情預測與追蹤的多方數據協作平臺、國內首個雲原生量子平臺重磅推出,提出AI安全三大維度……大量技術硬核來襲,百度大腦分論壇成為中國百萬AI開發者的極客盛宴,詮釋著 「AI新型基礎設施」的巨大能量,這也成為國內AI技術的「風向標」。

(百度CTO王海峰)

王海峰表示,「人工智慧是第四代工業革命的核心科技,是國家推進『新基建』重點建設的新型基礎設施,百度建設的AI基礎設施正是百度大腦,能夠讓各行各業更高效、更全面、更深入地應用人工智慧技術,加快產業智能化進程。」

瞄定「AI新型基礎設施」,百度大腦6.0締造AI基礎底座

栩栩如生、問答如流、認知接近人類甚至可以機機對話、可在手機終端運行的「虛擬人」是大會最大的亮點之一,其背後的技術支撐,也是科技圈及開發者的聚焦點。百度大腦分論壇上,百度集團副總裁吳甜詳解百度大腦6.0,闡述了百度如何聚焦人工智慧領域的前沿突破,來打造這一產品。

吳甜表示,百度大腦6.0的升級,瞄定的是國家戰略與政策角度中「推動網際網路、大數據、人工智慧和實體經濟深度融合」的需求,往推動「新基建」、助力產業升級轉型的方向發力,承擔著「AI新型基礎設施」的重要角色。

(百度集團副總裁 吳甜)

對於百度大腦6.0的升級,吳甜從多個層次進行了概括:在基礎層,飛槳深度學習平臺和百度崑崙AI晶片「軟硬一體」升級為開發者打下了堅實的基礎;在技術層,百度大腦實現多項核心技術融合,形成知識增強的跨模態語義理解能力,例如基於圖像語言一體化理解技術,OCR的準確率提升了24%,基於語音語言一體化理解技術,語音識別的準確率和交互成功率也迎來大幅提升。具有認知能力的「虛擬人」更是這些前所未有技術的綜合展示。

技術上的躍進,也在不斷加速產業智能化發展。「全國預警發布」百家號可自動製作圖文內容,目前已發布37.5萬篇,觸達用戶22.8億人次;水路運輸行業基於零門檻AI開發平臺EasyDL打造的首個且唯一基於 AI 識別船舶空滿狀態的智能水運調度平臺,空滿載識別準確率可達99.7%。

吳甜披露最新數據,百度大腦已經開放了273項AI能力,凝聚超過230萬開發者,創建超過31萬模型,並培養了超過100萬AI人才,有力推動了中國AI技術研發、實踐應用與生態建設。

晶片框架、核心算法全面演進 百度大腦「AI力」爆棚

百度大腦分論壇上,百度一眾AI大咖、科學家紛紛亮相,詳解百度大腦各個技術版塊。對於前沿趨勢與技術乾貨的呈現,囊括了AI晶片、框架、核心算法、AI安全,以及最前沿的數據聯邦和量子計算領域的進展。

(依次:百度語音首席架構師賈磊、百度視覺技術部總監丁二銳、百度知識圖譜部&大數據部高級總監朱勇、百度傑出架構師,文心(ERNIE)負責人孫宇、百度深度學習技術平臺部高級總監馬豔軍、百度智能晶片總經理歐陽劍)

基礎層,AI晶片是科技競爭的制高點,是歷史的趨勢。百度崑崙1已量產部署將近2萬片,在百度搜尋引擎等部署,相比英偉達T4 GPU性能在不同模型下提升1.5-3倍。百度智能晶片總經理歐陽劍預發布了國內首款雲端通用AI處理器「百度崑崙2」,採用更先進的7nm工藝,性能最高可超過前代三倍,預計明年初量產。

作為「智能時代的作業系統」,深度學習框架下承晶片,上接應用。百度深度學習平臺飛槳公布目前已適配15家硬體廠商、22種晶片型號,對國產硬體的支持力度業內第一。

百度深度學習技術平臺部高級總監馬豔軍帶來核心框架的技術進展。動態圖和API體系全面升級,飛槳實現了動態圖和靜態圖的統一,靈活性和效率兼顧,讓用戶更容易開發模型;全面升級的API體系,降低了編程複雜度,對於開發者更加友好。

英特爾的高級工程師Andres Rodrigus也在演講中提到深度學習框架與硬體配合打出的「組合拳」,可以在AI任務上帶來更高的計算性能與精度。據介紹,第二代英特爾至強可擴展處理器可以為文心(ERNIE)在INT8上獲得3倍的性能提升;第三代英特爾至強可擴展處理器在Bfloat16上更有利於訓練和推理等任務,可提供2倍多的計算性能和計算吞吐量。未來英特爾也將繼續與百度合作,在硬體層面為飛槳提供更多的優化與特性。

此外,核心AI算法也迎來全面升級。百度語音技術迭代,語音識別層面,提出端到端的信號聲學一體化建模技術,可解決傳統數位訊號處理和語音識別級聯繫統耦合嚴重、迭代困難問題;語音合成方面,實現了個性化TTS、多角色合成、單人千面等能力。百度語音首席架構師賈磊公布,百度智能語音日均調用量超過155億。

百度視覺技術部總監丁二銳表示,視覺計算在端側的需求凸顯,模型小型化已成為趨勢。百度大腦6.0讓視覺計算走向極致效率,基於PaddleSlim為開發者開源Slim系列視覺模型,不僅包括剛剛在CVPR低功耗計算視覺比賽獲得冠軍的基礎模型,還包括計算量下降到1/7的人臉識別模型、僅有3.1M的文字識別模型。此次還開放了業界首發的兩款視頻生產SDK方案和一款端雲一體虛擬形象構建及應用解決方案,可在手機端賦予用戶2D虛擬真人、二次元等獨特的形象,構成了全面的人物生成生態。最後還探討了以度目為代表的視覺硬體在生產生活中的落地應用,正式開啟「軟硬一體」的視覺時代。

知識是人類在實踐中認識世界的成果,是人類智慧的結晶。百度知識圖譜部、大數據部高級總監朱勇帶來知識圖譜的最新進展。百度構建了世界最大規模的知識圖譜,擁有超過50億實體和5500億事實,並在通用圖譜的基礎上構建了事件圖譜、多模態圖譜、行業圖譜等,可以讓人工智慧在多領域都實現「心中有數」。目前,百度大腦的行業知識圖譜已經覆蓋了100多個行業場景,日均調用次數超過400億次。

語言是人類思維的載體和溝通交流的工具。百度傑出架構師文心(ERNIE)負責人孫宇表示,百度語義理解技術與平臺文心ERNIE已經累計學習50億條知識。同時,提出了基於多流機制的預訓練語言生成技術ERNIE-GEN,可大幅提升自然語言生成任務效果;提出知識增強跨模態語義理解技術ERNIE-ViL,首次將場景圖知識融入到跨模態的預訓練模型中。

至此,在基礎層、感知層和認知層上,百度大腦6.0均實現了全新升級,不僅讓人工智慧更加接近人類,同時也為廣大開發者提供了更加趁手的工具,助力多樣、複雜、深度的AI應用落地。

數據聯邦、量子計算兩大發布 首提AI安全三大維度

人工智慧同時也在向數據聯邦、量子計算等領域融合。百度研究院大數據實驗室與商業智能實驗室主任竇德景發布國內首個面向疫情預測與追蹤的多方數據協作平臺—百度數據聯邦平臺,具備安全數據存儲、雲上可信數據交換、大規模數據演算等特性,能夠實現多個機構間的隱私數據融合、數據訪問與聯邦學習,目前已助力清華大學、西安交通大學,廈門大學等研究機構進行疫情研究。

(依次:百度副總裁馬傑、百度研究院大數據實驗室與商業智能實驗室主任竇德景、百度研究院量子計算研究所所長段潤堯)

量子計算被視為面向未來的計算範式與生產力,繼5月20日百度推出量子機器學習工具量槳後,百度研究院量子計算研究所所長段潤堯再次帶來國內首個雲原生量子計算平臺量易伏QUANTUM LEAF,可提供QCompute等量子開發套件、縮短量子編程全生命周期、實現量子工具鏈閉環。量子脈衝計算服務量脈Quanlse、量子機器學習工具集量槳Paddle Quantum也得到了全面升級,構建起百度量子平臺為核心的量子生態,開啟屬於中國的量子時代。

百度大腦的AI能力正通過雲和開放平臺輸出給社會各界,支持各行各業智能化升級。此外,安全體系縱貫百度大腦各層,為AI技術及應用保駕護航。百度副總裁馬傑首次提出AI安全研究的三大維度:Security、Safety和Privacy,即強對抗環境下的安全威脅、非對抗條件下自然環境所產生的真實威脅和數據安全與隱私保護。

在百度世界2020大會上,百度大腦分論壇為開發者展示了最前沿的技術進展,以及從AI晶片、深度學習平臺到核心AI算法,再到數據聯邦及量子計算的重磅發布與全新升級,這些技術乾貨,正在助推開發者實現自己的業務構想與AI應用,為中國科研創新提供前所未有的加速度。正如王海峰所說:「百度堅持以科技創新為驅動,以產業智能化升級為方向,與社會各界一起共同努力,加快新型基礎設施建設,為社會經濟高質量發展貢獻力量。」

相關焦點

  • 自研晶片+自主AI框架,百度CTO王海峰攜百度大腦6.0亮相
    百度大腦6.0—AI新型基礎設施,已開放270多項領先的AI能力,凝聚230萬開發者,企業發布的模型數量超過31萬,是業內最全面、最領先、服務規模最大的 AI 開放平臺,將更敏捷、更高效支撐AI工業大生產,助力產業智能化提速。今年,百度大腦6.0除了下沉到「新基建」,也有全方位的升級和完善。
  • 百度大腦升級至6.0發布養成類虛擬助手「度曉曉」
    新浪科技訊 9月15日上午消息,在2020百度世界大會直播現場,百度CTO王海峰在現場發布全新升級的百度大腦6.0。據介紹,核心技術方面,百度大腦6.0已具備「知識增強的跨模態深度語義理解」能力。基於掌握的5500億知識,以及「知識增強的持續學習語義理解」技術,百度大腦綜合語音、語言、視覺等不同信息,實現跨模態語義理解,獲得對世界的統一認知。有了這一能力,機器就能聽懂語音,看懂圖像視頻,理解語言,進而理解真實世界。此外,百度還發布了一款搜索創新產品 「度曉曉」。
  • 百度大腦論壇如期而至,語音、視覺、語言與知識技術成熱點
    Create 2019 AI 開發者大會如期而至,在上午展示了百度音箱的系列更新、發布鴻鵠晶片、宣布自動駕駛方面的多項合作之後,下午的百度大腦論壇重磅開幕。他隨後介紹,百度產品系統目前面臨了一系列挑戰,諸如數據量在萬億級、訓練數據量在百億級等,在這些挑戰下,他們設置了大規模參數伺服器解決方案。在最新發布的飛槳核心框架 Paddle Fluid v1.5 版本中,也更新了針對分布式訓練的 API。
  • 百度AI的2020
    2020年,百度大腦核心技術突破「知識增強的跨模態深度語義理解」,理解真實世界的複雜場景。百度提出 ERNIE-ViL,將場景圖知識融入預訓練,刷新5項多模態經典任務的世界最好效果,登頂視覺常識推理任務(VCR)榜首;發布超大規模開放域對話生成網絡 PLATO-2,在內容豐富性和連貫性上達到新高度,能夠就開放域話題進行流暢深入的聊天,在 DSTC-9比賽中斬獲五項冠軍。
  • 從語音、視覺、語義到算法,百度大腦 5.0 全方位升級
    2019 年 7 月 3 日下午,百度 AI 開發者大會的百度大腦分論壇舉行。在上午的主論壇上,百度首席技術官王海峰正式發布百度大腦5.0。百度大腦 5.0 在算法突破、計算架構升級的基礎上,實現AI算法、計算架構和應用場景的融合創新,成為軟硬一體AI大生產平臺。下午百度大腦分論壇上,相關業務負責人分別詳細介紹百度大腦各能力具體的進展。
  • 百度把黑科技發布會開到央視,主持人連連感嘆:文科生都看懂了
    在現場,「小李」與「小康」就著電影《臥虎藏龍》展開了「多輪對話」,但藝術遇上理工男,對話感覺也是非常微秒……據百度CTO王海峰介紹,「小康」和「小李」融合了視覺、語音、語言與知識等多種模態的百度大腦AI技術。
  • 百度大腦開放日召開機器翻譯專場 百度AI同傳翻譯性能可媲美人類
    12月1日,百度大腦開放日舉辦了以「機器翻譯 溝通全世界」為主題的專場活動。何中軍在會上詳解了機器翻譯技術的發展歷程,並通過一系列實際應用場景案例,詳解了百度翻譯全面的產品布局和服務方式。自2010年以來,百度翻譯在大規模產業化機器翻譯模型、海量翻譯知識獲取、多語言翻譯統一框架、機器同聲傳譯等方面進行了系統而深入的研究,取得重大技術突破,研製了具有完全自主智慧財產權、技術先進、功能豐富的機器翻譯系統,實時準確地響應全球海量複雜多樣的翻譯請求。
  • 百度黑科技天津辦證發布會開到央視文科生都看
    在現場,「小李」與「小康」就著電影《臥虎藏龍》展開了「多輪對話」,但藝術遇上理工男,對話感覺也是非常微秒……據百度CTO王海峰介紹,「小康」和「小李」融合了視覺、語音、語言與知識等多種模態的百度大腦AI技術。和以前人們見過的虛擬人相比,這個虛擬人具備了認知能力,會讓人覺得面對的是一個有思考能力的人。而且,虛擬人的門檻大大大降低。
  • 百度大腦十餘項全新AI硬體點燃年初第一把火
    藉由傳感器、計算板、模型等,讓終端聽得懂每一句話、看得懂每一張圖,實現這些或許不是「天方夜譚」。1月16日,「在端上思考」百度大腦AI硬體平臺及產品發布會於深圳召開。現場,百度大腦全新發布了12項新產品和1項新服務,覆蓋模型生產到產品售賣全層次鏈條,助力打造端側智能應用。活動現場火爆異常,不少參會者站在後排聽完了全場發布,「非常豐富!」一位參會者表示,「全陣列新品相當亮眼。」
  • 一文回顧百度人工智慧2020上半年,王海峰:百度AI助力新基建提速
    2020年5月28日,百度全球AI專利申請量已超過1萬件,其中中國專利7000多件,位列中國第一,並在語音識別、自然語言處理、知識圖譜和自動駕駛四個細分領域排名國內第一,展示出AI新基建領軍者深厚的技術底蘊和蓬勃的創新能力。2020年1月,《哈佛商業評論》發布「2019年全球AI公司五強」榜單,百度名列全球第四。
  • 百度王海峰出席中國認知計算和混合智能學術大會 深度解析「多模態...
    他是自然語言處理領域最權威的國際學術組織ACL 50多年歷史上唯一出任主席(President)的華人,也是ACL亞太分會(AACL)創始主席。同時,王海峰是百度人工智慧的奠基者和領導者,為百度創建和發展了自然語言處理、知識圖譜、語音、視覺、深度學習等AI核心技術,並成立AI技術平臺體系(AIG)擔任總負責人,致力於AI相關技術的研究及其應用落地。
  • 攜手國際AI領袖制定AI硬體全球標準OAI,百度發布超級AI計算平臺
    歐洲時間9月27日,在荷蘭阿姆斯特丹舉辦的2019 OCP Regional Summit 會議上,百度發布了業界首款支持 OAI(OpenAccelerator Infrastructure)標準和液冷散熱的超級 AI 計算平臺 X-MAN4.0。
  • 中國晶片能不能彎道超車,就看量子計算了
    晶片,作為計算機的「大腦」,自誕生第一天起,人類就再也離不開它了。 但隨著社會經濟對信息處理需求的不斷提高,以半導體大規模集成電路為基礎的經典計算性能提升或將面臨瓶頸。 上世紀八十年代,英特爾聯合創始人戈登·摩爾提出的「摩爾定律」定義了晶片行業的發展規律:集成電路上可集成的矽電晶體數量每 18 個月會增加一倍,計算能力翻一番。
  • 長圖回顧:屬於百度大腦語言與知識技術的激蕩十年!
    8月25日,百度大腦語言與知識技術峰會舉行,展示了在語言與知識技術上十年來的發展歷程和重大成果,既為開發者和企業與AI應用之間,更為人工智慧與這個複雜世界之間,架起了一道獨特的"鵲橋",讓中國AI得以放眼世界、齊目全球。
  • 百度CTO王海峰:AI推動量子科技發展
    10月27日,百度CTO王海峰表示,「一方面,以深度學習框架和雲計算為代表的人工智慧技術有望在量子計算軟、硬體的研發過程中大顯身手,比如百度飛槳深度學習 平臺就包含了量子機器學習工具集『量槳』,可以支持開發者和科研人員更便捷地開發量子人工智慧應用;另一方面,隨著量子科技的發展,量子計算、量子通信以及量子精密測量等方面的先進成果也將逐步融入人工智慧的技術發展和應用落地之中
  • 全球首個突破200種語言互譯的翻譯引擎 百度翻譯打破世界溝通壁壘
    12月1日,百度大腦開放日舉辦了以「機器翻譯 溝通全世界」為主題的專場活動。自2010年以來,百度翻譯在大規模產業化機器翻譯模型、海量翻譯知識獲取、多語言翻譯統一框架、機器同聲傳譯等方面進行了系統而深入的研究,取得重大技術突破,研製了具有完全自主智慧財產權、技術先進、功能豐富的機器翻譯系統,實時準確地響應全球海量複雜多樣的翻譯請求。
  • 百度翻譯打造定製化翻譯服務、AI同傳等全產品矩陣 企業效率工具擔當
    12月1日,百度大腦開放日舉辦了以「機器翻譯 溝通全世界」為主題的專場活動。自2010年以來,百度翻譯在大規模產業化機器翻譯模型、海量翻譯知識獲取、多語言翻譯統一框架、機器同聲傳譯等方面進行了系統而深入的研究,取得重大技術突破,研製了具有完全自主智慧財產權、技術先進、功能豐富的機器翻譯系統,實時準確地響應全球海量複雜多樣的翻譯請求。
  • 一口氣11項發布 一文看懂百度大腦的NLP布局
    8月25日,百度CTO王海峰在百度大腦語言與知識技術峰會上,首次對外全面完整的闡述了百度的NLP布局,還推出了一攬子11項新發布。知識圖譜是機器認知世界的基礎王海峰表示,在百度語言與知識技術的布局和發展中,始終在注意把握兩個趨勢,即技術發展趨勢和產業發展趨勢,並力爭引領趨勢。對此,2010年,他們就成立了自然語言處理部,「縱覽百度語言與知識技術發展歷程,從研究方法、研究對象、研究方向、產業應用等各個層面,布局完整,始終與應用的發展趨勢、需求一脈相承,與產業接軌。」
  • 量子計算如何用於AI
    毋庸置疑,量子計算這項技術仍處於發展的早期階段,儘管這項創新技術很新穎,卻仍有一眾科技公司投入巨資。像IBM、谷歌和微軟這樣的公司已經初步採取了投資和研發量子計算的措施。今年9月,本源量子推出了量子人工智慧應用——量子手寫數字識別。該技術採用經典算法與量子算法混合,利用QPanda量子計算編程框架、VQNET量子機器學習框架實現QNN量子神經網絡,為後續量子算法加速計算機視覺量子化處理提供了可能。
  • 谷歌推出TFQ,一個可訓練量子模型的機器學習框架
    TFQ提供了必要的工具,將量子計算和機器學習技術結合起來,以控制並建模自然或人工的量子計算系統。該框架可構建量子數據集、混合量子模型和經典機器學習模型原型、支持量子電路模擬器,以及訓練判別和生成量子模型。隨著近些年量子計算技術的發展,量子機器學習模型的研發可能會在醫學、材料、傳感和通信領域取得突破,甚至產生深遠影響。不過迄今為止,業界缺乏發現量子機器學習模型的研究工具。該模型可以處理量子數據並在可用的量子計算機上執行。