降本增效、工業級應用,百度語言與知識新品劍指產業智能化

2020-12-17 極客公園

  自然語言理解(NLP)素有「人工智慧皇冠上的明珠」盛譽,這也意味著語言與知識等認知層面的技術突破將進一步促進AI深入發展。

  8月25日,以「掌握知識、理解語言、擁有智能」為主題的百度大腦語言與知識技術峰會舉行,百度CTO王海峰發表主旨演講,解讀百度語言與知識技術的發展歷程與最新成果,與產學研各界分享技術及產業發展趨勢和展望,百度集團副總裁吳甜和百度技術委員會主席吳華分別發布百度語言與知識技術系列產品和數據集共建計劃,重磅推出5款產品的新發布,全面加速AI技術大規模應用。這是一場凝聚了百度在語言與知識領域十年技術積累和產業實踐的盛會,必將帶來深遠影響。

(百度CTO王海峰)

  十年:開拓者、深耕者、引領者

  語言與知識技術是人工智慧認知能力的核心。2010年,百度成立自然語言處理部,在前瞻技術與產業格局上不斷引領、創新,十年間已成為中國NLP發展的一面旗幟。

  峰會上,王海峰迴顧,「在百度語言與知識技術的布局和發展中,我們始終在注意把握兩個趨勢,即技術發展趨勢和產業發展趨勢,並力爭引領趨勢。」

  縱覽百度語言與知識技術發展歷程,從研究方法、研究對象、研究方向、產業應用等各個層面,布局完整,不斷打磨成熟,始終與應用的發展趨勢、需求一脈相承,與產業接軌。

  十年來,百度大腦語言與知識技術成果豐碩,獲得包括國家科技進步獎在內的20多個獎項,30多項國際競賽冠軍,發表學術論文超過300篇,申請專利2000多項。技術不斷突破創新的同時,也在產品上創新探索,同時將領先的技術輸出給開發者與合作夥伴,提升各行業智能化水平。

  全面分享語言與知識技術成果

  王海峰全面分享了百度語言與知識技術完整布局和最新成果。

  首先,知識圖譜是機器認知世界的重要基礎,百度打造了世界上最大規模知識圖譜,擁有超過50億實體和5500億事實,並在不斷演進和更新。百度知識圖譜應用於各行各業,每天的調用次數超過400億次。

  其次,在融入知識的基礎上,語言理解能力不斷增強。2019年3月,百度提出知識增強的語義理解框架ERNIE,在深度學習的基礎上融入知識,同時具備持續學習能力,曾一舉登頂全球權威數據集GLUE榜單,首次突破90分大關,刷新榜單歷史。基於知識圖譜和語義表示,突破了閱讀理解、對話理解以及跨模態深度語義理解等技術。

  第三,語言生成是語言與知識技術中的重要組成部分。基於預訓練技術的成功經驗,百度提出基於多流機制的語言生成預訓練技術,兼顧詞、短語等不同粒度的語義信息,顯著提升生成效果。百度也探索了多文檔摘要生成,通過圖結構語義表示引入篇章知識,在單文檔和多文檔摘要生成效果都有提升。

  應用系統層面,對話系統和機器翻譯等成績卓著。百度提出了知識圖譜驅動的對話控制技術,以及首個基於隱空間的大規模開放域對話模型PLATO等,並推出智能對話定製和服務平臺UNIT,幫助開發者高效構建智能對話系統,實現規模化應用。百度翻譯支持200多種語言,每天響應超過千億字符的翻譯請求,支持超過40多萬家第三方應用,技術上,提出了多智能體聯合學習、基於語義單元的同傳模型、稀缺語種分組混合訓練算法等。

  百度大腦語言與知識技術的持續探索和創新取得了令業界矚目的成績,同時這些技術以平臺化的方式輸出,賦能千行萬業,持續提升產業智能化水平。

  重磅推出5款產品的新發布、2大計劃

  王海峰首次發布了百度大腦語言與知識產品全景圖。百度集團副總裁吳甜接續發布語義理解技術與平臺文心、智能文檔分析平臺TextMind和AI同傳會議解決方案3大新產品,同時發布了6項升級,包括智能創作平臺的3個場景方案、以及智能對話定製與服務平臺UNIT的3項全新升級。

(百度集團副總裁吳甜)

  吳甜表示,「我們一直致力於將語言與知識技術凝聚成一系列技術平臺和產品,在應用中產生大量價值,為廣大開發者和產業實踐者提供以語言與知識技術為核心驅動的系列產品。」

  百度推出的語義理解技術與平臺文心,基於深度學習平臺飛槳打造,依託領先的語義理解核心技術,集成優秀的預訓練模型、全面的NLP算法集、端到端開發套件和平臺,提供一站式NLP開發與服務,讓開發者更簡單、高效地定製企業級NLP模型。文心經過了大量真實應用場景的淬鍊,具備優秀的工業級落地實力。

  全新發布的智能文檔分析平臺TextMind,基於OCR、NLP技術,以文檔解析為核心能力,支持文檔對比與文檔審核,具備「多快好省」的核心優勢,促進企業辦公智能升級。

  百度大腦智能創作平臺針對媒體應用場景再升級,全新推出智能策劃、智能採編、智能審校三大媒體場景方案,進一步助力媒體人更快、更好地創作,可謂切中媒體人的「痛點」。

  智能對話定製與服務平臺UNIT升級3大特性:更智能的任務式對話理解、極致便捷的表格問答和融合通用的新對話引擎。此次UNIT全新升級的三大能力,將進一步降低任務式對話、智能問答的定製成本,並融合通用對話能力,提升交互體驗。

  全新發布的AI同傳會議解決方案,覆蓋會議全場景、全流程,旨在打造用戶隨身的「會議同傳專家」。吳甜現場展示了如何只用一臺電腦和一部手機快速搭建一套同傳服務,只需點點滑鼠、打幾個字,就能快速獲得專業的同傳服務。

  數據匱乏、算力不足歷來是語言與知識技術研發中面臨的瓶頸。為突破瓶頸,百度聯合中國計算機學會、中國中文信息學會發起中文自然語言處理數據共建計劃——千言,解決數據稀缺問題。千言一期由來自國內11家高校和企業的數據資源研發者共同建設,已涵蓋開放域對話、閱讀理解等7大任務,20餘個中文開源數據集。

  百度技術委員會主席吳華表示,「未來,我們希望有更多的數據集作者能夠參與共建千言,共同推動中文信息處理技術的進步,建設世界範圍的中文信息處理影響力。我們計劃在未來3年,面向20多個任務,收集和建設不少於100個中文自然語言處理數據集,覆蓋語言與知識技術全部領域。」

  (百度技術委員會主席吳華(中)與中國中文信息學會副理事長兼秘書長孫樂(左)、中國計算機學會自然語言處理專委會主任周國棟(右)一起正式啟動千言計劃)

  吳華還發布了百度語言與知識技術算力共享計劃,通過百度AI STUDIO平臺提供算力支持,讓廣大開發者破除算力桎梏,專注於技術創新。

  十年徵程,百度語言與知識技術發展歷程中培養、吸引了大量全球頂尖人才。會上,百度推出以王海峰為代表的百度NLP「十年十人」,十年堅守,不忘初心,秉持「技術信仰」,勇攀技術高峰,矢志不渝致力於讓機器更好地理解世界、更好地服務於人。

  正如王海峰所言,「我們致力於更好地與學術界、產業界攜手,推動語言與知識技術發展,進而推動人工智慧技術持續進步,為產業智能升級、社會經濟高質量發展貢獻力量。我們對未來充滿信心,堅持研究和發展讓機器掌握知識、理解語言、擁有智能,繼續突破和創新,為技術和社會進步做出更大貢獻。」

來源:科技資訊

相關焦點

  • 新發布 新升級 百度語言與知識新品推進產業智能化
    8月25日,以「掌握知識、理解語言、擁有智能」為主題的百度大腦語言與知識技術峰會在線上舉辦,百度CTO王海峰深入解讀百度語言與知識技術的發展歷程與最新成果,分享技術及產業發展趨勢和展望,百度集團副總裁吳甜重磅推出5款產品的新發布,百度技術委員會主席吳華發布數據共建計劃和算力共享計劃,進一步為人工智慧大規模應用提速。
  • 百度OCR「技術+產品+應用」領先業界 為全行業企業開啟「降本增效...
    OCR(文字識別)技術是最早應用於企業降本增效的 AI 方向之一,如今已逐漸下沉為企業智能化升級的一項重要基礎設施能力。10月29日,百度智能雲線上線下同期舉辦了TechDay OCR技術創新沙龍,深度分享OCR產品矩陣、功能、應用案例等最新進展,並重磅全新發布EasyDL OCR自訓練平臺。泰康保險集團、北京融匯金信等企業夥伴在現場分享了OCR在企業內的應用經驗和心得。
  • 2020百度雲智峰會王海峰:切實推進產業智能化
    王海峰表示,「通過壯‘智’凌雲,使能行業,賦能生態,百度智能雲將技術突破及應用與產業實際需求相結合,切實推進產業智能化的創新實踐。」(12月17日,2020百度雲智峰會,百度CTO王海峰:百度智能雲將技術突破及應用與產業實際需求相結合,切實推進產業智能化的創新實踐)產業合作夥伴、開發者、媒體等與百度智能雲共同見證了2020年成績單:AIcloud活躍客戶數增長65%,AIcloud、質檢雲等多項排名第一,並多次獲選頭部廠商及標杆案例。
  • 智能辦公大勢所趨 百度如流成企業「降本增效」新選擇
    在線辦公應用功能也根據需求不斷更新,比如早期在線辦公主要解決的是公司內部人員之間的日常溝通問題,再後來又整合了打卡、項目協作、日常匯報等管理和協作方面的需求,而近年來,包括了音視頻會議、文檔協作、日程管理等多功能在內的在線辦公平臺很受歡迎。更進一步,隨著雲計算、大數據、人工智慧、物聯網等領先技術的集結,辦公模式正在向智能化方向發展。
  • 面向「新基建」產業大門,百度地圖提供的智能化鑰匙
    以GIS為例,企業專網應用GIS數據,往往面臨著基礎數據缺失、數據更新緩慢;技術更新滯後、應用程式接口不夠豐富、使用體驗交叉、可視化呈現效果較差;不支持移動端開發、不支持雲部署等等問題。而這僅僅是產業智能化升級過程中,對地圖產品與服務體系提出的要求之一。面對「新基建」中勃發的地圖產業化體系,百度地圖在精準的時間節點上,貢獻出了醞釀良久的產業智能化升級能力。
  • 「雲智」生態計劃:百度智能雲助力產業智能化從樣板間到規模化
    在此,觀察百度智能雲,則能發現其在今年五月份召開的ABC SUMMIT 2020百度夏季雲智峰會上,就推出了AI中臺和知識中臺,發布了包括「未來銀行」、智能營銷與客服、智能製造、智慧城市、智能辦公等在內的8大行業解決方案,用以滿足產業智能化升級需求。 可以說是準確把握住了智能經濟核心賽道。
  • 新基建賽道上連獲三個大單,百度AI助推產業智能化迎來厚積薄發!
    縱觀百度AI新基建「大單」的合作模式,可以看到,產業智能化轉型與AI落地應用已形成互為所需的緊密關係:一方面,新基建風口下,人工智慧作為新基建重要一環,成為新時代中每個企業轉型的必要條件;而人工智慧技術通過豐富的落地場景,得以加快發展,加強加深產業智能化變革。
  • 三一重能:數位化與智能化賦能風電製造降本增效
    ,技術創新是實現降本增效的必經之路。 除此之外,中東南部低風速區域也將是未來風電產業的「主戰場」之一。三一重能量身打造適合中東南部低風速區域的3.X機型,功率覆蓋3.0~3.3兆瓦,風輪直徑覆蓋146~164米。
  • 2020百度雲智峰會發布、升級17大產品及解決方案
    在十四五規劃下,百度智能雲正在通過加大技術投入、生態扶持計劃以及聯合行業專家等,全方位助力企業智能化轉型,實現降本增效。一、 百度智能雲突飛猛進不平凡的一年即將進入尾聲,在這特殊的節點,百度智能雲也公布了其今年的成績單。
  • 「雙中臺」加持,百度「如流」聚焦三大核心功能 助力企業智能化轉型
    百度CTO王海峰在會上宣布,依託「AI中臺」和「知識中臺」,發布「智能辦公」的企業智能應用「如流」,構建AI時代辦公流水線,打造新一代智能辦公平臺。智能化時代,簡單的OA產品已經很難滿足企業管理和員工高效辦公的需求,提升效率和企業知識管理的需求被激活,技術驅動解決方案成為必然。
  • 2020百度雲智峰會舉行:全場發布17大新產品及解決方案,助力產業...
    王海峰表示,「通過壯『智』凌雲,使能行業,賦能生態,百度智能雲將技術突破及應用與產業實際需求相結合,切實推進產業智能化的創新實踐。」(12月17日,2020百度雲智峰會,百度CTO王海峰:百度智能雲將技術突破及應用與產業實際需求相結合,切實推進產業智能化的創新實踐)  產業合作夥伴、開發者、媒體等與百度智能雲共同見證了2020年成績單
  • 百度語言與知識技術最全「導覽」
    8月25日,即七夕當天,以「掌握知識、理解語言、擁有智能」為主題的百度大腦語言與知識技術峰會以直播形式召開,百度CTO王海峰、百度集團副總裁吳甜、百度技術委員會主席吳華等大咖現身大會,向外界全面介紹了百度在語言與知識領域的整體布局、技術創新及產業實踐,並重磅發布多項全新產品和技術等,希望攜手學界、產業界合作夥伴推動語言與知識技術發展,為產業智能升級提供原動力。
  • 北海實施糖業降本增效三年行動計劃
    本報北海訊 (記者/管林華)記者從北海市有關部門獲悉,《北海市糖業降本增效三年行動計劃工作方案》近日實施。按照計劃,該市將以降本增效為中心,對標對表國際先進水平,圍繞糖料蔗種植砍運、製糖加工、商貿物流等全領域開展提質增效行動,切實降低糖業生產成本,促進蔗農增收、糖企增效,提升糖業綜合競爭力,推動糖業高質量發展。該市糖業降本增效三年行動計劃內容包括開展糖料蔗生產降本增效行動、食糖生產降本增效行動、糖業商貿物流降本增效行動。
  • 百度地圖亮相2020百度雲智峰會 AI新基建數字底座加速產業智能化
    為迎接「十四五」開局,以科技推動各行各業智能化升級已成為產業發展的大勢所趨。12月17日,2020 ABC SUMMIT百度雲智峰會在北京中國大飯店舉行。本次大會廣邀來自不同行業的合作夥伴,分享產業智能化實踐成果,探討AI新基建下的產業機遇。
  • 廣西實施糖業降本增效三年行動計劃
    5月8日,記者從自治區政府新聞辦舉行的新聞發布會上獲悉,我區已印發《廣西糖業降本增效三年行動計劃工作方案》,今後3年我區將採取糖料蔗生產降本增效、食糖生產降本增效、糖業商貿物流降本增效三大行動,力爭到2021/2022年榨季,主要指標較2018/2019年榨季全面提升——蔗農每畝累計增收500元以上,糖料蔗3個榨季平均畝產5噸以上,糖料蔗生產綜合機械化率67%以上,噸糖不含稅銷售成本下降300元/噸以上
  • 百度地圖亮相2020百度雲智峰會 AI新基建數字底座加速產業智能化進程
    為迎接「十四五」開局,以科技推動各行各業智能化升級已成為產業發展的大勢所趨。12月17日,2020 ABC SUMMIT百度雲智峰會在北京中國大飯店舉行。本次大會廣邀來自不同行業的合作夥伴,分享產業智能化實踐成果,探討AI新基建下的產業機遇。
  • 2019百度雲智峰會重磅發布:全自研崑崙雲伺服器、智能來電小秘書
    AI跑在自主可控的AI晶片上,展示與頭部客戶共建的智能應用:央視網「AI編輯部」、精研科技智能質檢車間、重慶市氣象局智慧氣象系統、國家電網智能客服,還重磅發布智能來電秘書,AI分身24小時幫你接電話,AI正在全面走向產業實現規模化應用;百度智能雲首推業界首個完整的人工智慧生態聯盟——百度產業智能聯盟,更是讓人工智慧產業爆發出個體所不具備的成長力。
  • 十數家頭部企業出席2020百度雲智峰會智能產業論壇 共同展望智能經濟
    後疫情時代,各行各業如何加速產業智能化升級? 12月17日,「2020 ABC SUMMIT百度雲智峰會」在北京舉行。上午的主論壇展現了百度智能雲的最新成績和產業智能化成果。「雲智一體」成百度智能雲獨特的競爭力,在各行各業加快規模化落地。在下午的智能產業專題論壇上,百度副總裁李碩發表了題為「精工數聯,智贏未來」的主旨演講。
  • 2020百度雲智峰會智能產業專題論壇召開,諸多最新行業解決方案亮相
    後疫情時代,各行各業如何加速產業智能化升級? 12月17日,「2020 ABC SUMMIT百度雲智峰會」在北京舉行。上午的主論壇展現了百度智能雲的最新成績和產業智能化成果。「雲智一體」成百度智能雲獨特的競爭力,在各行各業加快規模化落地。
  • 新基建浪潮下如何重塑產業價值鏈?百度的答案有三個關鍵詞
    而百度作為專注對外賦能的人工智慧平臺型公司,已在產業智能化探索多年,早在10年前就為「新基建」打下技術和產品基礎。據介紹,百度正在依託包括百度大腦、飛槳、智能雲、晶片、數據中心等新型AI技術基礎設施,推動智能交通、智慧城市、智慧金融、智慧能源、智慧醫療、工業網際網路和智能製造等領域實現產業智能化升級。