來源:證券時報網
在8月25日舉行的百度大腦語言與知識技術峰會上,百度集團副總裁吳甜和百度技術委員會主席吳華分別發布百度語言與知識技術系列產品和數據集共建計劃,推出5款產品的新發布,全面加速AI技術大規模應用。
自然語言理解(NLP)素有「人工智慧皇冠上的明珠」盛譽,這也意味著語言與知識等認知層面的技術突破將進一步促進AI深入發展。語言與知識技術是人工智慧認知能力的核心。2010年,百度成立自然語言處理部,在前瞻技術與產業格局上實現引領和創新。十年來,百度大腦語言與知識技術獲得包括國家科技進步獎在內的20多個獎項,30多項國際競賽冠軍,發表學術論文超過300篇,申請專利2000多項。
百度CTO王海峰介紹,知識圖譜是機器認知世界的重要基礎,百度已經打造了世界上最大規模知識圖譜,擁有超過50億實體和5500億事實,並在不斷演進和更新。百度知識圖譜應用於各行各業,每天的調用次數超過400億次。同時,在融入知識的基礎上,語言理解能力不斷增強。基於預訓練技術的成功經驗,百度還提出基於多流機制的語言生成預訓練技術,兼顧詞、短語等不同粒度的語義信息,提升生成效果。
同日,百度集團副總裁吳甜接續發布語義理解技術與平臺文心、智能文檔分析平臺TextMind和AI同傳會議解決方案3大新產品,同時發布了6項升級,包括智能創作平臺的3個場景方案、以及智能對話定製與服務平臺UNIT的3項全新升級。
據悉,百度推出的語義理解技術與平臺文心,基於深度學習平臺飛槳打造,依託語義理解核心技術,集成預訓練模型、全面的NLP算法集、端到端開發套件和平臺,提供一站式NLP開發與服務,讓開發者更簡單、高效地定製企業級NLP模型。全新發布的智能文檔分析平臺TextMind,基於OCR、NLP技術,以文檔解析為核心能力,支持文檔對比與文檔審核,具備「多快好省」的核心優勢,促進企業辦公智能升級。
百度大腦智能創作平臺針對媒體應用場景再升級,全新推出智能策劃、智能採編、智能審校三大媒體場景方案,進一步助力媒體人更快、更好地創作。智能對話定製與服務平臺UNIT升級3大特性:更智能的任務式對話理解、極致便捷的表格問答和融合通用的新對話引擎。此次UNIT全新升級的三大能力,將進一步降低任務式對話、智能問答的定製成本,並融合通用對話能力,提升交互體驗。
同時,百度聯合中國計算機學會、中國中文信息學會發起中文自然語言處理數據共建計劃——千言,解決數據稀缺問題。千言一期由來自國內11家高校和企業的數據資源研發者共同建設,已涵蓋開放域對話、閱讀理解等7大任務,20餘個中文開源數據集。
百度技術委員會主席吳華表示,「未來我們希望有更多的數據集作者能夠參與共建千言,共同推動中文信息處理技術的進步,建設世界範圍的中文信息處理影響力。我們計劃在未來3年,面向20多個任務,收集和建設不少於100個中文自然語言處理數據集,覆蓋語言與知識技術全部領域。」