超大規模PLATO-2刷新對話智能上限

2020-12-10 東方財富網

人與機器在開放領域自由對話這一終極理想,又迎來重大進展。近日,百度全新發布了超大規模模型PLATO-2,在承襲PLATO模型運用隱變量進行多樣化回復生成特性外,模型參數規模上升到16億!能夠就開放話題和人類流暢嗨聊。在對話演示中,PLATO不僅能深聊「去吧去吧,學會了遊泳帶我一起」,還會小腹黑「你不怕我把你扔河裡麼?」,朱朝陽看了都直呼專業。

這樣的優秀效果同樣反映在公開數據集的測試中,評估結果顯示百度PLATO-2的對話效果全面超越了今年穀歌發布的26億參數模型Meena,以及Facebook發布的27億參數模型Blender,以更少樣本達成了更優的效果。而在中文對話中,更是與微軟小冰拉開了極大差距,這無疑意味著百度PLATO-2將對話智能提升到了全新高度。

如今,智能對話正以肉眼可見的速度成為人們熱愛談論的話題,不管是《嚮往的生活》裡的國民機靈鬼小度,或者是手機裡隨叫隨到的「hi,siri!」,我們越來越習慣以語言來和機器進行溝通。但不論是家庭、或是手機端,當下有明確功能性的智能助手對比真正能與人類在開放話題中自由對話仍然有差距。

針對這一問題,近年來,基於大量語料和超大規模預訓練模型的對話生成技術取得了非常多喜人進展,如谷歌Meena、Facebook Blender等模型依託數十億級的參數和語料,已能模擬生成與人類非常相近的對話。

但是,龐大的對話語料下隱藏著豐富的信息,同樣的對話語境可以有多種不同的回覆,這樣「一對多」問題是當前對話系統面臨的一個重要難點。我們知道,人與人的對話不僅與上下文相關,也和背景知識相關,不論是個人屬性、知識背景、或是價值觀、情緒狀態等。但每段對話背後,對話者的背景知識是模型訓練中難以獲取的,這就給訓練帶來了很大噪音。如谷歌Meena、臉書Blender等一般的編碼-解碼神經網絡不論結構多複雜,仍然是一個「一對一」的函數,直接應用很容易產生大量「哈哈,不知道」這類的安全回復。

針對這一問題,百度去年發布的PLATO模型和微軟近期發布的OPTIMUS模型中都提到了運用隱變量來建模這種不可見多樣性的方法。百度PLATO更獨特地採用了離散隱變量建模,運用多樣化生成+合適度判斷的方式,在三個不同各類型的公開數據集上均取得了SOTA效果。

此次公布的PLATO-2,是百度在PLATO工作基礎上的進一步擴展,通過擴展網絡增加訓練數據集,模型的參數規模擴展到了16億。同時,PLATO採取了課程學習的方法,解決大規模參數隱變量網絡訓練的計算消耗問題,逐步優化參數、加快訓練效率。

PLATO-2模型結構簡圖

這樣大體量的模型訓練,離不開百度深度學習平臺飛槳強大的並行能力支持。PLATO-2包含中英文兩部分模型。其中,中文模型在12億中文開放域多輪對話數據集上進行訓練,而英文模型則在7億英文開放域多輪數據集上訓練。PLATO-2訓練耗費了64張V100卡共3周的時間,依託了飛槳強大並行能力,包括Fleet並行庫和Recompute等擴展顯存的方式。單個Batch包含52萬Token,訓練過程中約進行了30萬次梯度回傳。

為了驗證模型效果,百度對PLATO-2進行了全面的靜態和動態評估。靜態評估為利用現有對話從上文預測下文,以及人機對話、兩個模型相互對話形式的中英文動態評估。評測結果顯示,百度PLATO在動態和靜態評估中均明顯超越了微軟DialoGPT,谷歌Meena和Facebook Blender模型。更在中文上,與微軟小冰在連貫性、信息量、吸引力、人性化等維度拉開了極大的差距。

在對話演示中,也可以明顯看出PLATO不僅在對話內容豐富度上提升明顯,還能夠就一個話題深入聊天並擴展到相關話題。而此前的最佳模型Blender,則會頻繁地轉換話題。

PLATO-2英文對話演示和Blender使用相同對話種子對比

基於PLATO-2在對話內容的豐富度和連貫性上展現出了來的高度,有望為智能對話開闢出全新的領域。此外,百度POLATO-2相關英文模型和代碼將在Github中陸續開放,中文模型未來也將開放接口服務。也期待在全球領軍AI企業的共同努力下,我們將離人機自由對話的終極夢想更近一步。

(文章來源:中國網)

相關焦點

  • 對話智能新高度:百度發布超大規模開放域對話生成網絡PLATO-2
    PLATO-2 承襲了 PLATO 隱變量進行回復多樣化生成的特性,模型參數規模上升到了 16 億。PLATO-2 包括中英文版本,能夠就開放域話題進行流暢深入的聊天。據公開數據,其效果超越了 Google 於今年 2 月份發布的 Meena (26 億參數)和 Facebook AI Research 於今年 4 月份發布的 Blender (27 億,最高 94 億參數)的效果。
  • 中英文對話效果超越微軟、谷歌!百度PLATO-2開闢對話智能全新邊界
    人與機器在開放領域自由對話這一終極理想,又迎來重大進展。近日,百度全新發布了超大規模模型PLATO-2,在承襲PLATO模型運用隱變量進行多樣化回復生成特性外,模型參數規模上升到16億!能夠就開放話題和人類流暢嗨聊。在對話演示中,PLATO不僅能深聊「去吧去吧,學會了遊泳帶我一起」,還會小腹黑「你不怕我把你扔河裡麼?」,朱朝陽看了都直呼專業。
  • 百度效果碾壓谷歌,16億參數超大規模對話網絡PLATO-2
    在開放領域中人與機器之間自由對話的終極理想迎來了巨大的進步。最近,百度新發布了超大型模型PLATO-2。除了PLATO模型運用隱變量進行多樣化生成特性外,模型參數規模已增加到16億!能夠在開放主題上與人類進行流利的聊天。
  • 騰訊開源進入爆發期,Plato助推十億級節點圖計算進入分鐘級時代
    相對於目前全球範圍內其它的圖計算框架,Plato可滿足十億級節點的超大規模圖計算需求,將算法計算時間從天級縮短到分鐘級,性能全面領先領先於其它主流分布式圖計算框架,並且打破了原本動輒需要數百臺伺服器的資源瓶頸,現在,最少只需要十臺伺服器即可完成計算。
  • Uber 開源 Plato:擴展性極強的開發測試會話 AI 平臺,可實現多智能...
    克隆存儲庫:git clone git@github.com:uber-research/plato-research-dialogue-system.git2.examples / config / simulate_text.yamlpython runPlatoRDS.py -config examples / config / simulate_speech.yaml2)運行多個會話智能體柏拉圖的主要功能之一是允許兩個智能體互相交互。
  • 英特爾IDF2012:超大規模物聯網系統技術
    IT168記者IDF2012精彩技術課程中了解到,英特爾針對物聯網技術的應用,特別安排了超大規模物聯網技術應用的課程,課程將通過來自英特爾的講師從技術的角度出發詳細的介紹英特爾在物聯網領域所扮演的角色以及物聯網中技術創新。  據相關的資料顯示,物聯網概念從1995年開始提出,最早稱之為傳感網,它是基於感知、傳輸、應用這三個層面建立起來的。
  • 微軟轉型:沒有deadline的刷新之旅
    外界看到的微軟轉型是構建智能雲,重塑生產力和流程,創造個性化的計算和服務;而內在的微軟轉型是刷新企業使命,刷新企業戰略,刷新企業文化。作為第三任CEO,2014年薩提亞·納德拉上任之時,微軟正處於轉型初期的探索中。5年過去,微軟的股價上漲了三倍,市值增加了近900億美元,裡程碑式突破萬億美元大關,並且還時不時地坐上全球市值第一的位置。
  • 全球對話技術頂賽DSTC9落幕,百度NLP開源PLATO-2斬獲四項冠軍
    這些賽道全面涵蓋了開放域閒聊、知識對話、任務型對話等關鍵問題。據悉,百度在這些任務中所使用的核心技術,均基於其最近開源的開放域對話模型 PLATO-2。PLATO-2 是基於隱空間技術的大規模開放域對話模型,參數規模高達 16 億,可就開放域話題深度暢聊,在中英文效果上,已全面超越 Google Meena、Facebook Blender、微軟小冰等先進模型。
  • 讓對話更智能的夥伴
    2016年12月,聲訊科技首創的靈聲VUIbot語音機器人產品和解決方案上線,希望可以通過強大的技術打造更有溝通力的智能客服,為每個崗位每個人配一個機器人,賦能每個人。「此前人工客服撥打電話,單人每天上限在200通。而通過靈聲機器人,單線路撥號頻率可以達到每天1000通,是的5倍,平均通話時長在35秒,基本在5到10輪交互。」聲訊科技的負責人是這樣說的。靈聲機器人不僅可以代替人工客服的工作,還具有人工的熱情和智慧。靈聲機器人撥通客戶電話之後,會像人一樣流暢地主動與客戶溝通,部分方言也能進行對話。
  • VR和智能家居欣欣向榮,藍菲光學助力刷新視覺感官新高度
    VR(虛擬實境)浪潮興起以來,很多公司都進入 VR(虛擬實境)領域從事全景相機的研發,光學巨頭也紛紛通過全景相機切入 VR(虛擬實境)市場,VR(虛擬實境)的火爆帶動了全景相機的快速發展,VR(虛擬實境)全景相機通常是360度全方位的記錄內容,這類設備通常都會使用多個魚眼鏡頭或者超大廣角鏡頭拍攝,而採用多個魚眼鏡頭或者超大廣角鏡頭拍攝時最容易出現因鏡頭性能不同導致拍攝出來的畫面不一致
  • NL2SQL:「智能對話」資料庫
    NL2SQL將用戶輸入的自然語言轉為可執行的SQL語句,是自然語言處理的新興研究熱點。同理,業界關於Text-to-SQL、NLIDB研究的核心內容是與NL2SQL相類似的。開發NL2SQL的目的是將其作為資料庫的智能接口,降低資料庫查詢的門檻,讓非專業用戶無需學習和掌握資料庫程式語言即可自由地按需查詢數據。
  • 智能對話 Cleverbot
    智能對話 Cleverbot 聊天社交 大小: 1009KB
  • 郭威:進一步發揮超大規模市場消費潛力
    【郭威:進一步發揮超大規模市場消費潛力】 中央黨校〔國家行政學院〕習近平新時代中國特色社會主義思想研究中心研究員郭威指出,進一步發揮我國超大規模市場的消費潛力,尤其是挖掘消費結構改善帶來的巨大增長潛力,可以從改善收入分配、優化供給、加快社會保障等方面做出努力。
  • 國產超大規模AI預訓練模型發布 可實現「用圖生文」等任務
    原標題:國產超大規模AI預訓練模型發布,可實現「用圖生文」等任務   六出奇光動地來,西方海國見旌旗。   水心惟有終無底,火內曾無徹上灰。
  • 孫學工 王蘊:充分發揮我國超大規模市場優勢和內需潛力
    衝擊和挑戰沒有改變我國經濟長期向好、穩中向好的基本趨勢,其堅實基礎就來自於我國超大規模的市場優勢和內需潛力。當前,在黨中央堅強領導和各方面大力支持下,全國疫情防控阻擊戰取得重大戰略成果,但境外疫情暴發增長態勢仍在持續。在疫情防控常態化條件下加快恢復生產生活秩序,統籌推進疫情防控和經濟社會發展工作,有效應對外部環境變化,更需要充分發揮我國超大規模市場優勢,有效挖掘和激發強大內需潛力。
  • 阿里智能對話交互實踐與創新
    在圖 2 所示的智能對話交互核心功能模塊中,自然語言理解和對話管理之外,智能問答用來完成問答類任務,智能聊天用來完成閒聊類任務。在對外輸出層,我們提供了 SaaS 平臺、PaaS 平臺和 Bot Framework 三種方式,其中 Bot Framework 為用戶提供了定製智能助理的平臺。
  • 特大超大城市要大幅增加落戶規模,落戶京滬有戲了?
    特大超大城市要大幅增加落戶規模,落戶京滬有戲了?4月8日,國家發改委網站公布《2019年新型城鎮化建設重點任務》指出,超大特大城市要大幅增加落戶規模。21世紀經濟報導記者了解到,這與《國家新型城鎮化規劃(2014-2020年)》表述發生了巨大變化。當時該規劃提出,嚴格控制城區人口500萬以上的特大城市人口規模。
  • 超大規模跨國商業峰會亮相普陀這個園區→
    超大規模跨國商業峰會亮相普陀這個園區→ 2020-12-16 18:19 來源:澎湃新聞·澎湃號·政務
  • 超大規模高頻電磁場分析軟體HOBBIES簡介
    它最大的特點就是高精度求解超大規模電磁模型。HOBBIES的技術優勢緣於:1) 超大規模並行計算: 對於大規模問題,HOBBIES軟體的千核規模電磁並行計算效率達到90%。2) 高效的核外求解技術:對於艦船、飛機編隊等大型電磁目標,其電磁特性計算量很大,任務不可能在內存完成,HOBBIES核外求解技術的效率可以達到物理內存的90%以上,而其它軟體的虛擬內存效率遠低於60%。3) 先進的計算方法:HOBBIES包含高階矩量法、多層快速多極子法、高低頻混合法、自動降階矩量法等先進算法,在保證精度的前提下實現快速求解。
  • 如何降低超大規模數據中心IT硬體能耗和成本
    超大規模數據中心技術的發展,已為所有數據中心運營商提供了30多年的進步和技術創新。但是,隨著本地超大規模應用程式和業務模型的激增,數據中心空間爆炸式增長對環境的影響也越來越大。 實際上,數據中心設施在其使用前期就消耗了其生命周期75%的能源:採購原材料和製造IT硬體消耗了大量能源。為了最大限度地實現可持續性,超大規模數據中心的用戶和運營商需要圍繞循環經濟實施模型,以最大限度地延長IT硬體的使用壽命,並減少整體的能源消耗。