擊敗谷歌AI拿下「最強」稱號?Facebook AI開源聊天機器人Blender

2021-02-14 DeepTech深科技


如今,我們對虛擬語音助手已經十分熟悉。無論是蘋果 Siri、亞馬遜 Alexa,還是百度小度,阿里巴巴天貓精靈,在提供幫助之餘,還經常扮演著被無聊人類調戲的對象。

就在你來我往的博弈之間,語音助手們練就了一身反調戲的本領,甚至還會出其不意,給你驚喜。

但如果把蘋果推出 Siri 視為消費級虛擬語音助手誕生元年,算下來迄今已經過了近九年,要說它們沒什麼長進,恐怕是冤枉了。只不過,跟它們對話似乎總是差點意思。

當然,如果只是指示語音助手設置鬧鐘,查詢天氣,它們在絕大多數情況下都能完美實現。然而一旦脫離具體任務,以聊天或諮詢為主要目的,因為涉及到對話和交互能力,它們的表現就會一落千丈,經常會出現前言不搭後語的情況,令人沮喪。

為了改善這一問題,Facebook AI 近日就公布了一項最新研究成果:擁有 94 億參數的開源 AI 聊天機器人 Blender。

 

Facebook 研究人員聲稱,Blender 是迄今為止「最先進的」聊天機器人,可以以有趣和連續互動的方式討論幾乎所有內容。在人-人和 Blender-人的對話比較測試中,有 49% 的測試者把 Blender 的對話記錄誤認為是人和人的對話,67% 的測試者認為 Blender 和人的對話更像是人和人的對話。

視頻|Blender 對話演示(來源:Facebook)

「對話有點像 AI 完備問題(AI-Complete),你必須要解決所有 AI 問題才能解決對話。反過來,如果解決了對話問題,所有 AI 問題也就解決了,」Facebook工程師 Stephen Roller 表示。他認為,研究開放式聊天系統將有助於提升虛擬語音助手的交互能力。

有意思的是,今年 1 月底,谷歌 AI 剛給自家的聊天機器人 Meena 冠上了相似稱號。當時,為了衡量 Meena 的水平,谷歌研究人員發明了名為感知性和特異性平均值(Sensibleness and Specificity Average,SSA)的評估標準。

該基準給人類真實對話的評分是 86 分,而 Meena 獲得了 79 分,位居第二名,並且遠勝於 Mitsuku 和微軟小冰等同類聊天機器人。「最先進聊天機器人」由此得名。

圖 | 谷歌 AI 對自家 Meena 的評價也是「最先進的聊天機器人」(來源:谷歌 AI)

Facebook AI 在論文中也提到了 Meena,稱「由於谷歌沒有完全公開 Meena 模型和詳細的 SSA 評估標準,因此很難進行 100% 橫向比較。」不過,他們還是儘可能地找到了一些解決辦法,利用公開資料比較兩種模型。

為了讓對比更公平,Facebook 使用的是擁有 27 億參數的 Blender 版本,因為谷歌 Meena 只有 26 億參數。論文稱其對比了人類測試者對兩個模型生成的對話的看法,最終有近四分之三的人認為 Blender 的對話更有吸引力和互動性,可以視為是「擊敗了 Meena」。

對此,谷歌尚未公開回應媒體的置評請求。

圖 | Facebook AI 給出的與谷歌 Meena 的對比結果(來源:Facebook AI)

94億參數很強大

Blender 的能力來源於其龐大的訓練數據。

它首先使用了 15 億份 Reddit 論壇對話進行訓練,為學習如何在對話中回復對方打下基礎。隨後它又接受了三種專項技能培訓,由額外挑選出來的數據組作為微調(fine-tuning)。

第一項是學習包含某種情感的對話,以表達同理心。例如,如果用戶表示自己剛剛升職加薪,那麼 Blender 就會回應「恭喜你!」一類的鼓勵字眼。

第二項是從電子書或維基百科上學習基礎知識,以獲取有關 1250 種話題的基本常識。這些知識都經過篩選,確保了真實性。

最後一項培訓專注於塑造友善性格和良性談話氛圍,使對話更具互動性,幫助Blender學習如何更積極地了解用戶喜好,而且在之後的聊天中一定程度上兼顧這些背景信息。

為了綜合這三項技能,研究團隊還使用了一套額外數據組,專門幫助 Blender 整合和練習所有技能,希望達到在對話中運用自如的目的。

圖 | Blender 對話例子(來源:Facebook AI)

最終完成的對話模型有三個版本,分別擁有 9 千萬、27 億和 94 億參數,參數越多,性能越強。相比之下,谷歌 Meena 最多擁有 26 億參數。

不過,94 億參數的 Blender 需要至少兩塊英偉達 32GB V100 GPU 才能運行,27 億參數版本也至少需要一塊 16GB P100 GPU。Facebook 目前沒有開放網頁版互動界面,因此想在家用電腦上體驗 Blender 暫時是不可能了。

從評估結果來看,在人類測試員中,有 75% 的人認為 Blender 比谷歌 Meena 的互動性更強,更具吸引力,還有 67% 的人認為前者更像是人類。另外有 49% 的測試者誤以為 Blender 是人類,意味著這些人僅憑聊天記錄無法區分 Blender 和人,其真實度和對話質量可見一斑。

 

難以攻克核心挑戰

儘管如此,Blender 仍然存在一些 AI 聊天機器人的通病。舉個例子,如果問它 「 魯迅說過的名人名言 」,它可能會給出符合語法卻是自己偽造的假名言,或者是張冠李戴,製造出 「 魯迅真的沒說過 」 的尷尬現象。

原因在於,除了進行過事實驗證的話題之外,AI 終究只是局限於利用單詞的統計相關性生成句子,而非知識資料庫。這一問題同樣存在於 OpenAI 之前公布的文章自動生成模型 GPT-2 中,故意濫用可能會造成誤導用戶的後果。

此外,在測試中,Blender 參與的對話最多只進行到 14 輪,比通常人和人之間的對話要簡短很多。項目負責人 Emily Dinan 指出,模型無法進行過於深入的對話,不然就會出現無意義回應,因為它幾回合之後就可能忘記歷史信息。

圖 | Facebook AI 在開放式聊天模型上的進步(來源:Facebook AI)

困擾著 Blender 以及任何開放式聊天系統的另一個主要問題是如何阻止其說出帶有攻擊性的句子。由於訓練數據基於真實的網際網路用戶對話,出現人身攻擊或歧視色彩的詞彙幾乎無法避免,而使用「有毒的」訓練數據顯然會帶壞聊天機器人。

2016 年 3 月,微軟曾在推特推出聊天機器人 Tay,模仿 19 歲美國女性的說話方式,以開放型對話方式與普通用戶交流並學習如何互動。然而僅僅一天之後,Tay 就開始發表種族歧視等偏激言論。微軟隨後不得不關閉 Tay 的帳號,將原因歸結為部分網民刻意引導其發表惡意言論。

Facebook AI 研究人員承認,這些問題是開放式聊天機器人普遍面臨的巨大挑戰。他們正在嘗試創造更好的安全機制來改善和規避。比如對三個較小的額外數據集進行敏感詞過濾,剔除惡意詞彙,但來自於 Reddit 的主要訓練集體積過於龐大,難以全面篩查。他們還希望嘗試引入知識資料庫來糾正機器人的錯誤,甚至是在機器人生成句子之後再進行二次檢查。

不過這些方法並不全面。很多時候,一句話的性質要結合語境才能準確判斷,像是「你說得很好」這樣的句子看似褒義,但在用於回應激進言論時卻會產生截然相反的效果。

因此目前看來, Blender 雖然在簡單對話時表現很好,互動自然且流暢,但跟其他開放式聊天機器人一樣,離最理想的聊天機器人還有很長的路要走。

Facebook AI 團隊還透露了未來的研究方向,另一個項目組正在開發一個「有性格的」圖片聊天系統 Image Chat,旨在對用戶發送的圖片進行有意義的對話。

 

-END-

參考:

https://ai.facebook.com/blog/state-of-the-art-open-source-chatbot

https://www.technologyreview.com/2020/04/29/1000795/facebook-ai-chatbot-blender-beats-google-meena/

相關焦點

  • Facebook 號稱擊敗谷歌,推出最強聊天機器人
    By 超神經場景描述:Facebook 近日開源了新的聊天機器人 Blender,表現優於現有對話機器人,更具個性化。關鍵詞:Facebook 聊天機器人 Blender4 月 29 日,Facebook AI 和機器學習部門 FAIR 發布博客宣布,經過多年研究,他們已近構建並開源了一個新的聊天機器人 Blender。
  • Facebook開源多款AI工具,支持遊戲、翻譯
    下面就是筆者為大家整理的完整的 Facebook 開源 AI 工具列表及 GitHub 地址。GitHub地址:https://facebook.ai/developers/tools/denseposeWSL EmbeddingsWSL Embeddings
  • 五種聊天機器人平臺大比拼,
    聊天機器人是一種革命性的客戶溝通方式。如今,已有許多公司在不同程度上通過聊天機器人,來自動化地減少了人類客服人員的繁瑣工作量。在Kommunicate平臺上(譯者註:是一款提供人機混合客戶支持的軟體平臺),我們評估了市面上常見的幾種聊天機器人平臺,以及它們在客戶支持等方面的服務用例。
  • 使用Recast.AI創建具有人工智慧的聊天機器人
    Recast.AI也完美地將不需要應用開發人員了解的機器學習底層細節進行了封裝,我們將要做的這個聊天機器人甚至不需要太多的編碼。我們在Recast.AI網站上在線創建聊天機器人。一般網站首次登陸都需要先創建用戶,而Recast.AI除了常規用戶註冊方式外,還貼心地提供了使用Github帳號直接登錄的選擇,對於每天混Github的程式設計師來說,這太方便了。
  • Facebook 開源 AI 圍棋原始碼,擊敗職業棋手只需一塊GPU
    雷鋒網 AI 科技評論消息:5 月 2 日,Facebook AI Research(FAIR)官網博客中宣布開源其 AI 圍棋機器人 ELF OpenGo(包括原始碼和一個訓練好的模型),該機器人是基於 ELF 平臺研發而成,曾擊敗了 4 位世界排名前 30 的圍棋棋手。
  • 這是一份 AI 界最強年終總結
    這一年,谷歌的科研人員們在人工智慧、量子計算、計算圖形學、算法理論、軟體系統、TPU、開源軟體與數據集、機器人技術、AI 應用、醫療保健等許多方面做出了許多新的成果,不僅有許多論文,更有許多實際的技術產品。如今谷歌把人工智慧的相關研究開發拓展到了新品牌「谷歌 AI」下面,曾經的谷歌大腦負責人 Jeff Dean 也就成為了谷歌 AI 的負責人。
  • Google、Facebook等不可錯過的 AI 開源工具,你想要的都在這裡!
    谷歌的一系列重要產品如 YouTube、Google Lens、ARCore、Google Home 以及 Nest 都已深度整合了 MediaPipe。Facebook全部開源:https://ai.facebook.com/results/open-source/?
  • 這裡有136個消費級 AI 產品(工具列表)
    https://alz.ai/ Amélie — 心理健康聊天機器人http://www.amelie.ai/ Bitesnap — 基於照片的食物識別 AI,可用於控制熱量攝入https://getbitesnap.com/ doc.ai —自動你解讀醫學檢查結果
  • Facebook虛擬助理M已死,這就是聊天機器人的現狀
    讓我們看看本文,了解目前聊天機器人的現狀。更多乾貨內容請關注微信公眾號「AI 前線」,(ID:ai-front) 儘管現在很難回想起過去的情況,但是在 2016 年初,很多科技行業的人都相信「聊天機器人」(基於文本的虛擬助理)將成為下一個大平臺。聊天應用公司 Kik 將自己的未來押在了機器和「chatvertising[1]」上。
  • 谷歌發布萬億參數語言模型, AI的語言功能真的可以超越人類嗎?
    2020年初,谷歌訓練的語言模型終於能夠在廣泛的語言理解任務中擊敗人類,他們通過在更多數據上訓練更大的網絡,將BERT架構推向了極限。現在,這種T5模型在標註句子和找到問題的正確答案方面可以比人類表現得更好。而在剛剛到來的2021年,谷歌又發布了萬億參數語言模型(trillion-parameter model),效果更加強大。
  • 用 Recast.AI 創建一個聊天機器人 | Linux 中國
    據 Gartner 2018 年 2 月的報告,「到 2020 年,25% 的客戶服務和支持業務將在參與渠道中整合虛擬客戶助理(VCA)或聊天機器人技術,而 2017 年只有不到 2%。」鑑於此,讀者會發現本教程對理解開源的 Recast.AI 機器人創建平臺的工作原理很有幫助。聊天機器人,包括基於語音的以及其他技術的,已經實際使用了有一陣子了。
  • OpenPilot:禁令後Comma.ai開源全部軟硬體(附原始碼下載)
    【新智元導讀】上個月,天才黑客George Hotz在推文上表示,由於NHTSA的審查,他將取消智駕產品CommaOne。Hotz自豪地說,Open Pilot  「比特斯拉任何一輛車內搭載的軟體都要好」,並且,Open Pilot 是經過MIT 許可的。但如果想升級你的車,配以自動駕駛功能,你還需要硬體。但這家公司現在還沒有開發出任何新產品。他們希望用戶能有一份說明書,讓你自己可以創建自己的機器人平臺。Comma.ai 提供了你需要的材料,軟體等詳細信息,以便將Comma.ai正確地載入你的車輛。
  • AI一周熱聞:百度回應「搜尋引擎百度已死」;特斯拉裁員3000人;任正非坦承AI可能是泡沫
    Facebook 提出「自動供給式」聊天機器人設想- 無人機測繪分析建築內部並建模成為現實- 神經架構搜索 + 遷移學習,讓 AI 設計更高效- Facebook 投入 750 萬美元資助歐洲人工智慧倫理研究中心- 民權團體發表聯名信抗議微軟、亞馬遜、谷歌向政府出售人臉識別技術更多優質內容請關注微信公眾號「AI 前線」(ID:ai-front
  • Facebook與CMU聯手打造開源框架PyRobot,LeCun站臺的機器人研發社區來了
    ,剛剛又開源了機器人框架PyRobot,該框架是與卡內基梅隆大學合作創建,可運行由Facebook的機器學習框架PyTorch訓練的深度學習模型。Facebook希望PyRobot能加快機器人開發,通過共享代碼,數據集和模型的通用API來發展機器人研究生態系統。Facebook的AI團隊最近對機器人技術非常著迷。過去一年Facebook沒少在機器人上下苦功,從六足機器人,到Replica真實感訓練數據集,到Habitat模擬引擎,最近又推出了PyRobot。從名稱就可以看出,這是一個基於PyTorch的機器人框架。
  • 【2017年度星際爭霸AI競賽結果出爐】中科院自動化所第4,Facebook第6
    還記得去年一票難求的AI WORLD 2016盛況嗎?今年,百度副總裁、AI技術平臺體系總負責人王海峰、微軟全球資深副總裁,微軟亞洲網際網路工程院院長王永東等產業領袖已經確認出席大會並發表演講。谷歌、亞馬遜、BAT、訊飛、京東和華為等企業重量級嘉賓也已確認出席。
  • Facebook AI開源最強全棧視頻庫:PyTorchVideo!
    在谷歌,臉書,Open-MM Lab等分別祭出各家殺器之後,臉書人工智慧實驗室(Facebook AI)在推出PySlowFast之後時隔一年,攜PyTorchVideo重回戰場。這不,在FiftyOne項目中,開源社區的吃瓜群眾就利用Lightning-Flash搞出了一個瀏覽視頻的工具箱,可以直接查看視頻的動作類別。
  • 翻閱1000+網站後整理的160個改變日常生活和工作的AI產品
    >http://airi.ai/Alz.ai — 使用 Alzheimer’s照顧你愛的人網址:https://alz.ai/Amélie — 維護心理健康的聊天機器人chatbot網址:http://www.amelie.ai/Bitesnap —幫助你從實物照片中識別食物熱量
  • Facebook 新的聊天機器人剛推出就狂遭吐槽
    (為什麼 Facebook 要讓我們和這個傻傻的機器人聊天?)TechCrunch: Facebook's new chatbots still need work(Facebook 新的聊天機器人還需要繼續完善)……總之,大家都對 Facebook 給 Messenger 新添加的聊天機器人開啟了吐槽模式。
  • AI聊天機器人設計指南 | AIID編譯組
    譯者篇首語:聊天機器人(chatbot)是一個用來模擬人類對話或聊天的程序。始於1966年,近兩年重新開始風靡。微軟2014年發布小冰,Facebook2015年發布M,谷歌2016年收購API.ai,亞馬遜2016年公開LEX。
  • Facebook Messenger新增聊天機器人 數量達11000
    據外媒報導,Facebook近日發布了最新Messenger數據,目前已有超過11000個聊天機器人。