猜猜我是真人仍是 AI
場景描繪:Facebook 近來開源了新的談天機器人 Blender,表現優於現有對話機器人,更具特性化。關鍵詞:Facebook 談天機器人 Blender
4 月 29 日,Facebook AI 和機器學習部分 FAIR 發布博客宣布,通過多年研討,他們已近構建並開源了一個新的談天機器人 Blender。
Blender 結合了多種對話技能,包括特性、常識和同理心,可以使 AI 更具人性化。
打敗谷歌 Meena,更像人類
FAIR 聲稱 Blender 是 GitHub 上最大的打開域(Open-Domain)談天機器人(打開域談天機器人也成為閒談機器人),其功能優於現有的生成對話的辦法。
GitHub 上供給了通過預先操練和通過微調的 Blender 模型,基礎模型包括多達 94 億個參數,是谷歌對話模型 Meena 的 3.6 倍。
GitHub 地址:https://parl.ai/projects/blender/
Blender 會主動提起一些論題與人類互動
在谷歌於一月份推出 Meena 時,Google 稱其為世界上最好的談天機器人。
但在 Facebook 自己的測試中,有 75% 的人類評價者發現,Blender 比 Meena 更吸引人,還有 67% 的測試者以為,Blender 聽起來更像人類。別的有 49 % 的人最初沒有分辨出談天機器人和真人。
和一般談天機器人不同的地方在於, Blender 可以用有趣的辦法談論任何事情。它不僅可以幫忙虛擬幫手處理許多缺點,而且承諾在企業、工業或面向顧客的環境中,可以讓對話式 AI 系統(如 Alexa,Siri 和 Cortana)與人類的交互比以往愈加天然,可以提出並回答各種各樣的問題。而且還會表達出憐惜、嚴肅等心境。
對於這種成果,Google 沒有回應媒體的置評請求。
Blender 殺手鐧:超大規劃的操練數據
Blender 的才能,來自其操練數據的巨大規劃。它運用了 15 億個揭穿 Reddit 對話進行操練。
然後,運用附加的數據集對其進行了微調,其間主要針對三個方面做了加強:
包括某種心境的對話,以教授同理心(例如,假如用戶說「我升職了」,它會回覆說「祝賀!」);與專家進行對話,通過巨大的信息量,交給模型一些常識;和不同人物的人之間的對話,以培育其特性。因為模型太過巨大,因而 Blender 必須運行在兩個核算晶片上。
而上述辦法保證了 Blender 具有健壯的交互才能。
94 億參數的模型需求
至少兩個 32GB V100 GPU 進行交互
仍有缺乏:聊多了就露餡兒
儘管成果看起來很優秀,可是 Blender 的技能仍遠沒有人類的技能高。
到目前為止,團隊僅在 14 個回合的簡略對話中,對談天機器人進行了評價 。研討人員稱,假如談天時間更長,或許談天機器人的缺點就會露出出來。
簡略的對話中,Blender 表現天然,幾乎沒有漏洞
(藍色為機器人)
另一個問題在於, Blender 無法記住對話的前史,所以在多輪對話中,仍是會顯露出缺乏。
Blender 還傾向於常識化或整理現實,這是對用於構建常識的深度學習技能的直接束縛。也就是說它終究是依據統計相關性,而不是常識資料庫生成其句子的。
它可以將出名名人的詳細而連接的描繪串在一起,但帶有徹底過錯的信息。團隊正方案測驗將常識資料庫集成到談天機器人的模型中。
下一步:避免機器人被教壞
任何打開式談天機器人系統,都面臨著一個應戰:怎麼避免其說出有惡意或偏見的話。因為此類系統終究在外交媒體進步行了操練,因而或許會學會網絡上有惡意的言語。
比如 2016 年微軟家被教壞的談天機器人 Tay
團隊企圖通過要求眾包人員從用於微調的三個數據會合,過濾出有害的言語來處理此問題,但因為 Reddit 數據集規劃太大,這一使命很難完成。
團隊還測驗運用更好的安全機制,包括可以對談天機器人的照應進行雙重檢查的惡意言語分類器。
研討人員招認,這種辦法並不全面,因為需求結合語境來看,比如,「是的,太好了」這樣的句子看起來不錯,可是在活絡的上下文中,例如對種族主義言辭的回應中,它就是有害的回覆。
從長遠來看,Facebook AI 團隊還對開發更雜亂的對話署理感興趣,這些署理可以照應視覺提示以及文字。例如,他們正進行一個項目,名為「圖畫談天」的系統,該系統可以與用戶或許發送的相片進行特性化的對話。
所以,未來有一天,或許你的智能語音幫手真的不再只是一個東西,而可以成為一個暖心的陪同。而 Siri 也不會再鬧出讓人哭笑不得的笑話。