Facebook AI聊天機器人研究新突破,可根據用戶改變機器人性格

2020-12-05 Embark有方教育

自進入大數據時代後,AI也學會了聊天這門藝術。儘管AI聊天機器人已經屢見不鮮了,但是 Facebook 人工智慧研究實驗室(FAIR)依然在該領域努力鑽研。最近他們又有了新成果,這是一種通過自然語言處理、對話、神經模型等技術構造的全新 AI 聊天技術。

Facebook AI Research (FAIR)

Facebook AI Research (FAIR) 目前在加州的Menlo Park,紐約曼哈頓和法國巴黎有三個分部,巴黎分部剛剛公開。總的來說,學術氛圍是非常濃厚的,大家坐在Facebook新建的20樓中央做深度學習的研究,目標是發高質量的文章,做有影響力的前沿工作。研究方向相對自由寬鬆,研究所需的計算資源(如GPU)相對豐富,同時也沒有近期的產品壓力,可以著眼長遠做困難和本質的研究問題。這樣的學術氛圍除了MSR之外,在各大公司是極其少見的。

扎克伯格之前提過Facebook將來的三大主要方向,其中之一就是人工智慧。FAIR正式成立是在前年12月至去年一月,然後陸續招人,時間還不長,重要的公開工作有DeepFace,運用深度學習將人臉識別(更準確說是人臉判定)提高到Human-level,Memory Networks,在深度學習中加入長期記憶(Long-term memory)以構建自然語言問答系統,開源深度學習框架Torch的更新和推廣,運用快速傅利葉變換加速卷積運算的CuFFT,等等。目前還有許多非常有影響力的工作正在進行中。

在深度學習的時代,研究和工程已經有融合的趨勢,因此FAIR這兩方面的大牛都有。工作氣氛上來說,組內較平等,討論自由,基本沒有傳統的上下級觀念。若是任何人有有趣的想法,大家都會傾聽並且作出評論。

聊天AI技術

關於新技術,FAIR 稱這是一種可以用來閒聊的聊天AI技術。相較以往,這項技術最大的突破就是在於它的「性格」。傳統聊天AI的性格都是統一的,並不能滿足於所有的用戶。而 FAIR 則為這個閒聊 AI 添加了一道塑造性格的措施:

1、收集用戶的個人公開資料

2、收集這些用戶的關係網。再把這些數據放進模型之中,便可以模擬出用戶喜歡的性格,並以此和用戶進行閒聊。

事實上基於神經模型的聊天AI是最近才誕生的,然而這些AI技術往往不能和用戶進行長時間的溝通。因為AI需要在響應用戶回話的同時訪問數據網絡,還必須要有足夠龐大的數據集支撐。不過這兩點,也正是 Facebook 的優勢。

FAIR 實驗室通過他們的數據網絡先創造了一個可以定製的基礎AI性格,被稱為配置文件。再將配置文件置於內存擴充式神經網絡之中。根據上述的用戶資料,將這個配置文件進行調整,使其變成另外一個更適合用戶的性格,以貼合用戶需求。

依照此步驟,FAIR 一共創建了1155 個獨立性格,每個性格都擁有最少5個配置文件。不僅如此,他們還有 100 個用於測試的性格和 100 個等待測試的性格。當然,為了讓這 1155 個性格更加獨特,FAIR 把這些性格所有重合的句子(比如口頭禪)全都重新調整,使之成為真正意義上的獨立性格。

但是這還沒完,閒聊機器人的性格建立完成後會向用戶提一些問題,或者發起一些話題。這項功能不僅僅是為了區別傳統Q&A式聊天機器人,還有一個更重要的原因:分析用戶聊天意向,建立用戶模型。

FAIR在論文中給出了這樣一則演示,上邊為原始性格(配置文件),下邊為基於用戶的公開資料所調整的性格。

※ 基礎性格:

我愛沙灘。

我爸有個4S店。

我剛剛做完指甲。

我正在節食。

我最喜歡的動物是馬。

※ 調整性格:

沒有什麼比在在海邊悠閒地呆上一天更讓人心曠神怡。

我爸以賣車為生。

我總是定期關心我自己。

我必須要減肥了!

我很喜歡馬術。

圖丨作為配置文件性格,右為調整後性格

性格數據集

對此,FAIR 創建了一種新的數據集,將其命名為性格數據集。這個數據集由隨機配對的 164,356 條對話組成,每個對話都要求對話雙方進行「角色扮演」,同時雙方會在對話之中逐漸了解。FAIR 表示,這一過程產生了許多引人入勝的談話內容,這對閒聊AI的幫助非常大。

性格數據集分為兩層,即基礎性格層(又稱性格層)和調整性格層。在基礎性格層,FAIR 會用 4 個句子來描述一個性格,比如「我是素食者」、「我喜歡遊泳」、「我父親在福特工作」、「我最喜歡的樂隊是 Maroon5」。

圖丨兩個閒聊AI進行角色扮演

基礎性格層的每個句子的長度不能超過15個單詞,這是為了讓性格數據集能夠更迅速地理解性格,每個句子單詞過多,則會導致性格數據集無法和用戶保持長時間聊天。同時,簡單的句子也能夠讓用戶更直觀地理解閒聊AI的性格。

調整性格層則是對這些句子進行修改,並且單詞的數量也有所放寬。但是該層需要面對另外一個問題——重疊。FAIR實驗室表示,這是一個人類也會犯的錯誤。有些時候,這些調整過的句子只是把單詞換了,但是整個句子的輪廓沒有改變,這就使得兩個獨立的性格出現了重疊的地方。正如上文所說,FAIR對所有重疊的性格進行了調整。

他們的做法是把這些輪廓相同的句子拿去給一支外包語言團隊進行改寫,比如把「我喜歡籃球」改寫成「我很崇拜 Micheal Jordan 」。這樣的改寫很大一定程度上偏離了句子的本意,但即便如此,改寫前後仍存在相互重合的地方。

不過調整性格層的工作遠沒有那麼簡單。外包團隊很有可能把「我爸爸在福特工作」改寫成「福特僱傭了我爸爸」。這樣的改寫在FAIR眼中是不合格的,因為這樣的改寫並沒有調整輪廓。

在所有外包團隊的工作都完成後,FAIR 還要進行一個步驟,就是把句子調整地更自然。比如,調整性格層有這樣一個句子「我喜歡咀嚼鹽」「我喜歡吞下扭曲的麵包」。這樣的句子並不合理,即使地球上會有小部分有如此獵奇的愛好,但是這並不是性格數據集應該呈現給用戶的樣子。

實踐出真知

FAIR 還將性格數據集和用電影腳本訓練的 OpenSubtitles 數據集進行比對,用戶的反饋是前者更能提出一些引人入勝的話題,還能長時間溝通。這對於FAIR來說還不夠,畢竟他們不能把數據集拿出來給用戶,而是要把它植入進閒聊 AI 才行。

圖丨閒聊AI模型

最終,FAIR利用生成模型和判別模型進行檢測,發現無論在怎樣的前提下,具有性格的閒聊AI,都要比傳統性格統一的聊天AI更讓用戶喜歡。

這個結果對於 Facebook 來說無疑是大喜歡,因為這項研究不僅讓該企業突破了自然語言理解的研究深度,也改善了 Facebook 自家的聊天AI。不過 FAIR 實驗室並不滿足於這個結果,他們表示,未來將會用這個閒聊AI和性格數據集來訓練其他聊天 AI 。同時他們也認為,未來的聊天AI絕對不是像傳統聊天AI一樣,對所有用戶都保持著相同的性格。

有方教育——我們的導師來自耶魯大學、麻省理工學院、史丹福大學等世界頂尖名校,致力為讓中學生提供來自學界業界前沿的學術科研教育內容,旨在讓學生在親身實踐的過程中深入淺出地理解前沿科技。

項目主題——我們聚集頂尖學府導師資源,補足中美教育差距,力求為中國學生搭建連接世界科技的平臺。我們引領學生在世界前沿課題研究中參與科研教育,全面提升學生的自主思考、觀察分析、邏輯思維能力。我們為學生提供參加海外科研項目,幫助學生斬獲國際知名學術驚呆大獎、發表英語敘述論文,讓學生在提升申請競爭力的同事,獲得領跑優勢。

相關焦點

  • Facebook開源聊天機器人,人們為何對聊天機器人如此痴迷
    4月29日,Facebook開源了一個新的聊天機器人 Blender。Facebook是全球最大的社交網絡,擁有最大的聊天資料庫,可供機器人學習。Blender可以說是目前最人性化的聊天機器人。比1月份Google發布的Meena效果更好。
  • 微軟聊天機器人可指導用戶自我檢測新冠病毒
    打開APP 微軟聊天機器人可指導用戶自我檢測新冠病毒 汐元 發表於 2020-03-21 09:46:28 IT之家3月21日消息 根據外媒Cnet今天的消息,微軟與美國疾病和預防控制中心(CDC)合作,構建了一個聊天機器人,該機器人可以指導用戶進行自我評估,初步判斷自己是否感染新型冠狀病毒,並在需要時聯繫其他醫療資源和相關專業人士。
  • Facebook下屬AI實驗室開發出一款動畫聊天機器人
    在交談過程中,數以百萬計的微小肌肉運動改變了我們眼睛、嘴巴以及頭部的位置,向我們的同胞發出我們正在作何思考的信號。這些無意識的動作讓我們成為獨特的物種,但它們也讓機器人模仿人類變得異常困難。更有甚者,這種模仿看起來很恐怖,因此形成了所謂的「恐怖谷效應」。Facebook下屬AI實驗室的研究人員讓我們距離攻克這個障礙又近了一步。
  • Facebook AI推出最先進聊天機器人:一句「恭喜」隱藏哪些玄機?
    如何回應這些超出內置指令的問題,也是過去諸多AI聊天機器人難以攻克的難題。不過,Facebook的機器人Blender已經可以勝任這個工作,它不僅能完美地接上話題,而且能夠講笑話、鼓勵用戶等,有「以假亂真」的效果。Blender不僅能執行一些簡單的口令,而且能應對各種複雜的談話。
  • 如何使用AI製作聊天機器人?
    一個人工智慧聊天機器人是一種電腦程式或可模擬與實時響應一個真正的人交談,基於增強學習用戶的人工智慧軟體,AI Chatbots使用簡訊語音命令或兩者兼而有之,AI機器人使用自然語言與嵌入其中的人工智慧功能進行通信,AI機器人可以作為談話機器人IM機器人人工對話實體等來解決,創建AI聊天機器人的主要目的是幫助客戶做出更明智的決策。
  • 谷歌與庫茲韋爾共同打造聊天機器人 性格來源庫氏小說
    現在,這位著名的未來學家終於透露了他和團隊在進行的項目之一:可以像人類一樣聊天的聊天機器人。在最近的奇點大會上,他揭開了科技巨頭谷歌的聊天機器人項目的神秘面紗,奇點大會每年圍繞科學、技術與未來展開討論。
  • 養老、問診、心理諮詢,和聊天機器人聊聊未來醫療
    當然許多已經霸佔在流量入口上的巨頭會想盡一切辦法再度擴張領土,這也是Google、蘋果、Facebook等等巨頭們都向聊天機器人投入資本的重要原因。forsky:兼具社交性,提升用戶黏性forsky是一個健康飲食領域的聊天機器人,它致力於幫助用戶改變不健康的飲食習慣。
  • 幾次嘗試聊天機器人後,Facebook 也要開發智能語音助理
    Building 8 也改名為 Portal,現在主要負責消費類硬體的開發,目前公開上線的產品僅有 Portal 視頻聊天硬體。Portal 圖/CNetPortal 視頻聊天硬體於 2018 年 10 月上線,根據顯示屏大小分為了兩個版本,顯示屏較大的版本叫 Portal Plus。
  • Facebook 推出最強聊天機器人
    打敗谷歌 Meena,更像人類FAIR 聲稱 Blender 是 GitHub 上最大的打開域(Open-Domain)談天機器人(打開域談天機器人也成為閒談機器人),其功能優於現有的生成對話的辦法。GitHub 地址:https://parl.ai/projects/blender/Blender 會主動提起一些論題與人類互動在谷歌於一月份推出 Meena 時,Google 稱其為世界上最好的談天機器人。
  • Facebook 正改進聊天機器人的對話能力,讓它們學會「閒聊」
    儘管 Facebook 關閉了自家個人助手 M,但 Facebook 依然沒有放棄聊天機器人。在過去的幾年裡,Facebook 曾做過很多嘗試,如讓聊天機器人代表用戶進行談判;關閉了兩個突然開始自行對話的機器人「Alice」和「Bob」;發布研究工具 ParlAI。
  • 聊天機器人的技術原理和未來的發展
    它是研究、開發用於模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。會首要響應用戶的需求,同時將內容推薦作為潛在任務來推進對話的進行;第三個問題是怎麼樣貼合用戶愛好,聊相關話題聊天機器人以用戶為中心,以內容為導向。構建了為對話設計的知識圖譜,裡面涵蓋了比較多樣化,高質量的內容,所以能進行一些風格多樣化的對話;第四個是面對多樣的用戶是怎麼讓各種用戶都滿意的?根據對話的歷史以及內容的屬性來選取最優的策略進行對話。
  • 臉書倆AI聊天機器人互聊,聊出一門人類無法理解的新語言
    有一天ai替代了人類繼續研究他們的ai,文明就這麼一次次進化!是的我確實是馬亮:機器人聊天軟體的基本原理就是儲存收集信息,開發者會將常用的詞句固化,然後設置磁性套索工具,當你對聊天軟體說早上好,他會回覆你開發者設置的原始回復,但是它會不斷積累新詞彙,然後篩選使用量最多的詞彙回覆你,它不不可能會分析情緒,所以它沒可能有情緒,它不會煩躁,不會憤怒,何來殺戮?
  • 感覺自已像機器人作文_rviz中的機器人模型怎麼跟著自己的機器人...
    摘要智能聊天機器人作為自然語言處理的一個重要分支,是目前最火熱也最具挑戰的研究方向,它對於促進人機互動方式的發展有著重要的意義。本文首先簡要介紹了智能聊天機器人的分類和研究背景,對國內外研究現狀進行比較,對生成和檢索兩種主流的實現技術進行優缺點分析,並分別列舉了幾項使用該技術手段實現的聊天機器人。
  • Facebook 開源聊天機器人 Blender,號稱全球最強
    Facebook AI 和機器學習部門 FAIR 發布博客宣布,經過多年研究,其已經構建和開源了一個新的聊天機器人 Blender。並稱,這是有史以來最大的開放域(Open-Domain)聊天機器人。「今天,我們將發布完整的模型、代碼和評估設置,以便其他 AI 研究人員能夠重現此工作,並繼續推進對話性 AI 研究。」據介紹,Blender 是第一個將各種對話技能(包括同理心、知識和個性)融合在一個系統中的聊天機器人。據人類評估者稱,在參與度方面,它比別人更出色,也感覺更人性化。
  • Facebook 開源聊天機器人 Blender,更具「人情味」
    不久前,Facebook 開源了號稱是全球最強大的聊天機器人 Blender,它標誌著 Facebook 在 AI 領域的新進展:不僅解決了此前聊天機器人的原有缺點,新的聊天機器人更是擁有史無前例的 94 億個參數!
  • 聊天機器人Vector來了,可以隨時與用戶進行互動
    近日,據外媒報導,Anki公司宣布將推出Vector聊天機器人。其是一款非常小巧但卻很有個性的機器人,它的外表就像《星球大戰》中機器人一樣可愛,只有巴掌般那麼大,它還可以陪你玩耍,聽你說話等等。
  • 韓AI聊天機器人被疑洩露用戶信息 被迫銷毀資料庫和算法
    韓國AI聊天機器人Iruda人民網訊 近日,在韓國引起熱議的AI聊天機器人「Iruda」因被質疑洩露用戶信息,再次站上輿論的風口浪尖。1月15日,Iruda的開發公司宣布將銷毀Iruda資料庫和深度學習算法。
  • 聊天機器人再受追捧?Facebook押注下一代交互界面
    在對M和其他聊天機器人的熱情爆發之後,隨之而來的是一波失望(微軟執行長納德拉曾說「機器人是新的應用」)。聊天機器人不像機器人那麼愛聊天,那是因為他們被訓練只談論一小部分事情,執行特定的、有限的任務。它們無法與人進行自然的對話,無法根據對單詞及其含義的一般理解產生自己的反應。它們只能提供一般性的答覆。
  • 新聞聊天機器人的時間簡史
    一項對238個Twitter Bot的分析研究明確了新聞機器人程序的下一步發展方向,比如批評、建議和娛樂等功能。例如,@NYTanon批評了《紐約時報》使用匿名信源的行為;@cybercyber指出「cyber」這個詞在新聞報導中被過度使用了;娛樂方面,@DrunkBuzzfeed在新聞內容中加入了更多趣味元素。相比而言,第一波Twitter機器人主要基於自動化技術。
  • 2020年AI預測:可定製,邊緣計算,數據透明性,RPA,聊天機器人
    具體來說,他們如何收集數據,將數據存儲在何處,有權訪問哪些數據,其用途以及最終對最終用戶意味著什麼。例如,今天當您在手機上下載新應用時,會看到冗長的點擊協議,其中充滿法律術語。在這種情況下,尚不清楚您允許的內容。人工智慧行業需要重新考慮其教育消費者的方法,並長期認真研究同意是否真正被告知同意。AI行業必須解決功率不對稱問題。