清華大學黃民烈博士:如何讓聊天機器人理解人類情感?

2020-12-12 雷鋒網

雷鋒網 AI 科技評論按:以微軟小冰為代表的聊天機器人已經滲透到我們的日常生活中,雖然小冰會賣萌懂幽默,但距離真正的共情、理解人類的情緒還是有一定的距離。清華大學計算機系朱小燕、黃民烈老師團隊今年的一項研究工作希望讓聊天機器人具備這樣的能力。

在這個名為 ECM(Emotional Chatting Machine:情緒化聊天機器人)、基於深度學習的情感對話模型中,團隊首次將情感因素引入了基於深度學習的生成模型中。

相關論文可查看《Emotional Chatting Machine: Emotional Conversation Generation with Internal and External Memory》,作者周昊、黃民烈、張天揚、朱小燕、劉兵。

9 月份,黃民烈博士也帶領清華的兩位學生,聯合搜狗搜索團隊一舉獲得了全球唯一開放域對話評測比賽 NTCIR-STC2 的冠軍。雷鋒網 AI 科技評論與黃民烈博士取得聯繫,與他交流了近期的一些研究工作,並探討了聊天機器人的情緒機制設計。

黃民烈,清華大學計算機系副教授。研究興趣主要集中在深度學習、機器學習方法與應用,自然語言處理如自動問答、人機對話系統、情感分析等。已超過 40 篇 CCF A/B 類論文發表在 ACL、IJCAI、AAAI、EMNLP、KDD 等國際主流會議及 ACM TOIS、Bioinformatics 等期刊上,SCI 他引超過 300 次。曾擔任多個國際會議的領域主席或高級程序委員,如 IJCAI 2017高級程序委員, ACL 2016、EMNLP 2014/2011、IJCNLP 2017 等國際會議領域主席,擔任多個國際頂級期刊的審稿人。

目前對話系統有兩種主要模式,一種基於信息檢索,即在資料庫或語料庫中找尋相近內容的答覆作為返回答覆,現在有很多工作及實際應用也採用的是這種方法。而隨著深度學習的發展,另一種方法——基於深度學習的生成式對話系統也受到了越來越多的關注。從去年開始,NTCIR-STC2 在基於檢索的任務上又新增了一項基於生成的任務評測,其重要程度可見一斑。

黃民烈博士告訴雷鋒網 AI 科技評論,有不少生成式對話系統的工作都將關注點集中於提升生成語句的語言質量,但往往忽略了對人類情感的理解。因此,團隊著手研究如何讓計算機通過文字方式表達情緒,也是希望能在人機對話系統中加入感知情緒的成分,能從語言和情感兩個維度上生成恰當的回覆。

根據論文的介紹,ECM 在傳統的 Sequence to Sequence 模型的基礎上,採用靜態的情感向量嵌入表示,動態的情感狀態記憶網絡和情感詞外部記憶的機制,讓 ECM 得以根據用戶的輸入,並基於指定的情感分類(包括快樂、傷感、憤怒、厭煩、好感等五種情緒)輸出相應的回覆。

在這項研究中,ECM 首次將情感因素與深度學習方法相融合。儘管自然語言處理領域本身早在深度學習快速發展前就已經能順利做出商業化的產品,但在 ACL 2017 上,雷鋒網 AI 科技評論也非常明顯地感受到深度學習的滲透。不可否認的是,深度學習對自然語言處理的影響力不可小覷。在黃民烈老師的理解中,語言本身的複雜性有很多方面,比如情緒、風格、結構等等,而且語言經過高度抽象後往往隻字之差意義去相去甚遠,這種符號上表達的含義很難用模型進行表述和定義。而深度學習更擅長的是做概率性的一些推理。「對於語言來說,深度學習目前還是比較難以解決包括符號、知識及推理層面的問題的。」

ECM 的主要數據來源是新浪微博。但微博作為一個非常活躍的社交媒體,也有非常多涉及網絡用語、反語、雙關的帖子或評論,目前有不少學者在做相關的研究,包括網絡新詞、反語檢測、雙關檢測等,黃民烈博士自己也有相關的研究工作。比如在自然語言處理領域頂級會議 ACL 2014 上,黃民烈博士有一篇第一作者的收錄論文《情感分析中的新詞發現》(New Word Finding for Sentiment Analysis),基於微博數據提出了一種數據驅動、不依賴知識、非監督的新詞發現算法。那麼在 ECM 中,是否也會對新詞進行發現並做情感分析,輔助進行生成式的回覆呢?

對此,黃民烈博士告訴雷鋒網(公眾號:雷鋒網) AI 科技評論,在 ECM 的研究中,這類數據並沒有很多,也不影響研究者們基於數據獲取生成內容。他認為,這類工作在判斷輿情或是大眾觀點上會更受關注些,但其中最重要的是對背景知識的了解。「比如你諷刺一個什麼事情,其實人類是知道關於這個內容或這個事件的背景信息的,因此你很容易理解這是一個反諷,但現在計算機系統還不太能做到這一點。如果模型不能很好地利用這種背景知識和信息的話,確實會得到一個相反的結論。」

「ECM 的研究只是非常初步的一個嘗試,聊天機器人的回覆目前是建立在給定情感分類的基礎上做出的,還沒有涉及到如何評判用戶情緒的研究。」黃民烈博士表示,後續可以通過設計共情機制,或是通過上下文、情境等信息判斷合適的回覆,不過這非常複雜和具有挑戰性。

機器要擁有「情緒」,能夠更加智能,在黃民烈博士看來需要有兩個方面的內容。首先是語義理解,另一個則是身份設定。語義理解不難懂,現在有很多公司及研究機構都在做類似的工作。但身份設定,則是要在聊天進行的過程中嵌入機器人的身份和屬性。

「比如現在我們可以和小冰聊天,但很快你會意識到它不是一個『人』,除了語義理解的問題外,更多的是因為它缺少一個固定的人格和屬性。比如當你問小冰,它的性別是什麼時,這個回答是前後不一致的。」黃民烈博士表示,如何讓機器人具有特定的說話風格,實際上也是一個非常重要的問題,在未來,當我們設定機器人是一個三歲的小男孩,會彈鋼琴時,那麼結合這樣的屬性再去和它對話,它應該生成跟它自己身份、個性相符合的答覆。在這方面,黃民烈博士也進行了初步探索,詳見論文《Assigning personality/identity to a chatting machine for coherent conversation generation》。

黃民烈博士表示,一個符合情境的交談或對話需要符合多個因素。首先是交談的話題;其次,交談的對象是什麼,是在和誰說話;再者,雙方的情緒甚至心理活動狀態是怎樣的。除此之外,還需要考慮用戶的背景和對話中扮演的角色,甚至多方面綜合的感知信息如語音、語調、姿態和表情等。「目前我們所做的研究還只是從文字上來判斷。有時候我們在設計模型時並沒有辦法完全地考慮到這些變量,因此只能在研究的基礎上做大幅的簡化。」

除了身份設定的研究外,黃民烈博士也正在進行更多的關於「解決任務導向對話系統、聊天機器人、自動問答中最具挑戰性」的研究工作。現在的人機對話要實現像人一樣的自主交談依然具有很大難度,而其中涉及的最根本的便是理解的問題。「平時做一個相對容易的分類問題,(準確率)可能做到百分之七八十,而且這些結果也能夠用在實際的系統裡面。但人機對話實際上需要的是深層次的理解,所以現在的系統還存在很多邏輯上的問題。」黃民烈博士及其團隊雖然在近年也做出了不少嘗試,也取得了一定的進步,但他認為,實際上在開放領域及開放話題上的聊天依然有很多問題亟待解決,比如如何利用客觀世界的知識,或是背景信息,並結合記憶、聯想和推理,才能實現符合情境的交談與對話。

在黃民烈博士看來,在特定任務場景的生成式對話才更具有商業應用的前景。目前,黃民烈博士及團隊在商業化應用上也做了不少嘗試,比如和一家機器人公司合作研發了一款點餐機器人。從 Demo 上看,這款機器人能夠清楚地理解各種上下文的指代,如「這道菜」、「剛剛那個魚」等語句,且不會被臨時的其它提問所打斷。

「家用聊天機器人的語境要寬泛得多,因為我們並不知道對方會和你聊些什麼,因此目前開放式的聊天系統距離真正的實用還有一定距離。」儘管如此,黃民烈博士表示,語音交互作為一個新的入口,作為人機交流的一種範式,開放式聊天對於情感陪護而言依然是非常重要的互動環節。「從產品的角度來講,一方面它確實可以提供更好的用戶體驗,另一方面如果積累大量的實際對話數據,也可以進一步促進技術的發展。」

有著深厚研究成果的黃民烈博士,實際上在自然語言處理的研究經歷了跨專業、跨學科的歷程,「半路出家」的他原本就讀的是清華大學工程物理專業,關於數學、計算機的課程給他轉向自然語言處理研究打下了紮實的基礎,並憑藉出色的研究成果獲得了 2006 年清華大學優秀博士論文,被授予「清華大學優秀博士畢業生」,隨即留校任教。

回顧就學經歷,黃民烈博士告訴雷鋒網 AI 科技評論,他非常看重學生的基礎課程和知識是否紮實,也強調了打好基礎知識的重要性。他認為,「語言理解的難點在於,首先它經過了高度的抽象,其次需要綜合利用的信息非常多,要理解一句話需要充足的背景知識才能明白真正的含義。」而於他而言,自然語言處理最大的魅力就在於所具備的挑戰性,作為人類日常使用的交流方式,語言理解的很多問題依然非常困難。而目前,黃民烈博士及其團隊也正試圖從理解的角度出發,進行更多複雜問題回答、人機對話、情感理解方面的相關研究。

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 妙筆學術委員、清華大學副教授黃民烈:知識讓自然語言生成更可用
    11月22日下午,第四期NLG(自然語言生成)論壇特邀報告在北大科技園北領講堂如期舉行,清華大學計算機科學與技術系副教授、博士生導師、清華大學智能技術與系統實驗室副主任、妙筆智能研究院學術委員黃民烈老師接受論壇邀請,作了主題為《知識增強的自然語言生成》的特邀專題報告。
  • 清華大學人工智慧研究院成立智能信息獲取研究中心,進一步促進產學...
    這是繼知識智能研究中心、聽覺智能研究中心、基礎理論研究中心、智慧機器人研究中心、智能人機互動研究中心之後成立的第六個研究中心。清華大學副校長、人工智慧研究院管委會主任尤政院士,人工智慧研究院院長張鈸院士出席成立儀式並共同為中心揭牌,並為智能信息獲取研究中心主任計算機系馬少平教授頒發了聘書。
  • 傲嬌的性格、逗比的語氣,和聊天機器人談情說愛可行嗎?
    對於聊天機器人的設計,人們一直希望能夠與其自然交互,而這其中起到關鍵作用的除了自然語言理解,就是情感交互了。看著這些巨頭紛紛布局聊天機器人,那現在的成果如何呢?一場關於情感的聊天機器人測試至於理論什麼的就不多說了,我們來進行一個測試,分別對四類聊天機器人說一句「我很傷心」,看看各家機器人都是啥反應。
  • 複製人類同理心,機器人怎麼理解機器人?
    複製人類同理心,機器人怎麼理解機器人?,是設身處地地對他人的情緒和情感的認知性的覺知、把握與理解,也是指人們將心比心,心理換位的能力。顯然,這種能力除了幫助我們認識他人和理解他人外,也給我們提供了預測他人行為的可能,這意味著,人們能夠更好地合作。基於此,一項來自哥倫比亞工程公司的新研究稱,其開發出了具有「同理心」的機器人,並且其開發的機器人已經學會了如何根據幾個視頻幀來預測其夥伴機器人的未來行動。
  • 不會「聊天」的聊天機器人:為什麼Siri這麼「蠢」?
    如果使用得當,AI聊天程序能夠極大地提升競爭力,徹底改變企業和客戶的交流模式。所以,為什麼消費者對聊天機器人的不滿會與日俱增?企業又將如何確保機器助手能促進企業與客戶的關係?有一些原因不難理解。但究其根本,聊天機器人無法和客戶順暢交流,這可能是因為「聽懂人話」和「說人話」真的很難!這一點往往被人們忽視。人們期望的是與聊天機器人能進行自然的互動,希望AI能對他們自然的表述和要求做出響應。但問題在於,一旦離開了簡單的命令——回答式交流,聊天機器人就必須使用複雜的人類語言。
  • 十問十答———來了解一下會聊天的機器人
    機器人和人類聊天的原理到底是什麼?和語言學有什麼關係嗎?帶著疑問「採訪」了一位理科生,藝名Shield,他也不是什麼專家,只是對人工智慧比較感興趣而已,但足以應付我這個「白痴」了。隨後又查閱了一些資料,下面通過十問十答的方式,來概括一下我的收穫。
  • 情感機器人ERWIN亮相:有五種基本情感
    據外媒ubergizmo報導,英國林肯大學的研究人員,目前正在研究一款名為ERWIN的機器人。該機器人未來將會賦予人類的情感,讓它們能夠與人類形成長期而穩定的情感關係。情感機器人ERWIN(圖片來自cnbeta)    ERWIN項目發起人John Murray博士表示「當兩個人第一次交互的時候,如果兩種不同的人格彼此吸引,關係就能夠形成。
  • 能理解聊天記錄的微信機器人 (一)
    TL; DR: 做了個在兩個群中間互相轉發消息的機器人 (github),對聊天機器人的一些思考,可以把文本理解加進來做有意思的應用。用一定程度的自然語言理解來陪聊.但我覺得這些並沒有體現聊天機器人的核心優勢。仔細看這四個方面的應用,它們其實都可以不通過聊天來完成,甚至不通過聊天可能會更方便。比如推送服務有系統信息推送(pushbullet, IFTTT notification等), 查天氣系統就有app,智能家居我更希望點點按鈕而不是打字,陪聊這個必須要聊天沒辦法。
  • 如何讓機器人聽懂人類的語言,理解人類的語言表達|極客雲算
    看過科幻電影的人就知道,在幾乎所有科幻電影中的人工智慧,都是具備能聽懂人類語言能力,不僅如此,它們還可以使用人類語言和你流利的交流,還會講笑話,甚至使用雙關語。可想而知,在科技發達的今天,讓機器聽懂人類語言、讓機器理解我們說的話,也並不是一件容易的事情。就算是我們現在廣泛使用的語音轉換文字功能,準確率也只在95%左右徘徊,如碰到方言、生僻詞、專有名詞或者同音詞時,準確率更會迅速下降。讓機器人聽懂人類的語言,理解人類的語言表達真的那麼難嗎?
  • 京東AI研究院何曉冬:如何讓AI通過NLP技術理解人類?
    在這場報告中,何曉冬博士首先簡略回顧了深度學習技術對語音,語言,視覺等方面的驅動,然後著重從兩個方面探討了其在自然語言處理(NLP)方面的前沿研究,一是如何讓AI通過NLP技術理解人類,如理解意圖,解析語義,識別情緒,搜索推薦;二是如何讓AI的結果能被人類理解接受,如文本摘要,內容生成,話題展開,情感對話等。
  • AI為何不能像朋友一樣聊天?聊天機器人智慧路上的絆腳石|極客雲算
    可以和機器人聊天一直人類的夢想,近年來隨著AI人工智慧的發展,各種各樣的聊天機器人正大量進入日常生活,但當你和它們聊天的時候,可以明顯的感覺到不足,那就是「不通人情」,更專業一點地說,它們在對話質量上更多關注語法性、多樣性以及話題相關性等方面,但不太重視對情緒或情感的深入體會。
  • 聊天機器人對知識圖譜有哪些特殊的需求?
    例如,機器人喜歡的明星需要和實體知識圖譜中的明星娛樂圖譜關聯;同樣,機器人的愛好需要與興趣圖譜關聯;機器人需要與用戶形成親人、好友、僱傭等社會關係。2.聊天機器人不僅需要靜態知識圖譜,還需要動態知識圖譜若一個聊天機器人想要更像人,就需要從早到晚做不同的事情,也就是需要有自己的生活規律,研發時又該如何刻畫這個聊天機器人的生活軌跡呢?
  • 【專知薈萃05】聊天機器人Chatbot知識資料全集(入門/進階/論文/軟體/數據/專家等)(附pdf下載)
    聊天機器人 (Chatbot) 專知薈萃入門學習進階論文綜述專門會議Tutorial軟體數據集領域專家聊天機器人 (Chatbot) 專知薈萃Model in Tensorflow  聊天機器人中的深度學習技術之二:基於檢索模型的實現自己動手做聊天機器人教程(1-42)如何讓人工智慧助理杜絕「智障」  微軟亞洲研究院周明:自然語言對話引擎  微軟亞洲研究院謝幸:用戶畫像、性格分析與聊天機器人25 Chatbot Platforms: A Comparative Table
  • 微軟曹文韜:機器人只是AI的載體 理解方式才是靈魂
    曹文韜介紹,在2014年微軟提出了小冰要做一個情感機器人,是一個和人類溝通的情感機器人,我們認為如何去解決用戶之間溝通的內容,如何打造跟用戶感覺,相信真正是一個人在和用戶溝通,而不是一個冷冰冰的機器。微軟把一些技術應用到小冰上,把一些語義理解和對用戶的情感提現在對話過程中,再應用到場景中,用戶就會真正感受到小冰是在聊天而不是回答問題,還能知道用戶的心情到底是什麼,更進一步的增強了黏性。其次是圖片。這是對於圖象識別本身不一樣的應用,曹文韜認為圖象識別不僅僅是技術層面的問題,如果用戶通過圖象識別溝通的時候,所具備的不是圖象識別,而是視覺,這二者之間是有差別的。
  • 報告《性的未來》稱:到2050年,機器人的將比人類更受歡迎
    近來,一份令人震驚的新報告稱,在短短30年內,人類將選擇與機器人而不是真正的人類成為伴侶。這份名為《性的未來》的報告稱,「戀機器人癖」隨著技術的進步將變得越來越普遍。該報告是受邦達拉委託,由著名未來學家伊恩·皮爾森博士撰寫的,報告稱:一開始,很多人對與機器人交往仍持保留態度,但隨著他們逐漸習慣,隨著人工智慧、機械行為和主觀感受的改變,人類與機器人之間開始成為具有強烈情感紐帶的朋友,那種存在的抗拒感會逐漸消失。該報告將2050年定為人類-機器人結合超越人類-人類結合的一年。
  • 聊天機器人除了模仿人類,還有什麼路可以走?
    編者按:智能聊天機器人這幾天是一個熱門話題,各種新聞報導著像人類一樣的機器和愛上機器的人。原因似乎很清楚:我們擔心這是一個機器已經取代我們的世界。但它不只是一個簡單的哲學問題,《快公司》對 Paul Adams 的採訪說明,設計師們已經在思考機器人是否應該表現得像一個人。
  • siri合體百度百科,能否讓聊天機器人智能起來?
    原標題:siri合體百度百科,能否讓聊天機器人智能起來?   近日,隨著蘋果siri「合體」百度百科,微軟小冰回歸微信,曾經一度引發關注的智能聊天機器人,正開啟二次風靡熱潮。   機器智慧進化的三個階段   在諸多關於人工智慧的電影中,《超能查派》裡提供了一種最為有趣的視角:智慧機器人並不是一開始就什麼都懂,在人類為其創造出智能化系統後,他們也需要像人類一樣通過學習,才能了解如何面對這個世界。   剛「出生」的查派,膽怯又蠢萌,似乎什麼事情都做不好,但又有趣且善良,如同一個人的童年。
  • 如何更好的在線學習英語?答案是通過聊天機器人
    該平臺的聊天機器人,就像Rikai Labs學生一樣,從老師的修正意見中學習,這意味著不僅僅只是發生了人與人之間的交互,同時也是機器人也從與人類的互動中學習。­  Rikai Labs的學生與聊天機器人練習,教師則可以觀察並隨時糾正錯誤。隨著培訓材料量的增加,Rikai Labs的聊天機器人將能夠更好的捕捉語法錯誤和教授學生。
  • AI模擬人類情感 但要警惕它帶來的新型自閉症
    科技越發達,人類越自閉——正如美國麻省理工學院教授雪莉·圖克爾在《一起孤獨》中寫道,我們好像是一個陌生人處於一個陌生的世界。智慧型手機給人類帶來的孤獨感讓人難以釋懷。然而與此相比,逐漸興起的人工智慧和聊天機器人則更應該引起人類的正視。電影《Her》中講述了這樣一個故事:作家西奧多在結束一段愛情長跑後,愛上了帶有優美女聲的電腦作業系統:一個給自己起名叫薩曼莎的人工智慧。
  • 工業之美丨能感知疼痛的機器人已來,擁有情感的仿生人還遠嗎?
    記者 | 彭強1機器人正在朝著更加智能化的方向前進。如果它們有了疼痛的感知,甚至擁有了情感,和人類相處會變得如何?據英國《每日電訊報》報導,日前,日本科學家發明了一種可以感覺到「疼痛」的機器人,它在遭受到電荷刺激時,人造皮膚會明顯收縮,在表情上表現出疼痛。