情感計算是人機互動核心?談深度學習在情感分析中的應用

2021-02-15 竹間智能

除自然語言理解(NLU)外,情感計算(AffectiveComputing)也成為近年來AI領域熱門的研究方向之一。其中針對中文語境裡人機互動中的情感、情緒識別與理解,竹間智能已經做了許多有益的探索,特別是如何利用情感、情緒分析,來幫助機器人實現對「對話意圖」與「深層語義」的更好理解。

 

本文將梳理一下情感計算在人機互動中的價值,同時分享一些情感分析的工具與方法。希望對從事人機互動研究的朋友們有所啟發。

 

撰稿:竹間智能自然語言與深度學習小組

 

情感計算在人機互動中的作用

 

在談論情感計算之前,先來說說情感本身在人類信息溝通中的意義。

 

情感對於人類的智力、理性決策、社交、感知、記憶和學習以及創造都有很重要的作用,甚至有研究顯示「人類交流中80%的信息都是情感性的信息」。但為什麼不是內容,而是情感能傳遞最多的狀態信息呢?其實從認知科學角度來看,情感本身是高級智能的一部分。作為大腦運行資源的調配者,情感狀態的不同會導致大腦計算和分配資源的方式有巨大差異,思維執行路徑也會完全不同。另外,人類進化使其情感判斷的準確性不斷提高,不斷的正向反饋也使得我們越來越依賴用識別對方情感的方法來判斷其行為傾向,甚至已經成為自動運行的認知方式了。

 

由於情感在人類信息溝通中的意義重大,所以情感計算是實現人性化的人機互動過程中必不可少的部分,情感識別與理解技術也是人機互動的基礎性技術之一。在此基礎上,「需求分析」、「深度用戶建模」、 「情感表達」、「人性化交互體驗」等更深入的互動設計才能成為可能。

深度建模來說,通過和人聊天,AI可以用情感分析對實體進行高效率的自動化標註,實現專屬的情感詞典。了解用戶的偏好甚至偏好程度,並利用這些信息進行建模,久而久之就能夠實現「個性化」,而不是像Siri這種號稱個人助手卻實際上不夠個性化的存在。

情感表達來說,可以實現人機對話系統對情感的誘導。在判斷出情感之後就可以用不同的回覆來改變情感傾向,比如對話系統能判斷接下來的哪一句答覆能讓用戶產生一個情感傾向,如高興、驚訝或傷心等。事實上能夠讓人產生感受就是在進一步實現更人性化的交互。

 

人性化交互體驗的應用方向是不言自明的,當智能體的「智商」沒有過於顯著的差別的時候,一個稍微有些情商的智能系統就會更容易被選擇。當然這一點的實現需要一整套的情感分析系統。

 

從文本情感分析到多模態情感分析

 

一般情況下,我們探討的情感分析多指文本中的情感分析,但多維度的情感分析,如文字+圖片+表情+顏文字的綜合分析,文本+語音+圖像的綜合,即多模態情感分析,是目前來說,比較前沿和更為重要的情感分析的研究方向。

 

對於多模態情感分析研究的必要性,這裡需要提一個概念——「情感帶寬」,即人類能表達的情感的信息量的大小和維度。比如面對面交流時,情感性的信息往往是從語音語調、面部表情、肢體等多個維度表達出來的。然而到了人機互動中,情感寬帶的整個範式會發生較大的變化,如通過人機對話系統交流時,少了肢體這個維度,人類的情感帶寬似乎瞬間驟降了。但實際上也增加了幾個新的輸出維度,如圖片、表情包、回復時間的長短等

 

除自然語言理解技術外,人機互動的另一困難就是信息維度的稀疏性。因此人機互動中情感分析應儘可能從多個維度入手,將缺失的情感帶寬補上——多模態情感分析成為一個重要的研究方向。內部的多模態分析即emoji+照片+表情包+文本長度等,外部的多模態即加入面部表情識別+提供的標籤(性格,愛好,年齡等)+語音等。如竹間智能在構建基於自然語言理解技術的人機互動系統時,加入多模態情感分析技術(文字、語音、圖像),打破了以往情感識別在單一文本維度上的局限性,讓機器能進一步讀懂、聽懂、看懂人類,從而達到了更好的人機互動效果。

 

情感分析的工具和方法

 

深度學習在情感分析中的應用已經較為普遍了,如利用LSTM結合句法分析樹、基於卷積神經網絡和支持向量機等。一般情況下,對於各種方法的綜合創新應用,能達到取長補短的效果,進而能夠提高情感分析的準確率,另外還能從無標註的文本裡學習到其中的隱藏特徵,以實現端到端的分類。

 

文本情感分析最常見的dataset 是 IMDB Movie Reviews,那麼該如何入手與練習呢?下面以 python 為例,從簡單的文本情感分析說起。

 

前置作業:

 

1. 先安裝 Keras (https://keras.io/),Keras 是一個 high-levelnetworks API,底層使用了 Tensorflow, CNTK, 或 Theano 運算 (這取決於具體安裝了哪一個)。

Keras 的安裝指南: https://keras.io/#installation

2. Keras 已安裝完畢,則 IMDB 可由此方式入手(https://keras.io/datasets/) 。此API的底層:https://github.com/fchollet/keras/blob/master/keras/datasets/imdb.py

 

接下來,依序分享一下怎麼用  LSTM,Bi-directional LSTM, CNN, CNN-LSTMNeuralNetwork 來解情感分析(sentiment analysis)的問題。


LSTM 的詳細原理,在此不加贅述,有興趣的朋友,可以參考這篇文章:http://colah.github.io/posts/2015-08-Understanding-LSTMs/ 

以下會使用RNN 的 concept 來解 sentiment analysis的問題。 

 

example: 假設,使用者輸入:「我今天好傷心」,分詞完的結果是「我  今天 好  傷心」,則我們希望model 可以輸出 「難過」。 model 裡面的簡單運算概念如下圖所示。 LSTM 會一直把資訊往後傳,並擁有記憶功能,最後整合所有資訊後,再做出判斷。

 

 

透過 Keras,可以快速建出上面的模型:

完整代碼:

https://github.com/fchollet/keras/blob/master/examples/imdb_lstm.py

詳細的代碼解說: 

http://machinelearningmastery.com/sequence-classification-lstm-recurrent-neural-networks-python-keras/


Bi-directionalLSTM 和 LSTM 非常類似,只是把句子透過兩個不同方向來看,如下圖所示:

 

這種做法有一個好處,以這句話「我今天好傷心」為例,重點剛好在句尾。但如果換一個句子,「真開心,明天要出去玩了」,此句的重點則在句首。因此,可以用Bi-directional LSTM 來處理這種問題。

 

一樣,透過 Keras,可以快速建出這種模型:

 

只要在LSTM 外面包上 「 Bidirectional 「 這個 wrapper ,馬上就能製作完成。

 

完整代碼: 

https://github.com/fchollet/keras/blob/master/examples/imdb_bidirectional_lstm.py


近年來CNN 在影像領域大有突破,不過也有人把 CNN 的方法應用到文字處理上面。在此先分享一篇arxiv上的文章,「RecentAdvances in Convolutional Neural Networks」,於2017年年初做了更新:https://arxiv.org/pdf/1512.07108.pdf

 

裡面對 CNN 做了overview,同時在 「5.10.Natural Language Processing」 對NLP做了些整理。

 

然後我們回歸主題,怎麼使用 CNN 來做情感分類呢?


詳細的原理,可以參考這篇文獻:https://arxiv.org/abs/1408.5882

這篇則是知名的博客WildML寫的介紹:http://www.wildml.com/2015/12/implementing-a-cnn-for-text-classification-in-tensorflow/

 

不過,從實作面的角度來看,透過Keras,CNN的原理也不是太重要,只要找對API即可 (Conv1D)。在以下這個實作範例中,大約需要20行的代碼,即可建出這個model:

 

 

完整代碼:

https://github.com/fchollet/keras/blob/master/examples/imdb_cnn.py


上面介紹完LSTM & CNN,那是不是有辦法可以把兩者的特性結合起來,融合成一個 CNN-LSTM的model?  透過 Keras,當然還是可以的!

 

完整代碼:

https://github.com/fchollet/keras/blob/master/examples/imdb_cnn_lstm.py

 

以上主要分享了比較普遍的實作面內容,也許能夠幫助大家解決手頭上的問題。不過上面用 LSTM 與 CNN 來解 sentimentanalysis 的問題大約是近5年內發展的技術,不是最近最新的技術。  

 

關於多模態情感分析:最直覺的做法,就是把文本、語音、圖像的原始輸入資料,利用深度學習的技術,映射到共同的 feature space 中。以文本的例子來說,原始輸入的文字,使用分詞(前處理)轉成字符與字元後,透過一層 embedding layer 映射到向量空間,可以使用 CNN 去擷取裡面的信息。同理,以圖像為例子,原始輸入的照片,利用影像前處理(ex: whitening) 後,再使用CNN 去擷取裡面的訊息。

 

RNN在語音和圖像上的情感分析,可參考:http://www.professeurs.polymtl.ca/christopher.pal/RNN-emotions-kahou.pdf

 

最新的 DeepLearning for NLP 的技術,可以參考由NLP大牛 Chris Manning 和 Richard Socher 在Stanford 合開的課程: http://cs224d.stanford.edu/syllabus.html

課程視頻:https://www.youtube.com/playlist?list=PL3FW7Lu3i5Jsnh1rnUwq_TcylNr7EkRe6

圖片來源於網絡。

竹間智能Emotibot以類腦對話系統和情感計算為核心,希望以人工智慧技術助力更多行業、機構及個人擁抱AI時代,分享AI發展的紅利。

如需轉載,請聯繫竹間智能Emotibot微信公眾號(Emotibot_tech),並註明出處。

相關閱讀:

中文NLP難於英文?從語言學角度看中文NLP、NLU難在哪裡

前沿 | Deep Learning 一書已有哪些內容被最新研究推翻或拓展了?

本帳號提供Emotibot最新動態,

為大家分享最前沿的人工智慧技術


相關焦點

  • 專欄 | 情感計算是人機互動核心?談深度學習在情感分析中的應用
    其中針對中文語境裡人機互動中的情感、情緒識別與理解,竹間智能已經做了許多有益的探索,特別是如何利用情感、情緒分析,來幫助機器人實現對「對話意圖」與「深層語義」的更好理解。本文將梳理一下情感計算在人機互動中的價值,同時分享一些情感分析的工具與方法。希望對從事人機互動研究的朋友們有所啟發。
  • 一文讀懂「情感計算」在零售中的應用發展
    近幾年,出現了各種各樣的方法和技術來識別用戶的情感,例如:面部表情識別、姿態識別、自然語言處理、人體生理信號識別、多模情感識別、語音識別等。人機情感交互則包括人臉表情交互、語音情感交互、肢體行為情感交互、文本信息情感交互、情感仿生代理、多模情感交互等。1、人臉表情識別和肢體行為識別,都是利用生物特徵分析的方法,提取被觀察者的情感特徵。
  • 「情感計算」讓機器也可以察言觀色 它是怎麼做到的?
    在近日中國科協發布的12個領域60個重大問題中,人機情感交互位列其中。「無情感不智能」已經成為眾多研究者的共識。 日前,在杭州舉行的第七屆UCAN用戶體驗設計論壇上,阿里巴巴人機自然交互實驗室聯合達摩院機器智能技術實驗室和浙江大學推出了一款可以基於圖文內容自動生成短視頻的人工智慧Aliwood。
  • 情感交互將成為移動交互的趨勢
    因為人類之間的交流與溝通是自然而富有感情的,因此人們期望與之交互的機器也具有類似於人的觀察、理解和生成情感特徵的能力。 隨著情感計算(affective computing)等技術的不斷發展,情感交互成為高級資訊時代人機互動的主要發展趨勢。(如圖所示)情感交互就是使人機互動可以像人與人交互一樣自然、親切、生動和富有情感。
  • 語言學運用、LSTM+DSSM算法、多模態情感交互
    隨著深度學習在自然語言處理中的運用,訓練數據的質量也成為了智能客服開發的關鍵。特別是服務於金融、電商等垂直行業的智能客服,相關領域的對話訓練數據的質量直接決定了深度學習模型的訓練質量。深度學習的運用也成為區別新一代智能客服區與傳統以關鍵詞、模版為核心的問答機器人的關鍵。   另一方面,客服知識庫是智能客服的核數據,它存儲了所有的問題和相應的答案。
  • 就喜歡看綜述論文:情感分析中的深度學習
    本文中,來自領英與伊利諾伊大學芝加哥分校的研究人員對基於深度學習的情感分析研究進行了詳細論述。情感分析或觀點挖掘是對人們對產品、服務、組織、個人、問題、事件、話題及其屬性的觀點、情感、情緒、評價和態度的計算研究。該領域的開始和快速發展與社交媒體的發展相一致,如評論、論壇、博客、微博、推特和社交網絡,因為這是人類歷史上第一次擁有如此海量的以數字形式記錄的觀點數據。
  • CAFA設計學院藝術與科技專欄 | 設計與療愈: 人工智慧、情感計算、心理療愈與設計
    Simon)表達了相似的觀點,儘管情緒和情感是人類日常生活中的基本組成部分,但缺乏情感交互的技術是不完整的,是令人沮喪的,在技術層面實現自然的人機互動仍是一個亟需解決的問題。目前,情感計算越來越受到研究者的重視。類似研究有人工情感(artificial emotion,AE)、感性工學(kanseiengineering, KE)、情感神經學(affectiveneuroscience)等。
  • 在Netflix 評論中做情感分析的深度學習模型
    在這篇文章中,我將介紹情感分析的主題和怎樣實現一個可以識別和分類Netflix評論中人的感情的深度學習模型。生意中的一個很重要的元素是了解客戶基本需求。這些數據對如市場分析、公共關係、產品意見、淨推薦值、產品反饋和顧客服務等商業應用非常有用。接下來,我將向你們展示如何使用深度學習模型對 Netflix 評論進行正向和負向的分類。這個模型會把全部評論作為輸入(每一個單詞),並且提供一個百分比的評分來檢測某個評論是在表達正向或負向的情緒。
  • 清華權威報告告訴你:人工智慧的情感計算是什麼?
    Mioednc因此,在智能人機互動的研究中,擁有對情感的識別、分析、理解、表達的能力也應成為智能機器必不可少的一種功能。在書中,她指出「情感計算就是針對人類的外在表現,能夠進行測量和分析並能對情感施加影響的計算」 ,開闢了計算機科學的新領域,其思想是使計算機擁有情感,能夠像人一樣識別和表達情感,從而使人機互動更自然。Mioednc簡單來說,情感計算研究就是試圖創建一種能感知、識別和理解人的情感,並能針對人的情感做出智能、靈敏、友好反應的計算系統。
  • 優必選科技與華南理工大學共建「類人情感智能」聯合創新實驗室
    11月11日,優必選科技和華南理工大學合作共建的「類人情感智能」聯合創新實驗室在廣州正式揭牌。雙方將在多模態情感計算、類人情感交互等類人情感智能的關鍵領域開展高水平合作研究,促成類人情感智能技術在機器人產業化中的應用,深入推動人工智慧行業的發展。
  • 深度學習人機互動相關資源推薦來啦
    ,深度學習和人機互動的學習資源很多,但很少有人把這些資源進行總結和整合。近日,bwang514 在 github 上做了一個「深度學習人機互動相關資源大列表」。上面有一些很棒的關於智能用戶界面和人機互動的課程資源。
  • 在 Netflix 評論中做情感分析的深度學習模型 | 洞見
    在這篇文章中,我將介紹情感分析的主題和怎樣實現一個可以識別和分類Netflix評論中人的感情的深度學習模型。企業最重要的目的之一就是與客戶群保持聯繫。情感分析是完成上述任務的方法之一情感分析是自然語言處理(NLP)中的一個領域,它建立模型,試圖識別和分類語言表達中的屬性 e.g.:1. 極性:如果發言者表達了積極或者消極的意見2. 主題:正在被討論的事情3.
  • 情感計算的核心問題:認知如何計算?
    近幾年來情感計算、生物計算、認知計算的廣泛的研究都取得了一定的成果。關於實現認知計算,應該解決3個問題:提出一個既符合認知機理又與計算相呼應的認知計算模型;認知表徵的描述和量化;能夠實現認知計算模型。前者為後者提供了一個可計算的實例以及從計算機科學角度對模型進行解釋而後者則是前者在心理學上的理論依據。從認知神經網絡的介紹中可以發現鄰接的結構在整個網絡構成中起了極大的作用。為此,我們提出一個重要觀點鄰接兩層結構是認知神經網絡進行認知計算的基本單元。
  • 阿里巴巴和清華大學成立聯合實驗室 推動人機互動研發 |新京報財訊
    新京報快訊(記者楊礪)像《超能陸戰隊》中「情感豐富」的大白(Baymax)那樣實現人機互動或將走進現實。4月3日,阿里巴巴和清華大學宣布達成戰略合作,共同成立清華大學-阿里巴巴自然交互體驗聯合實驗室(下稱」聯合實驗室」),共同探索人機互動的未來。
  • 優必選科技與華南理工合力攻堅 開啟「類人情感智能」新時代
    此時此刻,人工智慧正深刻改變著人類的生產、生活、學習方式,推動人類社會迎來了人機協同、跨界融合、共創分享的智能時代,人與機器人交互的場景模式都已經發生了深刻變化。此次,優必選科技與華南理工的合作,使「類人情感智能」迎來了重大的的發展契機。
  • 人機互動的內容有哪些_人機互動主要研究什麼
    友好人機互動界面的開發離不開好的交互模型與設計方法。因此,研究人機互動界面的表示模型與設計方法,是人機互動的重要研究內容之一。   可用性分析與評估(Usability and Evaluation)   可用性是人機互動系統的重要內容,它關係到人機互動能否達到用戶期待的目標,以及實現這一目標的效率與便捷性。
  • 想像科技領跑語音AI+革命 情感計算技術實現呼叫中心成交率最高...
    美國史丹福大學計算機科學系終身教授、人工智慧實驗室主任李飛飛曾公開表示:「我認為下一步人工智慧的發展,需要加強對情感,情緒的了解,要走近認知學,心理學。」在人工智慧不斷迭代的今天,用戶也不止滿足於冰冷的人機互動,而是上升到更有情感的精神需求層面。
  • 竹間智能完成4500萬美元融資,人工智慧擁有人類情感會怎樣?
    以情感計算為核心,並結合滿足用戶剛需功能的人工智慧機器人。由前微軟(亞洲)網際網路工程院副院長簡仁賢創辦,致力於自然語言理解、語音識別、計算機視覺、多模態情感計算等技術的研發。公司總部位於上海徐匯,在北京、臺北、波士頓三地設有研發中心,團隊有各類領域(人工智慧,深度學習/機器學習,自然語言理解,數據挖掘,圖像識別,語音情感識別,及物聯網)的科學家。
  • 前景專業|人機互動(HCI)
    後來,人機互動的重心擴展到遊戲、學習教育、商業、健康與醫療應用、應急規劃與響應,以及協作與社區支持系統等領域。如今,人機互動的跨學科性體現在計算機科學與行為科學的交叉領域。人機互動的目標是創建一套易於用戶操作的安全有效系統,這個概念看似並不複雜,但卻需要綜合計算機科學、認知科學及人因工程學等領域的技術。人機互動領域的研究員通常做些什麼事?
  • 【德勤技術趨勢】情感計算的核心問題:認知如何計算?
    近幾年來情感計算、生物計算、認知計算的廣泛的研究都取得了一定的成果。關於實現認知計算,應該解決3個問題:提出一個既符合認知機理又與計算相呼應的認知計算模型;認知表徵的描述和量化;能夠實現認知計算模型。 認知模型通常可以分為3類計算模型、數學模型和概念模型。