40 多年前,諾貝爾獎得主 Herbert Simon 在認知心理學方面強調,解決問題論要結合情感的影響。情感的識別和表達對於信息的交流和理解是必需的,也是人類最大的心理需求之一。人類的認知、行為等幾乎都要受到情感的驅動,並影響著人際互動以及群體活動。在人與人的交往中, 情感的交流還常被用來完成人的意圖的傳遞。Mioednc
因此,在智能人機互動的研究中,擁有對情感的識別、分析、理解、表達的能力也應成為智能機器必不可少的一種功能。Mioednc
作為人工智慧創始人之一的美國麻省理工學院Marvin Minsky教授首次提出讓計算機具有情感的能力,他在其專著《The Society of Mind》中強調情感是機器實現智能不可或缺的重要能力。20世紀90年代初,耶魯大學心理學系的Peter Salovey教授提出了情感智能的概念,並開展了一系列的研究。該概念隨後被Daniel J. Goleman發展為與智商(IQ)相對的情商(EQ),隨著Goleman的賦予計算機情感能力,並讓計算機能夠理解和表達情感的探討與研究引起了計算機界眾多專家的興趣,他們在情感研究的理論和實驗應用方面積累了很多經驗。Mioednc
本文來自於清華大學的研究報告《人工智慧之情感計算》,從技術特點、人才狀況、應用和趨勢四個方面深入解讀人工智慧情感計算。Mioednc
讓計算機具有情感能力的觀點並不新鮮,它與「機器人」 一詞幾乎同時出現。 1985 年,人工智慧的奠基人之一 Minsky 就明確指出: 「問題不在於智能機器能否有情感,而在於沒有情感的機器能否實現智能」 。但當時,賦予計算機或機器人以人類式的情感,主要還是科幻小說中的素材,在學術界罕有人關注。 1995 年情感計算的概念由 Picard 首次提出,並於 1997 年正式出版《Affective Computing(情感計算)》。在書中,她指出「情感計算就是針對人類的外在表現,能夠進行測量和分析並能對情感施加影響的計算」 ,開闢了計算機科學的新領域,其思想是使計算機擁有情感,能夠像人一樣識別和表達情感,從而使人機互動更自然。Mioednc
簡單來說,情感計算研究就是試圖創建一種能感知、識別和理解人的情感,並能針對人的情感做出智能、靈敏、友好反應的計算系統。顯然,情感計算是個複雜的過程,不僅受時間、地點、環境、人物對象和經歷的影響,而且要考慮表情、語言、動作或身體的接觸。Mioednc
在人機互動中,計算機需要捕捉關鍵信息,覺察人的情感變化,形成預期,進行調整, 做出反應。例如通過對不同類型的用戶建模(如操作方式、表情特點、態度喜好、認知風格、知識背景等),以識別用戶的情感狀態,利用有效的線索選擇合適的用戶模型,並以適合當前用戶的方式呈現信息。 在對當前的操作做出及時反饋的同時,還要對情感變化背後的意圖形成新的預期,並激活相應的資料庫,及時主動地提供用戶需要的新信息。 舉例來說,麻省理工學院媒體實驗室的情感計算小組研製的情感計算系統通過記錄人面部表情的攝像機和連接在人身體上的生物傳感器來收集數據,然後由一個「情感助理」來調節程序以識別人的情感。假設你對電視講座的一段內容表現出困惑,情感助理會重放該片段或者給予解釋。而目前國內情感計算的研究重點在於通過各種傳感器獲取有人的情感所引起的生理及行為特徵信號,確定情感類別的關鍵特徵,建立「情感模型」,從而創建個人情感計算系統。Mioednc
情感計算是一個高度綜合化的研究和技術領域。通過計算科學與心理科學、認知科學的結合,研究人與人交互、人與計算機交互過程中的情感特點,設計具有情感反饋的人與計算機的交互環境,將有可能實現人與計算機的情感交互。情感計算研究將不斷加深對人的情感狀態和機制的理解,並提高人與計算機界面的和諧性,即提高計算機感知情境,理解人的情感意圖,做出適當反應的能力,其主要研究內容如下圖所示:Mioednc
Mioednc
情感計算的研究內容Mioednc
情感計算是一個多學科交叉的嶄新的研究領域,它涵蓋了傳感器技術、計算機科學、認知科學、心理學、行為學、生理學、哲學、社會學等方面。情感計算的最終目標是賦予計算機類似於人的情感能力。要達到這個目標,許多技術問題有待解決。這些技術問題的突破對各學科的發展都產生巨大的推動作用。以下分別從情感計算的傳統研究方法和新興研究方法對技術發展進行探討。Mioednc
傳統的情感計算方法是按照不同的情感表現形式分類的,分別是:文本情感分析、語音情感分析、視覺情感分析。Mioednc
1.1 文本情感計算 Mioednc
20世紀90年代末,國外的文本情感分析已經開始。早期, Riloff和Shepherd在文本數據的基礎上進行了構建語義詞典的相關研究。 McKeown發現連詞對大規模的文本數據集中形容詞的語義表達的制約作用,進而對英文的形容詞與連詞做情感傾向研究。自此之後,越來越多的研究開始考慮特徵詞與情感詞的關聯關係。 Turney等使用點互信息的方法擴展了正負面情感詞典,在分析文本情感時使用了極性語義算法,處理通用的語料數據時準確率達到了74%。在近些年的研究中, Narayanan等結合各種特徵及其相關聯信息,提出了基於分句、整句、結果句的分類方案,獲得了很好的效果。 Pang等以積極情感和消極情感為維度,對電影評論進行了情感分類。他分別採用了支持向量機、最大熵、樸素貝葉斯算法進行分類實驗,發現支持向量機的精確度達到了80%。隨著研究的不斷深入,學者在對情感分析算法進行改進的同時,也將其應用到不同的行業中進行了實踐。Mioednc
文本情感計算的過程可以由 3 部分組成:文本信息採集、情感特徵提取和情感信息分類。文本信息採集模塊通過文本抓取工具(如網頁爬蟲工具)獲得情感評論文本,並傳遞到下一個Mioednc
情感特徵提取模塊,然後對文本中自然語言文本轉化成計算機能夠識別和處理的形式,並通過情感信息分類模塊得到計算結果。文本情感計算側重研究情感狀態與文本信息之間的對應關係,提供人類情感狀態的線索。具體地,需要找到計算機能提取出來的特徵,並採用能用於情感分類的模型。因此,關於文本情感計算過程的討論,主要集中在文本情感特徵標註(信息採集) 、情感特徵提取和情感信息分類這三個方面 。Mioednc
1、文本情感特徵標註:情感特徵標註是對情感語義特徵進行標註,通常是將詞或者語義塊作為特徵項。情感特徵標註首先對情感語義特徵的屬性進行設計,如褒義詞、貶義詞、加強語氣、一般語氣、悲傷、高興等等;然後通過機器自動標註或者人工標註的方法對情感語義特徵進行標註, 形成情感特徵集合。情感詞典是典型的情感特徵集合,也是情感計算的基礎。在大多數研究中,有關情感計算的研究通常是將情感詞典直接引入自定義詞典中。Mioednc
運用情感詞典計算出文本情感值是一種簡單迅速的方法,但準確率有待提高。在實際的情感計算中,會因為具體的語言應用環境而有所不同。例如, 「輕薄」 一詞通常認為是否定詞,但是在電腦、手機卻被視為肯定詞彙。同時,文本中常會出現否定前置、雙重否定以及文本口語化和表情使用等,這些都將會對文本情感特徵的提取和判斷產生較大的影響。因此在進行文本情感提取時,需要對文本及其對應的上下文關係、 環境關係等進行分析。Mioednc
2、情感特徵提取 :文本包含的情感信息是錯綜複雜的,在賦予計算機以識別文本情感能力的研究中,從文本信號中抽取特徵模式至關重要。在對文本預處理後,初始提取情感語義特徵項。特徵提取的基本思想是根據得到的文本數據, 決定哪些特徵能夠給出最好的情感辨識。通常算法是對已有的情緒特徵詞打分,接著以得分高低為序,超過一定閾值的特徵組成特徵子集。特徵詞集的質量直接影響最後結果,為了提高計算的準確性,文本的特徵提取算法研究將繼續受到關注。長遠看來,自動生成文本特徵技術將進一步提高,特徵提取的研究重點也更多地從對詞頻的特徵分析轉移到文本結構和情感詞上。Mioednc
3、情感信息分類 :文本情感分類技術中,主要採用兩種技術路線:基於規則的方法和基於統計的方法。在 20世紀 80 年代,基於規則的方法佔據主流位置,通過語言學家的語言經驗和知識獲取句法規則,以此作為文本分類依據。但是,獲取規則的過程複雜且成本巨大,也對系統的性能有負面影響,且很難找到有效的途徑來提高開發規則的效率。 20 世紀 90 年代之後,人們更傾向於使用統計的方法,通過訓練樣本進行特徵選擇和參數訓練,根據選擇的特徵對待分類的輸入樣本進行形式化,然後輸入到分類器進行類別判定,最終得到輸入樣本的類別。Mioednc
下表整理了10個文本情感分析API,供讀者參考:Mioednc
Mioednc
1.2 語音情感計算 Mioednc
最早的真正意義上的語音情感識別相關研究出現在 20 世紀 80 年代中期,它們開創了使用聲學統計特徵進行情感分類的先河。緊接著,隨著 1985 年 Minsky 教授「讓計算機具有情感能力」 觀點的提出,以及人工智慧領域的研究者們對情感智能重要性認識的日益加深,越來越多的科研機構開始了語音情感識別研究的探索。在 20 世紀 80 年代末至 90 年代初期,麻省理工學院多媒體實驗室構造了一個「情感編輯器」 對外界各種情感信號進行採集,綜合使用人體的生理信號、面部表情信號、語音信號來初步識別各種情感,並讓機器對各種情感做出適當的簡單反應; 1999 年, Moriyama 提出語音和情感之間的線性關聯模型,並據此在電子商務系統中建造出能夠識別用戶情感的圖像採集系統語音界面,實現了語音情感在電子商務中的初步應用。Mioednc