情感識別的國內外研究現狀之調研

2021-01-08 我是天邊飄過一朵雲

人的情感狀態(如緊張、激動、恐慌、愉快、憤怒等)往往伴隨著人體的多個生理或行為特徵的變化,某些生理或行為特徵的變化也可能起因於多種情感狀態。由於情感特徵很複雜,難以準確描述一個人的情感狀態。目前,學術界關於情感的表示並沒有一個十分統一的認識,也沒有一個定性和定量的測量評價標準,其主要的表示方法可以分為離 散情感模型和維度情感模型兩大類。離散情感模型 將情感按照多種分類方法進行分類,可以將情感類別分為開心、悲傷、驚訝等;同時,可以由任何一個情感類別或多個情感類別的組合來描述。維度情感模型將不同的情感維度的組合對應不同的維度情感空間,每個情感維度應具有取值範圍,情感維度 數值可位於該取值範圍內的任意位置。任何情感都可以通過一組數值進行表示,這組數值代表了這個情感在維度情感空間中的位置。

情感識別的研究重點就是通過各類傳感器獲取 由人類情感引起的生理指標或者行為特徵發出的信號(例如語音、面部表情、手勢、姿態、腦電波、脈搏等),以建立可計算的情感模型。在具體的研究中,多模態(主要是音頻和視頻)情感識別往往備 受青睞,但如何抽取有效的特徵參數並運用恰當的模型來表達這些特徵參數和情感之間的關聯性,是亟待解決的一個關鍵問題。

關於情感語音的聲學特徵分析主要圍繞韻律、頻譜和音質特徵。研究者已經發現很多聲學特徵與情感狀態有關,如持續時間、語速、基音頻率、共振峰、強度、Mel頻率倒譜係數(MFCC)等。研究人員將它們表示為固定維數的特徵向量,其中的各個分量為各聲學參數的統計值,包括平均值、方差、最大或最小值、變化範圍等。儘管韻律、音質、頻譜這三類特徵均對情感識別起到不同程度的貢獻,但是他們在不同語料下的作用不盡相同。通常頻譜類特徵在自然情感識別下較為魯棒,而韻律和音質類特徵在表演語料條件下較為魯棒,對情感識別結果貢獻較大。近年來,神經網絡提取優良特徵參數的能力越來越受到關注。深度語音情感特徵是基於語音信號或者頻譜圖,並通過語音情感識別相關任務學習到的深度特徵。但是由於情感數據集的匱乏,目前應用比較廣泛的是通過語音事件檢測或者語音情感識別等任務,採用在大規模的訓練數 據學習到的深度語音特徵作為語音情感特徵,比如VGGish和wav2vec。

在視頻情感識別中,局部二值模式(Local Binary Pattern, LBP)、局部相位量化特徵(Local Phase Quantization, LPQ)、Gabor 特徵被廣泛應用於靜態圖像的情感識別工作中;時序信息為情感識別提供了關鍵信息,許多基於上述特徵的時空特徵, 如LBP-TOP(LBP from Three Orthogonal Planes)、 LPQ-TOP在基於視頻的情感識別中廣泛應用。計算機視覺中常用的方向梯度直方圖(Histogram of Oriented Gradient, HOG)描述子、尺度不變特徵變 換(Scale-Invariant Feature Transform,SIFT)描述子、詞袋模型(Bag of Words,BoW)和 Gist描述子均在情感識別工作中有所涉及。另一類是基於深度神經網絡的深度情感特徵。深度情感特徵避免了繁瑣的圖片預處理以及特徵提取,相較於傳統方法在情感識別相關任務上的表現更好,對光照、姿態、遮擋物等情感識別魯棒性更高。深度情感特徵主要從人臉情感識別數據集上訓練的模型中進行抽取,比如目前應用廣泛的深度特徵是從人臉情感識別數據集(比如 FER+)上訓練的VGGNet、DenseNet等神經網絡模型中抽取,並在主流的情感競賽中取得了不錯的結果。

多模態信息的分析方法有很多,從信息融合層次來看,多模態信息融合的方法主要有決策層融合和特徵層融合,也有一些學者將這兩個融合方式混合使用。決策層融合方式操作方便靈活,允許各個模態採用最適合的機器學習算法進行單獨建模。特徵層融合的通常做法是將各個通道的特徵相串聯,組合成一個長的特徵向量,然後再將該特徵向量放入機器學習算法進行分類或是回歸輸出。最新的認知神經科學表明,大腦在整合多感官信息時存在多階段融合的現象,受此啟發,研究者提出了多階段多模態情感融合方法。首先訓練一個單模態模型,然後將其隱含狀態與另一個模態特徵拼接再訓練雙模態模型,以此類推得到多模態模型。這種建模方法在每個階段只關注多模態信息的一個子集,然後綜合考慮所有模態信息得到預測結果。多模態情感融合的關鍵在於實現了跨模態之間的有效整合以獲得多模態信息的互補,從而比單模態情感識別具有更大的優勢。

情感是一個時序變化的行為,其演變都會經歷一定的時間,因此需要考慮情感信息的前後依賴性。傳統的動態模型如隱馬爾科夫模型和條件隨機場,由於其可以對時序上下文信息建模的內在屬性,取得了比靜態模型更好的識別性能。然而這些模型考慮的前後時序信息較短,因此取得的效果有限。基於深度學習的情感識別系統具有更強的非線性建模能力,在情感識別領域取得了廣泛應用;但是經典的基於卷積神經網絡(Convolutional Neural Networks,CNN)和長短期記憶網絡(Long Short-Term Memory,LSTM)的模型在建模過程中對於每一幀預測情感的貢獻度是相同的,這種假設存在著不合理性;針對這種問題引入注意力機制,通過全局上下文信息自動學習不同幀對於情感識別的重要性得到相匹配的權重係數,可以實現更有針對性的 情感建模,顯著提高情感識別的性能。

近年來,情感計算技術與美學的結合得到了廣泛的關注,目前廣受歡迎的智能體如微軟小冰、賢二機器僧等,能夠針對客戶進行適度的情感分析,並根據分析結果進行對話。這種情感分析的基礎就 是「情感計算」。麻省理工學院(MIT)計算機專家 羅莎琳·皮卡德(Rosalind Picard)提出,人們可以利用計算機強大的儲存、搜索和運算能力,來計算和分析與情感相關的外在表現,如面部表情、心跳 速率、皮膚溫度等生理特徵。除此之外,情感計算還可以分析藝術家在作品中留下的能體現情感的相 關痕跡,如色彩、形狀、線條、文本等。在分析過程中,需要藉助美學家、藝術理論家對藝術品和藝術家的情感分析,這就是美學參與到人工智慧研究的實例之一。同樣,情感計算也給美學家提供了一種思路,即藝術家在創作時的情感也許可以量化研究和分析。

情感識別計算在諸多領域得到了應用。在人機互動場景中(如微軟小冰),自動感知用戶的情感 狀態並做出相應的反應以提高對話質量;在智能客服領域,客戶的情感狀態變化可以反映出客服人員的服務質量,當檢測到客戶出現生氣等負向情緒時,可以切換到更有經驗的客服人員,節省了大量的人力和物力;在智能教育領域,通過分析教師的情緒 以及學生的上課狀態,能更加智能地提高教師的教學質量和學生的上課效率;在醫療領域,通過分析病人的情感和心理壓力的變化來檢測可能出現的一些心理和精神的異常點,可以為醫生做診斷提供輔助。

相關焦點

  • 中國合成橡膠市場現狀全面調研及發展趨勢(2020-2026年)
    分類方法多樣,發展歷史悠久,有著廣闊的研究前景。  《中國合成橡膠市場現狀全面調研及發展趨勢(2020-2026年)》對合成橡膠行業相關因素進行具體調查、研究、分析,洞察合成橡膠行業的發展方向、合成橡膠行業競爭格局的演變趨勢以及合成橡膠技術標準、合成橡膠市場規模、合成橡膠行業潛在問題與合成橡膠行業發展的癥結所在,評估合成橡膠行業投資價值、合成橡膠效果效益程度,提出建設性意見建議,為合成橡膠行業投資決策者和合成橡膠企業經營者提供參考依據
  • 2020年版中國觸控屏市場現狀調研與發展趨勢分析報告
    《2020年版中國觸控屏市場現狀調研與發展趨勢分析報告》依據國家權威機構及觸控屏相關協會等渠道的權威資料數據,結合觸控屏行業發展所處的環境,從理論到實踐、從宏觀到微觀等多個角度對觸控屏行業進行調研分析。  《2020年版中國觸控屏市場現狀調研與發展趨勢分析報告》內容嚴謹、數據翔實,通過輔以大量直觀的圖表幫助觸控屏行業企業準確把握觸控屏行業發展動向、正確制定企業發展戰略和投資策略。
  • 2020-2026年中國發酵製品行業現狀調研分析及發展趨勢研究報告
    《2020-2026年中國發酵製品行業現狀調研分析及發展趨勢研究報告》在多年發酵製品行業研究結論的基礎上,結合中國發酵製品行業市場的發展現狀,通過資深研究團隊對發酵製品市場各類資訊進行整理分析,並依託國家權威數據資源和長期市場監測的資料庫,對發酵製品行業進行了全面、細緻的調查研究。
  • 2020年全球與中國電泳槽市場現狀調研與發展前景預測分析報告
    《2020年全球與中國電泳槽市場現狀調研與發展前景預測分析報告》主要研究分析了電泳槽行業市場運行態勢並對電泳槽行業發展趨勢作出預測。報告首先介紹了電泳槽行業的相關知識及國內外發展環境,並對電泳槽行業運行數據進行了剖析,同時對電泳槽產業鏈進行了梳理,進而詳細分析了電泳槽市場競爭格局及電泳槽行業標杆企業,最後對電泳槽行業發展前景作出預測,給出針對電泳槽行業發展的獨家建議和策略。《2020年全球與中國電泳槽市場現狀調研與發展前景預測分析報告》給客戶提供了可供參考的具有借鑑意義的發展建議,使其能以更強的能力去參與市場競爭。
  • 中國太陽能光熱發電行業現狀調研及未來發展趨勢分析報告(2020...
    據中國產業調研網發布的中國太陽能光熱發電行業現狀調研及未來發展趨勢分析報告(2020-2026年)顯示,**年底,國家能源局向各省發改委能源局等有關部門下發《太陽能利用十三五發展規劃徵求意見稿》,意見稿指出到**年底,太陽能發電裝機規模在電力結構中的比重約7%,在新增電力裝機結構中的比重約15%,在全國總發電量結構中的比重約2.5%,折合標煤量約5000萬噸,約佔能源消費總量比重的
  • 2020-2026年中國物聯網市場現狀調研分析及發展趨勢報告
    中國產業調研網發布的2020-2026年中國物聯網市場現狀調研分析及發展趨勢報告認為,物聯網產業鏈可細分為標識、感知、處理和信息傳送四個環節,關鍵技術包括RFID、傳感器、智能晶片和電信運營商的無線傳輸網絡。與射頻識別設備、傳感器等單個的微觀產業鏈相比,電信運營商在物聯網架構中的發展空間較大,運營商將在物聯網產業中強勢介入多個環節。
  • 中國工程造價行業現狀調研及發展前景分析報告(2020-2026年)
    《中國工程造價行業現狀調研及發展前景分析報告(2020-2026年)》通過工程造價項目研究團隊多年對工程造價行業的監測調研,結合中國工程造價行業發展現狀及前景趨勢,依託國家權威數據資源和一手的調研資料數據,對工程造價行業現狀及趨勢進行全面、細緻的調研分析,採用定量及定性的科學研究方法撰寫而成。
  • 中國建築設計行業現狀調研分析及市場前景預測報告(2020年版)
    中國產業調研網發布的中國建築設計行業現狀調研分析及市場前景預測報告(2020年版)認為,近年來,我國建築設計行業發展迅速,不論是企業規模、從業人員規模、經營規模,管理水平和經濟效益都有較大的發展,完成了大量固定資產投資項目的建築設計任務。
  • 2020-2026年中國幼兒教材行業現狀深度調研及發展趨勢
    《2020-2026年中國幼兒教材行業現狀深度調研及發展趨勢》通過幼兒教材項目研究團隊多年對幼兒教材行業的監測調研,結合中國幼兒教材行業發展現狀及前景趨勢,依託國家權威數據資源和一手的調研資料數據,對幼兒教材行業現狀及趨勢進行全面的調研分析,採用定量與定性相結合的科學研究方法撰寫而成
  • 2020-2026年中國消費金融行業現狀調研分析及發展趨勢研究報告
    據中國產業調研網發布的2020-2026年中國消費金融行業現狀調研分析及發展趨勢研究報告顯示,消費金融市場高速增長。網際網路消費金融從**年到**年,其交易規模從60億元增長到4367億元,年均複合增長率達到317.5%。
  • 2020年版中國噴塗市場現狀調研與發展前景分析報告
    《2020年版中國噴塗市場現狀調研與發展前景分析報告》通過噴塗項目研究團隊多年對噴塗行業的監測調研,結合中國噴塗行業發展現狀及前景趨勢,依託國家權威數據資源和一手的調研資料數據,對噴塗行業現狀及趨勢進行全面、細緻的調研分析,採用定量及定性的科學研究方法撰寫而成。
  • 2020-2026年中國導電塗料行業現狀分析與發展前景研究報告
    《2021-2027年中國導電塗料行業現狀分析與發展前景研究報告》依據國家權威機構及導電塗料相關協會等渠道的權威資料數據,結合導電塗料行業發展所處的環境,從理論到實踐、從宏觀到微觀等多個角度對導電塗料行業進行調研分析。
  • 2020年中國新能源開發利用現狀調研及發展趨勢走勢分析報告
    《2020年中國新能源開發利用現狀調研及發展趨勢走勢分析報告》通過新能源開發利用項目研究團隊多年對新能源開發利用行業的監測調研,結合中國新能源開發利用行業發展現狀及前景趨勢,依託國家權威數據資源和一手的調研資料數據,對新能源開發利用行業現狀及趨勢進行全面、細緻的調研分析,
  • 2020-2026年中國冰淇淋行業現狀深度調研與發展趨勢報告
    據中國產業調研網發布的2020-2026年中國冰淇淋行業現狀深度調研與發展趨勢報告顯示,**年我國冰淇淋行業銷售額為382億元,利潤為19.7億元。經過多年發展,冰淇淋已經成為普通消費品,市場覆蓋全國。
  • 2020年中國太陽能光伏發電行業現狀調研及發展趨勢預測報告
    中國產業調研網發布的2020年中國太陽能光伏發電行業現狀調研及發展趨勢預測報告認為,中國也不甘落後,近年來相繼出臺了《太陽能光電建築應用財政補助資金管理暫行辦法》、金太陽示範工程等鼓勵光伏發電產業發展的政策。**年,在國務院《關於促進光伏產業健康發展的若干意見》及一系列配套政策支持下,光伏發電快速發展。
  • 中國教育培訓市場現狀調研與發展前景分析報告(2020-2026年)
    中國教育培訓機構十大品牌企業  註:以上排名不分先後  《中國教育培訓市場現狀調研與發展前景分析報告(2020-2026年)》主要研究分析了教育培訓行業市場運行態勢並對教育培訓行業發展趨勢作出預測。
  • 中國壓敏膠行業現狀調研分析及發展趨勢預測報告(2020版)
    壓敏膠黏劑的特點是粘之容易、揭之不難、剝而不損,在較長時間內膠層不會幹涸,因而壓敏膠黏劑也稱為不乾膠。正是由於壓敏膠的七述特點壓敏膠製品具有非常廣泛的用途。從辦公、包裝用的膠帶,到塗裝、刻蝕用的遮蔽膠帶;從電工、電器用的絕緣膠帶到各種鏡面的保護膠帶以及各種壓敏標籤,壓敏膠及其製品已經形成了一個非常龐大的產業。
  • 2017-2022年中國胺基酸行業現狀調研分析及發展趨勢研究報告
    前景預測  據中國產業調研網發布的2017-2022年中國胺基酸行業現狀調研分析及發展趨勢研究報告顯示,未來高附加值的小品種胺基酸,如苯丙氨酸、脯氨酸、異亮氨酸、纈氨酸等市場需求量增加,同時這些產品也受到國家產業政策的支持,發展前景看好。國內胺基酸行業需要建立技術支撐體系,以保證菌種穩定高產、工藝清潔高效、裝備節能環保、產品高端優質。
  • 淺談自然場景中的語音情感識別技術
    語音是人類最基本、最便捷的交流工具,承載了複雜信息的語音信號不僅可以反映語義內容,還能夠傳遞說話人內在的情感狀態。語音情感識別是 建立在對語音信號的產生機制深入研究與分析的基礎上,對語音中反映個人情感信息的一些特徵參數進行提取,並利用這些參數採用相應的模式識別方法確定語音情感狀態的技術。
  • 2020-2026年中國鈦市場現狀全面調研與發展趨勢分析
    《2020-2026年中國鈦市場現狀全面調研與發展趨勢分析》在多年鈦行業研究結論的基礎上,結合中國鈦行業市場的發展現狀,通過資深研究團隊對鈦市場各類資訊進行整理分析,並依託國家權威數據資源和長期市場監測的資料庫,對鈦行業進行了全面調研。