每日一讀:基於情感融合和多維自注意力機制的微博文本情感分析

2021-01-11 PPT愛好者

從今天開始,我會將每天的閱讀筆記上傳至公眾號,因本人水平有限,如存在錯誤之處,還請批評指正

3.基於情感融合和多維自注意力機制的微博文本情感分析

3.1論文信息

中國民航大學電子信息與自動化學院,韓萍,孫佳慧,方 澄,賈雲飛計算機應用,2019年歸檔:WPS網盤\我的雲文檔\論文匯報\畢業論文\論文部分\短文本情感分析算法部分\參考文獻3.2論文重點

研究目的:作者認為在處理微博文本時,將表情符號和微博文本結合可以提升模型的準確性研究方法:詞向量方面,將表情符號向量和文本詞向量做相似度計算後,結合在一塊;隨後通過多維度的自注意力機制,對句子向量進行特徵提取,並在最後通過池化方式進行降維,通過Softmax函數進行分類。研究結果:相較於其他方法,有了一丟丟的提升。

3.3模型分析

該研究提出一種E-DiSAN的模型,具體如下圖所示:

接下來將重點對四個部分內容進行分析:

3.3.1 情感語義矩陣構建層

該層使用Word2Vec訓練包含情感符號和分詞的向量,其中表示個表情符號構成的向量;則分詞向量通過,表示句子分詞後的詞個數。而則是將上述兩個向量通過相似度計算後得到的,具體方法如下:。因此在向量中間中,當情感符號和分詞的詞語具有相似的含義時,其距離也就越近,EM值越小。建構方法如下圖:

3.3.2 多維度自注意力層

在進行該階段的模型分析前,需要了解注意力機制和自注意力機制。首先介紹【注意力機制】:

3.3.2.1 注意力與自注意力機制

設:表示個分詞後的詞個數,現在給定一個比對任務:比對向量對於的相關性。設對比函數為,且該函數的概率分布為:。則概率分布函數為:。而對於的求解算法目前有兩種,分別為加和方法和乘積方法,分別為:和。該研究採用的是加和方法。當第位置的詞對於查詢條件重要時,的值越大。則注意力機制可以通過函數:描述,其含義為:所有文本序列詞向量與概率分布乘積,並經過累加和求得句子特徵。

而自注意機制,則是將查詢條件變為裡面的每一個,這樣可以學習到句子裡面詞依賴關係。因此自注意力機制可以表示為,此處參數是為了更好的擬合數據,均由網絡學習得到。

3.3.2.2 融合位置信息的多維度自注意力

分析實際文本時發現:詞序對於文本情感的傾向度存在較大的影響,如:不喜歡下雨天! 」和「喜歡不下雨的晴朗天氣! 」都出現了「不」和「歡」兩分詞,但這兩分詞的位置不同,顯然表達了不同的情感向,前者是消極情緒而後者是積極情緒。因此此處作者引入了位置信息加入位置信息後的自注意力機制可以表示為:。其中包含兩種類型,即前項信息和後項信息,可以分別通過:和表示:

其他其他前向位置信息 中只保留了當前元素之前的所有元素與該元素計得到的自注意函數得分; 反之,後項位置信 中只保留了當前元素之後的所有元素與該元素計算得到的自注意分數。因此,引入位置信息的概率函數為:,故而,引入位置信息的注意力機制為:。由此,可以計算出前後向的注意力分數,分別用和表示,最後將分詞的前後句進行拼接,形成句子的特徵。

3.3.3 句子向量特徵獲取層

為了降低維度,該層使用了池化方法處理,池化方法採用了average-pooling方法,即:

3.3.4 情感極性分類層

使用了較為經典的Softmax函數,其定義的損失函數為:

相關焦點

  • 每日一讀:基於雙重注意力模型的微博情感傾向性分析
    2.基於雙重注意力模型的微博情感傾向性分析2.1 論文信息太原理工大學信息與計算機學院,羅春春,郝曉燕南京大學學報(自然科學),2020年歸檔:WPS網盤\我的雲文檔\論文匯報\畢業論文\論文部分\短文本情感分析算法部分\參考文獻2.2 論文重點研究目的
  • 每日一讀:基於Self-Attention和Bi-LSTM的中文短文本情感分析
    4.基於Self-Attention和Bi-LSTM的中文短文本情感分析4.1論文信息西北大學 信息科學與技術學院,吳小華,陳 莉,魏甜甜,範婷婷中文信息學報,2019年>歸檔:WPS網盤\我的雲文檔\論文匯報\畢業論文\論文部分\短文本情感分析算法部分\參考文獻4.2論文重點研究目的:對於當前基於注意力機制和雙向LSTM依賴於分詞精度的問題,研究者認為,採用字向量的方法可以解決過度依賴分詞精度的問題,採用自注意力機制可以獲取文本內信息。
  • 賽爾筆記|基於知識引入的情感分析
    為了彌補這一缺點,學者們嘗試引入外部情感知識為模型提供監督信號,提高模型分析性能。本文從常見的外部情感知識類型出發,簡要介紹在情感分析中使用知識的一些代表性工作。2.正文我們為什麼要不斷嘗試在情感分析中融入知識呢?
  • 達觀數據乾貨分享丨情感分析架構演進
    達觀數據基於在自然語言處理、機器學習算法和文本挖掘領域的多年技術積累,融合文本標籤提取、文本分類和情感分析,打造了針對產品評論的觀念挖掘服務,幫助用戶從海量評論數據中提煉出核心觀點,從而對產品的真實情況一目了然。
  • 百分點認知智能實驗室出品:情感分析在輿情中的研發實踐(上)
    編者按文本情感分析是對帶有主觀感情色彩的文本進行分析、處理、歸納和推理的過程。網際網路上每時每刻都會產生大量文本,這其中也包含大量的用戶直接參與的、對人、事、物的主觀評價信息,比如微博、論壇、汽車、購物評論等,這些評論信息往往表達了人們的各種主觀情緒,如喜、怒、哀、樂,以及情感傾向性,如褒義、貶義等。
  • 情感識別的國內外研究現狀之調研
    多模態信息的分析方法有很多,從信息融合層次來看,多模態信息融合的方法主要有決策層融合和特徵層融合,也有一些學者將這兩個融合方式混合使用。決策層融合方式操作方便靈活,允許各個模態採用最適合的機器學習算法進行單獨建模。特徵層融合的通常做法是將各個通道的特徵相串聯,組合成一個長的特徵向量,然後再將該特徵向量放入機器學習算法進行分類或是回歸輸出。
  • 專欄| NLP概述和文本自動分類算法詳解
    序列到類別的例子包括文本分類和情感分析。類別(對象)到序列的例子包括文本生成和形象描述。 2. 文章分類:依據預設分類體系對文本進行自動歸類。 情感分析:準確分析用戶透過文本表達出的情感傾向。 文章主題模型:抽取出文章的隱含主題。 為了實現這些頂層應用,達觀數據掌握從詞語短串分析個層面的分析技術,開發了包括中文分詞、專名識別、語義分析和詞串分析等模塊。
  • 利用Neo4j對電影評論進行深度學習情感分析
    【編者按】隨著網際網路的發展,用戶從以前的「讀」網頁轉變為「寫」網頁,網際網路上產生了大量的用戶參與的,對於諸如人物、事件、產品等有價值的評論信息,而隨著網絡上評論信息爆炸式的增長,以人工的方法很難應付海量評論信息的收集和處理,情感分析技術隨之產生,本文以電影影評為例,利用Neo4j對電影評論進行深度學習的情感分析。
  • 淺談自然場景中的語音情感識別技術
    語音是人類最基本、最便捷的交流工具,承載了複雜信息的語音信號不僅可以反映語義內容,還能夠傳遞說話人內在的情感狀態。語音情感識別是 建立在對語音信號的產生機制深入研究與分析的基礎上,對語音中反映個人情感信息的一些特徵參數進行提取,並利用這些參數採用相應的模式識別方法確定語音情感狀態的技術。
  • 深度| 從各種注意力機制窺探深度學習在NLP中的神威
    它們可以實現語言建模、情感分析、機器翻譯、語義解析等非常多的任務,這些序列建模任務可以使用循環神經網絡、卷積神經網絡甚至近來比較流行的 Transformer。機器之心也介紹過基於循環與卷積的序列建模方法,而近日一篇綜述文章進一步介紹了 NLP 中各種深度技術。由於很多基礎知識讀者可能已經比較熟悉了,因此本文只重點介紹該綜述文章討論的注意力機制。
  • 首屆情感AI大會:當人工智慧理解並具備人類感情時……
    圖源:unsplash最近,筆者參加了首屆情感AI大會,本次大會由自然語言處理(NLP)、文本分析、情緒分析及其商業應用領域的首席分析師和商業顧問SethGrimes組織。1995年,麻省理工學院媒體實驗室教授羅莎琳德·皮卡德發表了一篇題為「情感計算」的文章,這一領域開始興起,並催生出同名新學科,情感人工智慧由此衍生而來。情感AI的目標是什麼?通過機器理解、複製和模擬人類情感。情感計算和情感AI融合了許多技術和應用領域。例如,麻省理工學院的情感計算團隊「旨在彌合人類情感與計算技術之間的鴻溝」。
  • 優必選科技與華南理工大學共建「類人情感智能」聯合創新實驗室
    ,「類人情感智能」聯合創新實驗室將進一步整合雙方的人才、科技等高端創新資源,共同推進跨媒體感知、機器人智能交互、類人情感智能等新一代人工智慧技術與教育的深度融合,產出更多原創性成果,為新基建、科技內循環做出重大貢獻。
  • 當數據分析遭遇心理動力學:用戶深層次的情感需求浮出水面(萬字長...
    四、讓用戶情感需求洞察成為可能:Censydiam用戶動機分析模型1、馬斯洛需求層次理論在分析用戶行為動機上的不足傳統的用戶動機研究往往基於美國社會心理學家、人格理論家和比較心理學家亞伯拉罕·馬斯洛的需求層次理論,這個理論大家也相當熟悉咯,所以下面只簡單聊幾句,不太明白的可以去網上搜索。
  • 520禮包 | 情感分析算法從原理到PaddlePaddle實戰全解
    允中 發自 凹非寺量子位 報導 | 公眾號 QbitAI在自然語言處理中,情感分析一般是指判斷一段文本所表達的情緒狀態。其中,一段文本可以是一個句子,一個段落或一個文檔。情緒狀態可以是兩類,如(正面,負面),(高興,悲傷);也可以是三類,如(積極,消極,中性)等等。
  • 當數據分析遭遇心理動力學:用戶深層次的情感需求浮出水面
    4、讓用戶情感需求洞察成為可能——Censydiam用戶動機分析模型 4.1 馬斯洛需求層次理論在分析用戶行為動機上的不足 傳統的用戶動機研究往往基於美國社會心理學家、人格理論家和比較心理學家亞伯拉罕·馬斯洛的需求層次理論,這個理論大家也相當熟悉咯,所以下面只簡單聊幾句,不太明白的可以去網上搜索。
  • 誰發明了表情和情感符號?
    © Onedio利維坦按:就我們目前主要基於線上聊天的語言形式,表情包的應用實際上已經大大改觀了我們情緒和情感的表達,這幾乎成為不爭的事實。簡而言之,他認為添加標點符號是一種低級的寫作形式,演說這段文字的人應該僅基於字詞就能夠理解,而無需藉助符號。奇怪的是,大約在七八世紀,基本的標點符號被引入一千年以後,單詞之間的空格才變得普遍。《正字法》(Orthographiae ratio)。
  • 2020年 第1期 | 專題前言:突發事件應急情報分析
    本期的四篇專題論文是教育部哲學社會科學研究重大課題攻關項目「提高反恐怖主義情報信息工作能力對策研究」的階段性成果,從突發事件防控理論研究、輿情監測與畫像、情感分析等多個視角展開研究。《面向企業輿情監測的事件畫像與高危人群預測研究》一文基於事件信息結構表示理論,構建面向企業輿情監測場景的事件畫像體系,通過追溯用戶的歷史行為數據,採用多種語義挖掘算法及邏輯回歸預測模型刻畫事件背後的高危人群特徵,勾勒企業輿情相關的事件特徵以及推動事件進程的關鍵人群特徵。
  • 青年圈群脈動的媒介感知與文化詮釋——基於「飯圈」現象的敘事分析
    「飯圈」演化特徵識別基於新聞議題共現的詞雲主題從宏觀層面描摹出近五年的「飯圈」群體畫像,為進一步明晰「飯圈」群體媒介鏡像「他者化」的內在機制和外在表現,本研究對相關新聞文本的突變詞進行進一步識別和分析。
  • 微博核心傳播者挖掘與傳播規模預測研究
    以下為「核心用戶挖掘與傳播規模預測」選題優秀作品《社交媒體時代核心用戶識別與傳播規模預測分析》,由來自中國傳媒大學「豬頭DD的BoysandGirls天天有錢」精彩呈現。一、引言作為一種基於用戶關係信息分享、傳播以及獲取的社交平臺,當前微博已成為中國最重要的公共空間,而微博的核心傳播者起著輿論引導甚至改變輿情發展方向的重要作用。
  • 教師即時性和臨場感對學生情感學習、認知和動機的影響——基於在線學習情境的思考
    以699名自願參與調查的大學生為研究對象,運用雙變量相關分析、多元回歸分析、方差分析(ANOVA)等方法,對教師即時性、教學臨場感、學生情感學習、認知和動機等五個方面的量表收集的信息(包括年齡、性別、分類、在線課程體驗和課程類型等)進行分析處理發現,在學生情感學習、認知與動機方面,教師即時性和臨場感的線性組合與學生情感學習、認知與動機的因變量存在顯著差異,但教師即時性未被證明是重要的個體預測因子,而教學臨場感被證明是重要的個體預測因子