全文共6077字,預計學習時長16分鐘
最近,筆者參加了首屆情感AI大會,本次大會由自然語言處理(NLP)、文本分析、情緒分析及其商業應用領域的首席分析師和商業顧問SethGrimes組織。15年前筆者也有幸參加了Seth組織的第一屆文本分析峰會,他組織的下一個會議CXEmotion將於7月22日在線上舉行。
來自美國、加拿大和歐洲工業界和學術界約70人(包括演講者和小組成員)出席了這次會議。
本次會議的主題是:什麼是情感AI?為什麼它很重要?我們需要了解什麼?繼續閱讀本文,你將找到答案。但首先,讀者需要了解一些背景知識。
情感是人類智慧和決策的基石
人類是高度情緒化的生物,即使大多數時候沒有意識到,情緒也會影響人們所做的一切:引導注意力、影響學習和記憶的方式、對自己和他人的感知、最終影響個人成長以及人格形成。正如AI和深度學習的教父之一Yann LeCun所說:「沒有情感就不可能擁有智能。」
情感在高度個人化的同時也是社會化的。一般來說,對他人和對自身行為的情感反應是嬰兒期學習的第一件事。這也是人們喜歡講故事,以及故事對於學習、影響和啟發他人、鼓勵行動和變革都非常有效的原因。
在一個結構合理的故事中,情節(敘事弧)與角色的情感演變(情感弧)緊密交織在一起,形成了「敘事+情感」的雙螺旋。再者說,歷史、政治和新聞及其內含的情感,如果不是真實或虛構的故事集,又是什麼呢?
人們一生持續以微妙或不那麼微妙的方式受到情感的支配。會議演講者之一,TrueImpact的黛安娜·盧卡奇提到:「人們說出自己的想法,並根據自己的感受採取行動。」
因此,神經學研究和情感設計多年來一直是市場營銷、廣告、產品、服務和網站設計的主要內容,這也就不足為奇了。情感會促使用戶點擊連結購買產品,或者像設計者所期望的那樣,在網站上跟隨情感軌跡選擇推薦產品。
情感AI試圖理解、複製和模擬人類情感
多年來,在人工智慧領域,研究人員和從業人員一直在研究模仿和探索人類情感的方法。
1995年,麻省理工學院媒體實驗室教授羅莎琳德·皮卡德發表了一篇題為「情感計算」的文章,這一領域開始興起,並催生出同名新學科,情感人工智慧由此衍生而來。情感AI的目標是什麼?通過機器理解、複製和模擬人類情感。
情感計算和情感AI融合了許多技術和應用領域。例如,麻省理工學院的情感計算團隊「旨在彌合人類情感與計算技術之間的鴻溝」。
其項目範圍包括:在出現任何明顯的外部跡象之前,尋找預測和預防抑鬱的新方法;為面臨溝通、動機和情緒調節方面的問題,且有特殊需求的群體發明輔助方法;使機器人和計算機能夠接收自然的情感反饋並改善人類體驗。
以上示例只涉及了皮毛,在該實驗室的網站上還有更多的項目、應用程式和用例。
情感分析趨向多模態
情感分析作為情感AI的一個領域,最早在21世紀初就存在了。情感分析通常是對文本數據進行的,例如電子郵件、聊天、社交媒體帖子或調查回復。它使用NLP、計算語言學和文本分析來推斷文本作者的積極或消極態度(又名「導向」 ):人們對你的品牌、你的產品或服務表達了肯定還是否定?
情緒分析的常見應用包括品牌/聲譽管理(尤其是在社交媒體上)、推薦系統、基於內容的過濾、語義搜索、淡化用戶/消費者意見的重要性,以及告知產品設計的需要、分流客戶投訴等。
會議的幾份報告都關於這個主題,儘管最近在NLP和相關領域研究取得了進展,但這仍然是個難題。伊利諾伊大學芝加哥分校的計算機科學教授劉冰說,這主要是因為,甚至人類基本情感的構成要素和其數量,研究人員也沒有達成一致意見。
眾所周知,由於情感的模糊性、可替換性、重疊性和相鄰性,其很難被識別和編碼(標籤)。例如,一個人可以同時感到憤怒、悲傷和厭惡。
此外,情感並不總是容易抑制的。清晰、明確的標籤也很重要:人工智慧——或者至少70%被稱為監督學習的人工智慧——依賴於被人類標記( 「注釋」或「標記」 )的數據。這就是機器學習的方式(因此名為「監督」 )。
劉教授解釋說,情感傳遞的方式也很複雜。說話時,情感通過廣泛的語言和副語言線索進行交流,如語調、面部表情、身體動作、手勢和姿勢,以及生理信號(出汗、皮膚發紅等)。
在寫作中,通過標點符號、大寫、表情符號和其他創造性的表達方式來表達,例如,單詞加長(例如,「soooo slow」 or「so sloooow」)。除此之外,還有單詞選擇和語法。
人們表達情感的方式也存在文化差異。更複雜的是,有一種現象被稱為「認知差距」,人們所說的和他們真實的感受並不總是一致的。原因有很多:他們試圖禮貌地表達或者避免傷害別人的感情,又或者他們只是試圖隱藏自己的情緒。
劉教授說,上下文和多模態數據可能有助於解決許多此類歧義。事實上,隨著生物識別技術和可穿戴設備的發展,該領域已經擴展到從傳感器數據分析情感,包括心率、溫度、腦電波、血流和肌肉生物信號,以及聲音、面部表情、圖像和視頻。
戰略專家和「技術情感學家」帕梅拉·帕夫裡斯卡克預測,除了面部識別技術(FRTs)和觸覺/觸覺數據之外,這種利用傳感器的趨勢將繼續發展。FRTs最近因為隱私問題而受到抨擊。由於疫情影響,目前觸摸相關數據是「不可行的」。
可穿戴設備可以用來識別情感嗎?
弗羅茨瓦夫理工大學的Przemysaw Kazienko教授進行的薈萃分析著重於可穿戴設備,並試圖回答以下問題:它們可以用來識別日常生活中的情感嗎?他認為:「如果我們能做到這一點,那我們就可以改善患有易改變情緒的疾病的患者的健康、福祉和臨床結果(以腎功能障礙為例)。」
我們還可以將可穿戴設備用於壓力控制、心理健康和自閉症的治療。麻省理工學院媒體實驗室開發了一款應用程式,通過監測一個人的心跳來檢測他們是否正在經歷壓力、痛苦或沮喪等負面情緒,並釋放一種氣味來幫助佩戴者應對。
人們也可以利用從可穿戴設備檢測到的情緒來實現「傳統」個性化和產品/服務的改進:從在線內容和產品推薦到虛擬助手和遊戲體驗。他說,來自可穿戴設備的情感數據還可以用來防止車禍,追蹤學生的注意力從而提高學業成績,以及改善社交互動等。
帕夫裡斯卡克女士與勞倫·李·麥卡錫和凱爾·麥克唐納合作的US+項目對改善社交互動進行了說明。US+是「一款谷歌環聊(Hangout)視頻聊天應用,利用音頻、面部表情和語言分析來優化對話。」
該應用程式分析用戶所說的內容以及他們是否使用常見的詞彙和句子結構,隨著對話的進行,人類傾向於這樣做(這被稱為「語言風格匹配」)。對於每個聊天參與者,該應用程式都會顯示一個快速的可視化窗口和彈出通知,例如:「別老談論自己」或「你在隱藏什麼?克萊爾說得更誠實」。當對話失去平衡時,它甚至可以自動引導參與者。
帕夫利斯卡克女士在主題演講「為情感智能的未來而設計」中,還有許多有趣的情感數據和情感分析應用程式。會議現場的所有錄像都可以在會議網站上以200美元的價格購買,對於購買者所在組織中其他人來說則是100美元的折扣價,筆者強烈建議您觀看。
回到先前的問題上來,「可穿戴設備可以用來識別日常生活中的情緒嗎?」 Kazienko教授的結論是:「可穿戴設備的情感識別是個性化情感計算的未來。我們需要更多實地研究、更多更好的數據、研究人員之間的積極合作、如何分類情緒的通用模型、數據和代碼共享,以及其他一些事情,來提高識別質量和重現性。」
利用情緒讓人工智慧聽起來像人(並像人一樣行動)
隨著越來越多的體驗和日常生活受到人工智慧的影響,人們越來越希望人工智慧在外觀、感覺、聲音和行為反應上能像人類一樣,或許是因為人類總體上不像機器那麼可怕,亦或因為人們的想像力受到自身生理特徵的限制——類似於薩丕爾-沃爾夫假說(Sapir-Whorf hypothesis),該假說認為語言的結構影響著使用者感知世界的方式。
再或許是因為人類喜歡按照自己的形象和喜好重塑世界。你看過波士頓動力公司的機器人Atlas表演體操嗎?在其收穫的所有的機械領域的榮耀中,Atlas表現得還不錯,但該公司的無頭機械狗卻相當令人不安……
現在試想一下,如果Atlas會說話,你希望它的聲音聽起來是怎樣的。雖然它還不能,但人們與聊天機器人和虛擬助手的互動越來越多。
諮詢公司Rain的首席體驗官格雷格· 赫奇斯表示,如果我們可以向機器灌輸同理心,它們可以提供更好的消費者品牌體驗,並以此來建立熟悉度,更牢固的聯繫和更深的信任。他的公司為耐克、星巴克、蒂芙尼、汰漬和芝麻街等品牌創造了「情感智能語音體驗」。
從聊天機器人到「情感聊天機器」?
既然可以從具有情感意識的AI中獲得潛在的大額商業利益,那麼「情感智能」聊天機器人成為熱門研究領域也就不足為奇了。上文提到的劉教授正在努力「創建可以感知和表達情感並在對話中不斷學習的聊天機器人」,他稱它們為「情感聊天機器」。
他說:「情商是人類智力的重要方面」。研究表明,有情感的對話系統可以提高用戶滿意度。表達同情心的聊天機器人可以減少用戶的沮喪感和壓力,它們減少了對話中的故障。他還表示,它們還可以激勵人們合作而不是為「愚蠢的機器」而憤怒。
微軟首席研究員丹尼爾·麥克杜夫說:「與模仿人類風格的系統互動起來更自然」,他的團隊正在建立具身代理和其他一些項目。我們人類不斷適應彼此,這種適應創造了社會凝聚力。隨著時間推移,當人們與虛擬實境代理互動時,人們同樣會嘗試適應其風格。因此,虛擬代理和聊天機器人將需要適應人類。
在商業領域,情感型聊天機器人可能意味著更高的客戶滿意度和更低的成本,因為聊天機器人將能夠處理大多數問詢,並解放人工操作員,他們僅需參與不太常見或更複雜的互動,尤其是在當前危機時期。
在世界衛生組織宣布這種新型冠狀病毒為全球大流行病的兩個多月後,銀行、保險公司、主要零售商和政府辦公室的電話線路仍然擁擠不堪。
IBM提供了沃森助手幫助政府部署聊天機器人,其聊天機器人平臺的流量增長了40%;谷歌立即推出了自己的快速響應虛擬代理,以「快速構建並實現定製的呼叫中心AI虛擬代理,以響應客戶通過聊天、語音和社交渠道提出的關於COVID-19的問題。」
還沒結束……
要注意供應商的承諾。一般來說,聊天機器人需要大量的訓練和腳本,因此成本可能不會明顯降低——成本取決於組織的規模和數量、用例的類型和複雜性,以及其他參數。「情感感知」聊天機器人給聊天機器人技術增加了另一層複雜性和挑戰。以下是劉教授提到的幾點:
· 這種具有情感感知能力的聊天機器人和虛擬實境設備所依賴的情感標記數據很難獲得到訓練機器所需的規模。
· 注釋(即標籤),如果可用,是主觀的,且分類可能不準確。與AI和其他依賴數據的應用程式一樣,「胡亂輸入,胡亂輸出」。
· 具有情感功能的機器人還必須能夠在理解與之交談的說話者的情感與產生自己的情感和語言反應之間取得平衡。這確實很難做到,因為這兩個過程之間存在明顯的依賴關係,並且需要幾乎同時發生。
· 所有這些在所謂的「開放領域」中變得更加困難,不受機器人用例、應用領域、行業等的限制。
劉教授對具有情感意識的聊天機器人的看法是:「帶著情感聊天對於對話系統至關重要」。但其仍存在大量質量問題,這項技術還沒有準備好進入蓬勃發展期。
確實有部署帶有情感的聊天機器人的例子,但是這類機器人主要基於規則——根據腳本做出反應,自身並沒有智能。這些機器人也受到領域的限制:它們通常應用於較窄範圍,如客戶服務或作為情感伴侶。他說:為了創造更多的類似人類的「情感聊天機器」,我們需要在多模式情感檢測和生成方面做得更好。
情感啟發式機器學習
大會上最有趣的部分是微軟首席研究員丹尼爾·麥克杜夫的主題演講,他提出了一個問題:「機器學習如何利用情感來學習和探索?」他談到了「內臟機器」,即機器學習/人工智慧系統應該具有與人類相似的情感機制,或者至少它們應該能夠基於上述原因建立情感模型:我們希望技術能像人類一樣與我們互動。
但是還有另一個原因。麥克達夫先生說,情感幫助我們理解和探索世界,對於了解冒險、取得積極成果等的意義至關重要。當我們與世界互動時,我們會收到積極或消極的回應,引導我們採取進一步行動。如果我們可以將情緒整合到機器學習系統中以幫助其接收信息,會有怎樣的效果?
他展示的示例是利用駕駛員的心跳來指導機器學習。心率是我們表達和體驗情感的一種方式。其他方式包括生物學層面的變化:體溫的變化,瞳孔和血管的擴張/收縮以及血流、呼吸和腦電波的變化,唾液分泌的增加/減少、激素和消化酶的分泌等等。
麥克杜夫先生的團隊利用駕駛員心跳所表達的情緒反應來訓練神經網絡模型駕駛汽車,結果是該模型能夠駕駛車輛的時間比最先進的無情感因素模型更長。
他的團隊還研究了如何應用情感(或者說人類生理反應數據)來教機器避免車禍,本特殊案例利用了人類司機的面部表情,似乎也起了作用。他們的下一個項目希望「結合各種情感反應信號、風險規避和好奇心,推動機器以安全的方式進行更多探索。」
我們的看法
俄語中有一句諺語,大意是:當我們遇見一個人時,我們根據其穿著來判斷他們;當他們離開時,我們根據其智力來判斷他們。這也許是一個罕見的古老民間智慧不符真理的場合——人們通常不記得你穿過或說過或做過什麼,但他們記得,你帶給他們的感覺——換句話說,就是你的情感。
情感會影響個人和群體層面智力和行為的各個方面。總體而言,它們決定了市場行為、社會凝聚力、地方和全球經濟的發展狀況以及國家的進步。例如,北歐人是世界上最幸福的地區之一,也是最富有的地區之一。
那麼,我們能否將情感——這一使我們成為人類的基本品質——解碼並重新編碼到機器中?通過語言、語音技術或者計算機視覺,大數據、廉價的計算能力、強大的硬體、快速改進的算法和協作/開源軟體,在過去十年中取得了巨大的成功。
情感AI的發展始於60年前,其宏偉目標是模擬人類智能,開創者認為:「如果精心挑選一組科學家一起研究一個夏天,可以在一個或多個問題上取得重大進步」。然而如現在所知,該領域變得更加狹窄和脆弱:應用人工智慧(或特定領域人工智慧)。
這是否意味著情感人工智慧太難了,我們應該放棄?儘管範圍有限,許多特定領域的人工智慧應用程式產生了巨大的商業利益和人文價值。正如情感人工智慧大會所表明的那樣,只要我們意識到該領域所面臨的挑戰並抱有理性的預期,情感人工智慧也有可能做到這一點,但這與我們人類是如此的不同。
留言點讚關注
我們一起分享AI學習與發展的乾貨
如轉載,請後臺留言,遵守轉載規範