語言學運用、LSTM+DSSM算法、多模態情感交互

2020-12-13 騰訊網

  新智元報導

  編輯:張乾

  【新智元導讀】目前,金融業智能客服創業公司大量湧現,一方面說明行業整體技術壁壘較低,另一方面,也說明智能客服的在金融領域的應用商業場景還有巨大的開發空間。如何在構建技術壁壘的同時開發更多的商業場景,是創業公司能夠脫穎而出關鍵。

  目前,人工智慧已經在金融領域滲透:智能客服、智能投顧、人臉支付、智能安防等,已經進入商業化階段。在這些應用場景中,智能客服屬於獲客機會最大的業務。

  埃森哲(Accenture)去年的《全球消費者消費渠道與市場調研》顯示,在銀行、保險等金融行業,有七成的消費者願意選擇人工智慧客服為他們的消費決策提供建議。正因如此,市場上湧現出大量的智能客服創業公司。

  創業公司廣泛存在一方面說明行業整體技術壁壘較低,另一方面,也說明智能客服的在金融領域的應用商業場景還有巨大的開發空間。如何在構建技術壁壘的同時開發更多的商業場景,是創業公司能夠脫穎而出關鍵。

  三大痛點:傳統NLP方法對意圖和語意理解不足、缺少深度學習訓練模型數據、無法精確感知用戶情緒

  通常意義上的智能客服系統有語音客服、文字客服兩大形態,其核心技術主要由語音識別、自然語言處理、語音合成組成(部分還涉及到計算機視覺)。其中語音識別與語音合成技術相對比較成熟,但中文的語義理解由於漢語自身的複雜性(諸如分詞、歧義、缺乏形態變化、結構鬆散等),技術難度較大,也被很多業內人士譽為人工智慧皇冠上的明珠,也是能否實現高質量人機互動的關鍵。

  智能客服系統框架(圖據恒生研究院)

  對於智能客服機器人而言,語義理解與意圖識別決定了對話機器人的回答準確率。隨著深度學習在自然語言處理中的運用,訓練數據的質量也成為了智能客服開發的關鍵。特別是服務於金融、電商等垂直行業的智能客服,相關領域的對話訓練數據的質量直接決定了深度學習模型的訓練質量。深度學習的運用也成為區別新一代智能客服區與傳統以關鍵詞、模版為核心的問答機器人的關鍵。

  另一方面,客服知識庫是智能客服的核數據,它存儲了所有的問題和相應的答案。用戶的提問,將匹配到知識庫中的問題,從而將正確的答案返回給用戶。知識庫的好壞直接決定了智能客服的服務質量和用戶體驗。

  回到金融領域,智能客服的應用解決了金融企業有限的真人客服與龐大的用戶服務需求之間的矛盾,以及24小時在線的問題。通過智能客服還能將海量的用戶對話數據轉化為業務洞察,為後端的精準營銷與持續的業務優化提供參考依據。

  不過,智能客服在金融領域的應用仍然面臨一些挑戰:

  1、由於金融領域涉及的專業知識與詞彙較多,傳統NLP方法無法準確理解語義與客戶意圖。

  例如,客戶問「中國聯通的股票據說要跌?」在分詞上,普通的NLP可能會將這句話分為中國聯通的股/票據/說要跌?。分詞上的錯誤會直接影響到語義的準確理解,讓智能客服無法理解問句背後的真實意圖,並作出回答或處罰某些技能和服務。

  2、缺乏深度學習模型訓練數據。

  單純從業務數據上來講,金融的數據尤其是交易信息數據非常大,這跟金融業務信息化較早有關。但用戶的業務諮詢數據、客服數據、金融產品的導購對話數據,長期沒有得到充分重視,也缺乏積累和開發,因此可用來進行深度學習的訓練數據並不充裕。

  3、無法精確感知客戶情緒(如電話客服系統)。

  金融領域,人類情緒極易隨著金融行業市場的波動而起伏不定,經常難免帶有情緒與客服溝通,因此帶有情感識別與分析的人性化人機互動體驗就顯得更為重要。當智能客服普遍沒有感情時,一個稍微有些「感情」的智能客服系統就會更容易被選擇。

  技術新招:語言學運用、LSTM+DSSM算法、多模態情感交互等

  針對前述問題,在語義理解方面,目前比較新銳的做法是以傳統的NLP技術打底,加上語言學結構,結合新的機器學習、深度學習、以及金融知識圖譜的方法,融合地去把整個語義理解抽象化後做降維。

  目前使用上述方法的竹間智能,其語義理解算法包含言外行為分析、語義角色標準、命名實體識別等四十餘個模塊,且已迭代至第四代,嘗試了對抗生成網絡等眾多新方法。真正做到金融領域的語義層面的抽象和理解,而不是單純字詞層面的分析。

  同時,竹間智能還在金融對話機器人中大範圍的利用深度學習。從分詞、詞性、語法解析、信息抽取等基礎模塊,到自然語言生成、機器翻譯、對話管理、知識問答等高層的NLP領域,幾乎都可以應用以CNN、RNN為代表的深度學習模型,並取得不錯的效果。

  智能客服眼下已是各大服務平臺的標配,但多數客服更接近於一個搜尋引擎,將用戶輸入的關鍵詞與資料庫的相關答案匹配。對於口語化的提問,這樣的智能客服往往很難給出「智能」的回答。螞蟻金服的LSTM+DSSM

  (Long Short-Term Memory + DeepStructured Semantic Model)算法能夠對用戶語義和意圖進行很好的理解。用戶問題回答得越多,越精準,尤其對於口語化、表述不夠完整的提問,機器能夠主動理解。

  例如,當用戶向支付寶智能客服提問「如何退款?」時,這種沒有上下文的問詢,也意味著沒有場景。通過LSTM對用戶行為軌跡做一個編碼,通過深度排序模型,結合用戶之前的歷史操作,系統能夠判斷用戶的訴求更接近「轉帳到帳戶轉錯了怎麼辦?」,而不是「為什麼銀行卡轉帳被退回來了?」。

  同時,用戶來到客服解決問題,往往並不明確自己的問題所在,因此他們的提問也往往很模糊,甚至存在很多缺失的信息。這個時候,反問就很重要,可以通過多輪的交互,來逐步明確用戶的真實訴求。

  多輪交互一直是對話系統一個很大的挑戰,傳統的基於語言理解和對話狀態跟蹤的多輪對話技術並不適用於客服知識問答。螞蟻金服用問題結構化的思路來解決客服多輪對話,通過算法輔助以人工,對客服知識庫中的每個問題進行結構化,搞清楚每個問題是由哪些要素構成的。對用戶的提問我們同樣識別其中的要素,看看可以匹配到知識庫中的哪些問題。如果發生了要素缺失,就反問用戶,讓用戶進行補充和確認。

  針對金融領域對話機器人深度學習模型訓練數據的缺乏,遷移學習是一個有效的嘗試。遷移學習的目的是從一個或多個源任務(source tasks)中抽取知識、經驗,然後應用於一個有相關性的目標領域(target domain)中去,從而實現在金融領域跨行業、跨領域的知識學習。

  目前,竹間智能嘗試使用遷移學習方法,讓對話機器人能夠跨領域、跨行業學習。尤其當金融類客戶在客服、導購等領域面臨訓練數據缺乏時,在竹間現有訓練過的模型基礎上做遷移學習可以很大程度上提高模型的性能,達到更好的機器學習效果。

  由於情感在人類信息溝通中的意義重大,所以情感計算也是實現人性化的人機互動中必不可少的組成部分,情感識別與理解技術也正逐漸成為人機互動的基礎性技術之一。

  竹間智能嘗試建立起了一套多模態的情感情緒交互模型來解決情感計算的問題。通過找到人機對話中隱藏的信息狀態並加入到計算中,並結合內外部的多模態設計,即文本+emoji+照片+表情包+文本長度等,與外部的多模態,即加入面部表情識別+語音情緒識別+提供的標籤(比如性格,星座,愛好,年齡,性別等),來實現更深的的語義理解和多模態情感交互分析,從而達到人機互動過程中對人更深層次的理解。

  竹間多模態情感識別展示傅園慧視頻

  此外,在知識庫構建方面,對於傳統的知識庫而言,其構建往往依賴於人工運營,由運營專家根據自己的業務經驗來決定知識庫中會有哪些問題。這樣的構建過程需要很多人力成本,後期維護成本也很大,而且並不能發現用戶的真實訴求。螞蟻金服的做法是從過往海量的客服對話記錄中,通過文本聚類算法,將相似的問法找出來,形成很多聚類,每個聚類就是一個用戶關心的問題。

  這樣的做法還有一個額外的收益就是,聚類算法本身找到了每個問題所有可能的問法,這樣就為在線的問題匹配提供了寶貴的數據,用戶的提問只要模糊匹配到某個問題的任何一個問法,就可以知道用戶想問的是這個問題,這樣極大的提升了客服問題匹配準確率。這樣一個基於數據挖掘的知識庫一直處於自學習的狀態, 就可以持續的提升智能客服的效果。

  從幕後走向臺前:智能客服打開更多營銷空間

  客服部門是銀行業務中勞動密集型部門的之一,一家中等規模以上的銀行甚至有數千名員工接聽客戶電話,人工智慧可以大幅降低金融業務成本,提升業務效率。

  據21世紀經濟報導,光大銀行電子銀行部總經理楊兵兵曾表示,人工智慧在銀行業務中最早的應用便是智能客服。光大在引入智能客服後,「最近三年每年呼入的話務量有10%的速度增長,但是三年來我們沒有增加一名客服。」楊兵兵說,去年光大銀行的話務中有近60%是模擬人工服務。

  同時,隨著人工智慧在客戶服務領域的不斷拓展、網際網路獲客成本越來越高,智能客服逐漸由售後轉向售中和售前,承擔起更多企業營銷任務。

  竹間智能CEO簡仁賢介紹,竹間智能將售後、售中、個性化交互三者結合,可以形成端到端的解決方案。

  去年底,興業證券優理寶App上線「小興機器人」智能客服,它背後正是竹間AI證券機器人解決方案,幫助其實現了智能客服、投資者教育、產品諮詢、多輪對話與上下文記憶在內的一系列服務與功能。

  「小興機器人」智能客服

  簡仁賢還透露,在今年第一季度將推出新版的財富管理機器人,將對話機器人實現投資者教育、智能投顧、財富管理。目前,竹間智能的收入主要來源於對話機器人應用,如智能客服、導購機器人、企業助手、個人助理、語義理解、情感情緒分析等,並有望靠自身業務在2018年實現全年的收支平衡。

  著名呼叫中心運營及顧問培訓專家、亞太客服與呼叫中心聯盟APCCAL的發起人以及客戶世界機構(CCMWorld Group)的創辦人趙溪認為,人工智慧完全替代人工客服還為時尚早,但是會對結構化、標準化的客服工作進行替代,這有非常大的市場潛力。

  「客服中心是企業對內對外數據整合的一個平臺,有大量的數據,因此在大數據的背景下,有更大的挖掘的空間。」趙溪說。

  此外,圖像識別等技術也越來越多的應用到智能客服中,豐富和拓展了金融客服的場景。螞蟻金服資深算法專家張家興介紹,去年7月,螞蟻金服份發布車險的圖像定損功能,今後用戶有望直接通過手機拍攝圖片,就知道事故車的損害情況以及賠付金額。

  「拍照定損對保險業的衝擊來說是根本性的,它整個改變了保險業理賠的工作模式。」張家興說,拍照定損將來還能廣泛應用到生鮮電商等多個領域。

  加入社群

  此外,新智元AI技術+產業領域社群(智能汽車、機器學習、深度學習、神經網絡等)正在面向正在從事相關領域的工程師及研究人員進行招募。

  加入新智元技術社群,共享AI+開放平臺

相關焦點

  • 情感計算是人機互動核心?談深度學習在情感分析中的應用
    由於情感在人類信息溝通中的意義重大,所以情感計算是實現人性化的人機互動過程中必不可少的部分,情感識別與理解技術也是人機互動的基礎性技術之一。在此基礎上,「需求分析」、「深度用戶建模」、 「情感表達」、「人性化交互體驗」等更深入的互動設計才能成為可能。
  • 36氪首發 | 多模態情感識別讓機器更「懂」人類,「竹間智能」獲...
    、文本這類形式進行識別,鮮少有人觸及多模態情感識別。而自創立之初,竹間智能就將文本、語音、圖像等信息相整合進行識別和計算,從而提升機器感知能力,建立和優化多模態人機互動技術。 舉例來說,竹間智能曾與夏普旗艦店合作,當客戶走近產品附近,安裝在產品附近的攝像頭可採集用戶的表情、眼神、肢體數據,繼而竹間的情感識別機器人會「讀懂」用戶行為,並和用戶進行語音對話。 那這是如何做到呢?
  • 多模態研究:認知語言學的新方法
    多模態研究:認知語言學的新方法 2017年09月12日 07:39 來源:中國社會科學網-中國社會科學報 作者:王中祥 字號 內容摘要:所謂多模態研究,是指通過多種技術手段記錄人際交流過程中不同類型的模態數據
  • 德國漢堡科學院院士張建偉:人工智慧交互的未來是多模態共享模式 |...
    如果是在學習的語料裡頭有情感,機器人就會具有情感,但是人工智慧真正具有情感還有很多強人工智慧的挑戰。另外機器人閱片也是人工智慧的一個比較實用的方向。首先讓機器人學習大量的肺病的數據,然後和15個最強的醫生進行比拼,最後顯示機器人在這種有限環境裡的大數據的學習情況非常強,在非常小的細節的最後的識別方面,機器人戰勝了15個最強醫生的團隊。
  • 專欄 | 情感計算是人機互動核心?談深度學習在情感分析中的應用
    由於情感在人類信息溝通中的意義重大,所以情感計算是實現人性化的人機互動過程中必不可少的部分,情感識別與理解技術也是人機互動的基礎性技術之一。在此基礎上,「需求分析」、「深度用戶建模」、「情感表達」、「人性化交互體驗」等更深入的互動設計才能成為可能。拿深度建模來說,通過和人聊天,AI 可以用情感分析對實體進行高效率的自動化標註,實現專屬的情感詞典。
  • 基於機動LSTM的周圍車輛多模態軌跡預測
    本文提出了一種基於LSTM模型的高速公路周邊車輛交互感知運動預測模型。我們的模型為車輛進行機動分配置信值,並在此基礎上輸出未來運動的多模態分布。我們比較了我們的方法與現有技術的車輛運動預測的公開有用的NGSIM US-101和I-80數據集。我們的結果表明,在預測誤差的均方根值方面有了改進。
  • 人機互動新突破:百度發布主動多模態交互技術
    工作原理解釋百度提出的TFVT-HRI框架,是業內首次嘗試將主動交互擴展到集表情、動作、豐富話術於一體的多模態交互模式。通過目標檢測器,將可能對主動交互產生影響的相關物體,提取為涵蓋視覺以及相對空間信息的視覺標記(visual tokens),然後利用Transformer網絡學習一段時間內visual tokens之間的關係,從而實現對交互主體的時空建模,預測該交互主體是否有潛在交互意願,當前幀合適的多模態動作是什麼。
  • 專訪俞棟:多模態是邁向通用人工智慧的重要方向
    而騰訊作為業界關注這一研究方向的代表之一,自 2018 年 2 月就開始關注多模態方向的研究,並於 2018 年 11 月宣布探索下一代人機互動方式:多模態智能。與此同時,俞棟博士也解釋了為什麼多模態是人機互動的發展趨勢的原因,主要有四點:第一,多模態交互能夠讓人類在不同的場景下可以選擇不同的模態組合進行交互,進而從整體上提高人機互動的自然度;第二,在多模態技術下,一個模態可以補充另一個模態的弱點,從而能夠通過融合多個模態的信息,獲得更精確的用戶、情感、場景、和發聲人位置估計;
  • 提純算法:COINV模態參數識別新算法
    提純算法是目前所有模態識別算法中,唯一對密集模態參數識別能達到實時級的算法。MIMO試驗只要參考點數量合適,即使能量佔比很小的模態,通過提純算法也可得到非常協調的模態振型,精確的模態頻率和阻尼。提純算法尤其適用於耦合嚴重的超大阻尼模態試驗,提純後的FRF已完成了模態解耦,能直觀顯示模態的頻率和阻尼。飛機地面振動試驗 (GVT) 之一為純模態試驗[1] 。
  • 鄧力、何曉冬深度解讀:多模態智能未來的研究熱點
    這本特刊從五十多篇投稿中精選匯集了10篇高水平論文,涉及跨文本、圖像、視頻、語音等多模態的各種多元互補的深度學習算法。論文的最後分別對多模態知識學習、多模態情感智能以及任務導向的大規模複雜多模態人機互動系統等前沿方向的發展進行了展望。當前已經出現了一些具有多模態信息的資料庫,比如MS-Celeb-1M,其中包含了百萬級世界知名人物的面部視覺信息及人物實體對應的諸如職業、生平等相關知識信息,可用來支持跨模態的知識學習並強化圖像字幕生成等應用。
  • 多模態:翻譯研究的新視角
    ,也加速打破了語言學的認知藩籬,多模態話語分析理論(multimodal discourse analysis)於20世紀90年代在西方應運而生。因此,翻譯活動本身包含著多模態信息傳遞的內容,我們借鑑多模態話語分析的理論與成果來考察翻譯產品與過程,作為翻譯研究的新視角,具有其內在的合理性與可行性。從多模態的視角切入翻譯實踐和研究,我們能夠得到更多新的發現與收穫,從而豐富和完善翻譯研究的分支,同時也是對多模態話語分析這一語言學理論的開發與拓展。
  • 專訪| 入選福布斯榜單之後,俞舟和我們聊了聊「多模態對話系統」
    這個系統叫做 HALEF,基於實時的多模態對話系統,能通過接受不同模態的信息實現更好的人機互動。這套系統的發明者是加州大學戴維斯分校(UC Davis)的助理教授俞舟,也是該校的語言、多模態和交互實驗室(the Language, Multimodal and Interaction Lab)的主管。
  • 如何運用多模態課件培養學生的英語綜合能力
    本期,江蘇常州市蘭陵中學錢欣老師將分享自己如何在英語閱讀教學中運用多模態課件培養學生「聽、說、讀、看、寫」的英語綜合能力,以及實踐操作後的回顧與反思,希望有益於廣大一線教師的教學、教研提升。
  • 深思考楊志明:多模態語義理解能推動人工智慧大規模落地|2019 WISE...
    深思考專注語義理解15年的時間,目前在多模態語義理解方面取得了一些進展,在智慧營銷、智能終端落地了相關技術。對於多模態語義理解的AI落地,他們又有怎樣的見解和經驗分享?以下是深思考CEO AI算法科學家楊志明的演講實錄,36氪編輯整理:各位大家上午好!
  • 新高中英語課標新增的語言技能「看」與「多模態」
    新高中英語課程標準下的新增的語言技能「看」與「多模態」2017新版高中英語課程標準對高中英語的英語語言技能內容目標做了新的改革和創新,其中指出:語言技能是語言運用能力的重要組成部分。語言技能包括聽、說、讀、看、寫等方面的技能。聽、讀、看是理解性技能,說和寫是表達性技能。
  • 模態分解算法「一」EMD算法介紹
    模態分解相關的算法有以下幾類:IMF 固有模態函數EMD經驗模態分解EEMD集合經驗模態分解CEEMD 互補集合經驗(EEMD的標準形式)CEEMDAN自適應噪聲完備集合經驗模態分解VMD 變分模態分解本篇主要介紹EMD算法IMF的定義:將待研究的信號分解為一個個單分量信號
  • 一文讀懂「情感計算」在零售中的應用發展
    竹間智能多模態交互系統隨著5G時代到來,移動智能端與人們的生活、工作、學習的關係越來越緊密,從而可以通過多種智能終端來收集情感計算所需的多模態數據,這將有利於訓練多模態情緒識別的算法模型,而多模態的數據融合可以對情緒信息互相補充,能夠保證識別情緒的準確性。
  • NLP入門(十)使用LSTM進行文本情感分析
    情感分析簡介  文本情感分析(Sentiment Analysis)是自然語言處理(NLP)方法中常見的應用,也是一個有趣的基本任務,尤其是以提煉文本情緒內容為目的的分類。它是對帶有情感色彩的主觀性文本進行分析、處理、歸納和推理的過程。  本文將介紹情感分析中的情感極性(傾向)分析。所謂情感極性分析,指的是對文本進行褒義、貶義、中性的判斷。在大多應用場景下,只分為兩類。
  • AI賦能產業不能只靠算法 深度融合將成未來發展方向
    在近日舉行的海南自貿區(港)「陸海空」科技創新和產業發展國際合作交流大會上,德國漢堡科學院院士、漢堡大學多模態技術研究所所長張建偉教授表示。人工智慧是新一輪經濟社會變革的核心驅動力,未來技術與顛覆性創新將為人工智慧在各種場景應用提供技術支持。張建偉表示,計算機、腦科學、心理學、語言學的交叉發展以及與國際先進科研組織的合作,為當下人工智慧發展提供了更好的條件。
  • ​這可能是「多模態機器學習」最通俗易懂的介紹
    目前比較熱門的研究方向是圖像、視頻、音頻、語義之間的多模態學習。多模態學習從1970年代起步,經歷了幾個發展階段,在2010後全面步入Deep Learning階段。人其實是一個多模態學習的總和,所以也有」磚家「說了,多模態學習才是真正的人工智慧發展方向。