滴滴KDD 2019 論文詳解:基於深度學習自動生成客服對話摘要

2021-01-08 雷鋒網

世界數據挖掘領域頂級學術會議KDD2019繼續在美國阿拉斯加州安克雷奇市舉行。本次KDD大會首次採用雙盲評審制,共吸引了全球範圍內約1879篇論文投遞。其中,Applied Data Science track收到約 700 篇論文投稿,最終45篇被接收為Oral論文,100篇被接收為Poster論文;而Research track 共收到了 1179 篇投稿,最終111篇被接收為Oral論文,63篇被接收為Poster論文。

今年,滴滴共有三篇Oral論文入選KDD2019,研究內容涵蓋基於深度學習方法自動化地生成工單摘要、基於深度強化學習與半馬爾科夫決策過程進行智能派單及模仿學習和GAN在環境重構的探索。

本文是對滴滴AI Labs團隊Oral論文《Automatic Dialogue Summary Generation for Customer Service》的詳細解讀,在這篇論文中,滴滴基於輔助要點序列提出了Leader-Writer網絡來幫助解決客服工單摘要生成問題,能讓客服工單摘要的自動化生成更具完整性、邏輯性與正確性。

一、研究背景

滴滴的客服每天需要處理大量的用戶進線。客服人員在解答或處理用戶問題的時候,需要按照以下流程嚴格執行:1) 了解用戶問題與訴求;2) 提供解決方案或者安撫用戶情緒;3) 記錄工單摘要。

工單摘要對於滴滴客服系統非常重要,它有兩個目的:

當工單在內部流轉,被其他客服處理的時候,工單摘要可以輔助客服來快速了解用戶問題、解決方案、以及用戶反饋等信息,進而調整自己的服務策略;質檢人員會檢查工單摘要,評估客服提供的方案是否有效,用戶是否認可,進而來判斷客服的服務質量。在自動化工單摘要系統上線前,工單摘要主要由客服手工撰寫,耗費客服大量的時間。而客服每日解決的用戶進線量很大,這導致大量客服資源的佔用;另外,手工撰寫的工單摘要存在標準不統一、錯詞漏句等情況,錯誤或者不規範的工單摘要會給使用工單摘要的其他客服人員的工作帶來負面影響。

本文主要研究如何利用深度學習方法,自動化的生成工單摘要,提高客服工作效率,進而節約客服資源。

二、問題挑戰

相對於一般的文本摘要問題,客服工單摘要有其特殊性。我們需要保證工單摘要滿足以下三個條件:

完整性:即工單摘要需要包括所有的要點;一般情況下,摘要至少要包括用戶問題描述、解決方案、用戶反饋這幾個要點。在一些場景下,還需要包括用戶聯繫方式、反饋時效等要點。邏輯性:即工單摘要中的要點需要按正確的邏輯順序組織起來。工單摘要應該先記錄用戶問題,再記錄解決方案,最後記錄用戶反饋以及後續跟進策略等。順序不正確會導致摘要難以讓人理解。正確性:即工單摘要中的核心要點需要保證是正確的,例如用戶反饋部分中的」認可解決方案」與「不認可解決方案「。由於兩者從文本相似度很高,利用End-to-End方案學習效果通常比較差。目前的抽取式和生成式的文本摘要方案均不能很好的解決這些問題;針對以上挑戰我們提出了自己的解決方案。

三、解決方案

我們提出利用輔助要點序列(Auxiliary key point sequence)來解決以上這些挑戰。要點(key point)是工單摘要中一個片段的主題,例如「問題描述」。我們通過人工總結工單摘要,整理得到滴滴場景下51個要點;詳見表1

表1:滴滴場景下的工單摘要要點(部分)

我們利用規則,從人工撰寫的工單摘要中抽取出摘要中的要點。一個摘要中的所有要點構成了要點序列(Key point sequence)。如果一個摘要在要點序列上是完整的、有邏輯的、且正確的,那麼對應的工單摘要則是完整的、有邏輯的、且正確的。同時,為了更好的區分「用戶認可」和「用戶不認可」這種文本相似度高的要點,我們將對立的要點記為兩個不同的要點。

我們將工單摘要生成問題建模成一個多任務學習問題。首先模型根據對話信息生成要點序列;然後再利用對話信息和生成的要點序列生成每個要點對應的子摘要;最後根據要點序列中的邏輯拼接子摘要即可獲得完整的工單摘要。整個流程如圖1所示。

圖1:解決方案示意圖

通過引入輔助要點序列,可以帶來如下好處:

模型通過對輔助要點序列的學習,可保證生成的工單摘要的完整性、邏輯性與正確性,保證工單摘要的質量;輔助要點序列的詞典集合小(滴滴場景下為51),序列長度一般較短(不超過10),容易生成準確的要點序列;生成每個要點的子摘要,其長度也要顯著短於完整摘要,可提高摘要的質量。

Leader-Writer網絡

基於輔助要點序列,我們提出了Leader-Writer網絡來解決工單摘要生成問題。具體而言,Leader-Writer網絡具有層次化對話編碼器 (Hierarchical Transformer Encoder),要點序列生成網絡 (Leader-net) 和子摘要生成器 (Writer-net),並基於要點序列生成和子摘要序列生成的交叉熵損失和強化學習損失函數進行聯合訓練。圖2是模型網絡結構圖,接下來分模塊介紹其實現過程。

圖2:Leader-Writer網絡架構圖

1. 層次化對話編碼網絡(Hierarchical Transformer Encoder)

層次化對話編碼器包括詞級別(token-level)和句子級別(utterance-level)的編碼器,詞級別的編碼器通過Transformer編碼每一句對話中的單詞的embedding進行編碼並通過注意力機制(attention)聚合得到每句話的表示;句子級別的編碼器也是一個Transformer編碼器,通過編碼聚合的句子表示,獲取上下文相關的句子表示,並作為解碼部分中對話信息的表示。這裡句子級別的編碼器引入了相對位置embedding,相對於傳統Transformer模型採用的絕對位置embedding使整體效果提升。

2. 要點序列生成網絡(Leader-net)

要點序列生成器(Leader)是一個標準的Transformer解碼器,以要點序列做為監督信息,根據對話信息解碼要點序列。在損失函數中,我們同時考慮了交叉熵損失和自我批判的(self-critical)[1] 的強化學習損失。

3. 子摘要生成網絡(Writer-net)

子摘要生成器(Writer)則是考慮指針機制(Pointer-generator)的Transformer解碼器。通過指針機制,子摘要生成器可以拷貝原始對話中的部分信息,例如數字和電話號碼等。需要注意的是,由於模型中採用了層次化編碼器對對話進行編碼,在指針機制中,為了保證能選擇到對話中的詞,需要考慮層細化的指針機制。要點序列中的不同位置可能具有相同的要點,例如「問題描述 -> 解決方案 -> 不認可 -> 解決方案 –> 認可」中,兩個「解決方案」對應的子摘要內容不同。為了解決該問題,我們採用要點序列生成器的解碼狀態作為子摘要生成器的解碼起始狀態。基於多任務學習的設置,我們獨立了考慮了要點序列生成和子摘要生成的損失。

4. 訓練與預測

在訓練階段,Leader-Writer模型利用要點序列與對應的子摘要做為監督信息,學習模型參數。在預測階段,Leader-Writer模型首先根據對話信息生成要點序列,然後根據要點序列的每個要點的解碼狀態生成最後的子摘要,最後拼接摘要後,獲取最後的工單摘要。

四、實驗與結果

我們對比了一系列的基於深度神經網絡的文本摘要方案,包括:

基於LSTM的Seq2seq的文本摘要模型[2] ;基於LSTM+ Attention的文本摘要模型[3] ;基於Transformer的文本摘要模型[4] ;基於Pointer-Generator的文本摘要模型[5] ;以及基於Hierarchical Transformer的文本摘要模型。同時我們也實現了Leader-writer模型的三個變種,包括:

Hierarchical Encoder+Leader-net+Writer-net的網絡架構(不考慮強化學習損失,Writer-net不引入Pointer Generator機制);Hierarchical Encoder+Leader-net+Pointer Writer-net的網絡架構(不考慮強化學習損失);Hierarchical Encoder+Leader-net+Pointer Writer-net+Self-critical loss的網絡架構。通過實驗,我們的Leader-Writer網絡在工單摘要生成上取得了比目前領先方法更好的效果,同時我們生成的摘要在完整性和邏輯性上比對比方法效果更好;而在核心要點上的正確性,我們的方法在準確性上也優於對比方法。針對具有複雜邏輯的對話內容(即更長的要點序列),我們的方法也在總體摘要效果和完整性、邏輯性和正確性上遠遠優於對比方法的效果。

論文全文:https://www.kdd.org/kdd2019/accepted-papers/view/automatic-dialogue-summary-generation-for-customer-service

在最新一期的雷鋒網AI 研習社 大講堂上,滴滴 AI Labs技術團隊也為我們帶來了相應的詳細解讀分享。詳情可 掃碼 觀看回放視頻!

相關焦點

  • 滴滴KDD 2019 論文詳解:基於深度價值網絡的多司機智能派單模型
    今年,滴滴共有三篇Oral論文入選KDD2019,研究內容涵蓋基於深度學習方法自動化地生成工單摘要、基於深度強化學習與半馬爾科夫決策過程進行智能派單及模仿學習和GAN在環境重構的探索。本文是對滴滴Oral論文《A Deep Value-networkBased Approach for Multi-Driver Order Dispatching》的詳細解讀。
  • KDD 2020阿里巴巴論文一分鐘秒讀
    /videos/5f03f3b611dc83056223208b關於秒讀論文秒讀論文基於深度學習算法建立序列評分模型,實現論文中句級別知識自動抽取,得到論文研究的背景意義系統利用神經機器翻譯系統,解決了英文文獻閱讀難的問題,將提取出來的描述文本自動轉譯為中文,然後利用人工智慧和音視頻處理技術,生成形象直觀的可視化論文解讀視頻。
  • 滴滴KDD 2018 論文詳解:基於強化學習技術的智能派單模型
    在這篇文章中,滴滴技術團隊在其 KDD 2017 論文《A Taxi Order Dispatch Model based On Combinatorial Optimization》的基礎上,新設計了一種基於馬爾可夫決策過程 (MDP) 的智能派單方法,通過將派單建模成為一個序列決策 (Sequential Decision Making) 問題,結合了強化學習和組合優化,能在即時完成派單決策的條件下
  • KDD 2019放榜!錄取率僅14%,強調可重現性
    Zügner (Technical University of Munich); Amir Akbarnejad (Technical University of Munich); Stephan Günnemann (Technical University of Munich)摘要:圖深度學習模型在節點分類任務中取得了很好的性能。
  • 三角獸被 EMNLP 錄取論文精華導讀:基於對抗學習的生成式對話...
    論文中提出了一種新的對話文本對抗生成學習框架,目的是解決文本生成過程中的採樣操作帶來的誤差無法反向傳導的實際問題,從而實現基於對抗學習的聊天回復生成模型。通常認為自動聊天系統(Automatic Chatting Systems)可以通過兩種技術路線實現:一種是將信息檢索系統構建於大規模對話數據集之上,通過建立有效的問句匹配和問答相關度量化模型實現對用戶 query的合理回復[6],本文不做贅述;另一種技術路線則試圖通過構建端到端(End-to-End)的深度學習模型,從海量對話數據中自動學習 query 和 response 之間的語義關聯
  • 7 Papers|KDD2019最佳論文;AutoML SOTA 綜述
    機器之心整理參與:一鳴本周的看點是 KDD 2019 大會,分別有兩篇研究賽道和應用賽道最佳論文被選入。本周入選的其他論文都有架構或研究方法上新穎的點,如 CMU、加州大學聖地牙哥分校等的基於語義的相似性的機器翻譯論文、喬治亞理工聯合 Facebook 和俄勒岡州立大學提出的多模態 BERT 模型等、提出反向傳播替代方法 HSIC 瓶頸的論文等。
  • 7 papers|ICCV2019最佳論文;滴滴提出「語音版」BERT
    機器之心整理參與:一鳴、杜偉本周,ICCV 2019 最佳論文出爐,同時還有滴滴提出的語音預訓練模型,FaceBook 的 BART 預訓練語言模型等。_2019_paper.pdf項目地址:https://github.com/tamarott/SinGAN摘要:在這篇論文中,研究者介紹了一種無監督的生成模型 SinGAN,它以一種無條件約束的方式從單張自然圖像中學習知識。
  • KDD 2020最佳論文揭曉!杜克大學陳怡然組獲最佳學生論文獎
    論文連結:https://arxiv.org/pdf/2005.11480.pdf這篇論文的研究人員提出了一種基於匿名中間表示的任務無關隱私的數據眾包框架TIPRDC。該框架的目標是學習一個特徵抽取器,它可以隱藏中間表徵中的隱私信息,同時最大限度地保留原始數據中嵌入的原始信息,供數據採集器完成未知的學習任務。
  • KDD 2020 全部大獎出爐!杜克大學陳怡然組獲最佳學生論文獎
    :https://www.kdd.org/kdd2020/accepted-papers/view/on-sampled-metrics-for-item-recommendation論文摘要:項目推薦的任務需要在給定上下文的情況下對大量的項目進行排序。
  • 深度學習在NLP中的運用?從分詞、詞性到機器翻譯、對話系統
    中,我們已經講到,2016 年是深度學習大潮衝擊 NLP 的一年,通過去年一年的努力,深度學習在 NLP 領域已經站穩了腳跟。其中,對話交互系統已經成為一個重要的應用研究領域,2017 年的自然語言對話系統,將開創一個新的人機互動時代。通過深度學習和其他機器學習技術的模型組合,竹間智能也已初步實現了自然語言對話中的意圖識別、上下文理解和多輪對話。
  • KDD 2020最佳論文獎出爐!谷歌北航獲獎
    用戶對數據共享的隱私擔憂阻礙了眾包數據集的生成或使用,並導致對新的深度學習應用程式的訓練數據的渴求。一個自然的解決方案是在用戶端對原始數據進行預處理以提取特徵,然後只將提取的特徵發送到數據採集器。不幸的是,攻擊者仍然可以利用這些提取的特徵訓練對抗分類器來推斷私有屬性。一些現有技術利用博弈論來保護私有屬性。然而,這些防禦措施是針對已知的初級學習任務設計的,提取的特徵對於未知的學習任務效果不佳。
  • AAAI 2020論文|基於知識圖譜進行對話目標規劃的開放域對話生成
    一、研究動機讓機器生成有內容並且主題連貫的多輪開放域對話,是人工智慧公認的關鍵任務之一。針對這一任務,研究人員嘗試了一些基於端到端的生成模型,但模型生成的回覆內容豐富性較低。為解決這一問題,研究人員一方面嘗試引入外部知識或文本主題信息,以提升對話回復內容的豐富性;另一方面,嘗試藉助強化學習技術生成有內容的可持續的對話。
  • IJCAI 2018|騰訊知文等提出結合主題信息和強化訓練生成更優摘要
    不同於抽取式摘要,生成式方法能夠針對源文檔的核心思想重新組織摘要語言,並確保所生成的摘要語法正確且保證可讀性;這更接近於人類做摘要的方式,因此也是本論文關注的方法。近段時間,深度神經網絡模型已經在 NLP 任務上得到了廣泛應用,比如機器翻譯 [Bahdanau et al., 2014]、對話生成 [Serban et al., 2016] 和文本摘要 [Nallapati et al., 2016b]。
  • 中國力量佔領KDD:包攬「大數據領域世界盃」全部冠亞軍
    其中,北航學生獲得最佳學生論文,滴滴出行6篇論文入選;用戶隱私的問題,這篇論文提出了一個名為TIPRDC的框架,目的在於學習一個特徵提取器,可以從中間特徵中隱藏隱私信息,同時也最大限度地保留嵌入在原始數據中的原始信息。
  • 最新綜述 | 基於深度學習的立體視覺深度估計
    在傳統方法中,基於立體視覺的深度估計通過在多張圖片上、匹配手工提取的特徵來解決。儘管進行了廣泛的研究,這些傳統方法仍然受複雜紋理區域、較大的難以區別的區域以及遮擋的影響。由於在解決各種2D和3D視覺問題上獲得的成功,使用深度學習解決基於立體視覺的深度估計問題的方法受到了廣泛的關注,在2014年-2019年之間,該領域發表了150多篇論文。
  • 網絡表示學習領域(NRL/NE)必讀論文匯總
    Hamilton, Rex Ying論文地址:https://arxiv.org/pdf/1709.05584.pdf論文摘要:在不同圖(Graph)上的機器學習是一項重要且無處不在的任務,其應用範圍從藥物設計到社交網絡中的好友推薦。該領域的主要挑戰是找到一種方法來表示或編碼圖結構,以便機器學習模型可以輕鬆利用它。
  • 自動生成一句話摘要的人工智慧新軟體問世—新聞—科學網
  • 論文「太長不想讀」?人工智慧新軟體可生成一句話摘要
    TLDR軟體為科學搜尋引擎「語義學者」上的一篇計算機科學論文生成一句話摘要圖片來源:Agnese Abrusci/Nature論文太長不想讀怎麼辦?一個軟體就可以搞定。據《自然》報導,一位科學搜尋引擎的創造者推出了一款軟體,可自動為研究論文概括生成一句話摘要,他們說,這有助於科學家更快地瀏覽論文。
  • 回望2017,基於深度學習的NLP研究大盤點
    然而在最開始的時候,深度學習在自然語言處理(Natural Language Processing, NLP)領域的效果一般,但是現在已經被證實深度學習在自然語言處理領域依然能夠發揮巨大的作用。並且在一些常見的自然語言處理任務中,基於深度學習的方法已經取得了最佳的結果。
  • 2020最新智能客服|聊天機器人算法、架構及應用分享
    (聊天機器人)是在大規模知識處理基礎上發展起來的一項面向行業應用的,適用大規模知識處理、自然語言理解、知識管理、自動問答系統、推理等等技術行業,智能客服不僅為企業提供了細粒度知識管理技術,還為企業與海量用戶之間的溝通建立了一種基於自然語言的快捷有效的技術手段;同時還能夠為企業提供精細化管理所需的統計分析信息。