關於自然語言對話的技術挑戰和應用前景,來自這六大廠的一線技術...

2020-12-12 雷鋒網

雷鋒網(公眾號:雷鋒網) AI 科技評論按:對話作為人類最基本、最重要的交流方式,自然語言對話技術自然也成為了自然語言處理領域離人類最近的技術之一,這一領域乃至整個人工智慧領域要想走向理想狀態,勢必要解決自然語言對話所面臨的一系列問題和挑戰。

而所有技術的問題和挑戰在實踐應用中是最容易體現出來的,因而對此最具有發言權的莫過於實現技術落地的企業一線技術人員。

近日,華為諾亞方舟實驗室語音語義首席科學家劉群就在 CNCC2019 上主辦了一場主題為「自然語言對話:技術挑戰和應用前景」的技術論壇,邀請了來自微軟、阿里、百度、小米、京東以及華為這幾家在自然語言處理領域涉獵較深的大廠一線技術負責人——周明、陳海青、孫珂、王剛、何曉冬以及蔣欣來對這一主題進行探討,幾位演講嘉賓既從宏觀的技術視角闡述了自己對於該研究領域的看法和觀點,也從應用案例的角度分享了自然語言對話的技術實踐。

從左至右依次為:陳海青、何曉冬、孫珂、周明、王剛、蔣欣、劉群

我們一一來看他們在本場技術論壇的分享內容。

微軟周明:面向深度理解的聊天機器人

 

來自微軟亞洲研究院的周明,首先從宏觀、全局的視角分享了聊天機器人的整個技術演化進程。他指出,聊天機器人技術有從檢索式回復到生成式回復再到集成式回復的三個發展階段。

其中檢索式回複利用文本匹配技術選出相似的對話以此輸出對應的回覆,而生成式回復則是利用文本生成技術得到相應的回覆,二者相比各有優缺,前者的優勢在於可讀性好、語言流程,多樣性強以及易於分析、可解釋性強,缺點則在於強依賴於檢索數據,輸出的回覆有時在相關性方面並不好;後者在相關性方面表現較好,易於進行端到端實現並且靈活性強、不太依賴於檢索數據,然而在多樣性方面較差,同時輸出的回覆往往比較短,沒有太多信息量。

集成式回復生成則採用檢索式系統提供候選原型回復、生成式系統對原型加以修改的方式,既能夠繼承檢索模型回復的多樣性,又能夠繼承生成模型的靈活性,對二者揚長避短。

與此同時,周明指出,雖然回復技術取得了一定進展,包括基於神經網絡的 S2S 模型一定程度上改進了生成的回覆流暢度,預訓練模型讓檢索式回復技術一定程度上增強了上下文理解能力等,但目前聊天機器人依舊距離理想的狀態很遠,具體而言體現在:

  • 第一,在多輪對話中,機器人依舊無法真正理解對話歷史中的複雜句間關係;

  • 第二,對話風格與內容的解耦仍然不佳,即便風格符合,內容往往在改寫中出錯;

  • 第三,對話很難保持時間、空間和邏輯一致性,容易出現前後矛盾的情況;

  • 第四,缺乏人類先驗知識;

  • 第五,聊天機器人「健忘」,無法記憶用戶所說的內容。

對此,未來聊天機器人需要採用面向深度理解的回覆機制,努力的方向包括:讓聊天機器人融入常識和知識、 精準理解對話歷史、強化記憶機制從而提高上下文的一致性,並且能夠實現定製回復生成的風格(包括詞彙量、情感、句式和正規性等),而為了實現這些目標,社區還需要建立更加精準的評測,包括數據集和評測指標等。

阿里陳海青:阿里小蜜智能人機互動技術實踐

 

阿里巴巴集團達摩院智能服務事業部資深算法專家陳海青則從更加應用的角度,基於阿里的人機互動產品——阿里小蜜介紹了阿里 NLP 核心技術及人機互動技術實踐、面臨的挑戰及未來的發展方向。

簡單介紹阿里小蜜平臺的生態圈和應用後,陳海青介紹了其背後的核心 NLP 支撐技術:

  • 自然語言處理板塊的分層梳理流程,主要包括分層領域的框架設計,基於不同業務場景的意圖和模型設計與積累,以及通過模型沉澱框架並進行平臺化積累,能夠完成 QA Bot、Task Bot、Predict Bot 以及 Chit Chat 四項任務的能力。

  • 圍繞數據、算法、服務、應用四個層面的 NLU 架構體系,則包括數據的沉澱以及業務標註的訓練平臺體系構建、基於平臺化算法框架的意圖識別和實體識別能力搭建以及基於規則、降級模型以及深度模型的 NLU 工程能力平臺搭建。

而當前 NLU 還是以意圖識別和實體識別為核心能力,其面臨的核心挑戰是意圖的平臺化擴展效率和小樣本場景的冷啟動,就 NLU 的效率和效果而言,主要涉及的問題是如何構建數據、算法和服務。

最後,陳海青指出,未來智能服務機器人將以多模態的方式,不僅提供自動服務模式,同時提供更好的人機協同模式,為用戶和客服人員提供更複雜問題的解決能力和決策支持能力,而持續探索的技術方向有生成模型、強化模型、遷移學習、機器閱讀理解、情感分析等。

百度孫珂:可定製對話系統的挑戰與設計

百度自然語言處理部主任研發工程師、UNIT 平臺技術負責人孫珂基於百度的智能對話定製和服務平臺 UNIT 分享了目前可定製對話系統的挑戰與設計。

一開始,孫珂先拋出了對話技術在面對產業定製需求時所面臨的一些挑戰:

而將可遷移對話技術的目標進行拆解來看,設計思路便是用高學習效率的模型和自動發現模型缺陷板塊來提高單位數據對提高對話效果的幫助,而使用知識輔助構建和預置知識來降低單位數據的獲取成本。

整體基於這一思路設計的 UNIT,核心對話技術包括任務式對話和問答式對話,具體設計思路分別如下:

  • 針對任務式對話,UNIT 在高效率的學習模型上採用的是核心理解引擎為啟發式對話理解、基於深度學習的對話理解以及多引擎結果融合,成分分析為領域或通用關鍵詞分析的多引擎融合對話理解模型;在自動發現模型缺陷板塊和高效率知識構建工具方面,則採用 DataKit 以及 15 套對話式理解範式,可自動修復理解異常問題,從而提高對話效果理解。

  • 針對問答式對話,UNIT 的設計思路則是不定義任務、不梳理知識,而是直接用原始業務數據直接生成回復;其核心技術是引入外部知識的閱讀理解模型——文本表示和知識表示融合的閱讀理解模型 KT-NET。

小米王剛:語音交互帶給人機互動的變化

與前兩位基於自家產品進行技術解析不同,小米人工智慧部副總經理、小愛團隊負責人王剛從語音交互給人機互動帶來的變化出發,闡述了自身對於語音交互未來發展方向的看法。

他認為未來的語音交互有三個發展趨勢:無所不在、更自然的交互以及更懂你。而背後的技術可具體拆解為喚醒、識別、理解、滿足與合成幾大板塊,針對這幾大板塊目前所存在的幾大問題,王剛分別介紹了這些問題面臨的挑戰、當前的解決方案以及未來的潛在解決方案:

  • 第一個問題是 ASR 錯誤率高,其面臨的挑戰主要為同音錯別字、多字少字、中英文混雜、口音及方言,當前的解決方案為「NLP 幫 ASR」、「ASR 幫 NLP」,而未來可以嘗試往語音、語義一體化的方向嘗試;

  • 第二個問題是 Query 意圖理解難,其面臨的挑戰主要為領域和常識知識積累少、信息量少以及表達方式多樣化,當前的解決方案為垂域持續建設以及增強中控能力等,而未來則會逐漸走向涵蓋知識能力、算法能力、數據能力和用戶反饋閉環的綜合能力的建設。

  • 第三個問題是全領域全雙工連續對話,目前面臨的挑戰為技術鏈路長,當前解決方案為在前端進行回聲消除,採用上下文繼承方法來實現垂直域、跨垂域多輪對話,以及無效音拒識(語音拒識、語義拒識、聲紋識別)、節奏控制(回復打斷、主動響應以及 Query 預測)以及結合應用圖形交互界面和語音交互界面等方法;

  • 第四個問題是單領域複雜任務對話,目前面臨的挑戰為當遇到領域特有詞時,ASR 的錯誤率上升,另外面對歧義表達需要領域知識消歧和驅動對話等,當前的解決方法為:1)提高表示能力,包括領域知識的本體表示、對話表示以及本體表示道對話表示的轉移能力等;2)提高任務式對話能力,包括在 NLU 上,基於對話建模抽取槽位信息而非槽位標註方案以提高魯棒性;在 DST 上,基於對話表述和 NLU 輸出更新對話狀態;在 Policy 方面,基於對話狀態進行對話引導。

  • 第五個問題是主動感知和推薦問題,目前的解決方法主要從主動交互、場景理解以及用戶畫像等層面來解決此問題。

京東何曉冬:任務導向型大規模對話系統及應用

京東人工智慧研究院常務副院長、深度學習及語音和語言實驗室主任何曉冬在演講中強調了人機對話對於人機互動未來發展的重要性及其當前面臨的幾大技術難點,基於此,他也對對話系統下一步的發展方向闡述了自己的觀點。

他指出,多輪人機對話是人工智慧的起點及聖杯,而作為人類最基本、最重要的交流方式,對話也是人機互動技術未來的期望所在,然而雖然目前出現了很多應用於特定領域的對話系統並且領域內也在嘗試針對開放領域以及高複雜、可靠性要求高的任務的對話系統,但是目前尚無系統能夠真正通過圖靈測試。

在典型應用上,以京東大規模的複雜客服場景為例,對話系統需要覆蓋售前、售中、售後以及物流,涉及到智能調度、智能導航、智能摘要、實時輔助應答、智能質檢以及智能創事件等具體任務。基於在大規模任務導向場景中的積累,京東還聯合北京智源研究院發布了智源—京東大規模任務導向性對話數據集。

從技術難點來看,何曉冬進一步指出,對話技術目前主要面臨五大難點:

  • 一是多輪對話狀態跟蹤不充分,對話系統缺乏有效的全局優化機制,評估準則欠缺;

  • 二是基於上下文歷史信息的精確語義理解還有待提高,缺乏對用戶意圖的精確理解;

  • 三是缺乏大量的領域知識及基礎常識的支撐,目前還不能執行深度的推理與決策;

  • 四是對話生成機制還待探索,缺乏可控性、可解釋性,難以產生有對用戶有同理心的回覆;

  • 五是包括視覺、語音、語言的跨模態的對話與交互技術還有待深入研究;

對此,何曉冬表示,對話系統下一步必然走向全方位多模態的交互方式,通過視覺、語音、語言、知識等統一,使得人與機器的交流變成無限制的交流。基於這一目標,京東 AI 研究院也在不斷推進多模態對話智能基礎研究。

華為蔣欣:對話系統中的若干技術探索

來自華為諾亞方舟實驗室的蔣欣則從對話數據的收集和增強以及對話深度語義理解兩個維度來分享對話系統中的一些技術探索。

作為構建對話系統的基石,對話數據的收集面臨著不少困難,例如用戶隱私、領域強相關、標註複雜性以及動態交互和評估等都是其面臨的問題,對此學術界提出了人-人對話、人-機器對話以及機器-機器對話等三種數據收集方法。

其中人-人對話(Wizard-of-Oz)雖然較為貼近真實對話場景,然而人工標註和校驗成本高,並且對交互行為的覆蓋率低;機器-機器對話(Self-Play)雖然在覆蓋率和多樣性方面更佳,標註也相對容易,然而對話數據質量依賴於模擬用戶機器人和系統機器人,因而在實踐中往往會結合 Wizard-of-Oz 和 Self-Play 兩種方式分別生成對話數據,再使用數據訓練對話系統的 NLU、DST、Policy 以及 NLG 模塊,通常可以在受限領域的對話中達到較高的成功率。

對話數據增強方面,一個比較通用的方法則是複述生成,華為諾亞在近期的工作中提出基於 Seq2Seq 神經網絡生成相同語義的不同表達,具備更好的可解釋性、可控性和可遷移性;此外,在對話狀態跟蹤任務上,提出基於 Contextual Bandits 對增強的數據進行選擇,最後並聯合訓練數據增強模塊和狀態跟蹤模塊。

對話深度語義理解上,目前最好的模型是預訓練語言模型:

  • 預訓練語言模型作為語義理解新範式,具體指在大規模文本語料上訓練語言模型,之後在下遊任務上微調訓練,以中文預訓練語言模型「哪吒」為例,目前基於 BERT 已在華為雲上實現了多機多卡數據並行訓練並嘗試了混合精度訓練、全詞覆蓋等一系列訓練技術;

  • TinyBERT 模型則是專為 Transformer 模型設計的知識蒸餾方法,是以 BERT 作為「老師」蒸餾出的一個小型化模型,以適應不同邊緣設備上的計算需求。它的參數量為 BERT 的 1/7,預測速度是後者的 9 倍,並且在 GLUE 評測上相比 BERT 僅下降了 3 個百分點。


演講結束後,在劉群的主持下,周明、陳海青、孫珂、王剛、何曉冬以及蔣欣六位嘉賓還基於本場技術論壇的主題「「自然語言對話:技術挑戰和應用前景」,展開了一場 Panel 討論,就「在開發對話系統的實踐中遇到的難點」、「自然語言對話的數據和評價問題」、「強化學習在自然語言對話的實際應用中所存在的問題」以及「未來對話技術將會在哪些方面會取得突破,應用上是否會有殺手級的場景出現」等問題發表了自己的觀點並展開了深度交流。

雷鋒網 AI 科技評論報導。

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 市北GMIS|字節跳動李航:自然語言對話技術的發展機遇與挑戰
    可能每天大家都會使用各種自然語言對話系統,今天我想跟大家分享一下對對話技術的一些觀點。語音對話技術的發展和應用首先看一個視頻(見前文視頻),這個是 1992 年美國的一個電視節目。現在大家都知道,各種語音助手熱成什麼樣,給大家看看 27 年前的技術。
  • 自然語言處理的應用前景
    自然語言處理(NLP)的定義 自然語言處理(NLP)是人工智慧技術的一個分支,它使計算機能夠像人們一樣理解、處理和生成語言,並且在商業中的應用正在迅速增長。 雖然自然語言處理(NLP)這一術語最初指的是人工智慧系統的閱讀能力,但它後來成為所有計算語言學的一種通俗說法。
  • 2019自然語言處理前沿論壇 五大議題全面解析NLP技術前沿
    5月26日,由百度與中國計算機學會中文信息技術專委會、中國中文信息學會青工委聯合舉辦的「2019自然語言處理前沿論壇」正式召開。本屆論壇主題為「機器之『讀、寫、說、譯』—— 探尋NLP未來之路」。論壇圍繞語義計算、自動問答、語言生成、人機對話及機器翻譯五大議題,與學術界、工業界一線青年專家學者共同探討NLP領域的最新技術進展、產業應用及發展趨勢。
  • 2019 自然語言處理前沿論壇成功舉辦,百度 NLP 技術全揭秘
    、中國中文信息學會青工委舉辦的「2019 自然語言處理前沿論壇」上,來自百度和各大高校的嘉賓們分享了關於 NLP 技術研究的心得體會。本次論壇主題為「機器之『讀、寫、說、譯』—— 探尋 NLP 未來之路」,來自百度的嘉賓們分別在語義計算、自動問答、語言生成、人機對話和機器翻譯 5 場專題報告中分享了百度 NLP 技術的研究成果與應用。
  • 人工智慧領域的關鍵核心技術:自然語言處理
    前微軟公司全球執行副總裁沈向洋先生也在公開演講時說:「懂語言者得天下……下一個十年,人工智慧的突破在自然語言的理解……人工智慧對人類影響最為深刻的就是自然語言方面」。由於理解自然語言需要關於外在世界的廣泛知識以及運用操作這些知識的能力,所以NLP也被視為解決AI完備(AI-complete)的核心問題之一。可以說,NLP目前是AI領域的關鍵核心技術,對它的研究也是充滿魅力和挑戰的。
  • Java開發與技術挑戰——關於技術的技術思考
    期間參與過多次的Java技術培訓與問題指導,以撲火隊員的身份見證了形色各異的Java坑,從而不斷提醒自己要跳出Java語言本身,去思考一些開發中的技術困惑和挑戰。有關技術挑戰的思考Java語言的學習和運用一開始可以讓我們更多的關注在Java技術應用本身,隨著身份的變化和多元化的場景的出現讓我們對Java又有更加深入的理解。那就是Java是一門程式語言,我們處理和解決問題關注的更多層面不是選擇哪一門語言,而是如何更好地滿足實際場景的需要。
  • 孔曉泉:自然語言處理應用和前沿技術回顧 | 分享總結
    分享主題:自然語言處理(NLP)應用和前沿技術回顧分享提綱簡單介紹和應用舉例經典的實現方法基於深度學習的方案DNN-based NLP 常用技術回顧和總結分享內容:總的來說,自然語言處理技術相當複雜,在一個小時內將其講清楚也不太現實。
  • 人工智慧領域專家學者論道自然語言處理技術
    以語言和知識為研究對象的自然語言處理(NLP)技術是人工智慧的核心問題之一。為促進產學研深度融合,推動自然語言處理技術進步,11月28日,中國計算機學會福州青年計算機科技論壇在福州軟體園舉行,論壇通過線上直播、線下會議方式舉行。
  • 總結+paper分享|對話系統中的自然語言生成技術(NLG)
    自然語言生成(NLG)在很多NLP領域或任務都有涉及,比如摘要生成、VQA(視覺問答) 、翻譯、寫詩詞、寫作文、寫新聞、NBA等賽事報導、對話系統等
  • 人工智慧自然語言處理技術拉動產業升級引擎
    從整體來看,人工智慧自然語言處理推動著語言智能的持續發展和快速突破,並越來越多地應用於各個行業。綜合來看,自然語言處理是人工智慧的一種應用程式,它為需要快速可靠地分析文本數據的公司提供了各種各樣的應用程式。這有效地實現了人機互動,並允許對以前未使用的大量數據進行分析、格式化。
  • 淺談語音識別技術的發展趨勢與應用前景
    語音識別技術的應用包括語音撥號、語音導航、室內設備控制、語音文檔檢索、簡單的聽寫數據錄入等。語音識別技術與其他自然語言處理技術如機器翻譯及語音合成技術相結合,可以構建出更加複雜的應用,例如語音到語音的翻譯。
  • 阿里巴巴司羅暢談自然語言智能技術,兩平臺四應用助力商業落地
    自然語言智能的技術使命在感知智能、認知智能和創造智能之下,我們一定要解決「更好地理解知識,更好地分析語義」的工作,這就是自然語言處理所肩負的重要技術使命,阿里巴巴是一家技術公司,有遠大的技術抱負和期望,阿里巴巴很早就認識到自然語言智能的重要性,在自然語言智能研發方面有很大的投入,我們的使命是:第一,
  • 網絡課程 地下水汙染物的自然衰減:新範式,技術和應用
    環境修復技術免費網絡課程2016年9月6日起,美國萊斯大學(Rice University) 的免費網絡公開課「地下水汙染物的自然衰減:新範式,技術和應用(Natural Attenuation of Groundwater Contaminants,
  • 淘寶吳雪軍:自然語言處理技術在搜索和廣告中的應用
    編者按:本文為淘寶廣告技術部廣告算法負責人、淘寶網研究員吳雪軍在8月3日CTO俱樂部沙龍演講實錄,全文如下:我今天演講的題目是自然語言處理技術在搜索和廣告中的應用。搜索和廣告是技術非常密集兩個網際網路產品,它們前端都非常簡單,但後臺系統架構極其複雜。
  • 王海峰博士領軍的百度自然語言處理技術再獲國際認可
    近日,自然語言處理(NLP)領域的國際頂級學術會議「國際計算語言學協會年會」(ACL 2019)公布了今年大會論文錄用結果。根據ACL 2019官方數據,今年大會的有效投稿數量達到2694篇,相比去年的1544篇增長高達75%。其中,國內自然語言處理領軍者百度共有10篇論文被大會收錄,展現出在該領域的技術積澱和國際水準。
  • 當紅語言只認Go!趣頭條技術沙龍聚焦Golang應用熱點
    4月13日,趣頭條聯合極客邦科技在上海舉辦了首屆 Go 語言技術沙龍——Golang 在工程實踐中的應用。雖然只是一場持續半天的技術沙龍活動,但是現場參會者的參與熱情、從沙龍帶回的收穫與感悟,其意義已經遠遠超過活動本身。部分參會者在現場反饋說,如果不是參加了此次沙龍,真的感受不到,原來Go語言在國內這麼火,在開發者群體中這麼吃香!
  • 探討定位技術與應用的突破與挑戰!2019深圳高精度定位大會圓滿結束
    在物聯網萬億級市場的驅動下,新的定位技術和新的應用前景正在逐漸釋放。雖然行業機遇巨大,但定位技術及其應用發展也面臨著諸多的挑戰。,匯聚目前活躍在一線的定位企業以及學術專家300餘人,共同探討UWB、藍牙、5G定位、GNSS慣導等主流的定位技術的最新突破與創新應用與挑戰。
  • 華為李航:自然語言處理——理想與現實、機遇與挑戰(附PPT及視頻回放連結)
    ——理想與現實、機遇與挑戰」為題,全面綜述了NLP 的任務、特點、最新技術,尤其是深度學習在NLP 的應用。各種各樣的自然語言處理的應用,都可以模型化為這五大基本問題,基本能夠涵蓋自然語言處理相當一部分或者大部分的技術。主要採用統計機器學習的方法來解決。
  • 360搜索舉辦COLING 2018論文預講會聚焦NLP技術應用
    中文信息學會青工委主席、中科院自動化所劉康副研究員,以及360搜索首席數據科學家王浩出席本次預講會並開場致辭,來自清華大學、北京大學、復旦大學、中科院等多家院校和企業的20名講者與會,與現場百餘位聽眾共同探討NLP(Natural Language Processing,自然語言處理)領域的前沿技術和應用。
  • 竹間智能連續三年入選Gartner自然語言技術代表企業
    NLT涵蓋自然語言處理 (NLP) 的廣泛領域,包括自然語言理解 (NLU),自然語言生成 (NLG),文本分析,對話系統,語言知識圖譜,機器翻譯和文本摘要等。  根據最新發布的ICT Hype Cycle技術成熟度曲線,自然語言技術仍處在期望高峰期。