追一科技首席科學家楊振宇:對話機器人系統是怎麼煉成的

2020-12-13 站長之家

追一科技首席科學家楊振宇

相比於語音和圖像,自然語言是一個有「更多需求」和「更少標準答案」的領域。紮根自然語言的公司通常也不是從技術和方法出發,而是選擇一個具體的需求,然後用所有可能的方法解決它。追一就是這樣的一家公司,它瞄準的是「對話機器人」這個領域,把問題分類、分解、逐個建立準確高效的機器人,再有序集成起來。三月,機器之心有幸在深圳追一科技總部對首席科學家楊振宇進行了採訪,我們仔細聊了聊「對話機器人是怎樣煉成的」,以及在他眼裡,深度學習與自然語言最好的結合方式是怎樣的。

對話機器人需要解決的問題是如何分的?

對話機器人是一個相對比較複雜的系統,由許多個模塊組成。其中最核心的模塊就是語義理解,理解用戶想要表達什麼意思。而在利用深度學習處理商業對話機器人的語義理解問題方面,追一是國內最早的一家。

根據服務類型,對話機器人可以分為FAQ諮詢、資料查詢、任務型和閒聊四種,涉及的自然語言處理問題也各不相同。

對於 FAQ 諮來說,模塊的輸出對應知識庫裡的一個知識點。解決問答就像解決一個大型分類問題,機器人要將用戶的需求對應到知識庫裡的某一個答案。

知識庫裡的知識點數量少則幾百個,多則上萬個。而根據知識庫大小不同,適用的模型結構也會有所不同。例如,銀行類客戶通常有多個複雜的業務線,知識庫規模也是數以萬計,直接對幾萬個知識點進行分類是難以取得高準確率的,因此,機器人會採用分層處理的方法,先判定問題與哪一個大領域相關,再進行詳細的知識點分類。

查詢類對話需要從客戶的輸入裡判定兩件事:意圖和實體。比如「A 公司的市盈率是多少?」這個問句裡,就包含了意圖「市盈率」和實體「A 公司」。成功獲得這兩個信息後,機器人會去一個結構化的資料庫裡做查詢。得到答案後,按照一個預定義的格式化模板填充後返回給客戶。

資料查詢的一個難點是,用戶在連續發問時,不會每次都重複自己的意圖和實體,比如用戶會在詢問「A 公司的市盈率是多少?」之後,追問說,「那 B 公司的呢?」或者「那市淨率呢?」。這時,系統就需要通過上下文管理,對意圖和實體這些要素進行繼承或切換。用戶的提問到來之後,首先進行判斷:用戶在這一句中是否提供了某一要素?如果沒有,則嘗試從前文追溯繼承;如果有,再判斷用戶是否進行了意圖(實體)轉移,如果是,則需要進行對應更新。

另一個難點是,用戶可能不會直接說出實體全稱,無法進行精準的、基於規則的匹配。因此,機器人需要結合特定用戶的歷史記錄和用戶群體的統計信息,通過學習的方法計算詞與詞之間轉移的概率,然後進行模糊匹配。

對話是當下比較流行的一種交互形式,機器人試圖以對話的形式來執行訂機票、查帳單、買理財等任務。任務型和資料查詢類對話有相似之處:它們同樣要從用戶處獲得兩類信息:意圖和「元素」。區別在於,確定意後,任型機器人需要主導對話:它要理清進行特定任務所必要的元素有哪些,並以對話的形式確保用戶提供了所有元素。以訂機票舉例,用戶說「幫我訂明天北京到上海的機票」,那麼機器人在明確了任務是「訂機票」之後,就要理清,用戶已經提供的元素有時間、出發地、到達地,尚未提供的元素有艙位偏好、時間偏好、特定機場偏好等。只有獲得了全部所需元素,機器人才能「執行任務」。

最後一類是,與陪護機器人的閒聊功能不同,穿插在查詢、諮詢問答或任務交互之間的閒聊,需要結合上下文一起識別。有時,一句話單獨看是閒聊的意圖,但結合上下文一起看則屬於查詢、諮詢問答或任務交互的一部分。這種場景下的閒聊不僅要識別準,而且要保證上下文對話的流暢性,也非常有挑戰。

一個對話機器人系通常由哪些模塊組成?

如前所述,系統是由FAQ諮詢、資料查詢、任務型和閒聊等不同類型的機器人組成的。除此之外,還有一個中控模塊,是系統的管理控制中樞。

中控負責依據用戶當前問句和歷史會話記錄,初步判斷當前問題應該由哪個機器人來回答,然後下發給一個或多個下遊機器人。下遊機器人處理後,將答案以及對應的置信度返回給中控,中控根據下遊返回的信息進行決策後,將最合適的響應返回給用戶。

對話機器人上後效果如何持營優化?

對話機器人可能發生的誤判有兩種不同形式。

一種是「系知道自己可能犯:某一請求雖然分配給了特定機器人,但是機器人給出的最佳回答的置信度仍然很低,換言之,該回答能夠滿足用戶請求的可能性很小。此時,中控會進行重新判斷:其他機器人是否有置信度更高的回答?如果仍然無法找到置信度足夠高的答案,系統會啟動絕識別機制,即,系統判斷自己無法回答這一問題,返回給用戶一個通用話術,如「十分抱歉,您的問題我暫時回答不了」,然後記錄下問題,定期推送給機器人運營人員通過數據標註、知識庫擴充等手段進行迭代優化。

另一種則是「系很自信,但是回答了」。這類錯誤要通過分析用戶的反饋來發現,比如用戶選擇點「踩」或者繼續提問,都意味著他們的需求可能沒有得到滿足。系統會結合分析結果把這種疑似錯誤的回答挑出來,形成一個叫做「質檢」的任務,交給客戶的質檢人員判斷並標註,補充進訓練集進行迭代優化。與此同時,客戶也擁有能夠進行即時調整的人工幹預工具:如果客戶需要立刻對某個錯誤答案進行調整時,可以利用這個工具找到導致錯誤答案的影響因素,通過對這些影響因素的調整來達到即時生效的幹預效果。

對於機器人的優化來說,極其重要的一點是在系統層面有完整的反饋學習機制,能夠讓機器人收集可能的錯誤情景,以及特定場景下的正確回答信號,然後利用這些數據和信號建立正反饋機制。

總體來說,通過初始化教育和持續運營優化,機器人一般能夠達到綜合準確率 95% 的效果,這樣就會獲得比較好的對話體驗了。

自然理的界與學界:溝與啟

對於學界而言,最好的研究是用新方法解決新問題,其次是用新方法解決老問題,最次是用老方法解決老問題。而工業界的衡量標準則截然不同,工業界的出發點是以需求為核心,無論什麼方法,能落地提供極致體驗的就是好方法。

舉個例子,業界的系統是需要給客戶提供快速幹預工具的:一個無法調整的、幹預不了的系統是不合格的。出於對企業形象的重視,客戶需要能夠監控機器的效果、需要在發現問題之後能夠實時幹預、需要定期檢查用戶反饋,讓反饋數據作為新的監督信號進一步優化模型。業界搭建的優秀系統要有自適應的閉環和流動性,這是學界很少會考慮的事情。

另外,業界也需要更多地考慮系統上線時的資源限制問題。比如在自然語言領域裡一個典型的測試環境,斯坦福的 SQuAD 數據集上,現在學界裡效果最好的做法是把數十個不同的模型集成在一起,然而這種做法是很難在工業界大規模應用的。工業界要考慮成本、客戶在雲端的算力、用戶從提問到得到反饋的時間等種種限制,集成少數幾個模型也許是可行的,但是集成幾十個高代價的模型是不切實際的。

當然,業界也在持續關注學界的新方法,希望得到方法論上的啟示。

例如,深度強化學習的飛速發展也會讓我們關注:能否依靠數據驅動,端到端地訓練具有工業應用價值的任務型機器人?能否在有了足夠多數據之後,把對話信息看做狀態,用深度強化學習的方法學習一個對話策略出來呢?

另外,閱讀理解領域的發展也讓我們看到了不是基於「知識庫」而是基於「文檔庫」進行回答的可能性。例如,一個特定問題的答案可能在某個文檔裡,如何構建一個深度學習系統,根據某一問題,定位到特定的文檔,再從文檔中把信息提煉出來用以回答這個問題?

元啟化算法是否能與深度學模型合?

我個人的研究背景是計算智能(Computational Intelligence),在 2015 年之前的近 10 年裡,主要關注如何應用計算智能中的元啟發式優化算法求解大規模複雜優化問題。這是一類基礎性的研究難題,長期受到關注,比如我大約 10 年前的一個關於演化優化算法的工作,到現在已經被引用 500 多次了,而且現在還在逐漸增加,偶爾還會收到同行提出算法代碼需求的郵件。隨著算力的持續提升,也許元啟發式算法在不久的將來會成為人工智慧領域新的寵兒,我個人也非常關注它與深度學習結合的可能。

元啟發式算法的最大的優點在於不要求目標函數可導,通用性。現在,為了求解方便,建模時往往會對實際應用的真實目標做一些簡化,使得該目標函數可導,以便可以用現成的梯度下降算法求解。然而這往往不是最優方案:一方面建模的簡化一般會引入求解效果上限的損失;另一方面梯度下降算法不能保證獲得全局最優解,往往只會收斂到一個極值。

元啟發式優化算法是一個啟發式框架,一般是設計一些通用的、對問題的依賴沒有那麼強的啟發式策略,使算法更容易收斂到全局最優解。元啟發式優化算法的缺點在於算法對計算能力的要求比較高。這主要是因為梯度下降算法有明確方向,只要朝著這一個方向下降就可以了,而元啟發式算法,如其中的「主流分支演化算法」,用的方法則是試錯法(trial-and-error),需要在空間裡進行大量的採樣、評估,再決策接下來去何處繼續採樣更有獲得全局最優解的潛力。這個過程是非常消耗算力的。

現在,學界的關注重點是能否用局部優化的思想減少採樣點的數量,以及能否提高採樣、評估的並行化執行能力。

此外,元啟發式算法還有一個梯度下降無論如何也做不到的優勢,就是有希望進行構的。如今神經網絡的結構是全部由人來設計的,未必或者極有可能不是最優的。利用元啟發式算法能夠讓機器在卷積層、循環層、全連接層等不同開放組合結構構成的空間中進行搜索,組裝出一個針對特定問題效果最好的結構。這個方向一般叫做Neuroevolution,正逐漸引起越來越多的學界和業界的關注。

用深度學習帶來了哪些不同?

在中控的排序模型裡,深度學習模型能夠提供含有大量信息的特徵,讓體量更小、更簡單的模型就能獲得同等,甚至更優的效果。

在前深度學習時代,傳統的搜索推薦經常需要上千萬、上億的特徵,這是因為,在沒有強大的特徵的情況下,只能把各種組合人為構造出來,然後用一個淺層的大模型去學習。然而深度學習模型學習出的特徵本身已經包含了巨大的信息量,因此繁瑣的人工特徵工程變得沒那麼重要了,這對技術的商業化非常有利。

這種信息量是通過深度學習在面對大規模原始數據的抽象、非線性學習能力而獲得的。例如,通過抓取大量金融行業的相關文本,,進行統一的文本語義相似度學習建模和訓練,就能得到一個強大的文本特徵提取模型。這個模型可以用於證券領域、基金領域、銀行服務領域等等各個行業系統中。

此外,深度學習也可以通過「多任」(multi-task learning)的方式整合不同類型的問答數據,極大簡化了啟動階段客戶標註數據的工作。

知識點的構建階段需要客戶提供有標註的訓練數據:每一個知識點(標準答案),都需要客戶「手寫」用戶標準提問範式和可能的變體。構建這樣的標準問答集是極其耗費時間的,說服客戶進行標註也是有一定難度的,然而如果客戶之前採用過人工客服,有人工客服日誌,我們就可以大量削減需要人工完成的標註數據集創建工作。

追一一直偏重實用、偏重落地,我們不僅僅鑽研最前沿的技術,也致力於優化落地效果,把自適應、有閉環正反饋的系統交付給用戶。令人自豪的是,我們有一批能夠把問題想清楚的人,正在用系統工程的思維為客戶構建具有極致體驗的對話機器人服務。

我們的對話機器人,不追求「一個 AI 模型端到端解決全部問題」,而是在一個完整系統的每個模塊裡、各個維度裡,都用 AI 技術幫助提升效率、優化體驗。這種優化可能幫助主系統提取了更強的特徵,可能在冷啟動階段幫助客戶簡化了痛苦的數據標註過程,可能在運轉過程裡幫助分析輿情、找到客戶產品設計的不合理之處。它們並不顯山露水,卻無處不在。

這也是追一希望向用戶傳達的理念:真正有「AI 意味」的系統,是「草色遙看近卻無」的整體系統,而 AI 的角色,是「潤物細無聲」地、持續地優化其中的每一個細節。

相關焦點

  • AI Frontiers | 微軟首席 AI 科學家鄧力演講:口語對話系統的分類...
    編者按:鄧力博士原為加拿大滑鐵盧大學教授,1999 年加入微軟,2016 年起擔任微軟首席人工智慧科學家,負責微軟深度學習技術中心應用趨向的深度學習研究。鄧力:今天,我想講一講口語對話系統(Spoken Dialogue System)。 「Spoken Dialogue System」 成為一個術語已經有 30 年了,現在我們也稱其為對話式交互界面(conversational UI),或者稱為「bots」。
  • ACRV創始人Peter Corke任藍胖子機器人首席科學家
    原標題:ACRV創始人Peter Corke任藍胖子機器人首席科學家   南方網訊 澳大利亞機器人視覺中心(ACRV)創始人、昆士蘭科技大學機器人視覺傑出教授Peter Corke正式加入藍胖子機器人,擔任首席科學家,領導其澳大利亞布裡斯班研發中心的技術研究,並與其深圳和美國亞特蘭大的工程師保持技術交流
  • 微軟小冰首席科學家武威解讀 EMNLP 論文:聊天機器人的深度學習模型
    科技評論按:2018 年度 EMNLP 大會上,微軟小冰首席科學家武威和北京大學助理教授嚴睿就聊天機器人近年來的研究成果作了全面總結,並對未來聊天機器人的研究趨勢進行了展望。近日,在雷鋒網 AI 研習社公開課上,微軟小冰首席科學家武威就為大家帶來了其在 EMNLP 大會上分享的精華部分。公開課回放視頻網址:http://www.mooc.ai/open/course/606?
  • 專訪| 三角獸首席科學家王寶勳:熱度之下的對話生成
    從 EMNLP 入選論文《Neural Response Generation via GAN with an Approximate Embedding Layer》出發,就自動對話領域的特點到發展方向和亟待解決的問題,我們與三角獸首席科學家王寶勳聊了聊。
  • 對話微軟小冰三大首席科學家:微軟第一美少女AI的成長之路
    11月21日,微軟(亞洲)網際網路工程院在北京微軟總部召開了微軟小冰2019年年度研究進展分享會,微軟小冰三大首席科學家——微軟小冰首席科學家宋睿華、微軟小冰首席NLP科學家武威、微軟小冰首席語音科學家欒劍在會上展示了微軟第一美少女AI小冰近期的技術突破,帶來了相當硬核的技術乾貨分享。
  • 【人機對話】對話機器人技術簡介:問答系統、對話系統與聊天機器人
    本文會探討各種簡單的對話機器人技術,而這些技術,每個往往只能完成一個及其特定的功能。岔開話題的話,在科學上,「怎麼實現一個機器人」,是一個太寬泛的問題,往往此類問題都會被分解為若干個小問題。例如:怎麼讓實現讓機器人能回答單個問題?怎麼實現讓機器人能回答連續的問題?怎麼讓機器人幫我買咖啡?而一個學術領域往往是一個子問題的最新、最優解,而工程上我們往往需要結合不同領域的成果構建一個可用系統。
  • 對話機器人技術簡介:問答系統、對話系統與聊天機器人
    本文會探討各種簡單的對話機器人技術,而這些技術,每個往往只能完成一個及其特定的功能。岔開話題的話,在科學上,「怎麼實現一個機器人」,是一個太寬泛的問題,往往此類問題都會被分解為若干個小問題。例如:怎麼讓實現讓機器人能回答單個問題?怎麼實現讓機器人能回答連續的問題?怎麼讓機器人幫我買咖啡?而一個學術領域往往是一個子問題的最新、最優解,而工程上我們往往需要結合不同領域的成果構建一個可用系統。
  • 什麼樣的孩子有望成為科學家?楊振宇一番話,值得家長一看
    科學所打開的世界越來越遼闊,越來越奇妙……——伊林我們現在所享受到一切便利,都是科學技術帶來的,雜交水稻、飛機、汽車、火車……等都屬於科學技術發展帶給我們的便利,而讓這一切便利出現的,正是神秘的——科學家!
  • 甌網丨追問小創客 對話科學家
    「對話」現場,籀園小學濱海分校學子們向青年科學家林鴻教授接連發問。 林一潔 攝☉商報記者 陳燕平「地球深處巖漿溫度那麼高,為什麼沒把地球燒沒呢?」「我們能逆轉時間嗎?」10月18日,正值2020世界青年科學家峰會開幕之際,一場小學生與青年科學家「對話」會在溫州市籀園小學濱海分校展開。
  • 全球NLP最難榜單刷新:追一科技超越Facebook躍居第二
    Google預訓練模型T5保持第一,中國AI創業公司追一科技AI Lab團隊超越Facebook AI,躍居榜單第二。值得注意的是,相比谷歌T5等超大規模研究型模型,追一此次登榜的RoBERTa-mtl-adv模型在商業化能力也非常強勁,相關技術已經落地到追一科技的AI數字員工產品線上,持續賦能銀行、保險、證券、零售、地產、能源,教育,網際網路等多個行業。
  • 人工智慧勢如破竹,開創機器人對話時代 | Q推薦
    浙江大學計算機科學與技術學院副教授趙洲,將帶來《在智能對話中的語義解析技術研究及應用》演講主題,核心介紹 2 大要點:針對關係型資料庫的 TEXT-to-SQL 任務,即實現傳統關係型資料庫的自動問答能力,可普遍應用於大型查詢系統,智能報表生成系統等;針對圖資料庫的 TEXT-to-SPARQL 任務,實現了圖資料庫的自動查詢以及知識圖譜中的對應知識生成,廣泛應用於搜索系統
  • 這家由倪光南院士擔任首席科學家的企業做到了
    ,電纜和信號線一連接就可以用了。遨博協作機器人為中國從製造大國走向製造強國、走向世界做出了貢獻。」2017年受邀成為遨博智能首席科學家的中國工程院院士倪光南曾非常驕傲地說到。倪院士出任遨博智能的首席科學家,就是看重了遨博協作機器人擁有自主可控的核心技術以及實現了核心部件全部國產化。
  • 現場| 亞馬遜首席科學家:Alexa背後的深度學習技術是如何煉成的?
    微軟AI首席科學家鄧力、亞馬遜首席科學家Nikko Strom、百度AI實驗室主管Adam Coates、Facebook科學家賈楊清等20多位業界大咖,堪稱AI業界領域的一場盛事。作為2017開年最火的人工智慧之星Alexa項目的領導者,亞馬遜首席科學家Nikko Strom帶來了演講,詳細闡述了Alexa裡的大規模深度的基本架構、語音識別、語音合成等內容,尤其提到了Alexa為「雞尾酒派對難題」找到了有效的解決方法。
  • 美軍開發對話式AI系統 旨在讓士兵和機器人進行雙向「對話」
    據外媒New Atlas報導,美國陸軍正在開發一種對話界面,使士兵和自主機器人系統之間能夠進行雙向「對話」。由美國陸軍作戰能力發展司令部陸軍研究實驗室和南加州大學創新技術研究所的研究人員開發的 "聯合理解和對話界面"(JUDI)旨在降低訓練成本,提高士兵/機器人的團隊合作能力。隨著機器人在軍事中發揮越來越大的作用,控制問題變得越來越迫切。
  • 阿里巴巴、今日頭條聯合發布2018科技趨勢預測15位科學家「預言...
    15位不同領域的科學家,對IoT、量子計算、邊緣計算、自然語言處理、區塊鏈、自動駕駛等前沿技術將在2018年如何影響世界、影響社會生活做出了自己的預測。科學家們如何看待這個日新月異的世界?AI會威脅人類的生存還是造福於人類?未來真的會有能像人一樣思考和對話的機器人嗎?量子計算機的出現,會不會重構世界科技、經濟、政治格局?
  • 2020麻省理工北京論壇推動產學研融合 頂級科學家共話科技創新未來
    論壇緊跟經濟全球化、智慧城市、抗擊新冠疫情等熱點話題,邀請中美兩國前沿領域領軍者雲上相聚,研討疫情下科技創新發展的現狀與前景,並為八支來自 MIT 的科技創新項目搭建投資合作對接平臺,推動產學研融合,以巔峰對話引領產業未來。
  • 聊天機器人應用趨勢跟蹤月報
    今日在東京車展上豐田公司展示了Yui車載虛擬助手系統,Yui可以判斷駕駛者的情緒,和駕駛者閒聊,一旦察覺駕駛者睏乏或分心,還會主動提出由它來駕車。此次,Yui在眾多概念車上展示,說明這套系統兼容不同汽車。豐田汽車計劃從2020年開始在日本道路上測試一款配備Yui的汽車。解讀:語音虛擬助手在車載場景下有獨特優勢。
  • 矽谷科學家談機器人:機器人會自我學習與製造
    澎湃新聞在矽谷百度BIG TALK現場,整理了百度首席科學家吳恩達(Andrew Ng)、康奈爾大學創意機器人實驗室主任胡迪·利普森(Hod Lipson),以及蘋果公司聯合創始人斯蒂夫·沃茲尼亞克(Steve Wozniak)等科技大佬對機器人的六句最新判斷。
  • 亞馬遜首席科學家:揭秘 Alexa 語音識別技術|AI NEXT
    本次會議的主要嘉賓包括:微軟首席 AI 科學家鄧力,微軟院士黃學東,Uber 深度學習負責人 Luming Wang 等。華人之外,還有亞馬遜 Alexa 首席科學家 Nikko Strom,微軟小娜架構師 Savas Parastatidis 等業內知名專家。
  • 對話系統定製平臺UNIT上線2.0 百度AI致力讓人機對話更自然
    就在前一天AI開發者大會的主論壇上,百度公司創始人、董事長兼執行長李彥宏通過幾段通話錄音來展現的智能客服機器人,以及百度高級副總裁、AI技術平臺體系(AIG)總負責人王海峰展示的地圖語音導航助手,都展現出了自然流暢的人機互動,以及機器人對複雜語句的理解能力,震撼了全場。