雷鋒網(公眾號:雷鋒網) AI 科技評論按:隨著語音識別 ASR 的進步,對話機器人從簡單的指令式的語音助手,進化到關鍵詞交互方式,人們能夠使用較為完整的句子來表達意圖,機器人從中截取關鍵詞判斷用戶意圖。
現階段利用 NLP 、NLU 技術,以及機器學習方式,慢慢脫離關鍵詞的束縛,可以更聰明的去理解用戶意圖以做出正確的回應。再下一步是否能脫離一問一答的回應方式?是否機器人能主動的跟人產生互動?沒有情緒情感的機器人真的算是智慧機器人嗎?情緒情感又有哪些可能的應用?
近日,在雷鋒網 AI 研習社公開課上,竹間智能 CTO 翁嘉頎分享了人機互動技術探索。公開課回放視頻網址:http://www.mooc.ai/open/course/587?=aitechtalkwengjiaxin
翁嘉頎 Phantom Weng:竹間智能 CTO,作為 AI 領域的技術專家,他帶領團隊負責竹間在 AI 領域產品研發與技術規劃,領域主要涵蓋對話機器人、計算機視覺、金融科技等領域。此前,翁嘉頎在中國大陸及臺灣的多個科技類創新企業擔任 CTO、首席架構師等職位,帶領團隊進行 AI 及大數據領域的研究開發。他畢業於臺灣大學資訊工程學系,此後就讀於紐約州立大學。熟悉算法、程式語言、搜尋引擎、網絡安全以及郵件安全,使用過的語言超過 35 種。
分享主題:人機互動技術探索
分享提綱:情感計算、意圖、主題、上下文、中文 NLP 應用、多輪對話、算法與數據的關係
雷鋒網 AI 研習社將其分享內容整理如下:
今天講的主題是人機互動技術探索,我會著重講這些技術的應用以及怎樣解決當前的問題。
先看一下人機互動目前的現況:第一個,雙十一快到了,我在系統推薦了三件 T 恤後,回答「要黑色的」,結果因為不理解上下文,變成在解釋黑色的基本定義。跟各種機器人交互也常常會有類似答非所問的事情發生。
為什麼現況是這樣的?這是因為大部分人機互動都使用關鍵詞匹配和模板的方式,沒有上下文,語料都是從網絡上爬來的——根本無法控制質量,怎麼清洗基本上都沒法使用。
一個理想中的機器人是貼心的,是能夠有情感、有記憶、懂你的,是能夠陪伴你的。機器人應該避免攻擊性的回答。
使用模板的機器人沒有情商,也無法進行多輪對話。Siri 曾在美國做過一個測驗,測驗結果顯示它的智商為 2 歲,其他的機器人也差不多。而對於成年人來說,智商達到 16-18 歲的機器人,才是我們需要的機器人,然而,如何做到這種程度?
在此之前,我先介紹一下竹間智能這家公司。
我們似乎可以發現,目前在人工智慧的文本分析和語義理解領域,很多公司的技術人員都是做搜尋引擎出身的。
我們公司的 EMOTIBOT 是一個情感機器人,光文字情緒就做了 22 種,人臉表情 9 種,語音情緒 4 種,此外,還做了多模態情感識別。
做到較好的人機互動,需要哪些技術呢?
第一個是上下文理解技術,有三種方式:補全、指代消解和對話主題式補全。
第二個是主題、Speech Act &情感以及 Memory 的運用:
一是利用主題做對話控制;人類對話是有固定的主題,有時候會有主題的轉換,但是至少不是東一句「天氣」西一句「體育」,這是無法聊下去的。尤其機器人回答的答案更要跟原本的對話主題相契合,不然就是答非所問文不對題。
除了對話主題以外,句法句式,根據對話中記憶下用戶的屬性,做出好的回答。例如我不喜歡看恐怖片,當問到「最近有什麼好看的電影」,就不應該出現恐怖片。然後也可以用生成的方式來產生回答,直接生成方式要產生高質量的回答需要大量的數據訓練,所以也可以考慮先生成些細節 (句法、關鍵詞、主題 等等),再用造句的方式生成整個句子。
此外人機互動目前在特定場景內比較能表現好,因此需要針對場景做深,需要場景專家以及現有的場景語料,才能做到準確率超過 95%。
我們再來講 NLP 的重要性,剛剛所提到的技術有一個自然語言處理平臺,能夠提供我需要的線索。而我們底下其實做了大量苦工,做得模塊較多,就有更多機會,讓各個模塊在匹配時能夠 Cover 對方的弱點。
那我們如何利用 NLU 的基礎信息呢?
然後講到一個中控中心的問題,這就涉及到剛剛所提到的多輪對話問題。那多輪之間能不能切換?下面是幾個例子:
最後我分享一下竹間智能的實戰經驗。
一是算法。單一算法在圖像識別上的應用表現可能還好,但在文本和語義理解上基本不可能獲得好的準確率,下面是其無法解決的一些問題:
二是語言學家與數據質量。數據標註上必須非常嚴謹,尤其必須有專業的語言學家加入標準準則的設計,或是標註質量的把控。建議任何一筆數據都有多個標註人員做到交叉審查,當幾個標註人員意見不一致的時候,由語言學家 / 領域專家做最後的判定。不然垃圾的數據只會訓練出垃圾的模型。
未來會不會存在這麼一個世界:每個人都有一個機器人,機器人會懂你,就像好朋友和閨蜜一樣;每家企業也會有機器人,會幫助員工完成訂餐等事宜。這是一個理想的狀態,雖然現在還有一段距離,但是也有很大的希望,不過我們只有將技術底層做好,才能一步步走到這個理想狀態。
以上就是本期嘉賓的全部分享內容。更多公開課視頻請到雷鋒網 AI 研習社社區觀看,關注微信公眾號:AI 研習社(okweiwu),可獲取最新公開課直播時間預告。
雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。