1.聊天機器人需要更個性化的知識圖譜
對聊天機器人來說,除了需要實體知識圖譜和興趣知識圖譜等開放領域稀疏大圖,還需要針對機器人和用戶的個性化稠密小圖。機器人或Agent需要相應的知識圖譜來建模並展示自我認知能力,而用戶知識圖譜則可以被看作更精細化和個性化的用戶畫像知識表現。圖1對比了開放領域稀疏大圖和描述機器人屬性及用戶屬性的個性化稠密小圖的知識圖譜。
圖1 開放領域稀疏大圖與個性化稠密小圖的對比
機器人「琥珀·虛顏」,有自身的情感狀態、喜好、技能等知識維度,而用戶則需要表達其職業狀態和生活軌跡等信息。需要強調的是,無論是個性化小圖還是開放領域大圖,都不是獨立存在的,在實際工程應用時需要將它們融合在一起才能發揮更大的價值。例如,機器人喜歡的明星需要和實體知識圖譜中的明星娛樂圖譜關聯;同樣,機器人的愛好需要與興趣圖譜關聯;機器人需要與用戶形成親人、好友、僱傭等社會關係。
2.聊天機器人不僅需要靜態知識圖譜,還需要動態知識圖譜
若一個聊天機器人想要更像人,就需要從早到晚做不同的事情,也就是需要有自己的生活規律,研發時又該如何刻畫這個聊天機器人的生活軌跡呢?例如,圖2所示的聊天機器人自身的生活規律和用戶的實時狀態,應該如何刻畫?
圖2 聊天機器人自身的生活規律和用戶的實時狀態
顯然,想讓聊天機器人有生活規律,就需要在研發過程中在圖譜中體現時態知識。另外,聊天機器人作為用戶的個人助理,需要記住用戶圖譜——各種用戶已經發生、正在發生或即將發生的事件。知識圖譜中的用戶行程不僅是一個關係或屬性,還是一個由多元(N-ary)數據組成的事件。為了表示用戶行程,研發過程中需要定義多種事件類型,並在時間和空間兩個維度上對用戶的各種動態進行刻畫。
3.聊天機器人不僅需要表達客觀知識的知識圖譜,還需要可以刻畫主觀情感的知識圖譜
聊天機器人不能只是冷冰冰地回答用戶的問題或幫助用戶完成特定功能,它需要感知用戶的情感並在輸出答案回復的同時體現出相應的情感,這樣擬人化程度才更高。圖3所示為聊天機器人在與用戶交互的過程中,根據感知到的用戶情感狀態,與用戶進行交互的示例。
已有的知識圖譜大多是客觀的,即用於描述一些客觀的事實。如何使聊天機器人結合個性化圖譜,儘量形成一些主觀認知,進而刻畫機器人或用戶的情感元素呢?例如,用戶說「我心情不好」這屬於閒聊中的情感表達範疇,需要機器人將用戶當前的心情狀態更新到用戶知識圖譜的對應維度數值中。相應地,機器人也會有自己的心情、體力,甚至和用戶之間的好感度關聯。當機器人心情不錯,同時和用戶很親密時,它就會主動關心用戶。結合機器人和用戶情感因素的動態回復會更加溫馨且貼合場景。另外,在多輪對話時,當用戶說「來一首快樂的歌吧」時,需要進一步結合音樂知識的知識圖譜(快樂作為歌曲的曲風或風格標籤)和用戶知識圖譜中的音樂偏好,推薦符合用戶喜好的歌。
圖3 聊天機器人與用戶進行交互的示例
4.聊天機器人為了完成用戶要求需要對接外部服務或開放API
此時,要將傳統的關係型知識圖譜(刻畫二元關係)擴展到支持動態服務的動態圖譜(刻畫多元關係,事件屬於服務圖譜的一個特例)。同時,如何刻畫服務之間的各種關係(如因果、時序依賴等)也是圖譜擴展過程中需要考慮的。例如,完成訂餐後,會有很多後續(follow-up)服務(訂花或預約車等)可供消費。建立這些服務之間的關聯對進行精準的多輪對話過程中的場景切換是非常必要的,圖4所示為一個案例。
圖4 聊天機器人需要對接外部服務或開放API
5.聊天機器人不僅需要純文本的知識圖譜,還需要包含多媒體知識的知識圖譜
人類不僅把文字作為接觸世界的手段,還會結合圖像、語音和文字等多模態來了解外部世界。因此,在研發聊天機器人時所構建的知識圖譜也應該從單純文本自然擴展到多媒體知識圖譜。史丹福大學李飛飛教授創辦的ImageNet和Visual Genome正是在這方面進行努力的典範。對於用戶圖譜這樣更新頻度非常高且很稠密的知識圖譜,多媒體知識的引入能幫助聊天機器人從更多的維度了解用戶,並提供諸如Visual QA等潛在的問答服務。例如,小明正在和聊天機器人進行交互,聊天機器人通過自身搭載的攝像頭識別出當前交互的用戶是小明,然後根據小明的圖像與用戶ID的關聯,進一步得到自身保存的與小明相關的長短時記憶,了解到他將在4月20日~23日去南京出差,而4月24日要和小蘭共進晚餐。此時,通過用戶知識圖譜中的社交關係了解到小蘭是小明的女友。當聊天機器人需要進一步了解小蘭長什麼樣時,或者當小蘭出現在聊天機器人面前時,聊天機器人需要認出小蘭,這時就需要用到包含多媒體知識的知識圖譜。圖5是對上述描述的可視化說明。
總而言之,聊天機器人需要基於多源、異構的數據構建包含多類別且體現動態和個性化的知識圖譜。這其中包括基於來自網際網路的數據刻畫世界知識、基於用戶數據刻畫用戶畫像知識、針對機器人的各種基本屬性、社會關係、情感狀態、興趣愛好、日常生活等靜態和動態知識得到的融合圖譜,它是時空坐標中針對特定交互場景和時間節點的一個鏡像,圖6所示為一個案例。
圖5 聊天機器人需要包含多媒體知識的知識圖譜
圖6 聊天機器人需要基於多源、異構的數據構建包含多類別且體現動態和個性化的知識圖譜
根據聊天機器人所屬領域的自然語言理解具體技術的需要,建立知識圖譜後,使用分詞、實體識別與消歧等技術,將用戶輸入的自然語言中包含的實體與知識圖譜中的實體進行連結,使機器人可以理解用戶輸入的自然語言中包含的意圖,從而從知識圖譜中抽取合適的內容對用戶輸入進行回復。
6. 福利活動
小編今天為大家準備了王昊奮、邵浩等老師的新書:《自然語言處理實踐:聊天機器人技術原理與應用》,即日起截至3月22日(下周五)中午12:00,歡迎大家在本文留言區留言,點讚人數最多的6名同學,將獲得這本新書哦!我們將在3月25日公布獲獎結果,大家快快來參與吧!
下面帶大家來了解下這本新書:
書名:《自然語言處理實踐:聊天機器人技術原理與應用》
作者:王昊奮 邵浩 等
出版日期:2019年3月
內容介紹
聊天機器人作為人工智慧技術的殺手級應用,發展得如火如荼,各種智能硬體層出不窮。本書系統地闡述了聊天機器人的分類和關鍵技術,不僅給出了實際案例,還展望了聊天機器人在通往更智能化、更人性化、更趣味化的道路上所面臨的挑戰。同時,針對聊天機器人在從感知智能到認知智能的跨越中所面臨的難題,本書著重討論了知識圖譜和深度學習技術在自然語言處理、問答、推理、服務融合等方面的應用。
本書適合有志於從事人工智慧行業,以及想了解聊天機器人到底是什麼的讀者閱讀。
等不及的小夥伴,可以自己先行購買呦~
京東自營連結(也可點擊文末閱讀原文直接購買)
https://item.jd.com/12539314.html