雷鋒網 AI 科技評論按:今年 315 晚會曝光了智能騷擾電話機器人產業鏈,讓我們意識到那些令人不堪其擾的銷售來電背後,好多都是沒感情的 AI。對此深惡痛絕的阿里人工智慧實驗室研究員聶再清決定「以其人之道還治其人之身」,近日發布一款名為「二哈」的防騷擾電話 AI 技術,讓我們在接到騷擾來電時,可以選擇轉給 AI 代為應答。
阿里巴巴人工智慧實驗室近日發布的一段錄音顯示,「二哈」已達到以假亂真的對話水平,錄音中的人類銷售對此毫無察覺,不知與之對話的竟是一名 AI。
在這段長達1分多鐘的對話中,「二哈」對答如流,不但會主動向女銷售諮詢「北京能不能貸款?」、「最多能貸多少錢?」,甚至還在對話中「調戲」對方:「你之前給我打過電話吧,聽起來挺耳熟的?」
阿里 AI labs 北京研發中心負責人聶再清介紹,「二哈」應用了他提出的「智能聊天」概念,需要理解用戶請求,用強大的知識圖譜生成知識點,在對話中將知識點「輸出」給用戶,同時用基於深度強化學習的對話策略引導對方的問題,從而將聊天進行下去。
「大家可能看視頻覺得這是一個特別逗的產品,但這裡面其實應用了非常多的前沿技術。我們現在已經申請了幾十項人工智慧領域的技術專利,今天大家就可以在支付寶小程序和天貓精靈的App上『調戲』我們的這個小機器人了。」
相關技術積累
在聶再清一篇 2018 年 AAAI 錄用論文中,他提出一個聊天機器人人機協作框架 CoChat,該框架可以讓人類工作者隨時幹預機器人的學習過程,機器人能夠通過從標註過的對話日誌、人類工作者的反饋以及用戶的反饋中學習,由此使對話質量獲得持續改進。換句話說,CoChat 結合了監督學習(標註日誌)以及有延遲獎勵 / 反饋的強化學習(人類工作者/用戶反饋),可以持續不斷地自我完善。
CoChat 框架示意圖
此外,該論文還進一步提出對話管理器模型 MemHRNN,可以讓機器人迅速對人類提出的新問題作出回應(原來資料庫所沒有的)。
在具體操作上,首先將對話歷史、語言理解結果和 API 調用結果等外部信息組合起來作為輸入,然後輸出所有動作的概率分布以用於動作選擇。當出現新動作時,該 HRNN 的架構可以相應地改變,而不會丟失在之前的學習過程中積累的知識。最重要的是,聶再清團隊還在 MemHRNN 中進一步引入了外部記憶來處理由即時引入新動作所導致的單樣本學習難題,即這些新動作出現的次數太少,讓 HRNN 難以學習與它們有關的有效策略。
論文連結:https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/view/16748
聶再清的「實用產品」夢
聶再清此前在微軟亞洲研究院主要負責微軟自然語言理解、實體挖掘的研發工作。在對象級別搜索與大數據挖掘方面申請國際專利十餘項。
在 2017 年年底,他選擇加盟阿里人工智慧實驗室,當時被媒體稱為「阿里達摩院成立後打響的人才強奪戰第一槍。」,在業界的分量不言而喻。對於選擇加盟阿里的原因,他在接受採訪時表示,阿里可以讓他「把一些想法做成真正影響很多人生活的一個東西。」,而到了阿里巴巴人工智慧實驗室的他主要專攻知識圖譜與自然語言理解兩個研究方向,為阿里巴巴提供包括意圖理解、實體抽取、對話管理以及知識圖譜在內的技術支持。
去年接受媒體採訪時,聶再清總結了當時 NLP 領域的階段性問題,並提出相應的 4 大對策,可以看作是他過去 1 年試圖攻克的事情:
其一,從公開大數據中積累更多的可替換詞典和語義模板。以「請幫我打輛車」為例,「請幫我」有很多說法,如「麻煩幫我」、「給我」等,「打車」可以叫「約車」等,這些同類詞(或同義詞)叫做可替換詞典,它可以增強自然語言的通用性,能夠很好的解決語言的歧義性問題。而語義模板側重這句話中語義的順序,不同順序問答的積累,也可以解決一部分自然語言歧義性、多樣性的問題;
其二,他希望建立一個知識圖譜的生態平臺,讓大量的開發人員在上面去建立知識圖譜,使用積累的知識圖譜,不斷擴大知識圖譜在常識性和專業性方面的積累,即共建知識圖譜,產生1+1>2的效果;
其三,隨著語音交互進入千家萬戶,通過強化學習、深度學習等不同的策略,讓機器在與人溝通中判斷用戶的喜好,並進行不斷的自主學習和迭代,當有大量用戶大量數據的時候,自然語言理解就會更準確和個性化;
其四,把知識庫、知識圖譜運用起來,讓這些結構化的數據促進自然語言的理解。
因此,「二哈」如今看來令人驚嘆的對話水平,其實早有相應積累。這既是聶再清加盟阿里後的階段性成果,也是他個人「實用產品」夢的實現,讓人不禁期待,他在未來又將為我們帶來哪些有意思的產品。
雷鋒網(公眾號:雷鋒網) AI 科技評論 雷鋒網
雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。