十問十答———來了解一下會聊天的機器人

2021-02-26 i教漢語

近期「索菲亞」被授予沙特國籍一事,讓對人工智慧「漠不關心」的我很震驚。真的嗎?機器人和人類聊天的原理到底是什麼?和語言學有什麼關係嗎?帶著疑問「採訪」了一位理科生,藝名Shield,他也不是什麼專家,只是對人工智慧比較感興趣而已,但足以應付我這個「白痴」了。隨後又查閱了一些資料,下面通過十問十答的方式,來概括一下我的收穫。

「人工智慧」簡稱AI(Artificial Intelligence)是計算機科學的一個分支,它企圖了解智能的實質,並生產出一種新的能與人類智能相似的智能機器,研究包括機器人、語音識別、圖像識別、自然語言處理等。

PS:其實也就是,讓機器「擁有」人的大腦。

不知疲倦的倉儲機器人在工作(場面相當震撼):

有很多:聊天機器人、陪護機器人、銀行機器人、倉儲機器人、送餐機器人、家務機器人、工業機器人、太空機器人等等。現在引起關注較多的是工業機器人聊天機器人,但聊天機器人不一定有「真身」。

下面是聊天機器人系統框架圖,其中「1語音識別」和「5語音合成」不是必須的,比如客服機器人。

我們來簡單看一下這五個環節:

1.語音識別:將語音轉換成文本並交給2;

2.自然語言理解:對輸入文本的用詞和語法進行語義理解之後形成特定的語義表達式並交給3;

3.對話管理:負責協調各個模塊的調用及維護當前對話狀態(通過對話記錄構建的對話場景),選擇特定的回覆方式並交給4;

4.自然語言生成:生成回復文本並交給5;

5.語音合成:將文字轉換成語音輸出給用戶。

其中「4自然語言的生成」這一環節有兩種模式:

1.   對輸入的話語提取關鍵詞,再從龐大的語料庫中匹配最合適的回答。如果所問問題語料庫中沒有類似的,就會出現「答非所問」的情況。

2.   自動分析並檢索與輸入話語有關的詞並按照人類語言的組合規則,生成一個回復,這種回復有可能是從未在語料庫中出現的、由聊天機器人自己「創造」出來的句子。(據說,「小冰五代」不再鸚鵡學舌,已能夠自創回應。)

下面通過一個例子看看聊天機器人到底是怎麼理解並回復的?

問它:你好嗎? 它可有兩種方法回答:

1.先搜索同類問題,然後從庫中搜索答案,可能為:很好;還行;湊合吧。最後匹配最可能的答案。

2.通過語義識別進行處理的方法:

(1)先對語句進行分析:

你----需要回答「我」或省略

好----表狀態(需在狀態類詞語中選擇答案)

嗎?---表疑問

(2)語義轉換為「你+是/否+好」,然後在「很好/好/還行/湊合/怎麼樣不」中選擇一個。

(3)答:我還行。

   下面是跟機器人小冰的聊天記錄,前一天我曾逗她說她笨:

用途很廣,比如在線客服、娛樂、個人助理、教育和智能問答等。比如Siri就是「個人助理」,可以幫人訂餐,也能幫人做日程的管理,還能幫人播放本地的音樂、視頻。「小冰」會講笑話、會唱歌、會畫畫、還可以當記者和主持人、給她一篇文章,她還能馬上合成錄音;還有很多機器人會寫詩,有的還出了詩集。下面是古詩創作機器人「九歌」的作品:

一切皆有可能,說不準很快就有一款機器人可以陪留學生練習口語了。它還可以當一個稱職的導購人員或被應用到金融理財、醫療諮詢等領域。

可能是一些機械的、單調的、重複的工作,比如電話推銷員、客服、打字員、前臺、銀行職員等。對外漢語老師暫時應該是比較安全的,因為教師這個職業需要人文關懷,而機器人是沒有感情的。

之前交行出現的那個可愛的銀行機器人「嬌嬌」,專家表示:極有可能有人在幕後控制,只是經過了一道「變聲」。「索菲亞」出現後,清華大學的人工智慧專家馬少平教授評價「不相信是真的,某視在節目中已經有過類似欺騙行為。」現階段,微軟、蘋果和Google等國際巨頭尚不能達到這種問答水平,索菲亞機器人所屬的漢森機器人公司更難以達到,不過「索菲亞」機器人的面部表情確實是現階段機器人中表現最優秀的。

下面是曾引起轟動的機器人「嬌嬌」的視頻:

當前聊天機器人都是特定領域的,微軟「小冰」專注於情感聊天,Siri和Google Now致力於語音聊天與手機助理,客服機器人提供產品功能諮詢與售後等。目前還沒有全領域的聊天機器人,因為這需要複雜的知識背景,如果它的庫中沒有這些「知識」作基礎,它就無法理解並作出合適的回答。

另外,機器人雖然能跟人聊天,但並不能像人腦一樣精準理解人的言語、心情及意圖,特別是在缺少上下文語境、句中較多省略和指代的情況下。比如,你說「好熱啊」,它的回答可能就會瞎編亂造。

下面這位山東大哥,快被車載語音助手氣瘋了(超級搞笑)

詞法分析句法分析以及語義分析等成果對聊天機器人系統中的自然語言理解功能已起到至關重要的作用。但對話中的自然語言的規則有很大的靈活性和模糊性,以及各種例外情況,龐雜的語言規則系統至今沒有成功建立。這就造成當前自然語言處理學界與傳統語言學界的脫節,導致對話機器人在理解力上的內在缺陷。因此,自然語言處理或者對話機器人未來的方向是最基礎的語義分析語言規則系統的建立,當前符號系統(邏輯推理)與深度學習的結合研究正是這方面的嘗試。看來人工智慧想要更智能,需要語言學家的一臂之力啊!

圖靈獎(計算機界的諾貝爾獎)得主John Hopcroft對此表示:我們仍處於非常初級的階段,現在談論的機器人智能是未來10年會發生的事情,而他們談論的威脅是數百年後的事情。

雖然無法預言機器人是否會毀滅人類,但過於依賴智慧機器人,我們會變得懶於思考與行動,而讓自己的智力與體能退化,這才是對人類最大的威脅。

此篇文章的一些觀點是在查閱相關資料後形成的,所以難免主觀,不妥之處,多多見諒,也煩請行內高手多多指教,最後衷心感謝Shield先生對我的幫助。

參考文章:

《一篇文章看懂聊天機器人的歷史、技術和研究進展》  作者:張偉男,劉挺

https://www.sohu.com/a/56113983_129720

《談談聊天機器人》  小滿少尉

https://www.douban.com/note/258525988/

撰稿:班曼

編輯:LibbyO

相關焦點

  • 「十問十答」帶你了解《中華人民共和國社區矯正法》
    本篇「十問十答」帶你了解《中華人民共和國社區矯正法》。一問:《社區矯正法》制定的目的和依據?一答:根據《社區矯正法》第一章第一條規定,為了推進和規範社區矯正工作,保障刑事判決、刑事裁定和暫予監外執行決定的正確執行,提高教育矯正質量,促進社區矯正對象順利融入社會,預防和減少犯罪,根據憲法,制定本法。二問:《社區矯正法》通過及施行的時間?
  • 國家政務服務平臺「防疫健康信息碼」十問十答
    國家政務服務平臺「防疫健康信息碼」十問十答 2020-12-03 18:10 來源:澎湃新聞·澎湃號·政務
  • SCAD 招生官的十問十答
    新的學季已經展開,就讀高中、對藝術設計又充滿熱情的同學,最近開始與我們接觸,希望多了解 SCAD 的入學和申請相關的信息。
  • 朱一龍十問十答,30歲,焦慮嗎?讓自己先動起來!
    萬萬沒想到居然還有後續:朱一龍十問十答。「30歲,焦慮嗎?」,「『朱一龍』三個字是『負累』嗎」,「不工作的時候做什麼?」,「解壓的小方法?」,「會在監視器看自己的表演嗎?」,「對道具妝容會有嚴格的要求嗎?」,「對大學生活印象最深的是?」,「大學教育對你最大的影響?」,「武漢人有什麼特點?」
  • 2020年二級建造師報考十問十答,你知道哪些?來考網
    2020年二級建造師報考十問十答,你知道哪些?來考網Q1:二級建造師考試需要滿足什麼條件才能報考?A:報考二級建造師考試,需要滿足以下條件:凡遵紀守法,具備工程或工程經濟類中等專科以上學歷並從事建設工程項目施工管理工作滿2年。Q2:二級建造師報名時間是什麼時候?考試時間是怎麼安排的?
  • 訴訟費交納之十問十答
    訴訟費交納之十問十答 2020-11-23 13:49 來源:澎湃新聞·澎湃號·政務
  • 全面禁放煙花爆竹「十問十答」
    全面禁放煙花爆竹「十問十答」八、問:在禁止燃放煙花爆竹的區域、地點和時間燃放煙花爆竹,會受到何種處罰?九、問:在禁止銷售煙花爆竹的區域、地點和時間進行銷售,會受到何種處罰?END原標題:《全面禁放煙花爆竹「十問十答」》閱讀原文
  • 《中華人民共和國人民陪審員法》十問十答
    《中華人民共和國人民陪審員法》十問十答 2020-04-29 02:35 來源:澎湃新聞·澎湃號·政務
  • CoinCola可盈可樂研究院| Libra聽證會十問十答
    現整理出關鍵的十問十答,幫助大家快速掌握此次聽證會的關鍵信息。一. 政策監管【提問1】參議院銀行委員會主席:是否同意美國應該領導關於Libra的監管規則制定?David Marcus回答:同意,現在正在與美國監管機構合作。【提問2】參議院銀行副主席:如果我們所有人都覺得Libra是個壞主意,你還會這麼做嗎?
  • 關於線上預約掛號的十問十答
    關於線上預約掛號的十問十答 2020-03-12 18:06 來源:澎湃新聞 政務
  • 肇慶市2020年初中畢業生升學​體育考試十問十答
    肇慶市2020年初中畢業生升學​體育考試十問十答 2020-05-19 17:22 來源:澎湃新聞·澎湃號·政務
  • 期刊相關知識十問十答
    期刊相關知識十問十答二、論文發表的期刊是幾號字印刷?紙張是多大?一個版面多少字?論文發表的期刊通常是16開大小,和A4紙張差不多大小,期刊一頁被成為一個版面,不同期刊會使用不同的格式來印刷,字體、行距、邊距都不一樣,一本期刊的不同期數一般都會採用想用的格式。因而期刊一個版面能有多少字就不一定了。一般來說,一個版面,全部是文字的話,也就是沒有空格縮進,沒有符號空格表格圖片等,大概有2000-3000字符。
  • 英國留學籤證辦理十問十答_籤證新聞_中英網www.uker.net-英國留學...
    編者按:英國留學籤證辦理十問十答1. 英國留學籤證有效期是多長?這取決於籤證的類別。訪問籤證有效期為六個月,不可延期。如果是英國定居,您籤證的最初有效期為兩年。英國留學籤證的有效期與您被無條件錄取的課程等長。
  • 榮新奇教授關於青少年心理問題的十問十答(一)
    這也就是因為青少年看待事物的不全面性和不夠成熟,導致其有了心理問題只會默默承受,無法表達出來或者根本意識不到這是一種心理疾病,從而導致病情越來越深,有些心理問題青少年壓根就來不及做心理疏導就已經。。。這裡就不深入講 了。今天本人總結了青少年的十個心理常見問題作出解答和建議,希望能對部分青少年有所幫助。
  • 海南省衛健委發布登革熱防與治十問十答
    南海網、南海網客戶端海口9月9日消息(南海網記者 任桐)9月9日,海南省衛生健康委員會發布科普知識,就登革熱防治知識熱點問題進行解答,形成如下十問十答。一、什麼是登革熱?②全身的毒血症狀會伴隨發熱而發生,如頭痛,腰痛,骨關節痛。③有皮疹,在病程3~6天出現,有出血,淋巴結腫大等,個別的還會有黃疸、肝腫大發現。輕型登革熱:其表現類似流行性感冒。重型登革熱:有典型登革熱表現,並且會出現精神症狀和消化道大出血等表現。六、登革熱有無特殊防治方法?
  • 2021考研報名的十問十答,正確信息填寫
    考研報名的常見問題十問十答1.在預報名時已經報名成功,還需要再參加正式報名嗎?預報名和正式報名具有同等效力,原則上預報名是只針對應屆生開放的,但也有部分地區,像北京、廣東、湖南、江西、南京、黑龍江、河北、山東等地是允許往屆生參加預報名,還要以各個省教育部公布的報名要求為準。
  • 國慶長假 香港購表十問十答
    新浪尚品推出國慶長假香港購表十問十答,幫你買到心儀手錶。   Q:腕錶不斷上調價格,現在去香港買表還划算嗎?彌敦道上那些真正賣名表的老字號表行還不至於賣假表的,因為瑞士各名廠的東南亞總代理許多都在香港,誰敢在香港假冒他們的貨品他們會拼老命的。你應該做的是:在內地就選好表款,詳細記錄下本地公價及貨品獨立代碼。赴港後直接按代碼購買,做到有的放矢,較少聽取當地店員的推薦。
  • 總結 | 動態規劃十問十答
    今天給大家總結動態規劃十問十答,快速幫你掃盲動態規劃。答:動態規劃是一種通過「大而化小」的思路解決問題的算法。區別於一些固定形式的算法,如二分法,寬度優先搜索法,動態規劃沒有實際的步驟來規定第一步做什麼第二步做什麼。所以更加確切的說,動態規劃是一種解決問題的思想。
  • 星月菩提十問十答,大留白青花瓷原生態,看完就知道怎樣不被忽悠
    為了幫助玩友們選到中意的星月,我特總結了星月的十問十答,從星月的基礎知識和品相名稱給大家簡單介紹一下,讀懂了這十條,你就知道了什麼是好的星月菩提,再也不用擔心被商家忽悠了。一、 什麼是星月菩提?1.
  • 乾貨總結 | 動態規劃十問十答
    今天給大家總結動態規劃十問十答,快速幫你掃盲動態規劃。答:動態規劃是一種通過「大而化小」的思路解決問題的算法。區別於一些固定形式的算法,如二分法,寬度優先搜索法,動態規劃沒有實際的步驟來規定第一步做什麼第二步做什麼。所以更加確切的說,動態規劃是一種解決問題的思想。