智能語音機器人如何理解一句話?具體流程是什麼?

2020-12-15 人人都是產品經理

文章以機器人的口吻出發，簡述了身為智能語音機器人的「我」是如何理解一句話的，具體又分為哪幾個步驟，一起來看看~

自我介紹

哈嘍～我是人工智慧語音機器人，今天想給大家說說我的大腦中最關鍵的構造，這樣你們能知道我的思維方式和目前的局限性，就能持著一種更平和的心態看我啦。所以，我今天主要要回答的問題是：「機器人是如何思考的？」

問題：機器人是如何思考的？

當我把我獲取的信息轉化成文字，就是我要開始思考的時候了。我怎麼理解這些文字呢？全依賴於我大腦裡的「語音系統」——自然語言處理，NLP，它讓我能模仿你們去理解你們的語言。接下來我會通過一個例子來描述我的思考過程。

我理解「2018年5月周杰倫發表了一首新歌」的過程

1. 先把句子拆分成一個一個詞語

首先，我要先把這個句子用我的理解拆成一個個詞語（我能理解都來源於各種大數據，各種模型的支持），當然，我其實，有時候句子稍微複雜，我就容易把詞語拆分錯，這樣第一步出了問題，我就很難理解正確了。

例如，當說：嚴守一/把/手機/關了，我容易理解成：嚴守/一把手/機/關了。因為我印象中有一個「一把手」的詞語，而不存在「嚴守一」這個人名。所以我其實很難理解「嚴守一」是一個人名，而把「嚴守一」拆開來理解。

2. 理解每個詞語

當我把詞拆開後，我開始理解每個詞語的詞性，進行實體識別。例如，我理解了「周杰倫」是一個人名，「2018年」是一個年份，「新歌」是一個名詞。

3. 再理解每個詞語之間的關係

同樣是基於人類智慧的結晶，我利用數據和各種算法等來理解每個實體的相互關係，這個時候我大概對這句話有一個模糊的理解了

4. 把句子分意圖

在理解了句子有哪些實體，實體之間的關係，我就能粗略地把這個句子的意圖分類出來。在這裡說下為什麼我要把句子分意圖呢？人類語言太博大精深了，但還好，每一句話背後都有它的動機。

我基於這個動機把各種語言都化在一個有限的空間裡，分了n個大類，這樣我才有可能理解；一般來說，你們經常看到的人工智慧語言機器人，意圖都有如下幾類：閒聊-音樂-機器功能-天氣-鬧鐘-智能家居。

我是怎麼分意圖的呢，這個就是利用基於算法的模型，這個模型是程式設計師哥哥們通過各種數據來訓練的，當然有時還需要人定的一些特殊規則等來分類。這句話是不是在規定好的我們常要點歌的指令集裡（指令集：也就是我們總結的人表達某個意圖可能的說話方式，例如，聽歌可以有多種表達方式，如我要聽歌，能不能播放一首歌，來一首歌等）

例如，當我分析「我要聽周杰倫的歌」，我就能毫不猶豫地把這句話理解成：「哦，原來是要執行和音樂操作相關的」，然後把這句話的意圖歸類到：」音樂」意圖。

但，當我分析」2018年5月周杰倫發表了一首新歌」,我通過實體識別，發現有一個「歌」，還有一個歌手，周杰倫，我就可能會把這句話的意圖理解為播放歌曲，搞不好我就會直接給播放周杰倫的歌了。現在想想我真是傻；

多虧了程式設計師哥哥們的各種智慧，他們為我額外裝了一個糾錯模型，如果我把這句話的粗略意圖判斷錯了也沒關係，這句進入到糾錯模型後，會被過濾出來，再丟到一個萬能意圖（閒聊），這個時候，會被判斷為「音樂相關的閒聊」意圖。

所以，嗯，我最終把」2018年5月周杰倫發表了一首新歌」這句話理解成了原來是想和我聊個2毛錢的天啊。所以我就會啟動我的聊天模式（聊天模塊），開始和你瞎扯。

總結

總的來說，我要理解一句話，我要經過把句子拆了，然後再自己把句子組合，最後再理解這句話背後的意圖，當我理解了意圖的時候，我覺得我幾乎已經理解了這句話。但然而，我很多時候分類意圖還是會出錯，所以，當我意圖都錯誤的時候，我很有可能回應你的行為，你會覺得這行為很傻。

好啦，今天就聊到這吧。拜拜啦～

作者：huotui，從業語義產品經理，也就是AI產品經理，主要做智能音箱。後續會分享一些關於AI產品經理和AI產品心得給大家

本文由 @huotui 原創發布於人人都是產品經理。未經許可，禁止轉載。

題圖來自Unsplash，基於CC0協議

相關焦點

7x24小時快速響應,12122熱線啟用智能語音客服機器人

捷通華聲在與某省高速12122熱線中心合作項目中，將語音識別、語義理解、語音合成等人工智慧技術與客服業務相結合，打造了高情商、個性化的靈雲智能語音客服機器人。客服機器人可以自動接起廣大車主撥打的「12122」客服熱線，並以流暢自然的語音交互，7x24小時為車主提供ETC相關問題答疑、綠通政策諮詢、路況查詢、車輛救援等服務。
機器人是如何實現對話的?

對話機器人作為近年來愈發普遍的產品，以各種各樣的形態出現我們的生活中：電話客服、文本客服、超市裡的導購機器人等；那這些機器人如何實現和我們人類的智能對話的呢？本文將用顯淺易懂的文字講述機器人的對話原理與產品設計要點。
機器人也會說方言?度小滿語音機器人能說四川話、河南話

由曦：度小滿金融背靠百度的人工智慧技術，語音機器人的無感率已經達到99%。這個語音機器人不僅可以說普通話還可以說方言，包括四川話、河南話都可以講。語音機器人是如何聽懂人說話的，它背後的原理又是什麼？聽說在度小滿金融還有專門的語音機器人訓練師的崗位，他們是怎麼樣工作的？能不能請周總給我們介紹一下。周建龍：語音機器人的工作原理主要是在人機的對話過程中，模擬客服的聽、說、理解、決策這四項能力。首先，用戶在電話一端說了一句話，機器人它會先聽，聽是什麼，就是把用戶的這段話通過語音識別轉化成文本。
電視+機器人+語音,開創智能娛樂時代

作為一位商業攝影師+數碼產品發燒友，藉由工作之便，我常常有機會試用到一些新奇好玩的智能產品。比如這次極果試用的夏普60SU470A+超級飛俠樂迪機器人的智能家庭套裝，給孩子提供了一套全新的玩法。怎麼樣？好玩吧，有意思吧。超級飛俠樂迪機器人可以通過語音遙控電視機哦。所以電視機+機器人+語音識別，玩法就多了。
石頭掃地機器人接入了這些音箱:清掃回充變成一句話的事

還記得復仇者聯盟系列電影當中鋼鐵俠「妮妮」的那個無所不能、聰明智能的Jarvis管家嗎？隨時隨地有什麼需要，一句話就能讓Jarvis搞定。以石頭掃地機器人T7 系列為例，它現已支持聯動多個品牌的智能音箱進行語音操作：目前已經支持小愛音箱、小度音箱、天貓精靈、Siri 捷徑（需用米家APP）。
大家說 | 淺談智能聊天機器人的設計及應用

智能聊天機器人，是一種通過自然語言模擬人類進行對話的程序，它可以解放企業中相對固化、重複的密集型任務或流程所需的人力。智能聊天機器人最核心的部分是對話引擎，對話引擎包括自動語音識別(ASR)、自然語言理解(NLU)、對話管理(DM)、自然語言生成(NLG) 和文本到語音合成(TTS)，大部分聊天機器人系統的模型可以抽象成下圖所示的結構。上圖可以很清晰的看到對話引擎每個模塊的輸入輸出，以及各模塊之間的協作關係。我們解釋一下每個模塊的功能。
西北工業大學擬人化語音合成技術——「客服機器人」上線

「您好，某某客服，請問您是要諮詢什麼問題呢？」　　「我點的外賣什麼時候可以送到？」　　你有沒有給客服熱線打過電話？亦或是接到客服人員給你打來的電話？每天這樣的電話有上千萬通，在人工智慧和智能語音技術的幫助下，大量的這種電話目前可以自動通過內呼和外呼機器人自動完成，幫助人們從大量的簡單重複勞動中解脫出來，投入到更有創造力的工作中去。
智能語音交互應該如何設計?

編輯導語：隨著亞馬遜、小米、阿里巴巴等大公司都推出了智能語音產品，智能語音互動設計成為了一個值得探索的領域。語音交互如何設計才能達到更自然的交互反饋、更好的傳達情感，這是目前需要解決的問題。對於用戶來說，希望能與智能產品建立親切的信任感，越相處越好用。AI時代，深知我者，才能久居我心。
這些智能音箱可以控制石頭T7系列,一句話就能清掃

石頭掃地機器人T7系列還有一項小技能可以讓清掃變得更簡單，那就是支持智能音箱控制掃地機。通過智能音箱，你只要一句話就能讓石頭掃地機器人T7系列開始清掃、回充等，不用通過掃地機上面的按鈕或者手機，使用更簡單。
微軟曹文韜:機器人只是AI的載體理解方式才是靈魂

首先是語音。微軟把一些技術應用到小冰上，把一些語義理解和對用戶的情感提現在對話過程中，再應用到場景中，用戶就會真正感受到小冰是在聊天而不是回答問題，還能知道用戶的心情到底是什麼，更進一步的增強了黏性。其次是圖片。
遠傳:讓智能交互更有溫度

雖然對方聲音甜美、抑揚頓挫,但我們一聽就知道是機器語音。因為它自說自話,不支持打斷,用戶想提問必須先等語音講完。這種服務體驗就好像冬天裡的一桶冰,不僅沒有溫度,而且讓客戶感知從頭涼到腳。一、支持智能打斷和流程跳轉是「因你而變」作為縱深客戶服務領域15年的領軍企業,遠傳賦予智能語音機器人支持智能打斷的標籤能力。
解密人工智慧產業上遊:智能語音合成背後,誰在默默耕耘

前百度首席科學家吳恩達曾說：「語音是人類交流、人機互動最自然的方式。」過去的70年，人機互動形式不斷進化，從計算機時代的鍵盤，到智慧型手機時代的觸控螢幕，如今語音交互正在引領人工智慧為主導的下一個人機互動的新時代，它能夠在社交、導航、搜索、機器人等領域大規模應用。
如何讓機器人聽懂人類的語言,理解人類的語言表達|極客雲算

然而回到現實後，讓我們認清科幻畢竟是科幻，比如現在我們手機中的語音助手siri，當你和她對話時，你就會發現，Siri回答的話題也有相當大部分來自預先設定好的語料庫。很多的時候她並聽不懂我們在說什麼，或者說是脫離了她預測語料庫，所以她沒有辦法回答我們。
王者榮耀智慧機器人有什麼功能智慧機器人呂小布能做什麼

王者榮耀智慧機器人有什麼功能智慧機器人呂小布能做什麼王者榮耀官方最近新推出一款智慧機器人，就叫做王者榮耀智慧機器人呂小布，是以呂布為原型創作的，想必很多玩王者榮耀的玩家都會很感興趣吧
專訪阿里 iDST 語音組總監鄢志傑:智能語音交互從技術到產品,有...

iDST 智能語音交互小組在做哪些事情？雷鋒網：阿里 iDST 部門智能語音交互小組主要負責什麼？鄢志傑：我們這邊是智能語音交互的，包括幾個部分，通常我們講語音進和語音出。語音進就是語音識別，識別成了文字以後，就進入到我們的對話系統裡，做這句話的理解。
語音機器人走上工作崗位,翻譯官慌了!

2017年9月20日消息近年來工智能技術迎來爆發奇點，但語音技術的進步相對來說卻稍顯遜色。但隨著智慧機器人逐漸滲透社會各個領域，語音功能則成為衡量其性能的一項重要指標，尤其是對於翻譯機器人而言。翻譯機器人的誕生也將使得各國遊客可以盡情暢玩，因為你不用再苦練英文發音和文法，智慧機器人就會說中國話啦。對此許多人工翻譯工作者感慨：「作為翻譯，看到這個新聞的時候，我理解了18世紀紡織工人看到蒸汽機時的憂慮與恐懼。」當然語音技術一直被視為人工智慧領域難的難點，因為人類語義理解非常複雜，以及對於同一個場中聲音強弱的收取辨別等。
語音機器人走上工作崗位, 翻譯官慌了!

> 驅動中國2017年9月20日消息近年來工智能技術迎來爆發奇點
歐華帝斯智能家居加盟具體流程如何?

作者：來源網絡時間：2020-06-22 17:33:07 瀏覽：1次歐華帝斯AI智能家居加盟前景怎麼樣？具體加盟流程如何？
微信APP發語音照片的具體操作流程介紹

手機微信APP是我們現在生活中必備的軟體，至今還是有一些用戶不了解其中如何發語音照片?接著，現在就為你們帶來了微信APP發語音照片的具體操作流程介紹。第一步.點擊錄音面板結束錄音，然後再點擊右上角「...」圖標，選擇「發送給朋友」，將語音照片發送給對方即可。看了上文講解的微信APP發語音照片的具體操作流程介紹，你們也趕快去發試試吧!
京東AI研究院何曉冬:如何讓AI通過NLP技術理解人類?

在這場報告中，何曉冬博士首先簡略回顧了深度學習技術對語音，語言，視覺等方面的驅動，然後著重從兩個方面探討了其在自然語言處理（NLP）方面的前沿研究，一是如何讓AI通過NLP技術理解人類，如理解意圖，解析語義，識別情緒，搜索推薦；二是如何讓AI的結果能被人類理解接受，如文本摘要，內容生成，話題展開，情感對話等。

智能語音機器人如何理解一句話?具體流程是什麼?

相關焦點

7x24小時快速響應,12122熱線啟用智能語音客服機器人

機器人是如何實現對話的?

機器人也會說方言?度小滿語音機器人能說四川話、河南話

電視+機器人+語音,開創智能娛樂時代

石頭掃地機器人接入了這些音箱:清掃回充變成一句話的事

大家說 | 淺談智能聊天機器人的設計及應用

西北工業大學擬人化語音合成技術——「客服機器人」上線

智能語音交互應該如何設計?

這些智能音箱可以控制石頭T7系列,一句話就能清掃

微軟曹文韜:機器人只是AI的載體 理解方式才是靈魂

遠傳:讓智能交互更有溫度

解密人工智慧產業上遊:智能語音合成背後,誰在默默耕耘

如何讓機器人聽懂人類的語言,理解人類的語言表達|極客雲算

王者榮耀智慧機器人有什麼功能 智慧機器人呂小布能做什麼

專訪阿里 iDST 語音組總監鄢志傑:智能語音交互從技術到產品,有...

語音機器人走上工作崗位,翻譯官慌了!

語音機器人走上工作崗位, 翻譯官慌了!

歐華帝斯智能家居加盟具體流程如何?

微信APP發語音照片的具體操作流程介紹

京東AI研究院何曉冬:如何讓AI通過NLP技術理解人類?

微軟曹文韜:機器人只是AI的載體理解方式才是靈魂

王者榮耀智慧機器人有什麼功能智慧機器人呂小布能做什麼