智能語音機器人如何理解一句話?具體流程是什麼?

2020-12-15 人人都是產品經理

文章以機器人的口吻出發,簡述了身為智能語音機器人的「我」是如何理解一句話的,具體又分為哪幾個步驟,一起來看看~

自我介紹

哈嘍~我是人工智慧語音機器人,今天想給大家說說我的大腦中最關鍵的構造,這樣你們能知道我的思維方式和目前的局限性,就能持著一種更平和的心態看我啦。所以,我今天主要要回答的問題是:「機器人是如何思考的?」

問題:機器人是如何思考的?

當我把我獲取的信息轉化成文字,就是我要開始思考的時候了。我怎麼理解這些文字呢?全依賴於我大腦裡的「語音系統」——自然語言處理,NLP,它讓我能模仿你們去理解你們的語言。接下來我會通過一個例子來描述我的思考過程。

我理解「2018年5月周杰倫發表了一首新歌」的過程

1. 先把句子拆分成一個一個詞語

首先,我要先把這個句子用我的理解拆成一個個詞語(我能理解都來源於各種大數據,各種模型的支持),當然,我其實,有時候句子稍微複雜,我就容易把詞語拆分錯,這樣第一步出了問題,我就很難理解正確了。

例如,當說:嚴守一/把/手機/關了,我容易理解成: 嚴守/一把手/機/關了。因為我印象中有一個「一把手」的詞語,而不存在「嚴守一」這個人名。所以我其實很難理解「嚴守一」是一個人名,而把「嚴守一」拆開來理解。

2. 理解每個詞語

當我把詞拆開後,我開始理解每個詞語的詞性,進行實體識別。例如,我理解了「周杰倫」是一個人名,「2018年」是一個年份,「新歌」是一個名詞。

3. 再理解每個詞語之間的關係

同樣是基於人類智慧的結晶,我利用數據和各種算法等來理解每個實體的相互關係,這個時候我大概對這句話有一個模糊的理解了

4. 把句子分意圖

在理解了句子有哪些實體,實體之間的關係,我就能粗略地把這個句子的意圖分類出來。在這裡說下為什麼我要把句子分意圖呢?人類語言太博大精深了,但還好,每一句話背後都有它的動機。

我基於這個動機把各種語言都化在一個有限的空間裡,分了n個大類,這樣我才有可能理解;一般來說,你們經常看到的人工智慧語言機器人,意圖都有如下幾類:閒聊-音樂-機器功能-天氣-鬧鐘-智能家居。

我是怎麼分意圖的呢,這個就是利用基於算法的模型,這個模型是程式設計師哥哥們通過各種數據來訓練的,當然有時還需要人定的一些特殊規則等來分類。這句話是不是在規定好的我們常要點歌的指令集裡(指令集:也就是我們總結的人表達某個意圖可能的說話方式,例如,聽歌可以有多種表達方式,如我要聽歌,能不能播放一首歌,來一首歌等)

例如,當我分析「我要聽周杰倫的歌」,我就能毫不猶豫地把這句話理解成:「哦,原來是要執行和音樂操作相關的」,然後把這句話的意圖歸類到:」音樂」意圖。

但,當我分析」2018年5月周杰倫發表了一首新歌」,我通過實體識別,發現有一個「歌」,還有一個歌手,周杰倫,我就可能會把這句話的意圖理解為播放歌曲,搞不好我就會直接給播放周杰倫的歌了。現在想想我真是傻;

多虧了程式設計師哥哥們的各種智慧,他們為我額外裝了一個糾錯模型,如果我把這句話的粗略意圖判斷錯了也沒關係,這句進入到糾錯模型後,會被過濾出來,再丟到一個萬能意圖(閒聊),這個時候,會被判斷為「音樂相關的閒聊」意圖。

所以,嗯,我最終把」2018年5月周杰倫發表了一首新歌」這句話理解成了原來是想和我聊個2毛錢的天啊。所以我就會啟動我的聊天模式(聊天模塊),開始和你瞎扯。

總結

總的來說,我要理解一句話,我要經過把句子拆了,然後再自己把句子組合,最後再理解這句話背後的意圖,當我理解了意圖的時候,我覺得我幾乎已經理解了這句話。但然而,我很多時候分類意圖還是會出錯,所以,當我意圖都錯誤的時候,我很有可能回應你的行為,你會覺得這行為很傻。

好啦,今天就聊到這吧。拜拜啦~

作者:huotui,從業語義產品經理,也就是AI產品經理,主要做智能音箱。後續會分享一些關於AI產品經理和AI產品心得給大家

本文由 @huotui 原創發布於人人都是產品經理。未經許可,禁止轉載。

題圖來自Unsplash,基於CC0協議

相關焦點

  • 7x24小時快速響應,12122熱線啟用智能語音客服機器人
    捷通華聲在與某省高速12122熱線中心合作項目中,將語音識別、語義理解、語音合成等人工智慧技術與客服業務相結合,打造了高情商、個性化的靈雲智能語音客服機器人。客服機器人可以自動接起廣大車主撥打的「12122」客服熱線,並以流暢自然的語音交互,7x24小時為車主提供ETC相關問題答疑、綠通政策諮詢、路況查詢、車輛救援等服務。
  • 機器人是如何實現對話的?
    對話機器人作為近年來愈發普遍的產品,以各種各樣的形態出現我們的生活中:電話客服、文本客服、超市裡的導購機器人等;那這些機器人如何實現和我們人類的智能對話的呢?本文將用顯淺易懂的文字講述機器人的對話原理與產品設計要點。
  • 機器人也會說方言?度小滿語音機器人能說四川話、河南話
    由曦:度小滿金融背靠百度的人工智慧技術,語音機器人的無感率已經達到99%。這個語音機器人不僅可以說普通話還可以說方言,包括四川話、河南話都可以講。語音機器人是如何聽懂人說話的,它背後的原理又是什麼?聽說在度小滿金融還有專門的語音機器人訓練師的崗位,他們是怎麼樣工作的?能不能請周總給我們介紹一下。    周建龍:語音機器人的工作原理主要是在人機的對話過程中,模擬客服的聽、說、理解、決策這四項能力。首先,用戶在電話一端說了一句話,機器人它會先聽,聽是什麼,就是把用戶的這段話通過語音識別轉化成文本。
  • 電視+機器人+語音,開創智能娛樂時代
    作為一位商業攝影師+數碼產品發燒友,藉由工作之便,我常常有機會試用到一些新奇好玩的智能產品。比如這次極果試用的夏普60SU470A+超級飛俠樂迪機器人的智能家庭套裝,給孩子提供了一套全新的玩法。怎麼樣?好玩吧,有意思吧。超級飛俠樂迪機器人可以通過語音遙控電視機哦。所以電視機+機器人+語音識別,玩法就多了。
  • 石頭掃地機器人接入了這些音箱:清掃回充變成一句話的事
    還記得復仇者聯盟系列電影當中鋼鐵俠「妮妮」的那個無所不能、聰明智能的Jarvis管家嗎?隨時隨地有什麼需要,一句話就能讓Jarvis搞定。以石頭掃地機器人T7 系列為例,它現已支持聯動多個品牌的智能音箱進行語音操作:目前已經支持小愛音箱、小度音箱、天貓精靈、Siri 捷徑(需用米家APP)。
  • 大家說 | 淺談智能聊天機器人的設計及應用
    智能聊天機器人,是一種通過自然語言模擬人類進行對話的程序,它可以解放企業中相對固化、重複的密集型任務或流程所需的人力。智能聊天機器人最核心的部分是對話引擎,對話引擎包括自動語音識別(ASR)、自然語言理解(NLU)、對話管理(DM)、自然語言生成(NLG) 和文本到語音合成(TTS),大部分聊天機器人系統的模型可以抽象成下圖所示的結構。上圖可以很清晰的看到對話引擎每個模塊的輸入輸出,以及各模塊之間的協作關係。我們解釋一下每個模塊的功能。
  • 西北工業大學擬人化語音合成技術——「客服機器人」上線
    「您好,某某客服,請問您是要諮詢什麼問題呢?」  「我點的外賣什麼時候可以送到?」  你有沒有給客服熱線打過電話?亦或是接到客服人員給你打來的電話?每天這樣的電話有上千萬通,在人工智慧和智能語音技術的幫助下,大量的這種電話目前可以自動通過內呼和外呼機器人自動完成,幫助人們從大量的簡單重複勞動中解脫出來,投入到更有創造力的工作中去。
  • 智能語音交互應該如何設計?
    編輯導語:隨著亞馬遜、小米、阿里巴巴等大公司都推出了智能語音產品,智能語音互動設計成為了一個值得探索的領域。語音交互如何設計才能達到更自然的交互反饋、更好的傳達情感,這是目前需要解決的問題。對於用戶來說,希望能與智能產品建立親切的信任感,越相處越好用。AI時代,深知我者,才能久居我心。
  • 這些智能音箱可以控制石頭T7系列,一句話就能清掃
    石頭掃地機器人T7系列還有一項小技能可以讓清掃變得更簡單,那就是支持智能音箱控制掃地機。通過智能音箱,你只要一句話就能讓石頭掃地機器人T7系列開始清掃、回充等,不用通過掃地機上面的按鈕或者手機,使用更簡單。
  • 微軟曹文韜:機器人只是AI的載體 理解方式才是靈魂
    首先是語音。微軟把一些技術應用到小冰上,把一些語義理解和對用戶的情感提現在對話過程中,再應用到場景中,用戶就會真正感受到小冰是在聊天而不是回答問題,還能知道用戶的心情到底是什麼,更進一步的增強了黏性。其次是圖片。
  • 遠傳:讓智能交互更有溫度
    雖然對方聲音甜美、抑揚頓挫,但我們一聽就知道是機器語音。因為它自說自話,不支持打斷,用戶想提問必須先等語音講完。這種服務體驗就好像冬天裡的一桶冰,不僅沒有溫度,而且讓客戶感知從頭涼到腳。一、支持智能打斷和流程跳轉是「因你而變」作為縱深客戶服務領域15年的領軍企業,遠傳賦予智能語音機器人支持智能打斷的標籤能力。
  • 解密人工智慧產業上遊:智能語音合成背後,誰在默默耕耘
    前百度首席科學家吳恩達曾說:「語音是人類交流、人機互動最自然的方式。」過去的70年,人機互動形式不斷進化,從計算機時代的鍵盤,到智慧型手機時代的觸控螢幕,如今語音交互正在引領人工智慧為主導的下一個人機互動的新時代,它能夠在社交、導航、搜索、機器人等領域大規模應用。
  • 如何讓機器人聽懂人類的語言,理解人類的語言表達|極客雲算
    然而回到現實後,讓我們認清科幻畢竟是科幻,比如現在我們手機中的語音助手siri,當你和她對話時,你就會發現,Siri回答的話題也有相當大部分來自預先設定好的語料庫。很多的時候她並聽不懂我們在說什麼,或者說是脫離了她預測語料庫,所以她沒有辦法回答我們。
  • 王者榮耀智慧機器人有什麼功能 智慧機器人呂小布能做什麼
    王者榮耀智慧機器人有什麼功能 智慧機器人呂小布能做什麼 王者榮耀官方最近新推出一款智慧機器人,就叫做王者榮耀智慧機器人呂小布,是以呂布為原型創作的,想必很多玩王者榮耀的玩家都會很感興趣吧
  • 專訪阿里 iDST 語音組總監鄢志傑:智能語音交互從技術到產品,有...
    iDST 智能語音交互小組在做哪些事情?雷鋒網:阿里 iDST 部門智能語音交互小組主要負責什麼?鄢志傑:我們這邊是智能語音交互的,包括幾個部分,通常我們講語音進和語音出。語音進就是語音識別,識別成了文字以後,就進入到我們的對話系統裡,做這句話的理解。
  • 語音機器人走上工作崗位,翻譯官慌了!
    2017年9月20日消息近年來工智能技術迎來爆發奇點,但語音技術的進步相對來說卻稍顯遜色。但隨著智慧機器人逐漸滲透社會各個領域,語音功能則成為衡量其性能的一項重要指標,尤其是對於翻譯機器人而言。翻譯機器人的誕生也將使得各國遊客可以盡情暢玩,因為你不用再苦練英文發音和文法,智慧機器人就會說中國話啦。對此許多人工翻譯工作者感慨:「作為翻譯,看到這個新聞的時候,我理解了18世紀紡織工人看到蒸汽機時的憂慮與恐懼。」當然語音技術一直被視為人工智慧領域難的難點,因為人類語義理解非常複雜,以及對於同一個場中聲音強弱的收取辨別等。
  • 語音機器人走上工作崗位, 翻譯官慌了!
    > 驅動中國2017年9月20日消息  近年來工智能技術迎來爆發奇點
  • 歐華帝斯智能家居加盟具體流程如何?
    作者:來源網絡 時間:2020-06-22 17:33:07 瀏覽:1次 歐華帝斯AI智能家居加盟前景怎麼樣?具體加盟流程如何?
  • 微信APP發語音照片的具體操作流程介紹
    手機微信APP是我們現在生活中必備的軟體,至今還是有一些用戶不了解其中如何發語音照片?接著,現在就為你們帶來了微信APP發語音照片的具體操作流程介紹。第一步.點擊錄音面板結束錄音,然後再點擊右上角「...」圖標,選擇「發送給朋友」,將語音照片發送給對方即可。看了上文講解的微信APP發語音照片的具體操作流程介紹,你們也趕快去發試試吧!
  • 京東AI研究院何曉冬:如何讓AI通過NLP技術理解人類?
    在這場報告中,何曉冬博士首先簡略回顧了深度學習技術對語音,語言,視覺等方面的驅動,然後著重從兩個方面探討了其在自然語言處理(NLP)方面的前沿研究,一是如何讓AI通過NLP技術理解人類,如理解意圖,解析語義,識別情緒,搜索推薦;二是如何讓AI的結果能被人類理解接受,如文本摘要,內容生成,話題展開,情感對話等。