智能語音助手的原理_預測智能語音助手的未來

2020-12-02 電子發燒友

智能語音助手的原理_預測智能語音助手的未來

發表於 2019-07-31 10:16:14

   語音助手能和人類進行深度交談的背後,離不開自然語言處理(NLP)和自然語言生成(NLG)這兩種基礎技術。機器學習的這兩個分支使得語音助手能夠將人類語言轉換為計算機命令,反之亦然。

  什麼是NLP?

  NLP指在計算機讀取語言時將文本轉換為結構化數據的過程。簡而言之,NLP是計算機的閱讀語言。可以粗略地說,在NLP中,系統攝取人語,將其分解,分析,確定適當的操作,並以人類理解的語言進行響應。NLP結合了計算機科學、人工智慧和計算語言學,涵蓋了以人類理解的方式解釋和生成人類語言的所有機制:語言過濾、情感分析、主題分類、位置檢測等。

  

  什麼是NLG?

  自然語言處理由自然語言理解(NLU)和自然語言生成(NLG)構成。NLG是計算機的「編寫語言」,它將結構化數據轉換為文本,以人類語言表達。即能夠根據一些關鍵信息及其在機器內部的表達形式,經過一個規划過程,來自動生成一段高質量的自然語言文本。

 

  對於「AI語音識別」,每一個「語音識別」都是APP,這個APP裡面內置著我們常用字的「標準發音字庫「,同時,為了讓軟體能否識別我們「不標準的發音」,軟體還需要AI程式語言對我們不標準的發音做評分,然後做比對,最後選擇評分最高的那一個「標準發音」作為我們「不標準發音」的字庫!

  1.語音識別的基本原理

  語音識別系統本質上是一種模式識別系統,包括特徵提取、模式匹配、參考模式庫等三個基本單元,它的基本結構如下圖所示:

  

  語音識別系統構建過程整體上包括兩大部分:訓練和識別。訓練通常是離線完成的,對預先收集好的海量語音、語言資料庫進行信號處理和知識挖掘,獲取語音識別系統所需要的「聲學模型」和「語言模型」;而識別過程通常是在線完成的,對用戶實時的語音進行自動識別。自動語音識別技術有三個基本原理:首先語音信號中的語言信息是按照短時幅度譜的時間變化模式來編碼;其次語音是可以閱讀的,即它的聲學信號可以在不考慮說話人試圖傳達的信息內容的情況下用數十個具有區別性的、離散的符號來表示;第三語音交互是一個認知過程,因而不能與語言的語法、語義和語用結構割裂開來。

  2.工作原理

  第一步,把幀識別成狀態(難點)。

  第二步,把狀態組合成音素。

  第三步,把音素組合成單詞。

  

  3.工作流程

  一般來說,一套完整的語音識別系統其工作過程分為7步:

  ①對語音信號進行分析和處理,除去冗餘信息。

  ②提取影響語音識別的關鍵信息和表達語言含義的特徵信息。

  ③緊扣特徵信息,用最小單元識別字詞。

  ④按照不同語言的各自語法,依照先後次序識別字詞。

  ⑤把前後意思當作輔助識別條件,有利於分析和識別。

  ⑥按照語義分析,給關鍵信息劃分段落,取出所識別出的字詞並連接起來,同時根據語句意思調整句子構成。

  ⑦結合語義,仔細分析上下文的相互聯繫,對當前正在處理的語句進行適當修正。

  預測智能語音助手的未來

  1.語境理解提供個性化回應:目前而言,市場上的智能助理大多缺乏語境理解。

  2.語音區分:語音助理或將通過區分語音,提供更多個性化體驗。

  3.不僅是手機:Amazon Alexa副總裁Steve Rabuchin表示:「我們希望客戶可以隨時隨地訪問Alexa,這意味著客戶可以通過語音遙控他們的汽車、冰箱、恆溫器、燈具以及家中內外的各種設備。「

  4.搜索行為的變化:語音搜索一直是熱門話題。但語音的可見性將是巨大的挑戰。

  5.語音通知:在移動應用營銷方面,語音智能也提出了新的挑戰-用戶參與度和維護度。

  6.信息安全問題:隨著語音支付越來越方便,更多用戶選擇語音支付。支持智能語音的智能家居設備等也涉及大量用戶隱私和用戶習慣,其安全性也成為用戶關注的焦點。

  語音助手

打開APP閱讀更多精彩內容

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容圖片侵權或者其他問題,請聯繫本站作侵刪。 侵權投訴

相關焦點

  • 雷射筆能控制語音助手?你的智能家居可能存在可怕的「漏洞」
    央視網消息:如今,很多家具、電器越來越智能化,可以通過語音控制,讓我們的生活更加便捷。然而智能家居在帶給我們便利的同時,也暗藏隱患。
  • 語音操作,智能互聯:70邁智能行車助手套裝(測評)
    剛好手上有一款「70邁智能行車助手套裝 小米米家定製」的車載設備,那麼它能不能讓我有更好的行車體驗?下面做了初步測評,供大家選購參考。一、產品外觀關注米家產品的朋友可能會發現,70邁這個牌子是專門做智能車載用品的。
  • 三星智能電視已支持谷歌助手 可語音切換電視頻道
    【宅秘新聞】據外媒WinFuture消息,韓國電子巨頭三星現在正在德國推出針對智能電視的更新,其中將包括谷歌助手。到目前為止,三星智能電視支持的語音助手有自己的Bixby和亞馬遜Alexa,該公司希望用谷歌助手替換Bixby。
  • 傳三星智能語音助手Bixby英文版本周上線
    【環球科技綜合報導】據英國《每日郵報》7月14日報導,今年4月,隨三星S8一起亮相的三星智能語音助手 Bixby因無法支持英語遲遲未上線,但最近Reddit用戶爆料稱Bixby將於7月18日正式發布。2017年4月21日,三星發布了年度旗艦S8,但其核心功能Bixby語音助手卻遲遲不見蹤影,目前僅在韓國可用,三星官方並未給出跳票的原因。Bixby是三星自行研發的智能語音控制助手,能夠實現回答用戶問題,設定鬧鐘等等功能,與蘋果Siri和亞馬遜的Alexa功能相仿。
  • 微軟小娜成棄子,AI語音助手「行路難」
    毋庸置疑,移動端對語音交互需求更大,大部分語音交互場景都發生在智慧型手機上。但是微軟WP的潰敗,喪失了這個更好的入口。就算寄希望於安卓和iOS,也並不現實,他們有自家的語音助手,會給予系統級的優化和融合,體驗更好,所以小娜也就慢慢失去了優勢,只能被邊緣化。此後,微軟把小娜束縛在PC平臺,令這款語音助手陷入了掙扎。
  • 語音合成在語音助手中的應用及擴展
    總的說來,近期語音合成的方法可以歸結為四種:1)物理機理語音合成;2)源-濾波器語音合成;3)基於單元挑選與波形拼接技術的語音合成;4)可訓練的語音合成;其中現在大家常採用的合成方法為基于波形拼接技術的語音合成和可訓練的語音合成兩種。本文涉及的內容為語音合成的後端,語音合成的前端也是文本處理的一部分,主要包括文本正則化、分詞、詞性標註、多音字消崎及韻律預測等,這裡不做具體介紹。
  • TCL電視全球首發,搭載智能語音助手小T,售價99999元
    智東西文 | 寓揚智東西8月31日消息,今天TCL在德國IFA展會(德國柏林國際電子消費品展覽會)上發布搭載智能語音助手小T的三款新品電視——X6 XESS私人影院、C5都市藍調電視、P6超清薄電視。未來,TCL還將加快布局歐洲、美國、東南亞、印度、巴西等地區的業務。二、現場發布X6/C5/P6三大系列電視在2017年的德國IFA展會上, TCL發布了搭載語音助手小T的三款新品電視,分別為X6 XESS私人影院、C5都市藍調電視、P6超清薄電視。
  • 三星智能語音助手Bixby英文版正式登陸美國
    【環球科技綜合報導】據外媒appleinsider7月19日報導,時隔三個月之久,三星於19日宣布正式向美國市場的Galaxy S8和S8+用戶推送Bixby語音助手的語音功能。理論上來說,Bixby能執行更多語音指令,不僅能打開各種軟體,還能控制手機硬體,而這在蘋果設備上只能通過按鍵來實現。三星也致力於使Bixby與第三方應用更好地互動,谷歌就對自家的產品谷歌地圖、谷歌音樂和YouTube進行了整合。由於Bixby在大多數國家缺少語音功能,一些程式設計師嘗試開發軟體幫助用戶修改Bixby按鍵功能。
  • 小娜走了,微軟小冰又來了,語音助手到底有沒有用
    在技術上小娜被設計為雲端驅動,智能運算都依託於雲伺服器完成,終端只做輕量級的整合,這也是現在主流語音助手實現的原理,這樣的設計十分適合打造成跨平臺的服務。 這種助理向的語音助手在未來商業辦公的確能起到提升生產力的作用,搜索功能就是此前PC端用戶使用Cortana最常用的場景。 像我們平時直接在Win10菜單裡面進行搜索其實也可以通過Cortana搜索框提取存儲在Outlook電郵、通訊錄、日曆應用、網絡中的數據。
  • 小度/Siri/Bixby 誰家的語音助手起名字最走心
    語音識別是人工智慧趨勢潮頭,從2011年iPhone4S手機首次搭載Siri,語音助手正式登上歷史舞臺,時間雖然不長,但誰都知道這就是科技生活的未來,隨後谷歌Assistant,亞馬遜Alexa紛紛揭竿投入對傳統互動方式的挑戰之中。
  • Siri不只是語音助手:標誌計算機交互重大變化
    6月29日消息,《時代》(Time)發布文章稱,人們該改變對蘋果Siri的看法,如今它已經不再只是智能語音助手了之後還有「通過語音指令就能幫助你搞定事情的智能助手」。蘋果營銷主管菲爾·席勒(Phil Schiller)2011年發布Siri時所說的這句繞口的話,相比之下黯然失色。它也固定了人們此後對該全球最被熟知的語音助手的印象。如今,是時候改變對Siri的看法了。5年前,蘋果發布它時,它只是作為iPhone的一項功能。但時至今日,Siri已經全然不同了。
  • 百度語音助手體驗:界面清新英文識別是盲區
    【搜狐數碼原創】21月25日消息,「百度語音助手」今天正式亮相。作為一款類Siri的語音軟體,百度語音助手有哪些特點,搜狐數碼帶你來看看。目前百度語音助手已經可以下載,大小8MB。安裝後首先進入的是一個類似說明界面。
  • 人工智慧機器人語音助手系統或將讓強人工智慧提前出現
    人工智慧機器人語音助手系統或將讓強人工智慧提前出現  美國未來學家雷·庫茲韋爾的預言:「2045年左右,人工智慧將來到一個『奇點』,跨越這個臨界點,人工智慧將超越人類智慧,人們需要重新審視自己與機器的關係。」
  • 人工智慧化身貼心助理,天貓精靈X1語音助手體驗
    智能體驗,從「你好天貓」開始  天貓精靈的聯網過程比較簡單,根據App的提示進行操作,可以輕鬆地連上所在區域的Wifi信號,化身智能助手,同時也能夠使用藍牙和手機進行配對,讓天貓精靈成為一臺小巧的藍牙音箱。  天貓精靈的語音依然是溫柔醇厚、口音標準的女聲,用當下流行的話來說,就是一位機智貼心小助理囉。
  • 尼爾森AI助手報告出爐,如何用語音喚醒下一個商業時代?
    這一時期,由蘋果、微軟率先將智能語音助手這一產品引入中國,其中以搭載在iPhone 4S上的Siri最為驚豔,開始在國內掀起智能語音助手熱潮。2. 市場啟動期(2012——2015年)。在蘋果的帶動下,科大訊飛上線中文語音識別DNN系統,推出「靈犀語音助手」,百度、華為等也紛紛入局,行業迅速發展。
  • 發力車載智能,小米新品:999元,行車記錄+導航一體,AI語音助手
    小米科技,近日,迅速抓住了這塊蛋糕,做出了智能車載系統的首次嘗試,將自己AI語音助手(小愛同學)帶入了汽車行業,推出不足千元的小米米家智能後視鏡。下面,我們就來看一下這款攪局行業的產品吧!米家智能後視鏡出自小米生態鏈企業70邁之手,相比之前的70邁智能後視鏡有一些不同的地方,下文我會提到。
  • 最好的智能燈光開關可讓您使用電話或語音助手控制燈光
    如果天花板上有許多燈,那麼安裝最好的智能燈開關之一是最實用的方法,可以將這些燈具集成到智能家居中。 一方面,如果您安裝智能燈而不是智能燈開關,那麼您或其他人每次翻轉燈開關時,您將失去控制燈的能力。另一方面,如果您按下智能燈開關,仍然可以通過智慧型手機或使用語音助手來控制燈光。
  • 智能語音助手小微支持微信管理和硬體播放微信分享的...
    近日,微信智能語音助手騰訊小微宣布支持在微信中管理智能設備,支持分享音樂至智能設備播放。這意味著騰訊小微邁出了與微信深度結合的第一步。 現在,微信用戶可以在微信內通過「我-設置-設備」進入智能硬體管理頁面,輕鬆查看和管理自己綁定的小微設備。
  • Galaxy S8的語音助手Bixby仍在熟悉英語語法,在美推出時間未知
    PingWest品玩6月1日報導,《華爾街日報》4月曾報導三星Galaxy S8的智能語音助手將於5月下旬在美國正式推出,而現在的情況是Bixby直到6月下旬也可能並不會在美國推出。知情人士表示,支持英語的Bixby完全完成還需要幾周的時間,最近的內部測試顯示,Bixby語音助手正在努力理解英語語法。Bixby,類似於蘋果的Siri語音助手,也是Galaxy S8的賣點之一,它在4月21日發布,是去年全球召回Galaxy Note 7後最受關注的三星產品。
  • 除了客廳音響,sonos 還想做你的貼心中文語音助手
    對於 Sonos 這個名字我想大家也早已不陌生了,作為最早打造無智能音箱的企業之一,Sonos 的產品講究無線和無縫化的音樂聆聽體驗。在打造了數款大小不一適合臥室的無線音箱產品後,Sonos 再次把目標瞄向了客廳。