亞馬遜Alexa AI新突破:將縮寫符號秒轉文字,錯誤率降低81%

2020-12-14 智東西

智東西(公眾號:zhidxcom)
編 | 王小溪

導語:亞馬遜的研究人員研究出的AI文本規範系統可代替人工編寫規則,讓文本規範化過程的錯誤率降低81%。

智東西5月18日消息,據外媒報導,亞馬遜的研究人員研究出了新的算法,這種算法能更好地實現文本規範化(Text Normalization,TN),讓Alexa更快、更好地理解不同語言的指令。

文本規範化是指將文本中的數字、符號、縮寫等的不同描述方式轉化為統一的語言文字。舉個簡單的例子,「20%」在英文TTS(text-to-speech synthesis,從文本到語音)系統裡則會被轉換成「twenty percent」。

據研究人員Alexa AI部門應用科學家Ming Sun稱,相比於現有的最佳神經系統,他和同事研究的AI文本規範系統能將文本規範化的錯誤率降低81%,並且還能將延遲時間減少63%。此外,子字單元使AI模型能夠更好地處理以前沒有見過的輸入單詞。

在論文《Neural Text Normalization with Subword Units》中,Ming Sun更細緻地呈現了他和同事的研究成果。

一、AI系統可代替人工編寫規則

文本規範化是大多數自然語言系統中的基本處理步驟,它的主要功能是將文本中的數字、符號、縮寫等的不同表達形式轉換成統一的語言文字。

舉個例子,在英語語境下,如果對亞馬遜的語音助手Alexa說:「Book me a table at 5:00 p.m.(在下午5:00給我預訂個餐位)」,這句話中的時間「5:00 p.m.」可能會被語音助手的自動語音識別器轉錄為「five p m」,並進一步轉化為「5:00PM」。再比如,「6:30PM」會被轉化為TTS系統所能識別的「six thirty p m」。

像這種從「5:00PM」到「five p m」的轉化過程被稱為文本規範化,反之則為反向文本規範化。

那麼這些轉化是如何達成的呢?

根據Ming Sun的說法,目前,亞馬遜語音助手依賴於數千條日期、電子郵件地址、數字、縮寫和其他表達的人工規範化規則。這個方法本還不錯,但隨著Alexa所涉及的交互範圍不斷增加,人工編寫規則本質上成為一個很容易出錯的過程。此外,隨著Alexa不斷增加對新的語種的應用,重新編寫規則將是一項巨大的任務。

在論文中研究人員提出,將書面語言規範化為文本語言,存在以下困難:

1.人們很難獲得訓練機器學習模型的監督數據;

2.正如上文例子中顯示的那樣,書面文本具有歧義,在不同的語境轉化可能需要不同的規範化方法。

為此,研究人員研究了一種由機器學習驅動的更具可擴展性的技術。有關該研究的論文將在今年的北美計算語言學協會(NAACL)的會議上展示。

二、新算法將錯誤率降低81%

在論文中,研究人員介紹文本規範化是會話系統中的一個重要步驟。它能將書面語言規範化為文本語言,以促進語音識別、自然語言理解以及從文本到語音的合成。

有限狀態傳感器(FSTs)通常用於構建處理文本規範化的語法。然而,將語言知識翻譯為成機器所能理解的語法需要付出大量的努力。

以往的研究側重於藉助有限的詞級語境對一個詞或短語進行規範化,而孫明和劉玉宗在論文中提出的方法是直接對完整的句子進行規範化。

Ming Sun和他的同事們所提出的AI文本規範化系統,是將網絡的輸入和輸出流中的單詞分解成更小的字符串,這種字串符被稱為子字單元(subword units)。這些子字單元能減少機器學習模型必須學習的輸入數據量,並能很好的消除歧義。

他們研究的算法能用來識別最常出現的雙字符單元和三字符單元,直到達到大約2,000個子字符的容量。這些單訓練輸出子字單元的AI系統,最終能拼接成完整的單詞。

研究人員表示,在對來自公共數據集的500,000個示例進行系統訓練之後,與先前所報告的性能最佳的機器學習系統相比,他們研究的系統能將文本規範化的錯誤率降低75%,不考慮詞性、字母大小寫等額外的信息,錯誤率可以降低81%,單詞錯誤率僅為0.2%,並且它還能將系統的延遲時間減少63%。此外,子字單元能使AI模型能夠更好地處理以前沒有見過的輸入單詞。

結語:亞馬遜讓智能語音助手更智能

亞馬遜研究人員提出的新的AI文本規範化系統可改進文本規範化過程,單詞錯誤率僅為0.2%,且能減少系統的延遲時間。

亞馬遜目前一直在改進語音技術,讓智能語音助手能不斷擴大交互範圍,並且可以理解更多種語言,此次技術如果能實現大規模擴散,將會讓其語音助手Alexa變得更加智能。

論文連結:https://s3.us-east-2.amazonaws.com/alexapapers/NAACL_HLT_2019_neural_tok_final.pdf

文章來自:Venture Beat

相關焦點

  • 亞馬遜Alexa新突破:將縮寫符號秒轉文字,錯誤率降低81%
    智東西5月18日消息,據外媒報導,亞馬遜的研究人員研究出了新的算法,這種算法能更好地實現文本規範化(Text Normalization,TN),讓Alexa更快、更好地理解不同語言的指令。 文本規範化是指將文本中的數字、符號、縮寫等的不同描述方式轉化為統一的語言文字。
  • ai文字轉曲快捷鍵以及轉曲目的和注意事項
    1,ai文字怎麼轉曲ai文字轉曲,其操作為:選中要轉曲的文字,然後執行「文字--創建輪廓」。
  • 蘋果、Google、微軟、亞馬遜,哪家的語音助手會的語言最多,以及...
    2018 年 9 月,一家叫 Vocalize.ai 的人工智慧初創公司做了一項測試,它比較了 Google、蘋果和亞馬遜的智能語音助手,發現了一些有意思的事情。
  • 一文看懂 Echo 和 Alexa,亞馬遜如何用蘋果的玩法在玩語音?
    Alexa APP 並未上架到蘋果 Appstore 的中國市場, 如果要體驗,可以瀏覽 Alexa 的 Web APP :http://alexa.amazon.com。    當然, Alexa 並不要求開發者將自己的內容資源(如音視頻、問答對等)上傳到亞馬遜, 而只是在 Alexa 中定義「意圖」,當用戶觸發「意圖」時調用開發者定義的接口,類似於微信公眾號的開發者模式, 開發者自己在接口中返回 Alexa 要回答用戶的答案, Alexa 做到了「意圖」和「回答」的分離,在 Alexa 平臺定義「意圖」,而在開發者自己伺服器上面實現回答。
  • 蘋果、Google、微軟、亞馬遜,哪家的語音助手會的語言最多?
    2018 年 9 月,一家叫 Vocalize.ai 的人工智慧初創公司做了一項測試,它比較了 Google、蘋果和亞馬遜的智能語音助手,發現了一些有意思的事情。比如,三家語音助手都能很好地識別美式口音和印度式口音的英語,但 Siri 和 Alexa 在識別中式口音時,準確度都大幅下降。
  • 亞馬遜Alexa突然發瘋,讀著論文教主人自殺:你活著地球人口會過剩!
    新智元報導編輯:大明、鵬飛【新智元導讀】近日,一向以智能貼心著稱的亞馬遜Alexa數字助理竟然成了驚悚故事的主角。據多家英媒報導,一位用戶在使用Alexa時,後者突然失控,稱人類的存在對地球有害,並教唆用戶用刀戳刺自己的心臟自殺。亞馬遜事後回應稱,這是個錯誤,目前已經修復。
  • Briefly: 一款通過amazon alexa提升轉化率的shopify插件
    但是有一種渠道絕大多數賣家應該不知道,這個就是今天我們要介紹的briefly,一款亞馬遜alexa上的skill,通過它,你能給你的用戶帶來新奇獨特的體驗,從而提高轉化~ 我們先簡單介紹一下亞馬遜Alexa,它是一個由亞馬遜開發的智能個人語言助理,類似於蘋果的siri和谷歌的home,以下是它的官網。
  • 微軟開放多項AI技術,小娜與Alexa「合體」丨AI Daily
    1、7 月起,Drive.ai 將在德州提供無人計程車服務由吳恩達擔任董事的無人車初創公司 Drive.ai 昨日宣布: 2018 年 7 月起將在德克薩斯州弗裡斯科(Firsco)提供無人計程車服務。Drive.ai 將與弗裡斯科運輸管理協會合作,共同運營該項目。
  • 科學家用人工智慧將大腦活動轉成文字,準確率達 97%
    亞馬遜(Amazon)和Google 等公司的智慧助理近幾年的發展,已可準確辨識人們的語音指令。但另一個更難以置信的裡程碑可能就在眼前,這將使語音識別相形見絀:人工智慧(AI)可將大腦活動轉化為文字,而不需要用戶說話。
  • 亞馬遜被 7 家出版巨頭起訴,因為「有聲讀物轉文字」侵權
    起訴的原因是,亞馬遜計劃在旗下有聲讀物公司 Audible 上,推出名為「Audible Captions」的功能,它讓你在聽亞馬遜的有聲讀物時,還能看屏幕上同步音頻的文字。 問題就出在了這裡:亞馬遜只有權出售有聲讀物,但是和聲音匹配的字幕,是亞馬遜的 AI 轉錄而成的,它並沒有購買版權。
  • 百度AI接口開發文字轉語音功能-符號處理
    我們還是繼續說一下百度語音合成,整體的功能上沒有問題,但是在細節上需要注意符號問題,這也是在開發過程中實際遇到的,目前主要涉及到了三個符號「、」、——。百度在我們拿到文字內容時先將空格進行去除,方式如下://替換空行 $content = strtr($
  • AI新巨頭:走進亞馬遜總部 探尋Alexa成功的秘密
    對亞馬遜總部的第一次訪問似乎有點過於完美了:天氣很熱,卻又不太熱,很輕鬆,卻又不太輕鬆。站在第7大道,左邊是一個大型工地,工人們戴著安全帽,敲打著像三個巨大的玻璃球一樣的龐然大物,這些龐然大物距離地面最遠90英尺。這些「球體」將成為一個自然的綜合體,即亞馬遜在Denny Triangle社區華麗的新標誌。
  • 亞馬遜將Alexa變成聊天機器人
    撰文/藍科技亞馬遜正在測試iOS設備上Alexa的鍵入功能,該功能將允許用戶將消息發送到Alexa而不是使用語音。特別是在公共場所或會議中語音命令比較笨拙的情況下。亞馬遜發言人表示,「使用Alexa輸入文字」將使您無需使用語音即可與Alexa進行交互,這意味著現在可以使用Alexa移動應用輸入與Alexa通話的所有內容。在美國,iOS用戶可以使用Alexa進行打字」。但是,該公司沒有透露何時在全球範圍內或在Android上推出此功能。
  • 合成數據助力亞馬遜Alexa學會第十門外語,還會自己造句
    文摘菌反正是做不到的,但是亞馬遜的Alexa就一次性學習了三門外語,至此Alexa學會的語言已經達到了10種。 另一種是「引導重採樣(Guided Resampling)」,它通過從現有數據中的例子中重組單詞和短語來創造新句子,重點是優化句子類型的數量和分布。
  • 亞馬遜Alexa進化史:當話語遇見AI 生活發生了巨變|alexa|谷歌|微軟...
    2016年,德語版的Alexa誕生,其他非英語語種的Alexa也將陸續誕生。但是,亞馬遜並沒有試圖從可與Alexa相連接設備的製造商那裡獲得收入,這些設備包括智能恆溫器、燈泡等。不過,照這樣的趨勢發展,未來亞馬遜與這些公司之間很有可能會籤訂收入共享合同或者是採取其他的支付方式。這三個市場中最小的一個是家庭自動化市場,在這一市場中每年的支出已經超過了50億美元,而去年美國的零售總額為4.9萬億美元。
  • 電工電子電路圖符號英文縮寫大全
    電工電子電路圖符號英文縮寫大全  電流表 PA  電壓表 PV  有功電度表 PJ  無功電度表 PJR  頻率表 PF  相位表 PPA  最大需量表(負荷監控儀) PM  功率因數表 PPF  有功功率表 PW  無功功率表 PR  無功電流表 PAR
  • 亞馬遜悄然收購AI安全公司harvest.ai,增強雲服務安全
    雷鋒網消息,,亞馬遜的雲服務部門AWS很可能已經悄然收購了網絡安全公司harvest.ai。據外媒TechCrunch報導harvest.ai創始團隊中包括兩位前NSA員工,他們用機器學習和人工智慧的方式,分析一家公司關鍵IP上的用戶行為,從而識別和阻止有針對性的攻擊,防止信息洩露。harvest.ai的旗艦產品是MACIE Analytics。
  • 當亞馬遜Alexa與智能家居相連,它可以為你做這些事
    Alexa非常聰明,它可以在亞馬遜網站上下訂單,閱讀今天的新聞,看看某個餐廳是否還開著,還能做許多其他事情。如果你購買了亞馬遜的智能音箱設備Echo,你可能喜歡Alexa所能做的所有事情。但如果我告訴你,這個通曉網絡的人工智慧(AI)可以做更多的事情呢?這裡有些你可以將智能家居設備連接到Alexa的不同方法,讓你的家變得更聰明、更安全。
  • 科技論著中不應使用非法定單位符號的「單位符號」
    細加分析,這些錯誤的「單位符號」主要包括如下3類。常見的舊單位符號如sec(秒)、m(分)、hr([小]時)、y或yr(年),應分別改為法定單位符號s、min、h、a [a(年)為常用時間單位,可與法定單位並用]。
  • 智東西周報:首本AI生成的書籍誕生 亞馬遜被曝監聽Alexa對話 傳...
    2、微軟和亞馬遜將爭奪美軍方雲計算合同4月12日消息,據外媒報導,美國五角大樓日前宣布,微軟和亞馬遜將最終爭奪其價值100億美元的雲計算合同。IBM和甲骨文等公司也參與了競標,但由於不符合必要條件而被排除。甲骨文還提起訴訟,指控亞馬遜的一名現任僱員在國防部工作期間曾為JEDI工作,並為亞馬遜贏得了合同。