谷歌正在開發一種使用自己聲音的翻譯AI

2021-01-08 新浪VR

到一個你不會說當地語言的地方旅遊,最糟糕的是當你眯著眼睛看一本常用語手冊,張開嘴,準備完全毀掉這種語言時,你會有一種沮喪的感覺。如果那是你的噩夢,那麼好消息來了。谷歌正在開發一種可以用你自己的聲音講另一種語言的人工智慧。

在谷歌博客中,人工智慧被恰當地命名為Translatotron,被描述為一種端到端、語音到語音的翻譯模型。它的新穎之處在於它避開了通常的語音到文本再到文本到語音的轉換方法,而這正是谷歌翻譯所做的。相反,它使用了一個神經網絡,這樣它就可以跳過將音頻轉換為文本的中間步驟,然後再轉換回來。它還包括一個「揚聲器編碼器」,可以保存原始揚聲器的聲音。

與傳統方法相比,新的人工智慧有一些優勢。也就是說,谷歌指出了更快的推理速度,消除了複合錯誤,以及更好地處理不需要翻譯的單詞,如專有名詞和名稱。目前,谷歌表示,使用Translatotron的翻譯質量落後於傳統方法。也就是說,如果您查看示例音頻,最終結果不僅相當準確,而且聽起來更自然。仍然會有機械的語調,但比亞馬遜的Alexa強多了。

目前,已經有一些文本到語音的翻譯應用程式,包括谷歌翻譯、SayHi、Microsoft Translator、iTranslate和TripLingo。也就是說,他們都沒有在最終產品中使用你真實的聲音,這在現實生活中聽起來可能有點不舒服 。

Translatotron可能還在研發中,但我希望在不久的將來,我可以去一次我一直想去的巴黎旅行,而不用在一家高檔餐廳裡因為把「confit de canard」發錯音而尷尬。

原文出自:https://gizmodo.com/googles-working-on-a-translation-ai-that-uses-your-own-1834825088

相關焦點

  • 更快更高效:谷歌翻譯應用正在開發一項音頻即時翻譯
    日前,外媒bgr記者刊文稱:谷歌的大多數移動應用都非常棒,我也曾無數次地寫過自己是有多喜歡它們。自2007年首款iPhone發布以來,我就一直是iPhone用戶,但相比較而言其使用谷歌的時間更長且在很多事情上仍舊依賴谷歌。
  • 支持108種語言的谷歌翻譯如何用AI讓翻譯質量越來越好?
    共同的聲音(雷鋒網注,Common Voice是Mozilla發起的一個眾包項目,旨在為語音識別軟體創建免費的資料庫)自2017年6月推出以來,Mozilla為建立轉錄語音數據的開源集合所做的努力僅審查了40種聲音。谷歌表示,其翻譯質量的突破並不是由單一技術推動,而是針對資源較少的語言、高質量源語言、總體質量、延遲和整體推理速度的技術組合。
  • 爽文+AI翻譯,全球老外正在同步修仙
    2016年底,谷歌翻譯的一次革命性升級,讓AI翻譯初具與人工翻譯搶飯碗的能力。而短短一年之後,一家名叫funstory.ai的中國人工智慧公司就在某個垂直領域吊打了谷歌翻譯,這個垂直領域就是爽文翻譯。首先,鑑於網絡爽文的特殊文體,人工翻譯相比AI翻譯優勢並不明顯。爽文的行文風格一直是中國文壇的泥石流,在其賣弄國學又空洞無物的遣詞造句裡,連國人自己有時候都不知道它在說啥。翻譯這種風格的漢字,專業人工翻譯們也只能憑腦洞抓瞎翻譯。不得不承認,這個世界上永遠不缺那種敢於憑自信胡謅的人。
  • 蘋果正在開發自己的搜尋引擎以取代谷歌
    英國《金融時報》援引其 自身消息來源稱,蘋果正在開發自己的搜尋引擎。 在 美國司法部懷疑,蘋果公司每年收到 谷歌為 8 - 12個 十億美元用於 使用搜尋引擎。看來 ,為什麼要浪費這樣的錢?此事最有可能發生在該 部的反壟斷調查中,該部門認為此類交易是非法的。顯然,這就是Apple 決定安全使用的原因。
  • 手語也能有聲音?谷歌AI:我可以!
    這家科技巨頭還沒有開發出自己的應用程式,但已經發布了算法,它希望開發者可以利用這些算法開發出自己的應用程式。在此之前,這類軟體只能在個人電腦上使用。來自聽力受損社區的活動人士對該舉表示歡迎,但他們表示,這項技術可能會難以完全掌握部分對話內容。
  • 谷歌開發新技術:安卓手機將使用通話語音翻譯_遊俠網 Ali213.net
    谷歌Android業務副總裁雨果·巴拉(Hugo Barra)表示,谷歌正在開發一種技術,可以將手機變成「通用翻譯器」。  谷歌Android業務副總裁巴拉稱,谷歌正在開發一種技術,可以將手機變成「通用翻譯器」。對於通話的雙方,撥打電話的人可以說母語,然後手機將其翻譯成接聽電話人的母語傳給接聽者。  當前谷歌正在開發這種手機的原型,巴拉稱,研究還處於初級階段,他每周都會關注研發的進展。
  • 谷歌發布Translatotron直接語音翻譯系統
    Translatotron語音翻譯系統,這是第一個可以直接將一個人的聲音從一種語言轉換成另一種語言,同時保持說話人的聲音和節奏的翻譯模型。今天,谷歌發布Translatotron語音翻譯系統,這是第一個可以直接將一個人的聲音從一種語言轉換成另一種語言,同時保持說話人的聲音和節奏的翻譯模型。
  • 手語也能有聲音?谷歌AI人工智慧:我可以!
    谷歌表示,它的人工智慧技術讓智慧型手機能夠解讀和「朗讀」手語。這家科技巨頭還沒有開發出自己的應用程式,但已經發布了算法,它希望開發者可以利用這些算法開發出自己的應用程式。在此之前,這類軟體只能在個人電腦上使用。
  • 谷歌前瞻:AI「黑科技」翻譯器,同聲傳譯被突破
    【股價動態】5月15日美股收盤,谷歌收漲1.27%,報1178.980,本周累計漲幅1.26%。【公司動態】1.義大利反壟斷機構對谷歌是否濫用市場支配地位一事展開調查。2.谷歌披露了其藍牙Titan安全密鑰存在的兩個安全漏洞,並承諾為用戶免費更換它們。3.谷歌正在開發一種可以用你自己的聲音講另一種語言的人工智慧。【前景展望】在谷歌博客中,人工智慧被恰當地命名為Translatotron,被描述為一種端到端、語音到語音的翻譯模型。
  • Facebook開發出了翻譯神器:比谷歌翻譯快9倍
    目前翻譯應用已經成為很多人最常用的工具之一,其中社交用戶是一大群體。為此,Facebook一直在研發更準確、快速的翻譯技術。日前,Facebook方面宣布,開發出了一種基於卷積神經網絡的翻譯技術,其能夠從不同角度捕捉數據,相比於谷歌一直使用的,嚴格按照句子從左到右的順序一個字一個字進行翻譯的循環神經網絡而言,翻譯結果會更加貼近句子本身所要表達的意思和邏輯。據Facebook工程師表示,這種新型的翻譯技術在速度方面可以比谷歌翻譯快9倍之多。
  • 谷歌AI翻譯準確性正在接近人類水平?果斷輸入獵雲網介紹感受了下...
    谷歌人工智慧團隊將這項技術稱為谷歌神經機器翻譯系統,或直接以英文縮略語GNMT命名。最初,這項技術利用一種非資源密集的方式來將某種語言的句子,翻譯為另一種語言的句子。不像以前的方式——把每個單詞或短語當成一個獨立的單元來分析,GNMT是將整個句子作為一個整體來考慮的。
  • 翻譯|同聲傳譯被攻陷!谷歌發布Translatotron直接語音翻譯系統
    今天,谷歌發布Translatotron語音翻譯系統,這是第一個可以直接將一個人的聲音從一種語言轉換成另一種語言,同時保持說話人的聲音和節奏的翻譯模型。谷歌的新工具Translatotron捨棄了將語音翻譯為文本再返回語音的步驟,而是採用端到端的技術,直接將說話者的聲音翻譯成另一種語言。這使它能夠快速地翻譯,但更重要的是,能夠更容易反映說話人的語調和節奏。
  • 谷歌科研成果 2018 年年終總結(上篇)
    同樣由 Jeff Dean 撰寫的 2017 年穀歌大腦年終總結見這裡 上篇 下篇。如今谷歌把人工智慧的相關研究開發拓展到了新品牌「谷歌 AI」下面,曾經的谷歌大腦負責人 Jeff Dean 也就成為了谷歌 AI 的負責人。 現在我們把這篇 Jeff Dean 代表全體谷歌科研人員撰寫的谷歌科研成果 2018 年年終總結全文翻譯如下。
  • 谷歌智能助理的,增加了六種新聲音?谷歌相冊也使用AI了?
    谷歌 I / O 2018顯示了該公司谷歌 Assistant AI服務即將進行的一些改進和補充。從今天開始應該可用的新增功能之一是 谷歌智能助理的六種新聲音。現在可以選擇新的男聲和女聲,並且用戶可以分配不同的聲音以響應不同的家庭成員。
  • 重建「巴別塔」:谷歌推出全新端到端語音翻譯系統
    近日,谷歌提出了一種新的轉換系統 ——Translatotron,可以實現源語音到目標語音的直接轉換,還能保留源語音的聲音特徵。相關研究發表在 「Direct speech-to-speech translation with a sequence-to-sequence model」 論文中。
  • 2016:AI改變的不僅僅是谷歌翻譯,還有程式設計師的飯碗
    如今,珀斯默多克大學的海洋生物學家Hodgson,使用相同的技術來在成千上萬張開放水域的照片中尋找儒艮,並且都利用了相同的開源軟體——谷歌的TensorFlow。正如Hodgson所說,探測儒艮是一種對精確度要求很高的任務,主要是因為這些動物在海洋的表面下進食。「它們看起來像水面上的浪花或者眩光,」她說,但是神經網絡目前已經能夠識別分布在海灣的80%的儒艮。
  • 谷歌的新玩意兒 實時翻譯型虛擬鍵盤
    [中關村在線鍵鼠頻道資訊] 實時翻譯這樣的高難度技術活你是否也夢想過自己有一天能夠做到?其實谷歌兩年前就已經申請過一份專利文件,谷歌或許正在開發一種全新的匹配實時翻譯功能的移動虛擬鍵盤,文件中介紹到,該鍵盤分為兩個部分,類似於對稱設計的一種鍵盤,看起來兩面都能用,而實際上這款鍵盤也是讓兩人面對面進行實時翻譯交流用的。
  • AI新聞:正在開發用於醫療保健的AI機器人
    瑞典于默奧大學和于默奧大學醫院的研究人員正在開發一種可以測量人的體溫的機器人,可以用在醫院的候診室中。新型的AI機器人名叫RETHRO,是一種遠程紅外機器人。當下,紅外成像儀已是一種成熟的技術,在亞洲的機場和火車站中廣泛使用。
  • 谷歌翻譯將升級:實時聽譯並轉文字
    這種將某一語言翻譯為另一語言的技術可能效果並不是很好。在使用該服務時,用戶需要佩戴頭戴式耳機,而只有當說話者停下來靜聽對方正在說什麼時,才能發揮最好的效果。整個體驗就像是兩名電話銷售員在使用對講機。不過,在使用過程中,這樣的抱怨將會被「奇蹟」帶來的震驚所取代。
  • 谷歌開發實時語音翻譯Android應用
    新浪科技訊 北京時間9月9日早間消息,據國外媒體報導,谷歌正在為Android系統開發一款實時語音翻譯軟體,手機在安裝該軟體後可立即將用戶語音翻譯為目標語言。  儘管該項目尚處於研究階段,谷歌仍在本周的德國柏林國際電子消費品展覽會上為其做了產品演示。