如同真人般的同聲傳譯?谷歌的AI翻譯模型可模仿語調和節奏

2021-01-10 集微網

如同真人般的同聲傳譯?谷歌的AI翻譯模型可模仿語調和節奏

集微網消息,日常溝通與文字最大的不同點在於我們擁有的語調與節奏,而谷歌最新的人工智慧翻譯原型不僅能翻譯書面上的意思,連聲音的音調與節奏也能一併拿下。

這個系統被稱為Translatotron,谷歌的研究人員在最近的一篇博客中詳細介紹了它的工作原理。他們並沒有表示Translatotron很快就會進入商業領域,但這很可能會實現。正如谷歌的翻譯主管今年早些時候向The Verge解釋的那樣,該公司目前的目標是為其翻譯工具添加更多的細微差別,創造更逼真的語音。

雖然捕捉人類聲音的變化對外行人來說是最令人印象深刻的,但Translatotron對人工智慧工程師的吸引力在於,它可以直接將語音從音頻輸入轉換為音頻輸出,而無需將其轉換為通常的中間文本。

這種人工智慧模型被稱為端到端系統,因為輔助任務或操作沒有停止。谷歌說,讓端到端的翻譯更快地產生結果,同時避免了在多個翻譯步驟中引入錯誤的風險。

更有趣的是,模型處理的數據不是原始音頻。相反,它使用光譜圖數據,或聲音的可視化詳情。從本質上說,這意味著我們相當於在用圖片的形式把一種語言翻譯成另一種語言,這令人難以置信。

儘管谷歌經常推出新語言和翻譯工具,但它們的表現往往不如預期那樣,包括現在這個人工智慧模型,其適應性和準確性仍有待考究,但人工智慧一直在前進,未來也將會越來越好。(校對/ICE)

相關焦點

  • AI謀殺同聲傳譯究竟還有多遠?
    而同聲傳譯的工作方式也比較特殊,一般 2 到 3 人協同工作,在一場數小時的會議中每個人需要輪流翻譯幾十分鐘,這足以說明同聲傳譯腦力消耗之大非一般職業能及。相較之下,其他的口譯工作則要簡單不少,比如交替傳譯,譯員只需在演講結束後複述即可,雖然需要一定的記憶能力,但比起同聲傳譯的即時翻譯,這點難度便相形見絀了。
  • 同聲傳譯收入揭秘
    同聲傳譯是翻譯中最難的一種,因而薪水也特別的高,年薪能達四五十萬元。 親身感受同聲傳譯 「The honor Mrmayor,my Chinese friends……」吳鍾明教授說。
  • 同聲傳譯:收入按分鐘計算,日薪超萬元不難
    ,消除不同國別代表之間的溝通障礙,這個職業就是同聲傳譯。  「按從易到難,口譯可分為陪同翻譯、交替傳譯和同聲傳譯。」郝璐璐說,陪同翻譯應用在普通場合,為一般交談進行口譯;交替傳譯應用在會議上,當發言者講完一段話後,口譯員將對方的發言準確、完整地翻譯出來;同聲傳譯應用在國際高端會議上,口譯員在不打斷發言者講話的情況下,不間斷地將發言內容口譯給聽眾。  雖然今年才29歲,但郝璐璐已有豐富的口譯經驗。
  • 澳洲同聲傳譯華裔第一人:多次擔任領導人同傳
    中新網3月15日電 據澳洲新快網報導,來到澳洲生活和學習的華人中,不乏經過努力使自己的英語能力達到極高水平的人士,但修煉到能夠從事同聲傳譯工作的人卻並不多。秦先生(Charles)在澳洲從事了多年的翻譯工作,並且是國際會議口譯員協會(AIIC)會員。據Charles介紹,他是澳洲地區第一位加入AIIC的華人。
  • 同聲傳譯到底是一份什麼樣的工作
    在日益密切的國際交流中,翻譯作為不同語言之間溝通的橋梁,其作用也不斷凸顯。而在翻譯行業中,難度最高,也承載了人們最多讚許與好奇的,莫過於同聲傳譯。所謂同聲傳譯,是指譯員以幾乎與講者同時的方式做口語翻譯。也就是在講者仍在說話時,同聲傳譯員便同時進行翻譯。
  • 巴別魚雛形,谷歌推出端到端語音翻譯技術,還能模仿你說話
    每次技術的突破都讓我們離巴別魚更近一步,直到今天,谷歌的發布了一項新研究Translatotron,這是一種可以實現端到端的語音轉語音的翻譯技術。該工具放棄了將語音翻譯成文本在返回語音的步驟,可以直接從一種語言轉換成另外一種語言,並同時保持說話著的語調和節奏。
  • [圖]谷歌推「同聲傳譯」系統Translatotron:語音翻譯無需文本轉換
    谷歌AI官方博客最新博文中向我們介紹了一項實驗性質的新系統--Translatotron,它能夠直接將語音翻譯成為語音,中間不再需要任何文本
  • 搜狗錄音翻譯筆體驗:18國語言、同聲傳譯
    近期,搜狗推出了自家AI戰略落地的第二款硬體產品——搜狗錄音翻譯筆。這款產品採用了搜狗目前最新的技術,不僅支持對話翻譯,還能夠支持錄音速記和同聲傳譯功能。官方稱通過它所搭載的深度神經網絡機器翻譯,翻譯準確度可以達到90%,每分鐘可以做到400字識別。
  • 百度大腦開放日召開機器翻譯專場 百度AI同傳翻譯性能可媲美人類
    自2010年以來,百度翻譯在大規模產業化機器翻譯模型、海量翻譯知識獲取、多語言翻譯統一框架、機器同聲傳譯等方面進行了系統而深入的研究,取得重大技術突破,研製了具有完全自主智慧財產權、技術先進、功能豐富的機器翻譯系統,實時準確地響應全球海量複雜多樣的翻譯請求。
  • 同聲傳譯把teach fish to swim翻譯成教魚遊泳,老外哭笑不得
    今天和戰友分享一個跟魚相關的俚語teach fish to swim,按字面意思很容易理解為教魚去遊泳,千萬不要這樣翻譯,這句話意思表示班門弄斧,這句話不僅僅我們基礎不好會翻譯錯,連一位同聲傳譯也出錯了,有次他做口譯聽老外講
  • 新版Skype支持語音聊天「同聲傳譯」
    新版Skype支持語音聊天「同聲傳譯」網易科技訊 12月16日消息,據國外媒體報導,微軟旗下即時通訊軟體Skype今天開始將可以對人與人之間的語音通話進行翻譯。Skype實時將英語或西班牙語翻譯成了另一種語言。聽起來像變魔術,但它是微軟研究團隊和Skype工程師完美合作的成果。目前,該功能還處在早期開發階段,但這一功能有可能幫助改變世界未來的交流方式。Skype的翻譯預覽功能適用於Windows 8.1或Windows 10的預覽版本。它的工作原理是將英文或西班牙文語音轉換成文本進行翻譯,然後再用軟體進行朗讀。
  • 谷歌同志是位好「翻譯」!
    在谷歌即將發表的一篇博文中,詳細介紹了一些新的創新,這些創新可以讓包括約魯巴語(Yoruba)和馬來亞拉姆語(Malayalam)這樣十分冷門的語言翻譯變得更加準確到位,改善使用這些語言的用戶的體驗。谷歌表示,其翻譯突破並非由單一技術驅動,而是針對少文本資源語言、富文本資源語言、總體質量、延遲和整體推理速度的技術組合。
  • Gartner最新報告:百度翻譯整合多項AI能力 多模態翻譯助跨國交流
    據Gartner預測,到2025年,全球10%的企業將使用集成在IT運維中的企業翻譯服務,75%的翻譯工作將從專注於翻譯本身轉向對機器翻譯的結果進行審閱和編輯。未來,機器翻譯將是大中小企業增強全球化信息能力不可或缺的抓手;其中,百度是全球AI翻譯服務中的重要力量。
  • AI翻譯離無障礙交流有多遠
    就連網路遊戲開發大戶騰訊公司,也悄然上線了一款實時語音翻譯APP「翻譯君」,這款以AI內核驅動的翻譯產品,運用了語音識別+NMT(神經網絡機器翻譯)等技術,可以實現「同聲傳譯」功能,對著屏幕說話時,邊說邊翻,就像身邊帶了一位私人翻譯官。
  • 在AI科學家、翻譯家眼裡,谷歌翻譯其實沒那麼神?
    對於一個在線服務,要是一句話的翻譯得等個一分鐘,就不具備用戶粘性了。Google 最大的功績在於,用了許多的算法去改進模型,改進 LSTM 系統。深度神經網絡由層層數理計算(即線性代數)組成,每一層的算法結果都會輔助下一層的計算。谷歌採納的一種技巧是在第一層完成的時候才啟動第二層的計算。
  • 百度機器翻譯現在都能預測你未來幾秒要說的話了!
    同聲傳譯是一項很重要的工作,在國際會議、外交談判、演講等場合,只要交流之間出現了兩種語言,就需要同聲翻譯的幫助,他們會在現場聽取演講,並實時翻譯成另一種語言。在會場的同聲傳譯(圖片來自網絡)同聲傳譯工作通常在一句話的話音剛落,2-3秒之內就要立即傳譯出來,是一份高壓力、高強度的職業。而 AI 機器同傳就是把人類翻譯工作的過程用 AI 技術來代替。
  • 百度發布即時翻譯「神器」 突破自然語言處理重大難關
    在翻譯質量方面,提出了「語音容錯」的對抗訓練翻譯模型,根據語音識別模型常犯的錯誤,在訓練數據中有針對性的加入噪聲數據,使得模型在接受到錯誤的語音識別結果時,也能夠在譯文中糾正過來。為了降低時延提升翻譯質量,人類譯員通常對演講內容進行合理預測,百度開發人員從人類譯員身上獲得啟示,研發了「wait-k words」模型,可以根據歷史信息,直接預測翻譯中目標語言詞彙。該模型在翻譯質量和翻譯延遲之間做出了很好的平衡,用戶可通過根據實際需求設定延遲時間(例如延遲1(k=1)詞或延遲5(k=5)詞)。
  • 星雲法師弟子同聲傳譯片段受捧 被贊「最正宗佛系英文」
    (圖片來源:臺灣「中時電子報」)中國臺灣網5月11日訊 據臺灣「中時電子報」報導,前陣子大陸「女神翻譯」張璐成為兩會會場上的另類「嬌點」,近日微博流傳星雲法師女弟子的同聲傳譯片段,引發網友討論話題,翻譯精準、易懂且全程不需筆記,讓網友嘆服「最正宗佛系英文」、「不說了,看書背單詞去了」。
  • 百度入圍Gartner全球AI翻譯服務代表企業 打造企業智能升級新引擎
    據Gartner預測,到2025年,全球10%的企業將使用與IT運維集成的企業翻譯中心類型架構,75%的翻譯工作將從專注於創建翻譯的工作轉向對機器翻譯部分進行審閱和編輯的工作。未來,機器翻譯將是大中小企業增強全球化信息能力不可或缺的抓手,有效推動企業智能化升級;其中,百度是全球AI翻譯服務領域中不可或缺的一股重要力量。
  • 對比人工翻譯及自然語言處理翻譯,ai翻譯存在哪些優勢?
    舉個簡單的例子,微博上一般都是這樣子對話的:這種對話很好「產生」,因為人的語言翻譯一般很難做出來,從整體上描述了人對話過程,這樣就完成了對話的設計和「模仿」。當然,單這麼說也不嚴謹,可能有的翻譯有點細節交流上的錯誤。另外,比如歌詞有時也可以通過一些對比的對話(bingquery)自動生成,原因在於歌詞是「不可編碼」的。這麼理解,也就沒問題了。