藉助AI技術 Facebook開發出更快更精確翻譯方法

2021-01-08 環球網

【環球網智能綜合報導】 據印度《經濟時報》9月2日報導,Facebook的研究人員已經開發出了一種更快、更準確的方法,使用人工智慧翻譯烏爾都語和緬甸語等低資源語言。

據《福布斯》雜誌報導,這項突破將在自然語言處理頂級會議 EMNLP上展示。由於Facebook這一社交媒體巨頭使用自動語言翻譯來幫助世界各地的用戶閱讀適用他們的語言的帖子,因此這一突破對其可能很重要。

Facebook人工智慧研究院 ( FAIR )部門的團隊,從維基百科等公開網站中獲取大量不同語言的不同文本,以此來提升機器翻譯 (MT)。

需要注意的是,這些文本是相互獨立的。「建立一個平行語料庫很複雜,因為你需要找到精通兩種語言的人來創建它。例如,如果你想建立一個葡萄牙語和尼泊爾語的平行語料庫,需要找到精通這兩種語言的人,這是非常困難的,」研究科學家兼FAIR巴黎研究實驗室主任Antoine Bordes表示:「另一方面,建立葡萄牙語和尼泊爾語單語語料庫非常容易:無論它們是否為平行句子,也不管它們談論的是否為同一件事,你只需要從葡萄牙語和尼泊爾語網站下載網頁就可以了。」

大多數語言翻譯計算機系統使用單語語料庫和平行語料庫來學習。Bordes稱:「我們方法的新穎之處在於,只用從單語語料中提升MT系統,我們不需要任何平行語料。理想化來說,如果一本書是用外語寫的,我們可以用我們的模型將其翻譯成英語。」(實習編譯:吳瓊 審稿:劉洋)

相關焦點

  • Facebook AI 正在升維突破:教AI像人類一樣理解三維世界
    ,還整合了多個最新研究成果,包括用來預測 3D 形狀的 Mesh R-CNN 神經網絡框架,用來提取和重建 3D 不規則模型的 C3DPO 方法,用來檢測物體和生成 3D 點雲的 VoteNet 技術以及配套的新型優化算法等等。
  • 谷歌翻譯是如何藉助多項新興AI技術提高翻譯質量的
    谷歌稱,它在翻譯領域所取得的突破並不是由單一技術驅動的,而是針對低資源語言、高資源語言、總體質量、延遲和整體推理速度的多項技術共同作用產生的。在2019年5月到2020年5月之間,根據人工評估和BLEU(基於翻譯系統翻譯和人工參考翻譯之間相似性的衡量標準),谷歌翻譯在所有語言中平均提高了5分以上,在50種語料資源最少的語言中平均提高了7分以上。
  • Facebook AI 年度總結來啦
    內容如下,一起來看看吧~在 Facebook,我們認為,人工智慧以更有效的新方式學習,就像人類一樣,可以在將人們聚集在一起發揮重要作用。這一核心信念有助於推動我們的 AI 戰略,將投資重點放在與使用真實數據學習的系統相關的長期研究上,激勵工程師與更廣泛的人工智慧社區共享尖端工具和平臺,並最終展示使用技術造福世界的新方法。
  • Facebook AI的DETR,一種基於Transformer的目標檢測方法
    當前的深度學習方法試圖解決作為分類問題或回歸問題或綜合兩者的目標檢測任務。例如,在RCNN算法中,從輸入圖像中識別出幾個感興趣的區域。然後將這些區域分類為對象或背景,最後,使用回歸模型為所標識的對象生成邊界框。另一方面,YOLO框架(只看一次)以不同的方式處理目標檢測。
  • 最強翻譯?Facebook AI可以直接翻譯100種語言
    近日,Facebook 宣稱已經開發出一種人工智慧翻譯系統,能夠在 100 種語言之間進行精確翻譯,而不需要像許多現有 AI 翻譯那樣先翻譯成英語在翻譯成目標語言。圖 | 新翻譯系統使 Facebook 每天能做 200 億份翻譯任務(來源:incamerastock / Alamy)在學術機構用來自動評估機器翻譯質量的 100 分制中,該人工智慧的表現比同類翻譯系統高出 10 分。該模型的翻譯也由人類進行了翻譯評估,其準確率約為 90%。
  • Nat Biotechnol:中美科學家開發出更快的螢光顯微鏡圖像處理技術...
    2020年7月18日訊/生物谷BIOON/---在一項新的研究中,來自美國國家生物醫學成像與生物工程研究所和中國浙江大學的研究人員開發出了新的顯微鏡圖像處理技術,可以將後處理時間縮短高達幾千倍。
  • Facebook 100種語言互譯模型原始碼公開!機器翻譯再也不用英語當...
    為了實現多語言不依賴英語互譯,研究人員使用不同的挖掘策略構建了首個真正的多對多翻譯數據集,再通過Fairscale等擴展技術建立具有150億個參數的通用翻譯模型,使M2M-100可以從大量語言資料庫中學習,並反映出更加多樣化的語言文字和詞法。
  • 科學家利用AI技術造出更快,更精準,更清潔的光碟機納米晶片
    近日,來自澳大利亞皇家墨爾本理工大學(RMIT University)的研究團隊成功開發出一種 AI 技術,該技術將成像、數據處理、機器學習和內存部件全部集成在一個納米級電子晶片中,以模仿人腦處理視覺信息的方式,極大地提高了 AI 的決策效率和精準度。
  • 面對內容理解的準確性和效率問題,facebook是這樣利用自我監督技術...
    隨著我們內容理解能力的不斷提高,我們也在自我監督的新領域取得了進展。這項技術將加速預訓練系統的學習,它可以為下一代更快、更靈活的工具奠定基礎。我們將在這裡重點介紹我們如何提高內容理解系統的準確性和效率,並找到新的方法,在無監督學習中做更多的事情。
  • Facebook專家強烈質疑人類預測能力,未來只有靠AI才能自救!
    但近日,Facebook的AI研究科學家Tomas Mikolov表示, 如果不開發AI,人類的未來會變得更糟,人類實際上非常不善於預測,當我們做出重大的錯誤決定時,幫助人類實現自我拯救的可能就是機器。在未來,人工智慧可以超越人類、甚至奴役人類,但如果我們不在人工智慧領域取得進步,我們的未來可能會變得更糟。
  • 重磅| Facebook提出全新CNN機器翻譯:準確度超越谷歌而且還快九倍...
    選自code.facebook作者:Jonas Gehring、Michael Auli、David Grangier、Denis Yarats、Yann N. Dauphin機器之心編譯參與:吳攀、微胖、蔣思源去年穀歌在機器翻譯上取得了連續不斷的突破,谷歌的方法用到了文本處理慣用的循環神經網絡。
  • Facebook的研究人員應用數學進行更好的翻譯
    Facebook等社交網絡正在尋求滿足全世界所有語言的高效自動翻譯,人工智慧或許能解決這個問題。機器翻譯工具的設計者仍然主要依靠詞典來翻譯外語。但現在有一個新的方法:數字。目前,自動翻譯的原理是基於建立兩種語言相同語義文本的大型資料庫。但是對於許多語言對來說,受限於詞彙數量,沒有足夠多的平行文本供參考。這就是為什麼研究人員一直在尋找另一種方法,比如Facebook開發的系統,它可以為單詞創建數學表示。每個詞在幾百維的空間裡都變成一個「向量」。
  • 成立5 周年:一文覽盡 Facebook 人工智慧研究院歷年重要成果
    要想製造出真正意義上的智能機器,無論從技術還是產品工程的角度來說,都是一項挑戰。因此,FAIR 有相當一部分的研究精力都集中於攻克一些基礎問題,比如推理、預測、計劃和無監督學習等。與此同時,要想在這些研究領域有所建樹,需要對生成模型、因果關係、高維隨機優化和博弈論等理論有更深入的理解。
  • 無需依賴英語中介,Facebook 發布可翻譯 100 種語言的 AI 模型
    不管你在世界的哪個地方,美國、巴西、法國或者亞洲的婆羅洲島,藉助機器翻譯,谷歌和 Facebook 這類軟體都可以把平臺上的幾乎任何文字內容都翻譯成當地語言。  不過你可能不知道的是,多數翻譯系統都是將英語作為中間語言進行的翻譯工作。也就是說,在把中文翻譯成法語時其實是中文到英語再到法語的。  這麼做的原因是因為英語翻譯的數據集(包括譯入和譯出)非常多而且容易獲得。但是,用英語作為中介語總體上降低了翻譯的準確性,同時讓整個流程更加複雜臃腫。
  • 機器翻譯三大核心技術原理 | AI知識科普
    )於1966年公布了一份名為《語言與機器》的報告,該研究否認機器翻譯可行性,機器翻譯研究進入蕭條期;復甦階段:1976年,加拿大蒙特婁大學與加拿大聯邦政府翻譯局聯合開發的TAUM-METEO系統,標誌著機器翻譯的全面復甦;發展階段:1993年,IBM的Brown等提出基於詞對齊的統計翻譯模型
  • Facebook想教AI理解數學,這件事有多難?
    或許你沒聽說過這個專業術語,但你一定熟悉通過模式識別衍生出許許多多功能強大的應用:比如,如何讓 AI 給出地道而不是呆板的翻譯,如何讓手機相冊自動識別並標記照片中反覆出現的面孔,甚至包括讓 AI 學習下圍棋並戰勝世界冠軍等等,這些都離不開模式識別技術的強大助推。
  • F8 2017 | 技術負責人為你解析 Facebook 神經機器翻譯
    機器翻譯的兩代架構以及技術挑戰。雷鋒網(公眾號:雷鋒網)消息:在昨日的 F8 會場,該講座吸引了眾多開發者到場,主講者是 Facebook 語言翻譯部門技術負責人 Necip Fazil Ayan。Necip Fazil Ayan 首先介紹了 Facebook 翻譯業務的使命和願景,以及對機器翻譯的應用。
  • Facebook 又出黑科技,手機照片一鍵切成 3D 大片
    為了讓更多人體驗到這種新的視覺格式,Facebook 利用機器學習開發了一個系統。這個系統可以推斷出任何圖像的 3D 結構,任何設備、任何時間拍攝的圖像都可以被轉換成 3D 形式。這就可以讓人們輕鬆使用 3D 照片技術。不僅如此,它還可以處理幾十年前的家庭照片和其它珍貴圖像。
  • 更靈敏,更特異,更精確——數字PCR技術的發展與應用簡介
    由於這種檢測方式具有比傳統qPCR更加出色的靈敏度和特異性、精確性,dPCR迅速得到廣泛的應用,這項技術在極微量核酸樣本檢測、複雜背景下稀有突變檢測和表達量微小差異鑑定方面變現出的優勢已被普遍認可,而其在基因表達研究、microRNA研究、基因組拷貝數鑑定、癌症標誌物稀有突變檢測、致病微生物鑑定、轉基因成分鑑定、NGS測序文庫精確定量和結果驗證等諸多方面具有的廣闊應用前景已經受到越來越多的關注。