Facebook宣布採用AI翻譯平臺內容,但你以為事情就這麼簡單嗎?

2020-11-28 獵雲網

【獵雲網(微信號:ilieyun)】8月7日報導 (編譯:小白)

過去,很少有人關注Facebook的翻譯,但今日之後可就不一樣了。今日,Facebook告別了原來的基於短語的翻譯系統,啟用了最新的AI驅動的神經機器(NMT)翻譯系統。

雖然在NMT翻譯技術上,Facebook相比谷歌或微軟(均於去年開始使用NMT技術)略顯落後,但是對Facebook本身,這項技術可以為其翻譯的準確性帶來顯著提升。

Facebook原先基於短語的翻譯系統存在的問題是,它無法從整個句子的層面去翻譯句子。事實上,該系統會直接將句子打碎,分成獨立的短語和關鍵詞,然後再利用概率計算和搜索算法來儘可能地提供準確的翻譯。

理論上,這似乎可行。但實際上,在那些句型結構有較大差異的語言之間進行翻譯時(比如中文和英語),這項技術就完全不管用了。

反之,神經機器翻譯可以從整個句子的層面嘗試分析句子,並基於上下文內容——而非獨立的單詞和短語——進行翻譯。當你將幾年前的谷歌翻譯拿來和現今的谷歌翻譯進行比較時,你就可以明顯感受到技術帶來的差異。

但不管怎樣,AI翻譯技術還遠談不上完美。並且,在翻譯其網站上的內容時,Facebook又面臨著一堆比較特別的難題。比如,Facebook的工程師經理Necip Fazil Ayan在某次採訪中指出,Facebook平臺上有許多俚語、首字母縮略詞以及其他非正式語言,這些都會大大增加NMT系統在整個平臺上自動翻譯文本的難度。

1、獵雲網原創文章未經授權轉載必究,如需轉載請聯繫官方微信號進行授權。

2、轉載時須在文章頭部明確註明出處、保留官方微信、作者和原文超連結。如轉自獵雲網(微信號:

ilieyun

)字樣。

3、獵雲網報導中所涉及的融資金額均由創業公司提供,僅供參考,獵雲網不對真實性背書。

相關焦點

  • Facebook AI 年度總結來啦
    我們提出了新的研究,除了圖像識別上的進展,在NLP領域,我們現在可以用較少的監督數據翻譯更多的語言。我們發布了許多平臺和工具來幫助其他人將他們的人工智慧研究轉化為生產應用程式,包括我們將目前流行的開源深度學習框架 PyTorch 升級成新的、更通用的 1.0 版本。
  • Google宣布推出AutoML Vision,自然語言,翻譯和聯絡中心AI
    圖片來源:谷歌今天在舊金山舉行的谷歌Cloud Next會議上,山景城公司宣布,它將去年在Google I / O上宣布的機器學習平臺Cloud AutoML擴展到新的領域。谷歌表示,其背後的理念和雲終端服務Cloud AutoML旨在為需要定製機器學習模型的組織,研究人員和企業提供一種簡單,簡潔的方式來培訓他們。為此,它正在將AutoML擴展到自然語言處理(使用AutoML自然語言)和翻譯(使用AutoML Translate)。
  • 重磅| Facebook提出全新CNN機器翻譯:準確度超越谷歌而且還快九倍...
    選自code.facebook作者:Jonas Gehring、Michael Auli、David Grangier、Denis Yarats、Yann N. Dauphin機器之心編譯參與:吳攀、微胖、蔣思源去年穀歌在機器翻譯上取得了連續不斷的突破,谷歌的方法用到了文本處理慣用的循環神經網絡。
  • 面對內容理解的準確性和效率問題,facebook是這樣利用自我監督技術...
    如何將這些內容識別出來並進行處理對平臺健康良好的運作具有重大意義。近日,facebook 人工智慧研究院發表了一篇博文,探討了這個問題。雷鋒網(公眾號:雷鋒網) AI 科技評論編譯整理如下文。如今,我們在 Facebook 的各種應用程式中使用人工智慧技術——其中最重要的一點是幫助人們安全地使用我們的平臺。
  • 無需依賴英語中介,Facebook 發布可翻譯 100 種語言的 AI 模型
    不管你在世界的哪個地方,美國、巴西、法國或者亞洲的婆羅洲島,藉助機器翻譯,谷歌和 Facebook 這類軟體都可以把平臺上的幾乎任何文字內容都翻譯成當地語言。  不過你可能不知道的是,多數翻譯系統都是將英語作為中間語言進行的翻譯工作。也就是說,在把中文翻譯成法語時其實是中文到英語再到法語的。  這麼做的原因是因為英語翻譯的數據集(包括譯入和譯出)非常多而且容易獲得。但是,用英語作為中介語總體上降低了翻譯的準確性,同時讓整個流程更加複雜臃腫。
  • 2020最佳AI論文,都在這裡了
    儘管2020年發生了很多事情,研究者們仍然為人工智慧技術的進步做出了大量重要的貢獻。位於蒙特婁的 AI 內容創作者 Louis Bouchard (他的 YouTube 帳號叫 What's AI) 匯總了一份2020年最值得關注的 AI 論文名單(https://github.com/louisfb01/Best_AI_paper_2020 )。
  • Facebook註冊,其實很簡單
    作為全球最大的社交平臺Facebook,創立於2004年2月4日,其又名臉書或臉譜,簡稱FB,擁有超過26億的活躍用戶量。而且在2012年每天已經達破3.5億的照片上傳量,成為全球人們最大、最熱門的照片分享站點。
  • Facebook 開源可直接翻譯上百種語言的 AI 模型
    DoNews 10月20日消息(記者 劉文軒)Facebook 近期宣布將首個不需透過英語、可直接翻譯兩種語言的 AI 模型 M2M-100 開源。Facebook 表示一般機器翻譯需要為每種語言及每種任務建立一種 AI 模型,由於英語訓練資料較充裕,因此形成以英語為中心的翻譯模式;碰到要翻譯非英語的兩種語言,例如中文和法文時,大部份機器翻譯採取法文翻成英文,再由英文翻成中文。Facebook 指出,這種需要以英文為中介的翻譯會導致原意流失或翻譯錯誤,並不適合臉書平臺上160多種語言貼文翻譯的需求。
  • AI翻譯會取代人工翻譯嗎?
    反過來說,如果你的發音不標準,帶有濃重的地方口音,那結果可就不那麼樂觀了,很多人認為方言和官方語言僅僅是發音不同,一個發音的翻譯搞定了,其他發音就很簡單了。 然而現實卻沒有那麼美好,方言之所以只能成為方言,概因其缺乏規範,隨意性很高,AI很難找到統一的語法規律。
  • 搶佔AI翻譯賽道,搜索平臺為何不約而同發力NMT?
    搜索平臺不約而同發力NMT,為的是哪般?前面說到,不論是國外的谷歌,還是國內的搜索巨頭百度、搜狗、360等,均把NMT作為AI翻譯的標配,翻譯集中的領域在中英互譯上,這是一個很有趣的現象。AI翻譯真的是塊肥肉嗎?惹得誰也不願意掉隊。據統計表明:全球一共有73個國家,超10億人以英語為官方語言,而漢語則是世界使用人數最多的語言。
  • 喜馬拉雅小雅Nano圖賞:三分靠AI,七分靠內容
    大多數學生或者喜歡喜馬拉雅的用戶當然也能接受這個價格,你以為身材縮到這麼小一個,難道功能就縮減了?麻雀雖小,「內容」俱全!
  • Facebook像素是什麼?facebook像素的安裝方法及功能
    簡單地說,如果你不了解誰進入了你的網站、進入網站之後做了什麼,那你的廣告取得成功的機率很小。相反,Facebook像素可以抓取你所有想知道的數據,並幫助你構建受眾。二、Facebook像素主要有三方面的用途:Facebook有預設的9個標準事件,分別是:查看網頁內容、搜尋、加到購物車、加到心願清單、發起結帳、添加支付信息、購買、潛在顧客、完成註冊。
  • 停止翻譯和造句,練出流利英語口語比你想的要更簡單
    賽思特 麥浪有一個美國人在來中國之前,有人教他一句中國話:「你好嗎?」他怕忘了,就沿途念著。到了中國是一位漂亮小姐姐來接待他,他一慌說:「媽,你好。」他見小姐姐生氣了,馬上改口說:「你媽好。」當然這是個笑話,事實上中國人見人哪會說:「你好嗎?」這是由英文硬生生翻譯過來的,美國人見面說「你好嗎?」,中國人見人都是說「你好!」
  • Facebook AI 正在升維突破:教AI像人類一樣理解三維世界
    圖 | 通過網格構建物體 3D 形狀(來源:Facebook) 簡單來說 這些成果不僅可以幫助 AI 加深對傳統 2D 圖像和視頻內容的理解,還可以用來增強 AR 和 VR 體驗。 研究團隊表示,在評估不同個例之間對應關係的準確性時,新系統的表現優於舊方法兩倍。
  • 除了Facebook和Google,你還知道幾個海外廣告平臺?
    決定先把一件事情做好,再來完成另一件事情吧~ 綜合類廣告管理工具(BM):www.facebook.com/adsmanager/manage/ Google旗下YouTube不僅僅是一個視頻網站,作為第二大搜索平臺,YouTube擁有龐大的搜索流量。
  • 你願意讓AI來審稿你的論文嗎?
    出版業巨頭愛思唯爾(Elsevier)的同行評議管理系統Aries Systems曾採用了一款叫做StatReviewer的軟體,該軟體可以檢測稿件中的統計數據和研究方法是否靠譜。 許多期刊採用的同行評議平臺ScholarOne也和丹麥的UNSILO達成了合作。
  • Facebook移動用戶數達2.5億 推新移動網站
    北京時間4月1日早間消息,Facebook周四宣布,該網站的移動用戶數已經達到2.5億。Facebook同時宣布了移動業務的其他一些進展。Facebook已針對iPhone、Android、WebOS和其他平臺推出了應用,但仍有很大一部分移動用戶直接通過網站登錄Facebook。到目前為止,Facebook的移動網站版本仍然複雜。
  • 康傳媒facebook群控的多種用法
    康傳媒武漢Facebook在全球有26億用戶,是全球最大的社交平臺,人們在facebook上進行交流,滿足社交的需求,比如隨時發布動態,將生活中的點點滴滴分享到facebook平臺上,圖、文、視頻等多種展示方式。
  • 扎克伯格facebook怎麼賺錢 社交網絡馬克廣告論並不現實
    劇呱呱記得在電影《社交網絡》裡有這樣一個場景,馬克和愛德華多因為廣告問題起了爭執,他堅持「加廣告會讓臉書變得不酷」,那麼現實當中facebook怎麼賺錢的,真的不靠廣告嗎?馬克在電影裡的經典廣告理論現實當中扎克伯格怎麼看?
  • 你們以為的上海英文名真的有這麼簡單?
    作為同時期(近代)也很輝煌的北京(Peking)、重慶(Chungking)、南京(Nanking)等都有這麼多king真的好嗎?就連香港都是粵語譯名(Hong Kong)。中國上海上海是一座極具世界影響力的國際化大都市,在上世紀二三十年代還有一個別稱「魔都」,當時日本人對現代都市/摩登都市(modern city)的稱呼,因音譯問題翻譯成魔都。