日均調用量超13億次,阿里達摩院研發全球首個實時翻譯直播

2020-12-23 DeepTech深科技

近幾年來,直播電商到處開花,但絕大多數都是國內的中文直播。如果想買外國電商主播推薦的商品,語言不通怎麼辦?

這一難題已被阿里巴巴(下稱 「阿里」)攻克,阿里速賣通是面向全球海外消費者設立的電商平臺,它和淘寶一樣,也面向所有終端消費者,但區別是速賣通是面向全球 200 多個國家和地區的電商平臺。

直播電商動輒 「幾億元帶貨」 的高歌猛進,也讓跨境電商賣家對這一模式心動不已。然而,由於不同國家和地區的語言不同、文化不同、消費習慣也不同,所以要想在速賣通做直播,語言、物流、支付和技術都是非常複雜的系統,其中語言是最急需攻克的難題。

而在近日,阿里達摩院聯合速賣通推出 AI 實時翻譯直播,可同時進行中文到英、俄、西三種語向的翻譯。據悉,這是全球首個啟用 AI 實時翻譯的電商直播,中國商家只需用中文一鍵開播,就能同時覆蓋全球英語、西班牙語、俄語區的逾十億人口。

「被迫」 研發的翻譯引擎

兩年前,速賣通開始探索直播,然而不同於淘寶直播的是,高峰期湧到直播間的用戶來自 19 個國家,且說著不同的語言。當時,沒有多元實時翻譯,要麼全部用英文直播,要麼面向某一語言地區的用戶專門用某種語言直播,比如法語或西班牙語。

據速賣通官方直播負責人陸嬿介紹,大部分實力雄厚的商家會請外國主播,而中小商家要麼放棄,要麼無聲直播或用中式英語(Chinglish)尬播。數據顯示,速賣通上近九成商家來自中國,而 82% 的中國商家因為語言困難而放棄跨境直播。

相比淘寶直播,速賣通直播更像一個嬰兒,她需要強大的 「營養」 才能快速成長。這個營養就是能實現多譯多功能的實時翻譯工具。

在研發多譯多之前,速賣通曾試用過現成的翻譯引擎,但對直播間的翻譯輸出腳本來說,即便是質量最好的翻譯引擎,其翻譯結果也不合格。當時,還有俄羅斯和西班牙用戶受邀參與評測,他們的評價也是完全聽不懂。

速賣通研究後發現,這些翻譯引擎之所以無法使用海外直播,其一是常規同傳有專業的收音設備來保障翻譯準確度。但是電商直播的環境很嘈雜,很多商家直接在檔口就開始播,這樣就難以保證較好的收音。

其二常規的同傳詞庫是固定的,翻譯工具得到有效訓練後就能保證準確度。但是電商直播商品數量過億,且每天都在變,根本沒有辦法讓翻譯工具快速學習。而且主播每個人都來自不同地方,有的說話還帶有方言。並且有些主播語速很快,這都會極大地增加翻譯難度。以上原因使得速賣通不得不自研引擎。

沒有訓練集,商家自己 「造」

隨後,速賣通耗時 7 個月開發出中譯英引擎,並於 2020 年 5 月份上線。上線後商家開播率已有 65%,今年 「828 大促」 期間線上 90% 的直播間都使用了該功能。

但仍存在不足,即使中譯英能力做到極限,直播間裡只有 30% 的用戶能聽得懂主播說的話,因為 AE 是一個跨全球平臺,直播間裡各種用戶都有,英語用戶最高比例是 30%,因此亟需推出中譯多的功能。

兩個月後,中譯多功能完成,上線之後用戶體驗得到較高提升,部分店鋪銷量隨之增加 3 倍。當時,很多商家直播間的購買轉化,比達人直播的轉化率還高。一些直播達人和海外商家發現後,也要求使用中譯多功能,可是很多商家不說中文,為此速賣通增加了多譯多功能,並於今年 7 月上線。

研發過程中也有很多困難。第一是跨團隊協作,研發團隊分布在美國、中國、新加坡三個國家。另外,60 多位研發人員幾乎從未見過面,如何讓他們快速建立信任、並快速推下去是一大難題。

第二是訓練集的收集。跨境直播業務在全球都很少見,市面上沒有現存訓練集可以直接復用。好在阿里本身擁有較強的商家生態,很多商家都積極幫忙收集訓練集。

第三是並發承載點。如果只做一場翻譯,根本不會有壓力。但是直播每天有上千場,翻譯幾國語言,這就需要幾千個翻譯,因此伺服器的並發壓力非常大。後來,阿里雲對此做了改造,使得伺服器得以承載得住。

第四個難題是自動化展示。多譯多功能可自動識別用戶種類,並展示出相應的語言,比如它能識別你是中國人,從而用中文展示主播說的話。之前大家看到同傳效果都是在 PC 端上面,但是移動端很複雜,為此研發人員在其中做了不少自適應的工作。

自研更高效算法模型,可 「聽懂」 主播口音

達摩院研發的統一多語言多領域融合模型,可把上百個語言,以及每個語言的多個領域壓縮到一個神經網絡模型中進行翻譯,且翻譯質量不變。據達摩院駱衛華介紹,達摩院 AI 翻譯技術已創下多項業界第一,日均調用量超過 13 億次,累計 3000 億單詞,可提供 214 種語言的高質量翻譯。

據速賣通直播實時翻譯產品負責人趙文倩介紹,速賣通上有上億件商品、數百億個商品相關的專業名詞,對直播實時翻譯技術的要求極高,需要克服口音不標準、直播環境複雜、商品專業名詞多、新品新詞更迭快等問題。

主要負責該難題的是阿里達摩院自然語言處理實驗室的研究員樊楷,他表示為解決 AI 聽不清、聽不懂的問題,達摩院研發出更高效的語音算法模型,它不僅能在嘈雜環境中 「聽清」 直播內容,還能 「聽懂」 主播的口音。通過將多領域的知識融入翻譯模型,該算法模型還能舉一反三,無需重新訓練便能快速學習不同場景裡不斷更迭的專業名詞。

現在,速賣通平臺支持 18 種語言,可以保證設計出來的頻道和商品定位,能夠符合當地文化,這種 「入鄉隨俗」 主要體現在以下三方面。

心有靈犀。速賣通上有大量多元的商品,除了給它們做分類,還得容易被搜到。因此平臺得根據用戶輸入的詞,馬上就能獲悉他的搜索目的。在多語言混合下,這種挑戰會更大。以 「Case」 為例,它具有箱子和案子的雙重意思,用戶輸入該詞語時,到底想買什麼,就需要結合具體情景。此外,同樣的詞在不同語言裡的意思也不同,例如 「Basket」 在英語裡有 「籃子」 的意思,在法語裡還有 「球鞋」 的意思。

可面對數以億計的商品搜索,全程由人工解決會很慢。為此,速賣通採用人工智慧來解決,當然人工智慧的初步訓練是由算法工程師來解決。訓練結束後,速賣通最終可做到無論用戶輸入什麼,都能根據他前後搜索的詞語,來知曉其購買意圖。

了如指掌。速賣通希望用戶能對商品了如指掌,因此商品標題需要承載很多內容。比如,這個商品是什麼?怎麼找到?為什麼買?但是一些商家的標題,有的沒有標點符號,標題手法上也沒有特別規則。這一問題也可被人工智慧解決,它會給標題加上標點符號,並可整理成當地用戶熟悉的表達方式。

深信不疑。速賣通是跨境平臺,很多商家位於海外,商品需要飄洋過海才能到用戶手中。所以,用戶對平臺信用、商家信用和商品質量都有很高要求。而購買前想知道商品到底好不好?就只能通過用戶評價去了解。但是用戶評價非常多,涉及的語言種類也非常多。另外,用戶會用各種不規範的語言來評價,比如 「Very gooooood」 這樣的短語,有的評價還會用到表情符號。而採用 「多到多」 翻譯引擎,上述問題也可得到解決。

由於疫情原因,2020 年很多此前從未涉足直播的商家,如中國山區的果農也開始直播賣貨。有了速賣通,無論是江西贛南的臍橙、還是河北棗強的貂皮都可以走向全球各地。同樣,中國用戶也可以買到此前只有靠代購才能買到的產品。科技惠及的從來不只是某一個國家的用戶,而是全世界。

相關焦點

  • 日均調用量超13億次,阿里達摩院研發全球首個實時翻譯直播
    然而,由於不同國家和地區的語言不同、文化不同、消費習慣也不同,所以要想在速賣通做直播,語言、物流、支付和技術都是非常複雜的系統,其中語言是最急需攻克的難題。而在近日,阿里達摩院聯合速賣通推出 AI 實時翻譯直播,可同時進行中文到英、俄、西三種語向的翻譯。據悉,這是全球首個啟用 AI 實時翻譯的電商直播,中國商家只需用中文一鍵開播,就能同時覆蓋全球英語、西班牙語、俄語區的逾十億人口。
  • 日均調用13億次 實時翻譯直播將參與今年雙11
    央廣網杭州10月24日消息(記者張國亮) 「日均調用量超過13億次,累計3000億單詞,可提供214種語言的高質量翻譯!」在阿里達摩院創下多項業界第一AI翻譯技術的支持下,近日,全球首個實時翻譯直播上線,將全面參與今年的天貓雙11全球購物狂歡節。最重要的是:不會外語也能向全球直播!
  • 阿里達摩院全球首個實時翻譯直播上線,今年雙11多語種一鍵開播!
    日均調用量超過13億次,累計3000億單詞,可提供214種語言的高質量翻譯。作為餘杭重大創新載體,阿里巴巴達摩院的AI翻譯技術曾創下多項業界第一。近日,速賣通聯合阿里達摩院推出的全球首個實時翻譯直播上線,它將全面參與今年的天貓雙11全球購物狂歡節。
  • 主播不會外語也能向全球直播 阿里達摩院實時翻譯直播上線
    日均調用量超過13億次,累計3000億單詞,可提供214種語言的高質量翻譯。作為杭州餘杭重大創新載體,阿里巴巴達摩院的AI翻譯技術曾創下多項業界第一。近日,速賣通聯合阿里達摩院推出的實時翻譯直播上線,它將全面參與今年的天貓雙11全球購物狂歡節。最重要的是:主播不會外語也能向全球直播。
  • 阿里AI實現全球首個實時翻譯直播,214種語言翻譯支持雙11
    簡介: 10月21日,阿里完成全球首個多語言實時翻譯的電商直播,該直播展示了AI無懼嘈雜環境、口音不標準及口語化語言風格等問題,實時將中文直播內容精準翻譯成英語、俄語、西班牙語等語言。10月21日,阿里完成全球首個多語言實時翻譯的電商直播,該直播展示了AI無懼嘈雜環境、口音不標準及口語化語言風格等問題,實時將中文直播內容精準翻譯成英語、俄語、西班牙語等語言。阿里方面透露,該技術將大規模應用於2020雙11。
  • 阿里AI 實現首個實時翻譯直播 大規模用於雙 11
    原標題:阿里 AI 實現首個實時翻譯直播,將大規模用於雙 11   今日(21)日消息,阿里完成全球首個多語言實時翻譯的電商直播,
  • 阿里AI 實現首個實時翻譯直播,將大規模用於雙 11
    今日(21)日消息,阿里完成全球首個多語言實時翻譯的電商直播,通過AI實現環境降噪,解決口音不標準及口語化語言風格等問題,可實時將中文直播內容精準翻譯成英語、俄語、西班牙語等語言,該技術將大規模應用於2020年雙11活動。
  • 一鍵直面10億海外消費者,速賣通全球首個實時翻譯直播天貓雙11上線
    【獵雲網北京】10月22日報導不會外語也能向全球直播!今年天貓雙11,速賣通聯合阿里巴巴達摩院推出AI實時翻譯直播,可同時進行中文到英、俄、西三種語向的翻譯。據悉,這是全球首個啟用AI實時翻譯的電商直播,中國商家只需用中文一鍵開播,就能同時覆蓋全球英語、西班牙語、俄語區的逾十億人口。
  • Facebook AI 翻譯主管黃非加盟阿里達摩院
    新智元報導 【新智元導讀】日前,黃非博士入職阿里巴巴達摩院。他以前的身份是:Facebook(臉書)應用機器學習部AI翻譯團隊主管。在達摩院機器智能技術實驗室,他將和同事推動AI翻譯在新零售、跨境電商、視頻等領域的實時翻譯應用。日前,黃非博士入職阿里巴巴達摩院。
  • 前Facebook AI翻譯主管加盟阿里達摩院,致力圖片、視頻、聲音「秒...
    摘要:入職達摩院後,黃非博士將和同事推動AI翻譯在新零售、跨境電商、視頻等領域的實時翻譯應用。文/ 天下網商記者 孫茜茜 日前,前Facebook(臉書)應用機器學習部AI翻譯團隊主管黃非博士入職阿里巴巴達摩院。
  • 阿里實現AI實時翻譯直播 助力雙·11視頻直播
    中關村在線消息:北京時間10月21日,今天阿里巴巴對外宣布,他們已經完成了首個多語言實時翻譯的電商直播。這種技術可以讓AI實時將中文直播內容精準翻譯成英語、俄語、西班牙語等語言。這種翻譯並不會受到環境音、口音和口語化的影響。
  • 全球首個電商實時翻譯AI現身阿里巴巴國際站 可自動糾錯比人還聰明
    據悉,這是全球首個電商領域的實時翻譯AI(人工智慧)產品。憑藉日翻7.5億次的實力,阿里巴巴位居電商AI翻譯之首,實力遠超臉書、亞馬遜。,融合了達摩院機器翻譯、語義理解、自動語種識別和語音識別多項AI技術。
  • 日翻7.5億遠超臉書亞馬遜,阿里推出全球電商實時翻譯AI
    憑藉日翻7.5億次的實力,遠超臉書、亞馬遜。 ,融合了達摩院機器翻譯、語義理解、自動語種識別和語音識別多項AI技術。 但目前大多數AI翻譯工具偏向日常交流,比如臉書不久前上線的實時翻譯便是2C場景。而電商擁有大量商品品牌、型號、關鍵屬性等專業術語,通用翻譯工具往往難以勝任。CNN曾報導,今年2月參加韓國冬奧會的挪威奧運代表團,因谷歌誤翻計量單位,在一家韓國超市網購的1500個雞蛋拿到手竟是15000個。
  • 日均調用量超155億次!百度世界2020秀出百度智能語音產業化成果
    (百度世界2020央視新聞直播間)在當天的百度大腦分論壇上,百度語音首席架構師賈磊重點講解了百度端到端語音交互技術。他表示,百度語音交互技術持續迭代升級,已發展成為基於深度學習技術的端到端的語音識別和語音合成技術。
  • 日均調用量超155億次!百度世界2020秀出百度智能語音產業化成果
    同時交出了百度語音技術最新成績單:日均調用量超過155億次,廣泛應用在移動端、智能家居、和語音IoT等場景,智能語音產業化成果豐碩。據他介紹,百度端側全雙工語音交互技術將複雜的建模過程轉化為3個端到端的深度學習過程,即信號聲學一體化建模、聲學語言一體化建模以及語義置信一體化建模。通過端到端的建模,該技術能夠將整個複雜的端側交互轉變成若干個深度學習計算,使得依靠一顆AI晶片就能完成端側的全雙工語音交互,從而大幅度提升車載手機等語音交互性能,顯著改善用戶體驗。
  • 全球首個AI實時翻譯直播上線
    視頻裡爺爺給孫子買了個AI人工智障完了,人工智慧也必不可能落下,雙十一前阿里上線的全球首個AI實時翻譯直播,給全國各商戶提供了極大的便利,中國的淘寶商戶只要在直播間一鍵開播便可實現國際直播,可同時英、俄、西三種語言的翻譯同時覆蓋全球十多億人口。
  • 日均翻譯請求量超2億次 騰訊翻譯君以AI引領翻譯技術革命
    騰訊公司日前透露,上線一周年的騰訊翻譯君日均翻譯請求量已達2億次,發展速度令業界驚嘆。這款以AI內核驅動的實時語音翻譯軟體目前支持中、英、日、韓四國語言,能夠實現語音、文字、圖片的快速翻譯。特別是在中英互譯方面,已達到業界領先水平。
  • 把網絡小說翻譯成外語後再賣給老外,人工智慧真的是「智能」
    達摩院AI翻譯技術已創下多項業界第一,日均調用量超過13億次,累計3000億單詞,可提供214種語言的高質量翻譯。AI翻譯在應用上已經出現在了一些很奇怪的領域。據專業人士報導,一個專業人士譯者翻譯1000個單詞可能需要幾個小時的時間
  • 阿里AI實時翻譯直播助力開啟全球剁手模式
    達摩院AI可實時翻譯直播內容及評論區的小語種語言(網絡圖片)阿里AI實現首個實時翻譯直播10月21日,阿里完成全球首個多語言實時翻譯的電商直播,該直播展示了AI無懼嘈雜環境、口音不標準及口語化語言風格等問題,實時將中文直播內容精準翻譯成英語、俄語、西班牙語等語言。