「我是來打醬油的」怎樣翻譯成外語?「雲上曲率」以AI翻譯幫助遊戲...

2020-12-10 36氪

電子遊戲發明至今已有數十年歷史,由於其傳播文化、寓教於樂等特性被很多人稱為「第九藝術」。遊戲最早運行於專用遊戲主機之上,後經過早期PC時代、網際網路時代、移動網際網路時代的過度,如今人們早已能夠通過各種平臺及設備體驗遊戲帶來的快樂。後移動網際網路時代的來臨,讓遊戲的呈現形式有了更多可能,而遊戲及其相關技術的發展,也讓更多創新的遊戲形式逐漸成為現實。36氪「遊戲創新專訪」系列文章,將圍繞遊戲內容及相關領域技術,為讀者帶來更新奇有趣的創新創業故事。

中國是遊戲出海大國,以FunPlus、騰訊遊戲、網易遊戲、IGG、紫龍遊戲等為首的遊戲大廠,旗下產品的用戶均已覆蓋全球範圍內幾十個國家和地區。而遊戲本身作為承載了文化意義的的內容產品,也擔負著文化交流、文化傳播、寓教於樂的使命。

遊戲的核心是內容。當中國廠商將遊戲質量打磨到了世界頂尖水平後,要想開拓更多的海外市場,遊戲內容本身與各國文化、民俗、社會環境等方面的「適配度」,則成為了廠商們研究的重點。

「很多出海遊戲都在做『全球服』,那麼玩家之間該如何溝通?打個比方,你說一句『扎心了,老鐵』,我說一句『猴子去上路』,這時候隊內有一位來自英語國家的玩家,通過市面上任何一款常見的翻譯軟體,可能都難以理解這兩位玩家想表達的完整意思。」雲上曲率創始人兼CEO杜曉祥說道。

在中國手遊出海的初期,雲上曲率團隊便注意到了各國玩家語言不通給出海廠商帶來的問題。杜曉祥認為,在遊戲聊天中,經常出現的口語、俚語(或方言)、遊戲專有名詞、縮略語等,使常規翻譯平臺並不能高效準確翻譯。

此外,市面上的常規內容審核產品與用戶自研詞庫,對於網遊中的敏感詞(涉政、色情、暴恐、辱罵、廣告等)也基本是「一刀切」,導致玩家的正常交流時常受到幹擾。

事實上,隨著移動遊戲在全球範圍內的普及,遊戲本身的社交屬性也逐漸凸顯,很多玩家更在意的是「與友同樂」;同時,遊戲內容的本地化也很讓遊戲廠商煩惱——宗教信仰、用戶喜好、文化差異等因素,不得不讓廠商在進入市場前進行大量的市場調研,並根據當地情況對遊戲的部分文字內容進行本地化調整。

基於這些需求,在積累了多年AI大數據語言分析及互譯的服務經驗後,杜曉祥團隊於2018年成立了雲上曲率公司。雲上曲率定位於提供PaaS雲服務的大數據及AI公司,團隊人員來自於谷歌/騰訊/Facebook等核心團隊,公司目前研發人員超過60人,大多有15年以上的專業經驗。

除專注於口語化聊天的「實時翻譯系統」外,雲上曲率的另一款核心產品「內容審核系統」是基於自研的深度學習和內容審核模型,在千億級語料的支撐下,自動識別文本、圖片、音頻中出現的涉政、色情、暴恐、辱罵、廣告等敏感內容,比如審核用戶聊天內容,自定義上傳的頭像、籤名、工會介紹等,幫助遊戲廠商降低業務違規風險,淨化網絡環境,提升用戶體驗。

目前,雲上曲率的翻譯系統和內容審核共支持中文、英文、日語、韓語、泰語、俄語、德語、法語、義大利語、西班牙語、葡萄牙語等23種語言間的實時互譯及內容審核。

雲上曲率團隊基於自然語言處理和深度學習算法等AI技術,主要解決了遊戲出海的三方面困擾:

敏感詞精準識別及屏蔽:很多玩家在交流中,會通過簡寫、網絡用語、拼音變體、形近字等方式,規避傳統敏感詞識別方式,使得遊戲內的交流環境變差(包括遊戲內違規廣告、涉黃涉暴等內容)。雲上曲率的內容審核系統在進行敏感詞檢測時,可通過近義詞分析、意圖識別、上下文語境識別等方式,精準進行敏感詞屏蔽,更大限度幫助遊戲廠商規避因敏感詞帶來的運營風險。玩家間的口語化交流及翻譯:玩家在進行跨語言社交的過程中,經常會使用本地化口語(例如老鐵、Lmfao等方言、口語或俚語),雲上曲率通過對於各地語言習慣、社會環境的多年積累,目前已支持23種語言的實時互譯,降低溝通成本的同時,提升交流效率和體驗。精準識別遊戲中的黑產廣告等內容:基於Word2Vec, Elmo, Bert等預訓練技術構建的知識體系,使用transformer, lstm, textcnn等多樣化模型, 避免單一模型有偏數據導致的誤殺和漏殺,提升複雜語境下的識別準確度;系統支持識別符號、圖標、多語言混合等變異手法。「我們在新加坡、巴林、美國、德國、巴西等都部署了全球實時數據傳輸中心,覆蓋東南亞/中東/歐洲/美洲等多數地區,為遊戲廠商提供高速互聯互通的遊戲網絡,促進東南亞國家/中東地區/歐洲/美洲地區與其他國家地區的文化交流與合作;實時數據傳輸服務則為很多遊戲(特別是中重度遊戲)提供了穩定的底層網絡環境,針對大型活動消息突增流量暴漲,我們的平臺可以實現每秒最高1000萬的並發消息數,單日可處理超2000億的消息量,保證遊戲穩定運行。」杜曉祥表示。

雲上曲率目前服務的頭部出海廠家超過15家,產品囊括數百款出海遊戲。杜曉祥表示,除了積累豐富的詞庫,雲上曲率的優勢還體現在多語種互譯——許多市場產品目前主要停留在中英互譯,同時很難針對不同市場進行精準的屏蔽和互譯定製,這也使得很多全球服部署的遊戲產品最終選擇與雲上曲率合作。

合作模式方面,遊戲廠商可通過申請服務接口接入雲上曲率的服務,以流量方式付費。為了扶持更多優秀產品,單款遊戲可獲得初期100萬字符翻譯的免費扶持。截至目前,與雲上曲率合作的頭部廠商已包括FunPlus、紫龍遊戲、掌趣科技、三七互娛、4399等。

值得一提的是,作為文化內容交流的重要載體,遊戲出海近年來已經吸引眾多國內開發者和遊戲廠商的青睞,但由於缺乏專業且成體系的圖文監控及互譯系統,很多遊戲盲目出海後遭遇了當地監管部門的處罰甚至永久下架。「更好的內容檢測系統,不僅是為了提供流暢的交流環境,更是為遊戲出海的長遠發展帶來了幫助。」杜曉祥說道。

為了提供更好的客戶服務,雲上曲率接下來會繼續降低產品的使用成本,優化內容審核准確率,並增加適配的國家和語種。杜曉祥表示,公司當前雖已處於盈利狀態,但對遊戲產業內的戰略合作會繼續堅持開放的態度。

「團隊在做技術產品的同時,也在與遊戲廠商們共同探討產品未來的發展規劃。中國遊戲出海已經是整個行業發展的重要方向,雲上曲率作為整個內容輸出的『大後方』,會繼續為廠商們提供高效穩定的服務。」杜曉祥表示。

————————————

相關焦點

  • ...外語?「雲上曲率」以AI翻譯幫助遊戲開拓海外市場 | 遊戲創新專訪
    打個比方,你說一句『扎心了,老鐵』,我說一句『猴子去上路』,這時候隊內有一位來自英語國家的玩家,通過市面上任何一款常見的翻譯軟體,可能都難以理解這兩位玩家想表達的完整意思。」雲上曲率創始人兼CEO杜曉祥說道。 在中國手遊出海的初期,雲上曲率團隊便注意到了各國玩家語言不通給出海廠商帶來的問題。
  • 對比人工翻譯及自然語言處理翻譯,ai翻譯存在哪些優勢?
    ai的核心問題是如何「產生」,不管是imagenet還是svd,都是一種「訓練」過程,這種練習的價值基於特徵提取完成後對目標的預測。那麼這些特徵能不能「產生」呢?根據經驗,是的。舉個簡單的例子,微博上一般都是這樣子對話的:這種對話很好「產生」,因為人的語言翻譯一般很難做出來,從整體上描述了人對話過程,這樣就完成了對話的設計和「模仿」。當然,單這麼說也不嚴謹,可能有的翻譯有點細節交流上的錯誤。另外,比如歌詞有時也可以通過一些對比的對話(bingquery)自動生成,原因在於歌詞是「不可編碼」的。這麼理解,也就沒問題了。
  • 「翻譯」這件枯燥的事兒應該怎樣有趣而有用?
    你可能每周都在等著「權利的遊戲」和「破產姐妹」的更新,而在美國,也有一個名叫「Asianfanatics」的論壇在同步追著亞洲的最新、最熱劇集和綜藝節目。就像曾經火遍全國的美劇「越獄」一樣,「還珠格格」(譯名:「Pearl Princess」)也在許多美國的「中劇迷」心中有著不可替代的地位,一位呆萌的美國網友甚至在「Pearl Princess」的一個討論帖裡評論道,「我太喜歡看《還珠格格》了,從小就看,第一部最經典,第二部有點拖沓,第三部的紫薇咋長得和前兩部不一樣了呢……好難過,他們都不認識爾康了啊!」
  • 我的職位是「文員」「跟單」,標準的翻譯是什麼呢?千萬別翻譯成secretary!
    「文員」「跟單」是國內求職市場上最常見的職位,但貌似這些都是非常中國特色的崗位,這在國外貌不典型,所以很難找到對應的翻譯。我在看一些小夥伴的簡歷時,發現這些崗位翻譯得千奇百怪,其實都是強行用電子詞典翻譯惹的禍。比如「文員」,有的翻譯成clerk,有的翻譯成secretary。
  • Laura:AI 字幕翻譯經驗分享 | AI研習社第 52 期猿桌會
    比如這一句「made our network more efficient」,大家不需要一看到 make 就把句子翻譯成「把」字句,直接使用動賓結構就可以了。在另一句中,前面這句「what we're gonna do 」和後面這句「a bit of stuff about」都沒有信息量,大家完全可以不翻出來。總之,大家在翻譯的時候,要想一想是否有更簡練的表達。
  • 直播電商都用上 AI 實時翻譯了!歪果仁也能聽懂李佳琦
    距離「雙 11 」還有半個月,各大電商平臺早已經開始摩拳擦掌,紛紛將預售時間提前,搶佔先機。而每年剁手黨們狂歡的背後,離不開技術力量的支持。 今年的「雙 11 」,不僅來得越來越早了,而且,還走得越來越遠,正從國內走出海外,讓全球消費者一起加入「買買買」的隊伍中來。
  • 「心靈雞湯」這個詞是怎麼來的?怎麼翻譯成英文?
    而這兩年內,「心靈雞湯」一詞又仿佛被賦予了一些諷刺意味,成了「文字優美但空洞」的代名詞,「毒雞湯」倒是因為其辛辣的風格有成為主流的趨勢。 出於以上的原因,「心靈雞湯」一詞被翻譯成英文時就應該考慮到其雙重含義。俗語「打雞血」和「心靈雞湯」並沒有關係,「打雞血」這個詞語的出現要比「心靈雞湯」早很多。
  • 乾貨|外語人名翻譯規則
    對每一種外語有著不同的愛,不能割捨的愛,這種愛會滲透到平常的工作中。打個比方來說,就人名翻譯,遇到歐洲的語言人名,用自己的專業語言翻譯一篇文章統一就好了,但有時候可能會深究。比如一個意西葡語的名字,用自己的專業,比如英語或法語音譯成中文,和找到它的原始語言音譯就會不一樣了。
  • 直播電商都用上 AI 實時翻譯了!外國友人也能聽懂李佳琦!
    今年的「雙 11 」,不僅來得越來越早了,而且,還走得越來越遠,正從國內走出海外,讓全球消費者一起加入「買買買」的隊伍中來。阿里旗下的速賣通就趕在「雙 11」之前,推出了多語言實時翻譯服務,方便全球的消費者們一起來「剁手」。
  • 一個英語水平一般的人怎樣成某領域專業翻譯和自媒體?
    然而有少部分人做到了這兩點,他們就成了某領域的專業翻譯。其中就包括兩類人:1.英語專業深耕某一領域成功的。2.醫療、法律、機械等專業的學生提高語言水平之後,結合紮實的專業知識儲備和術語儲備,逐步走上專業翻譯的道路。所以想解決這個問題,應該從這兩方面下功夫。
  • 微信表情怎麼翻譯成文字方法 微信表情翻譯你是不是很喜歡我
    微信表情翻譯我喜歡你怎麼翻譯成文字?許多用戶都還不太清楚這個翻譯成文字,下面就讓小編為大家帶來,微信表情翻譯我喜歡你翻譯成文字方法。  微信表情怎麼翻譯成文字方法  之前用戶和微信翻譯玩遊戲時就曾發現不少彩蛋,比如「You are my shadiao friend」之前就會被翻譯為「你是我的好朋友」,想到「沙雕」這個詞中調笑的意味,你似乎也不能說這個翻譯是錯的。而有的語音信息在轉文字後也會有表情翻譯的信息出現,比如「太生氣了」就能召喚出一個[發怒]的表情。
  • ...億字資料庫 ,「譯訊科技」以精準語料資料庫切入AI文檔翻譯賽道
    「目前我們平臺已積累了超百億句對(約4千億字)的翻譯數據。」「譯訊科技」創始人馬帥告訴36氪四川,「譯訊科技」推出的雲譯通智能文檔翻譯軟體,以PC平臺為基礎,利用大數據、人工智慧和雲技術,能做到1分鐘翻譯100頁,專業翻譯準確率高達92.8%。 海量的數據積澱,使得用戶可通過搜尋引擎與雲譯通後臺雲端儲存的數據進行快速比對。
  • 哦我的老夥計,瞧這濃濃的翻譯腔,可真叫人「聲臨其境」| 語言學午餐
    觀眾紛紛表示:段譽的聲音一出來,立刻感受到了濃濃的「TVB風」。對於葉清的演繹,演員王剛老師這樣評價:從配音風格上劃分,我們通常稱歐美電影為「譯製腔」(這裡我們主要討論英語翻譯成漢語的情況),港劇為「TVB腔」,另外還有「韓劇腔」「臺灣腔」等等「腔」。
  • 從翻譯影片到國內外IP版權運營,在線翻譯平臺「人人譯視界」要探索...
    36氪獲悉,5月28日科技公司「譯滿天下」研發的在線翻譯平臺人人譯視界正式公布,該產品結合AI技術,為各語種翻譯從業人員、愛好者和翻譯公司提供智能翻譯服務。 譯視界基於海量語料庫和AI技術,支持視頻聽譯、文檔速譯,快速匹配語料,自動生成影片字幕。
  • 聲之形:把「喜歡」聽成「月亮」,夏目漱石的翻譯謠言
    不僅得到了原諒,甚至硝子還喜歡上他。影片中硝子的告白也給人留下了深刻的印象。鼓起勇氣地開口,卻因為有些奇怪的發音,加上將也作為欺凌者根本不敢奢望得到受害人的青睞。喜歡(suki)便被聽成了月亮(tsuki)。
  • 「知行翻譯」最常見的日語「雷」區,你中招了嗎
    其實不單單是漢語有這些「雙關」,外語也是一樣的,今天,小強為大家整理了日語的一些日常使用禁忌。「そのうち分かるよ」之後你就會明白的。這句話給人一種「現在跟你說,你也不懂」,「跟你說太麻煩了」的感覺,聽者會覺得你懶得向TA解釋,沒有尊重TA。
  • 把「我愛你」翻譯成「今晚月亮真美」,是你看了假的夏目漱石
    —— 夏目漱石夏目漱石問他的學生如何翻譯「I love you」,學生翻譯成「我愛你」,夏目漱石說:「日本人怎麼可能講這樣的話?『今夜月色很美』就足夠了。」但據知乎一位日本文學話題優秀回答者稱,事實並非如此:這個翻譯最早的出處是小田島雄志的『シェイクスピア全集』和『珈琲店のシェイクスピア』,其中提到了夏目漱石將「I love you」翻譯為「月がとっても青いから」(月亮真是很藍啊)。
  • 來聊聊「格局」的英文翻譯
    中文裡的格局其實是一個很宏大的詞,在不同的使用場景中意思都不同,不能用一個英文單詞來翻譯,視實際意思採用不同的英文表達。格局很有可能來自圍棋,象徵著棋局上的每一小格和棋子走在格子上影響的整個局面,英文中有一個詞landscape很接近這個意思,本意是大視野下的風景。
  • 「全職·翻譯」Tap Tap - 英語翻譯(月薪最高15K)
    其致力於為用戶提供發現遊戲、購買以及安裝遊戲到智慧型手機的渠道。現在大火的經營類遊戲《江南百景圖》便是該社區中可下載遊戲之一。除此之外,還有《香腸派對》、《光·遇》等等。遊戲《江南百景圖》嚴大人(花名「貪官」)1.全日制本科或以上學歷,英語相關專業,英語專四以上,好的英文寫作、翻譯能力; 2.熱愛遊戲,包括但不限於主機
  • 這年頭的翻譯app都是AR翻譯了
    > 小程序 網站 遊戲 教程這年頭,國內外的機器翻譯都轉到神經網絡陣營,所以現在不管是國外還是國內的機器翻譯水平都比原先高出一截,利用高精確的語音識別,實現同聲傳譯現在已成現實。所以今天說的騰訊翻譯君做的就是這些事情,且不僅僅是同聲傳譯,我們今天就來好好說說吧。