「我是來打醬油的」怎樣翻譯成外語?「雲上曲率」以AI翻譯幫助遊戲...

2020-12-21 36氪

電子遊戲發明至今已有數十年歷史,由於其傳播文化、寓教於樂等特性被很多人稱為「第九藝術」。遊戲最早運行於專用遊戲主機之上,後經過早期PC時代、網際網路時代、移動網際網路時代的過度,如今人們早已能夠通過各種平臺及設備體驗遊戲帶來的快樂。後移動網際網路時代的來臨,讓遊戲的呈現形式有了更多可能,而遊戲及其相關技術的發展,也讓更多創新的遊戲形式逐漸成為現實。36氪「遊戲創新專訪」系列文章,將圍繞遊戲內容及相關領域技術,為讀者帶來更新奇有趣的創新創業故事。

中國是遊戲出海大國,以FunPlus、騰訊遊戲、網易遊戲、IGG、紫龍遊戲等為首的遊戲大廠,旗下產品的用戶均已覆蓋全球範圍內幾十個國家和地區。而遊戲本身作為承載了文化意義的的內容產品,也擔負著文化交流、文化傳播、寓教於樂的使命。

遊戲的核心是內容。當中國廠商將遊戲質量打磨到了世界頂尖水平後,要想開拓更多的海外市場,遊戲內容本身與各國文化、民俗、社會環境等方面的「適配度」,則成為了廠商們研究的重點。

「很多出海遊戲都在做『全球服』,那麼玩家之間該如何溝通?打個比方,你說一句『扎心了,老鐵』,我說一句『猴子去上路』,這時候隊內有一位來自英語國家的玩家,通過市面上任何一款常見的翻譯軟體,可能都難以理解這兩位玩家想表達的完整意思。」雲上曲率創始人兼CEO杜曉祥說道。

在中國手遊出海的初期,雲上曲率團隊便注意到了各國玩家語言不通給出海廠商帶來的問題。杜曉祥認為,在遊戲聊天中,經常出現的口語、俚語(或方言)、遊戲專有名詞、縮略語等,使常規翻譯平臺並不能高效準確翻譯。

此外,市面上的常規內容審核產品與用戶自研詞庫,對於網遊中的敏感詞(涉政、色情、暴恐、辱罵、廣告等)也基本是「一刀切」,導致玩家的正常交流時常受到幹擾。

事實上,隨著移動遊戲在全球範圍內的普及,遊戲本身的社交屬性也逐漸凸顯,很多玩家更在意的是「與友同樂」;同時,遊戲內容的本地化也很讓遊戲廠商煩惱——宗教信仰、用戶喜好、文化差異等因素,不得不讓廠商在進入市場前進行大量的市場調研,並根據當地情況對遊戲的部分文字內容進行本地化調整。

基於這些需求,在積累了多年AI大數據語言分析及互譯的服務經驗後,杜曉祥團隊於2018年成立了雲上曲率公司。雲上曲率定位於提供PaaS雲服務的大數據及AI公司,團隊人員來自於谷歌/騰訊/Facebook等核心團隊,公司目前研發人員超過60人,大多有15年以上的專業經驗。

除專注於口語化聊天的「實時翻譯系統」外,雲上曲率的另一款核心產品「內容審核系統」是基於自研的深度學習和內容審核模型,在千億級語料的支撐下,自動識別文本、圖片、音頻中出現的涉政、色情、暴恐、辱罵、廣告等敏感內容,比如審核用戶聊天內容,自定義上傳的頭像、籤名、工會介紹等,幫助遊戲廠商降低業務違規風險,淨化網絡環境,提升用戶體驗。

目前,雲上曲率的翻譯系統和內容審核共支持中文、英文、日語、韓語、泰語、俄語、德語、法語、義大利語、西班牙語、葡萄牙語等23種語言間的實時互譯及內容審核。

雲上曲率團隊基於自然語言處理和深度學習算法等AI技術,主要解決了遊戲出海的三方面困擾:

敏感詞精準識別及屏蔽:很多玩家在交流中,會通過簡寫、網絡用語、拼音變體、形近字等方式,規避傳統敏感詞識別方式,使得遊戲內的交流環境變差(包括遊戲內違規廣告、涉黃涉暴等內容)。雲上曲率的內容審核系統在進行敏感詞檢測時,可通過近義詞分析、意圖識別、上下文語境識別等方式,精準進行敏感詞屏蔽,更大限度幫助遊戲廠商規避因敏感詞帶來的運營風險。玩家間的口語化交流及翻譯:玩家在進行跨語言社交的過程中,經常會使用本地化口語(例如老鐵、Lmfao等方言、口語或俚語),雲上曲率通過對於各地語言習慣、社會環境的多年積累,目前已支持23種語言的實時互譯,降低溝通成本的同時,提升交流效率和體驗。精準識別遊戲中的黑產廣告等內容:基於Word2Vec, Elmo, Bert等預訓練技術構建的知識體系,使用transformer, lstm, textcnn等多樣化模型, 避免單一模型有偏數據導致的誤殺和漏殺,提升複雜語境下的識別準確度;系統支持識別符號、圖標、多語言混合等變異手法。「我們在新加坡、巴林、美國、德國、巴西等都部署了全球實時數據傳輸中心,覆蓋東南亞/中東/歐洲/美洲等多數地區,為遊戲廠商提供高速互聯互通的遊戲網絡,促進東南亞國家/中東地區/歐洲/美洲地區與其他國家地區的文化交流與合作;實時數據傳輸服務則為很多遊戲(特別是中重度遊戲)提供了穩定的底層網絡環境,針對大型活動消息突增流量暴漲,我們的平臺可以實現每秒最高1000萬的並發消息數,單日可處理超2000億的消息量,保證遊戲穩定運行。」杜曉祥表示。

雲上曲率目前服務的頭部出海廠家超過15家,產品囊括數百款出海遊戲。杜曉祥表示,除了積累豐富的詞庫,雲上曲率的優勢還體現在多語種互譯——許多市場產品目前主要停留在中英互譯,同時很難針對不同市場進行精準的屏蔽和互譯定製,這也使得很多全球服部署的遊戲產品最終選擇與雲上曲率合作。

合作模式方面,遊戲廠商可通過申請服務接口接入雲上曲率的服務,以流量方式付費。為了扶持更多優秀產品,單款遊戲可獲得初期100萬字符翻譯的免費扶持。截至目前,與雲上曲率合作的頭部廠商已包括FunPlus、紫龍遊戲、掌趣科技、三七互娛、4399等。

值得一提的是,作為文化內容交流的重要載體,遊戲出海近年來已經吸引眾多國內開發者和遊戲廠商的青睞,但由於缺乏專業且成體系的圖文監控及互譯系統,很多遊戲盲目出海後遭遇了當地監管部門的處罰甚至永久下架。「更好的內容檢測系統,不僅是為了提供流暢的交流環境,更是為遊戲出海的長遠發展帶來了幫助。」杜曉祥說道。

為了提供更好的客戶服務,雲上曲率接下來會繼續降低產品的使用成本,優化內容審核准確率,並增加適配的國家和語種。杜曉祥表示,公司當前雖已處於盈利狀態,但對遊戲產業內的戰略合作會繼續堅持開放的態度。

「團隊在做技術產品的同時,也在與遊戲廠商們共同探討產品未來的發展規劃。中國遊戲出海已經是整個行業發展的重要方向,雲上曲率作為整個內容輸出的『大後方』,會繼續為廠商們提供高效穩定的服務。」杜曉祥表示。

————————————

相關焦點

  • 機器翻譯時代的降臨——打造通曉外語的部隊
    換句話說,那怕是新人汰換離退老手時,個人外語能力或有高下之分,但是外事人員的整體水平仍將保持一致。第二、計算機翻譯能力將不斷有所進展,隨著科技朝「小而強」,現代史上沒有人會認為明日計算機翻譯工具的字彙量會少於今日,或是較前一代操作不順、速度變慢。第三、谷歌和臉書等商業巨擘將持續領導自動化翻譯技術發展,吸引全球各角落客群來使用其所提供的各項服務。
  • 直播電商都用上 AI 實時翻譯了!歪果仁也能聽懂李佳琦
    距離「雙 11 」還有半個月,各大電商平臺早已經開始摩拳擦掌,紛紛將預售時間提前,搶佔先機。而每年剁手黨們狂歡的背後,離不開技術力量的支持。 今年的「雙 11 」,不僅來得越來越早了,而且,還走得越來越遠,正從國內走出海外,讓全球消費者一起加入「買買買」的隊伍中來。
  • 特沒譜「原則上」同意TikTok雲上加州方案,強烈diss「原則上」這個翻譯
    我看標題時候就覺得有些出戲,「原則上」是什麼鬼?到底是同意還是不同意,一點也不爽快。然後再看到全文裡特沒譜的原話:「我已經對這筆交易表達了祝福」,「我在原則上同意了這筆交易」。我不禁陷入了好奇,「原則上」是多麼中國特色的詞彙,難不成對外輸出到了美國,特沒譜也學會了這一套?
  • 從翻譯影片到國內外IP版權運營,在線翻譯平臺「人人譯視界」要探索...
    36氪獲悉,5月28日科技公司「譯滿天下」研發的在線翻譯平臺人人譯視界正式公布,該產品結合AI技術,為各語種翻譯從業人員、愛好者和翻譯公司提供智能翻譯服務。 譯視界基於海量語料庫和AI技術,支持視頻聽譯、文檔速譯,快速匹配語料,自動生成影片字幕。總之,藉助譯視界,不會視頻後期製作的小白用戶,也能在英語、法語、日語等外語影片中插入字母,輕鬆看懂外語影片。
  • Google 翻譯「即時相機翻譯」功能更新升級
    更新後的 Google 翻譯可以輕鬆幫你解決這些問題!「即時相機翻譯」是 Google 翻譯上最受歡迎的功能之一,只需將相機鏡頭對準陌生的語言文字,就可以對它們進行翻譯,而且即使在無法連接到網絡的情況下依然可以使用。
  • 微信表情怎麼翻譯成文字方法 微信表情翻譯你是不是很喜歡我
    微信表情翻譯我喜歡你怎麼翻譯成文字?許多用戶都還不太清楚這個翻譯成文字,下面就讓小編為大家帶來,微信表情翻譯我喜歡你翻譯成文字方法。  微信表情怎麼翻譯成文字方法  之前用戶和微信翻譯玩遊戲時就曾發現不少彩蛋,比如「You are my shadiao friend」之前就會被翻譯為「你是我的好朋友」,想到「沙雕」這個詞中調笑的意味,你似乎也不能說這個翻譯是錯的。而有的語音信息在轉文字後也會有表情翻譯的信息出現,比如「太生氣了」就能召喚出一個[發怒]的表情。
  • 聲之形:把「喜歡」聽成「月亮」,夏目漱石的翻譯謠言
    不僅得到了原諒,甚至硝子還喜歡上他。影片中硝子的告白也給人留下了深刻的印象。鼓起勇氣地開口,卻因為有些奇怪的發音,加上將也作為欺凌者根本不敢奢望得到受害人的青睞。喜歡(suki)便被聽成了月亮(tsuki)。
  • 為什麼《敦刻爾克》裡的Home不能翻譯成「祖國」?
    火力集中在其將片中的幾處Home,強行翻譯成「祖國」。 網友對賈翻譯詬病已久,除部分錯翻外,其作品以過度翻譯著稱,如《環太平洋》中出現「天馬流星拳」,《黑衣人3》中出現「地溝油」、「瘦肉精」等本土流行語,一段直譯字幕應為「也活得比我寂寞呢,畢竟你是最後一個活著的伯格羅多人了」的臺詞,被翻為「天長地久有盡時,此恨綿綿無絕期。」這種信馬由韁的再創作曲解了電影的原意,亂入的流行語更破壞了影片的整體格調,令觀眾出戲。
  • 2019年度十大翻譯熱詞揭曉!
    這也是很好的翻譯。「北京外國語大學 李長栓」硬 核hardcore也可以拼寫成hard-core,這個英語外來詞在國內不脛而走。「復旦大學 朱績崧」996如果徑直翻譯成「996」 work schedule,會使許多英文讀者在第一時間不解其意。
  • 臺灣同胞,再說自己翻譯好我要報警了!
    背負著「無敵鐵牛」的黑歷史,這是要有怎樣的勇氣和無畏,才敢吐槽「補天士」和「驚破天」這樣的譯名呢!據說,《霸王別姬》有因為從英譯直接翻譯回來變成《再見,我的妾》的;《燃情歲月》《廊橋遺夢》《暮光之城》到了臺灣直接成了《真愛一世情》《麥迪遜之橋》《吸血新世紀》(你考慮過票房的感受麼!);《雲上的日子》在臺灣譯作《雲端上的情與欲》,《天生愛情狂》則是《這個男人有點色》,《這個殺手不太冷》變成了《終極追殺令》……你能從下面的圖中看出臺灣翻譯的規律麼?
  • 微信翻譯鬧笑話蔡徐坤躺槍,AI翻譯為何總「翻車」?
    更多優質內容請關注微信公眾號「AI 前線」(ID:ai-front) 昨天,有細心的網友發現,微信翻譯出現故障,得出了很多讓人啼笑皆非的翻譯結果。比如明星們的名字被翻譯成各種風馬牛不相及的字眼,Cai Xukun 被翻譯成「傻蛋」也真是非常尷尬了。
  • 為什麼「我愛你」要翻譯成「月色真美」?
    據說文豪夏目漱石在做英語老師的時候,看到有學生將「I love you」翻譯成了「我君を愛す」時說,「日本人はそんなことは言わない。月が綺麗ですねとでも訳しておけ(日本人不會說這樣的話。要翻譯成月色真美)」。雖然這個小故事只是坊間流傳,夏目漱石並沒有什麼確切的譯著可以作為證據,但是因為翻譯的直達日本人的心底,符合日本人的性格思維,在日本到現在也是一個非常有名的梗告白方式,在現在的日本很多的影視作品中也有體現。
  • 西班牙語翻譯培訓班外語不用愁
    西班牙語翻譯培訓班外語不用愁,學員主要對象為辦公室白領以及企業高層和團體、學校學生群體。西班牙語翻譯培訓班外語不用愁, 這是一篇帶有命令性的範文。這是一篇帶有嚮導、介紹性意味的範文。這是一篇商務檢討書的範文。這是一篇取消性的範文。這是一篇帶有聯絡性意味的範文。來自星星的你更新時間:來自星星的你什麼時候更新?
  • iOS 14 翻譯 App 體驗:猜猜「吃瓜群眾」被翻譯成什麼
    作為一款智能語音助手,Siri 除了可以幫助我們處理一些簡單的事務,例如設定鬧鐘、建立備忘錄等,甚至還可以充當應急翻譯助手,應付一些簡單的短語。 但在面對完整對話時,Siri 的翻譯效果往往不及其他專業應用。
  • 30多種方言外語識別翻譯 訊飛輸入法AI語音創新多
    對於很多英文不太好人而言,和不會中文的外國人交流是一件比較困難的事情:先用中文擬好常用語,翻查外文字典編寫成句;或者將中文複製到翻譯APP中翻譯,也有部分用戶在網頁上翻譯,這再來觀察翻譯結果是不是真的貼切準確,比較浪費時間。
  • 「巨野」竟被翻譯成「great wild」,大劇院標牌翻譯太搞笑!
    「巨野廳」竟成great wild hall菏澤大劇院廳內多處指引牌內容翻譯不準或有誤:外語專家提出修改建議 其中,巨野廳翻譯成great wild hall,漢式思維地逐字翻譯,這不是明顯改變了巨野縣的原意了嗎?
  • 日語:中文裡的「發現」,翻譯成日語卻要用不同的單詞表達
    但是到了句子,卻要因為前後內容的不同,其程度和某種含義會發生變化,而使用不同的翻譯效果,特別是在中文翻譯成日語的時候,尤其明顯。有一次,我和同事一起到庫房去找一件東西(我們庫房沒有庫管,誰都可以進去,非常亂),找了很久終於找到了,於是大叫:「発見しましたよ。ここにあります。(找到了,在這裡。)」同事急忙過來,「見つけたの。よかった。(找到了,太好了。)」
  • 搜狗翻譯推出首個AI寫作助手 開啟外語學習智能化新篇章
    中新網6月17日電 近日,搜狗翻譯推出國內首個AI寫作助手,通過藉助先進的人工智慧算法對英文作文進行實時語法和拼寫糾錯,並提供專業的語句潤色優化建議,從「糾錯」到「潤色」,一站式解決英語寫作常見難題。以AI寫作助手為代表,搜狗翻譯正不斷探索高效的英語學習方式,推動外語學習智能化。
  • 怎樣從5種角度來分類翻譯?
    翻譯可從5種不同的角度來分類:1)從譯出語和譯入語的角度來分類,翻譯可分為本族語譯為外語外語譯為本族語; 2)從涉及到的語言符號來分類,翻譯分為語內翻譯(intralingual translation)、語際翻譯 (interlingual translation)和符際翻譯(intersemiotic translation);
  • 這兩本書被翻譯成英語出版,譯者是外語學院一眾老師!
    我頭戴紗帽啊,身穿金銀袍,奉請誰啊?——頭王太公呀,我向你稟告。」「奉你啊,你的披風好華麗,啊!頭髮如柳絲啊!啊!衣袖飄如水!」 ——《梯瑪歌》可曾想,如果用英語將這些內容表達出來,會是怎樣的呢?近日,國家社會科學基金項目「土家族民歌系列圖書」《擺手歌》《梯瑪歌》兩部譯著由外語教學與研究出版社出版。這一系列譯著正是由我校外語學院中國南方少數民族文庫翻譯研究基地負責人張立玉教授主持,多名青年教師參與完成的。中國英漢語比較研究會典籍英譯專業委員會常務會長王宏印為這兩本著作作序。