微軟這次搶先Google,要在廣東和香港大漲真愛粉

2020-12-13 愛範兒

想節稜,稜胎稜。

一頭霧水?請看以下圖片:

截圖來自廣告視頻

想起了嗎?

沒錯,這就是曾經傳遍網絡的某輪胎廣告,裡面生動地體現了以粵語為母語人民的「煲冬瓜」(備註:「煲冬瓜」=「普通話」,廣東和香港人用於自嘲普通話不標準的說法)。當然,古天樂現在的普通話已經進步很多了,但微軟還是決定要將人類從「煲冬瓜」裡解救出來。同時,這也是微軟要打破世界語言隔閡的其中一個舉動。

電影《家有喜事 1992》劇照,截圖來自電影

前段時間,微軟亞洲研究院在其官網上宣布微軟翻譯(Microsoft Translator)正式發布粵語文本翻譯功能, 並已集成到必應搜索和翻譯、Microsoft Office、SharePoint、Cortana(微軟小娜)和 Yammer。

事不宜遲,ifanr(微信號 ifanr) 現在和大家一起測試一下。

Level 1 —— 詞彙題:表情包

Level 1 的測試選擇了微信表情包「廣東青年粵語表情」,其中包括了「核突」、「靚爆鏡」、「細路」等不少有看港劇的非粵語母語者都能看懂的詞語。測試詞彙合計 14 個,結果如下:

(正確部分)

(無法翻譯部分)

翻譯測試正確率:50%。(翻不出來的,都會保持原來的寫法。)

根據微軟官網介紹,微軟翻譯基於平行語料庫,且應用了機器學習技術和應用統計學,翻譯「利用單詞的整個語境,而非單個單詞來為整句提供最佳的譯文。」 因此,愛範兒(微信號 ifanr)將為原來翻譯不正確的詞語提供了語境,再試一次:

在本次測試中,微軟翻譯在語境中對「靚爆鏡」、「無陰功「、「錫曬距」和「心淡」的理解都基本正確。可見語境對於提高理解還是有幫助的。

《英雄本色》劇照,動圖來自電影

第一輪得分:85。

Level 2 —— 閱讀題:香港娛樂新聞

其中一個粵語口語文本出現較頻繁的情景是香港娛樂新聞,因此 2 級測試截取了難度中等的新聞報導測試,結果如下:

總體而言,翻譯文本意思基本通暢,只是在某些口語化特別強的詞語翻譯上有點奇怪。例如:「精靈 BB」,語境中意思應為形容人的精神狀態很好,看起來聰明,反應快。

但這個錯誤真不可以怪微軟,因為這個用法包含了兩個知識點:1. 「精靈」在粵語中為不同音多義詞,其一可用於指神話中出現的生物「精靈」,和普通話一樣;其二為形容人看起來或做事很機智;2. 粵語中喜愛用「BB」搭配在形容詞和名詞後用於表達親暱,並無實義。

從另一個角度看來,微軟翻譯在這個測試中,不少粵語用詞的處理都比較好,例如:「查實」=「其實」、「嗲幾句」=「閒聊幾句」;而「咁」、「嘅」、「喺」、「噚晚」等高頻用詞的翻譯表現更是穩定。

第二輪得分:80。

Level 3 —— 翻譯題:地道地「說」粵語

既然微軟翻譯的成段粵語-普通話翻譯表現不錯,那普通話譯粵語呢?

從測試結果看來,微軟翻譯「說」粵語的能力基本和反向翻譯的水平相符,可以將一些高頻詞如「是」、「的」、「還」等轉化為粵語口語用法。

但翻譯同一詞語在不同語段裡翻譯效果不一的現象。例如,在測試第二段中,原本第一段保留的「愛範兒」就成了「鍾意範兒」、「無人機」也成了「冇人機」。這呼應了之前提及的依賴語境翻譯的說法,但同時也體現其不準確性。因此,還是建議學習粵語的用戶在參考時要謹慎。

第三輪得分:70。

終極 BOSS —— 奧賽題:口語+髒話搭配測試

(說明:下文涉及不雅語言,目的僅用於測試,不建議模仿)

電影《九品芝麻官》劇照,動圖來自電影

人在學習新語言的時候,經常學得最快記得最牢的都是髒話,有文章表明這是出於社交需求。那暫無社交需求微軟翻譯又是否如此呢?

測試表明,平行語料庫裡有包含髒話素材,因此系統可以辨認得出髒話詞組,但還是無法以合符說話習慣的方式來組織句子。

第四輪得分:60。

測試結論

微軟四輪綜合得分:75.75 分。

從該次測試看來,微軟的表現還是非常不錯的。雖然現階段可翻譯的部分還局限於單個詞語以及一些常用銜接詞,但鑑於粵語本質上為一種口語(粵語的書面翻譯對應類別為簡體字與繁體字翻譯),用法特別靈活,所以這樣的水平已非常不錯。相信日後在語料庫不斷豐富以及長期機器學習後,效果必定會更好。

Google 在去年 2 月的時候,已經向用戶發出邀請到翻譯社區參與粵語翻譯的準備工作,但沒想到這次居然讓微軟搶先一步面世。不過無論如何,推出粵語翻譯功能只是時間的問題。因為根據人機通過語音交互的大趨勢,粵語這個在國內有 5500 萬人,國外 2000 萬人使用的口語,還是非常值得去突破。

而且,微軟說了,要 「永久打破語言的障礙,讓人們實現隨時隨地的多語言溝通。」 那是要讓人們可以自由地使用自己想說的語言無障礙地溝通。

課外活動:和愛範兒一起來玩

調戲微軟粵語翻譯攻略:

打開必應翻譯;選擇「粵語(繁體中文)」(如果是粵語翻普通話,就在左邊對話框選擇粵語;反之亦然);手動輸入粵語的用戶需要將輸入法調為繁體字輸入法(否則表現不穩定哦);在左邊框輸入要翻譯的文本,點擊「翻譯」,OK!

歡迎各位對粵語,或者調戲微軟翻譯有興趣的朋友,加入我們的「微軟粵語翻譯群」,分享大家給微軟出的考試題。屆時,我們會精選大家分享的「微軟粵語考題」到本文章上。

加入方式:關注 ifanr(微信號 ifanr),輸入「粵語」,掃碼入群一起玩。

電影《家有喜事 1992》劇照,動圖來自電影截圖

題圖來自微軟官網

相關焦點

  • Google關閉Google.cn 正式退出中國 通過香港站提供服務
    北京時間3月23日凌晨3:03,谷歌公司高級副總裁、首席法律官大衛•德拉蒙德公開發表聲明,再次借黑客攻擊問題指責中國,宣布停止對谷歌中國搜索服務的「過濾審查」,並將搜索服務由中國內地轉至香港。北京時間3月23日凌晨2點31分google.cn自動跳轉至google.com.hk,同時界面顯示:「歡迎來到谷歌搜索在中國的新家」。
  • 微軟戰Google 軟體一對一 - 網易學院
    微軟到底想做什麼?當11月3日比爾·蓋茨宣布Windows Live和Office Live同時發布的時候,開啟了所謂的軟體「在線時代」。整個微軟帝國最大的一場核心遷移運動也同時開始了。打造網際網路帝國?那Google呢?詳細  讓我們看看,微軟如何面對這位強大的網際網路的王者。
  • Google將谷歌香港伺服器移到美國
    ,連google.com.hk的谷歌香港域名均無法訪問。針對此問題,隨後筆者ping了一下google.com和google.com.hk兩個域名的伺服器情況,如下圖所示:Ping谷歌域名從中可以看到伺服器在美國,這一點也不令人意外,但是谷歌香港(google.com.hk)伺服器由之前的香港變為了美國,也就是說,谷歌香港伺服器也被轉移到了美國。
  • 石器真愛粉!《原始守衛戰》邀你瓜分千元紅包!
    石器真愛粉!《原始守衛戰》邀你瓜分千元紅包! 來源:www.18183.com作者:蘭斯級一號艦時間:2019-06-19 分享到: 石器真愛粉!《原始守衛戰》邀你瓜分千元紅包!
  • 香港風水師預言:黃曉明會搶先周杰倫當爸
    >香港風水大師預言黃曉明會搶先周杰倫當爸  搜狐娛樂訊 據香港媒體報導,今年多位圈中男神相繼結婚,繼臺灣天王周杰倫(周董)宣布明年1月18日結婚後,內地一線小生黃曉明也豪言明年會娶女友Angelababy。日前,香港風水大師麥玲玲接受媒體邀請,一連預測羊年圈中喜事。
  • 分析Google、微軟、蘋果設計規範的異同點
    googlematerial design 由來從2011年10月19日安卓4.0冰淇淋三明治正式發布後,11月Android Market上提交審核的應用程式數量達到50萬。開發者可以任意上傳自己的應用,而不必通過審核;開發者可以隨意按照自己的想法設計應用,Google方面不予任何限制。
  • 程式設計師:想去google英語不行可以麼?google員工:有免費外教!
    當然也有一些程式設計師把目標放在了google,微軟,facebook這些公司。 首先咱們看看google,微軟的員工都是什麼看法吧,畢竟他們對自己的公司會更熟悉,他們的觀點更值得我們參考。親測Google內部用英文的機率比微軟多,尤其是說,不過Google會給員工請1:1外教作者點評:這名前谷歌員工又進一步做了補充,就是在國內面試的話,如果是中國人面試官面試就不會用英文,除非是點背,遇見了老外面試官,另外這名員工提到在國內google用英文的機率要比微軟高一點,難道是國內谷歌的老外員工更多麼?
  • 三部以上算是真愛粉了!
    《賭俠》,這應該算是《賭神》的第二部,這部片子是在1990年上映的,和《賭神》不同的是,這次劉德華搭檔的是十分有名搞笑明星周星馳和吳孟達等人,這部劇講述了即使上部《賭神》最後在公海舉行了一場驚天動地的豪賭之後,收了刀仔為徒,然後將刀仔帶回美國,然後將所有的絕技都傳給了刀仔,刀仔回來以後發生的故事,因為加入了周星馳,所有搞笑的段子肯定是少不了的,值得一看到,劉德華還是飾演陳刀仔
  • 商務移動選微軟 SurfacePro7廣東6388元-微軟 Surface Pro 7(i5...
    【中關村在線廣東行情】微軟 Surface Pro 7筆記本電腦,近日在商家「廣州翰通答(授權代理商微軟公司是世界PC機軟體開發的先導,比爾·蓋茨是它的核心。微軟公司1981年為IBM-PC機開發的作業系統軟體MS-DOS曾用在數以億計的IBM-PC機及其兼容機上。但隨著微軟公司的日益壯大,Microsoft與IBM已在許多方面成為競...
  • 王鷗有多鍾意易烊千璽,三個稱號讓你馬上明白真愛粉含義
    王鷗有多鍾意易烊千璽,三個稱號讓你瞬間明白真愛粉含義 王鷗給人的印象就是御姐高冷的女人 王鷗有多鍾意易烊千璽,三個稱號讓你瞬間明白真愛粉含義 據悉王鷗還給易烊千璽起了三個很可愛的名字
  • Google 更新了PR查詢接口伺服器
    無意間發現,在GET數據時,google 返回了302 重定向可以看出,Google 這次是將 toolbarqueries.google.com 的請求,重定向了 toolbarqueries.google.com.hk這與 Google移居香港 的聲明不謀而合,但 Google 為何使用
  • 迪士尼公主:集合啦真愛粉!憑剪影+城堡,一眼能看出哪位公主?
    導讀:迪士尼公主:集合啦真愛粉!憑剪影+城堡,一眼能看出哪位公主?大家好,歡迎來到動漫迷世界~何為真愛粉?第二位公主▼迪士尼公主每一位都各具特色,不會有重複的特徵,就好比下面的這位公主,以睡覺聞名世界,也因此過得了美人的稱呼,要是這還猜不出這個頭戴皇冠的公主是誰,你一定不是真愛粉!
  • onedrive和Google drive哪個更好用?
    不通之處在於google docs共享public,可以被搜尋引擎爬到。onedrive的好處就是國內可以訪問網頁版,客戶端好像已經被封了。如果你用Office365,你的文檔都會被存入onedrive中。企業用戶onedrive用的多。如果你有能力,毫無疑問選擇Google drive同步速度快,全家桶服務直接安排上,絕對一流。當然國內的網盤也是完全沒有問題的,更加本地化。
  • 真愛粉1.8萬塊樂高積木打造《星際迷航》「企業號」
    真愛粉1.8萬塊樂高積木打造《星際迷航》「企業號」 時間:2015-02-01 20:57:24 來源:3DM新聞組-唯有花知
  • 谷歌宣布將於明年6月30日永久關閉3D模型內容平臺Google Poly
    被網友調侃為谷歌「關門部」再次出動了,這次谷歌停止的服務是 Google Poly。
  • 肖戰舊視頻被扒,模仿蜘蛛俠跳起來擺全套姿勢,不愧是真愛粉
    這不,在2月27日,就要粉絲考古出了一個肖戰的舊視頻,這個一米八大個子的男孩模仿蜘蛛俠的功力爐火純青,妥妥的真愛粉無疑。在粉絲分享的視頻中,一群男孩子圍坐在一張大床墊上,當時的肖戰還比較青澀,從他的著裝上就能看出來這應該是老早之前的視頻。當時的大家仿佛在玩身體力行表演詞語遊戲,當主持人說到蜘蛛俠一詞時,所有在場人員都在瞬間擺好了蜘蛛俠吐絲的手勢,但只有肖戰的動作跟大家的動作不一樣。
  • 一碗粉面裡藏著最地道的香港!這份尋味餐廳必須珍藏!
    幾乎每篇香港吃喝攻略上都能找到這家店的影子。魚蛋粉香港的魚蛋粉以口感妙著稱,爽滑米粉和彈牙魚蛋的搭配,不愧是赴港必吃的明星小吃。正宗的魚蛋粉湯底用魚乾和豬骨熬製,濃湯入味可口。香滑米粉加上細膩的魚丸、牛丸、炸制的肉卷、肉塊,色香味俱全,可能只有香港能把簡單的湯湯麵面做得如此出神入化。
  • 小花仙:最繞口的10個魔法咒語,真愛粉5分鐘可以全部背下來嗎?
    小花仙:最繞口的10個魔法咒語,真愛粉5分鐘可以全部背下來嗎?小花仙是一部非常有意思的國產動漫作品,雖然時下3D動漫在國內非常的流行,但是優秀的2D動漫也從來都不曾被大家遺忘。所以這次小編就來為大家盤點一下《小花仙》中最繞口的十句魔法咒語,而且真愛粉可以挑戰一下,看看能不能十分鐘背下來。第一句:千韓:「愛心花仙魔法使者變身!花朵的精靈們啊,賜予我溫暖和愛意,將心意傳遞,魔法凝結!」(千韓的變身咒語,你們還記得嗎?)第二句:淑馨:「智慧花仙魔法使者變身!花朵的精靈們啊,賜予我光明和指引,將心意傳遞,魔法凝結!」
  • 各類材料紛紛大漲,那原材料粉體價值幾何?
    導讀 受多種因素影響與激化,近期各類材料紛紛大漲,那原材料粉體價值幾何?粉體材料企業又何去何從? 自跨入後疫情時代,各行各業開工率回升後原材料穩穩地迎來一波不大不小的漲幅。
  • 中國版《阿麗塔》cos仿妝,機械少女攻氣滿滿,不愧是原著真愛粉
    在為cosplay愛好者獻上極致的視覺盛宴後,這次這位cos什麼都仿佛讓人看到了原版的小姐姐又出了一個《阿麗塔:戰鬥天使》主角阿麗塔的仿妝cos。同樣的。這次關於阿麗塔的仿妝cos效果同樣讓人驚豔到移不開眼睛。