跑贏業內大盤,日活逆勢大漲的百度翻譯有什麼魔力?

2020-12-04 曾響鈴

文|曾響鈴

來源|科技向令說(xiangling0815)

百度翻譯日活迎來新一輪逆勢增長:2020年Q1日活較上一季度環比增長10%,較去年Q1同比增長40%,這還是在在業內大盤增長整體放緩的前提下。

同時,百度翻譯目前可支持語種擴充到200個,翻譯方向近4萬個,每天來自世界各地的翻譯請求字符量超過千億,相當於2000部大英百科全書,平均每秒鐘就要翻譯超過1百萬字符。

百度翻譯日活的增長,我們或可將歸結為疫情的推動。

一方面是學生們在家學習、在線學習,有了更多時間通過手機和電腦使用百度翻譯(在校學習期間K12學生不能使用手機);另一方面,疫情背景下,跨過的多語言溝通變得更加重要,跨語言的信息分享變得緊迫,百度翻譯正好滿足了突然集中爆發的市場需求。

當然,這並不是百度布局翻譯方向十年以來能持續保持增長的全部,在翻譯之外,百度翻譯還藏著更多「秘密」。

好的翻譯產品,從來不只是「翻得準確」

在過去很長一段時間內,「準確率」是評判一款翻譯產品是否優秀的唯一標準,因而所有的翻譯產品都在準確率上「做文章」,從各個維度的「成績」來說明自己在這方面有多厲害,但事實上,隨著越來越多AI技術融入到翻譯產品,其體驗好壞的評判維度變得多元起來。

首先,在翻譯的廣度和速度方面,要不斷擴充與突破。

前者不應只局限在主流語言的互通上,而應尋求更大範圍內的多語言互譯,做到真正意義上的「與世界對話」;後者的最高境界是同聲傳譯。

道理大家都懂,但做起來才知道為什麼這兩項能力不是每家都有,其原因就在於太難了。

翻譯廣度牽涉到小語種語言的訓練資源,全球5000多種語言,有一半的語言使用者不到萬人,很大一部分小語種語言的訓練數據只有幾萬條甚至幾千條,難以邁過翻譯的門檻。

翻譯速度牽涉到時間延遲和翻譯質量難以平衡的難題,導致很多翻譯產品的同聲傳譯體驗很難盡人所意。

百度翻譯通過模型上的創新,比如在多語言翻譯技術上,提出基於多任務學習的翻譯模型、多智能體聯合學習模型等,使多個語言可以共享模型表示,再經過回譯技術進行數據增強,使得1個季度之內,翻譯語種擴充了近7倍,目前支持200種語言互譯,是全球支持語種數量最多的翻譯系統。

在同聲傳譯領域上,百度翻譯又相繼提出了可控時延的翻譯模型、語義單元驅動的上下文感知翻譯模型等,在技術獲得了突破,不但開放了全球首個面向真實場景的中英文同傳數據集,還舉辦了首屆同傳評測,促進本領域技術發展。

還有一個值得一說的案例,由前沿科技領域頂級科學家參與的iCANX Talks(全球前沿科技直播)主辦方之前嘗試了多款翻譯產品,對翻譯效果都不甚滿意,直到近期才更換為百度翻譯。

其次,翻譯產品的使用場景不應只局限在原始的文本或語音輸入場景中,還應更加豐富和多元。

在技術不斷強化的今天,用戶追求的產品體驗變得更加全面和多樣,如果只有「結果」而沒有細節豐滿的過程,哪怕有100%的準確率,也因為一個字一個字地輸入而產生乾澀的使用感受,市場不會買帳,用戶也不會買單。

百度翻譯除了文本和語音這兩種常規的輸入翻譯功能之外,其PC文檔翻譯功能支持word、pdf、ppt、excel等多種格式,支持中英、中日、中韓互譯,一鍵上傳,實現不限字數快速翻譯,保留文檔樣式排版,原文譯文對照查看,並支持免費導出,提升文檔翻譯效率。

視頻翻譯領域,百度翻譯攜手人人譯視界聯合推出了百度視頻翻譯平臺,只需上傳視頻文件並填寫必要信息,即可一站式獲取AI和人工視頻翻譯結果。

除此之外,百度翻譯在拍照翻譯、實景AR翻譯、對話翻譯等場景中通過AI技術的融合持續在對體驗細節進行改善。

可以預料的是,來源於百度的AI技術基底,百度翻譯在幫助用戶更好地完成翻譯這件事上,未來或將增加更多創新性的技術體驗。

最後,要從「語言轉換」的狹隘產品認知中跳出。

「語言轉換」是翻譯產品的基本盤,但如果只盯著「語言轉換」,就將翻譯產品劃定了一個局限的牢籠。

藉助著AI的能量,翻譯產品的路子可以變得更寬,也更能符合當前所有APP都開始提供關聯多樣化服務的趨勢。

如何理解?

百度翻譯在業界首先推出了第四代AI詞典,可以為用戶提供個性化、可互動、智能化、視頻化的「生動」體驗,主要增加了面向學生群體的單詞考頻及題型大數據,單詞講解及情景演繹小視頻,相關知識內容個性化推薦,AI互動跟讀評測,多模態智能取詞等功能。

例如,產品啟動時,用戶只要完成個人身份及目標(或興趣)的填寫,就能夠體驗到資訊流帶來的專屬定製化推薦。

又例如,在學習場景下,能夠根據用戶的查詞歷史為用戶智能推薦講解視頻;在英語學習十分重要的發音方面,百度翻譯能夠對用戶的跟讀進行智能評分糾錯。

文章開頭提到,疫情期間讓學生們有了更多使用百度翻譯的機會,如果說這是特殊情況下的被動拉新,那麼通過第四代AI詞典的能力,百度翻譯或將進一步強化用戶粘性,從而形成對新增用戶的留存,繼續在後續競爭保持領跑。

從更開闊的視野來看,百度翻譯某種程度上可以成為一種生活方式,在產品中內置與翻譯相關的原創內容,在常規信息流(例如百度APP)之外給出了一個垂直的專業的信息獲取方式。而與翻譯相關的內容很多,旅行、人文、美食、探索,這些內容更深度也更體現翻譯的生活化信息。

也正是因為在「準確率」之外,百度翻譯豐富了翻譯產品的體驗細節,來自用戶的反饋也是一面倒的好評,百度翻譯APP的下載評論區中大批網友寫道:「文檔翻譯功能非常好用,把文檔拖進翻譯框裡數秒就能翻譯出保留原格式的譯文,節省了我們數倍的工作時間」、「在學術文章上百度翻譯表現非常出色!」「全篇拍照翻譯厲害到飛起」……

產品體驗是基礎,社會責任是高度

體驗是一款優秀翻譯產品的基本盤,但若要夠領跑行業,還在於其通過技術建立起行業優勢之後所釋放出的社會價值。

在目前正在進行的疫情當中,百度翻譯就向公眾積極提供自己的能力,將中國抗疫經驗精準推向全球,以及服務防疫志願者團隊,開放翻譯醫療定製服務,體現出一家有責任企業的社會擔當。

在這裡不得不提到百度翻譯的多領域翻譯技術,採用預訓練+精細化訓練、以及領域自適應方法,研發了領域定製翻譯引擎。

在疫情發生初期,百度翻譯第一時間免費對外開放了生物醫藥垂直領域翻譯。深度定製生物醫藥領域中英互譯模型,截止目前已累計服務上百萬用戶,累計翻譯字符達7.6億。

此外,百度翻譯還緊急成立了專項小組,兩天內開發搭建並免費開放了醫療領域定製化翻譯產品,同時為千餘名防疫志願者,定向提供單獨醫療領域頁面,包括免費的術語定製、圖片翻譯、文檔翻譯等功能。

隨著疫情在全球範圍的蔓延,百度翻譯新增了包括波斯語在內的172個語種,累計上線語種達200個,累計翻譯方向約4萬個,覆蓋全球約180個國家的74億人口,讓疫情信息的共享更加平等和便捷。

為將防疫的「中國經驗」及時分享出去,百度翻譯不僅免費開放覆蓋病毒、疫情、症狀、防護等多維度重點詞語的多語種疫情詞典,為馳援海外抗疫的中國志願者提供更準確的翻譯結果,還攜手中新視頻、人人譯視界,為國際疫情嚴峻地區提供防疫視頻翻譯,讓「中國經驗」在全球抗疫中發揮更大作用。

我們可以看出,百度翻譯在疫情防控這件事上,不光提供自己的能力,還拉上了生態夥伴們一同參與,眾人拾柴火焰高,推動的不光是防疫工作,更重要的是在更大的範圍內提高了社會對防疫工作的重視以及對疫情危害的認知。

在提供翻譯服務的對象上,也不僅限於中國的疫情防控工作,而是著眼全球,站在更高的公益高度,也正是因為如此,百度翻譯收到了很多正面反饋:「文檔翻譯功能非常好用,把文檔拖進翻譯框裡數秒就能翻譯出保留原格式的譯文,很驚喜,這個細節節省了我們數倍的工作時間」、 「在學術文章上百度翻譯表現非常出色!」等。

疫情使得全球人民更加緊密團結起來共同面對困難,也讓百度翻譯獲得了一次極好的歷練機會。正是因為百度翻譯近十年來兢兢業業打磨技術,不斷創造滿足用戶需求的產品,提升體驗,才得以在疫情期間獲得口碑傳播,引來日活增加。

通過助力防疫,展示出的是百度翻譯的技術力量與產品情懷。

百度翻譯的發展史,翻譯產品的三級跳

上文主要分析的是百度翻譯當前所構建起的護城河,然而當我們回頭環視百度翻譯的發展歷程,可以發現正是在百度翻譯的帶動下,翻譯產品這才完成從工具到產品,再到交互服務的三階進化。

1、工具階段:百度利用技術沉澱解決翻譯工具從無到有

早在2010年初,百度就已經組建了機器翻譯的核心研發團隊,籌備在翻譯領域有所作為。作為全球最大的中文搜尋引擎,百度與「語言翻譯」這件事天然親近,僅一年半後的2011年6月,百度就正式推出了web端「百度翻譯」產品。

這個階段,可以認為是百度翻譯利用了百度已有的技術積澱解決翻譯工具從無到有的過程。

此時的百度翻譯,使用的是百度自主研發的翻譯核心技術,其原理是機器自動從大量語料中學習並自動生成翻譯結果,不經過任何人工整理與編輯。

2、產品階段:與AI融合帶來更多翻譯體驗

隨著移動網際網路時代到來,把PC端的工具變成移動端的隨身產品成為一時的浪潮,2013年2月百度翻譯發布Android客戶端(iOS在半個月後發布),首次在Android平臺上支持離線翻譯應用。

這一過程,是翻譯產品與AI逐步結合,帶來更多翻譯體驗的過程。

百度翻譯背靠百度強大的AI技術,將AI能力與產品逐步融合,既可以認為是領先行業、獲取競爭優勢的舉動,也可以看作在為整個翻譯產品門類與AI融合「探路」。

3、交互服務階段:圍繞用戶、內容、服務的多維度融合

隨著AI滲透的不斷深入,百度翻譯在「翻譯」這件事上的智能化程度大大提高。

比如百度翻譯推出的第四代AI詞典實現了專屬定製化內容推送與服務的融合,甚至還能為用戶的英語學習提供輔助服務。

從以上三個階段跨越看出,行業與百度翻譯一樣,也在經歷從翻譯得更好,到翻譯得更便利,再到翻譯有更多應用的進化。

如今,百度翻譯的產品形態已經跨越了傳統翻譯產品古板的工具形象,其使用場景和用戶圈層也在不斷擴大,隨著能力的不斷提升,百度翻譯也正在抹平語言之間的障礙,翻譯產品讓中國與世界的溝通更加順暢的同時,也帶來了見識和眼界的提高。

「與世界更好地溝通」是百度翻譯的願景。

在過去十年,百度翻譯致力於提升翻譯的精準度廣度和速度、改變翻譯的輸入方式、豐富翻譯產品的應用場景等,在下一個十年,隨著產品形態的進一步進化,百度翻譯或將在於世界「對話」的同時,講出更多在翻譯之外的故事。

*此內容為【科技向令說】原創,未經授權,任何人不得以任何方式使用,包括轉載、摘編、複製或建立鏡像。

【完】

曾響鈴

1鈦媒體、品途、人人都是產品經理等多家創投、科技網站年度十大作者;

2虎嘯獎評委;

3作家:【移動網際網路+ 新常態下的商業機會】等暢銷書作者;

4《中國經營報》《商界》《商界評論》《銷售與市場》等近十家報刊、雜誌特約評論員;

5鈦媒體、36kr、虎嗅、界面、澎湃新聞等近80家專欄作者;

6「腦藝人」(腦力手藝人)概念提出者,現演變為「自媒體」,成為一個行業;

7騰訊全媒派榮譽導師、多家科技智能公司傳播顧問。

相關焦點

  • 百度翻譯Q1 DAU大漲40%,疫情期學生在線學習率猛增
    百度翻譯迎來新一輪DAU 暴漲。5月11日,百度翻譯公布最新的DAU(日活躍用戶數量)相關數據,2020年Q1較上一個季度環比增長10%,較去年Q1同比增長40%。在業內大盤增長整體放緩的前提下,百度翻譯逆勢增長,憑藉良好的用戶口碑,進一步挖掘出翻譯服務市場潛力。
  • 百度翻譯Q1日活漲40% 已支持200種語言互譯全球最多
    百度翻譯迎來新一輪DAU暴漲。5月11日,百度翻譯公布最新的DAU(日活躍用戶數量)相關數據,2020年Q1較上一個季度環比增長10%,較去年Q1同比增長40%。在業內大盤增長整體放緩的前提下,百度翻譯逆勢增長,憑藉良好的用戶口碑,進一步挖掘出翻譯服務市場潛力。此外,百度翻譯還在一個季度內,將翻譯的語種擴充了近7倍,目前百度翻譯支持200種語言互譯,是全球支持語種數量最多的翻譯系統。涵蓋近4萬個翻譯方向,每天來自世界各地的翻譯請求字符量超過千億,相當於2000部大英百科全書,平均每秒鐘就要翻譯超過一百萬字符。
  • 大盤大漲!上證50創12年新高!原來牛市還在!
    今天,在金融股的爆發下,大盤大漲,其中滬指上漲1.14%,再度站上3400點關口;上證50指數上漲1.54%,創下2008年3月7日以來的新高。 如果單純看上證指數、創業板指數,或許你有一種感覺,市場總是在震蕩,而且貌似沒有方向,也沒有給人太大的希望。
  • 百度翻譯Q1 DAU暴漲40%背後 AI技術加持打造王牌功能
    百度翻譯迎來新一輪DAU暴漲。5月11日,百度翻譯公布最新的DAU(日活躍用戶數量)相關數據,2020年Q1較上一個季度環比增長10%,較去年Q1同比增長40%。在業內大盤增長整體放緩的前提下,百度翻譯逆勢增長,憑藉良好的用戶口碑,進一步挖掘出翻譯服務市場潛力。此外,百度翻譯還在一個季度內,將翻譯的語種擴充了近7倍,目前百度翻譯支持200種語言互譯,是全球支持語種數量最多的翻譯系統。涵蓋近4萬個翻譯方向,每天來自世界各地的翻譯請求字符量超過千億,相當於2000部大英百科全書,平均每秒鐘就要翻譯超過一百萬字符。
  • 21股籌碼連續集中 三成跑贏大盤
    21股連續3期以上籌碼集中證券時報·數據寶統計顯示,逾130家公司公布了最新一期(11月30日)的股東戶數,相比之前各期,有21股股東戶數連續減少3期以上,股東戶數最多已連降18期,也就是說籌碼呈持續集中趨勢。
  • 2月12日大盤預測丨「開門紅」放量大漲後,重倉或輕(空)倉者應如何...
    【本欄目收集整理了當下市場上幾家實戰派比較認可的微信公眾號對於次日大盤走勢的預測及熱點板塊的觀點】大盤走勢錢眼:「開門紅」放量大漲後,重倉或輕(空)倉者應如何操作?豬年第一個交易日,A股三大指數上演單邊上漲的開門紅行情,創業板收盤大漲逾3%重回1300點領漲三大指數,滬指也是突破2650點,權重和題材股也是全面開花,成交量明顯放大,市場賺錢效應爆棚,做多氛圍有回暖。漲停88家,連板9家,開板17家。
  • 2月份跑贏兩大指數概率79%,漂亮100盈利能力強勁,這一行業上漲動力...
    2018年2月份漂亮100跑贏指數概率78.57%截至2018年2月28日,漂亮100指數、上證指數和滬深300指數分別報收1057.71點、3259.41點和4023.64點,月內上漲-1.27%、-6.36%和-5.90%。可見,榜單超額盈利,競爭優勢猶在。
  • 百度大腦開放日召開機器翻譯專場 百度AI同傳翻譯性能可媲美人類
    機器翻譯作為人工智慧關鍵技術之一,正日益成為企業智能化升級的重要應用場景。12月1日,百度大腦開放日舉辦了以「機器翻譯 溝通全世界」為主題的專場活動。
  • 大盤強勢震蕩 關注成交量變化
    金融投資網記者 林珂承接前一交易日大漲之勢高開後,A股周二並未能延續強勢。滬指小幅高開後出現震蕩走勢,盤中刷新反彈新高后股價便開始震蕩回調,5日均線對指數有明顯支撐,最終跌幅有所收窄。
  • 股價一個月大漲近七成 百度宣布造車
    百度宣布以整車製造商的身份進軍汽車行業,吉利控股集團將成為其戰略合作夥伴。兩家公司股價此前多次伴隨「合作造車」的傳聞大漲。百度美股股價在一個月內已上漲67%,市值時隔兩年後站上800億美元。  百度造車,要造什麼車?百度方面回應稱,具體車型後續公布。不過,百度同時透露,該車型將基于吉利最新研發的純電SEA浩瀚智能進化體驗架構與百度Apollo的智能化技術打造。
  • 百度翻譯Q1日活用戶數同比猛增40%
    前段時間全民「宅家抗疫」,一時竟然有這麼多人「偷偷」搞起了外語!據數據顯示,百度翻譯2020年第一季度DAU(日活躍用戶數量)較前一季度環比增長10%,較去年同期更是猛增40%。而除了抓緊充電的學生黨、職場人,更有不少志願者在疫情期間用百度翻譯研究來自海外的口罩、防護服的外語說明,「外語需求」就這樣在整個疫情中被持續拉高。百度翻譯已布局翻譯方向十年,基於百度過硬的AI技術,讓「跨語言溝通」這件事兒變得越來越便利。
  • 機器翻譯七十年:百度領跑神經網絡翻譯時代
    近兩年,神經網絡機器翻譯(Neural Machine Translation, NMT)技術異軍突起,取得了翻譯質量的大幅躍升。12月21日,在百度機器翻譯技術開放日上,百度技術委員會聯席主席、自然語言技術負責人吳華博士表示,基於領先的人工智慧、神經網絡以及自然語言處理技術,百度早在1年多以前就率先發布了世界上首個網際網路NMT系統,引領機器翻譯進入神經網絡翻譯時代。
  • 圖像識別 百度翻譯App隨手拍照就能翻譯
    拍張照就能翻譯  「實物翻譯」是百度翻譯Android3.0一夜間紅遍網絡的主要功臣。常用百度翻譯App的小夥伴們在更新了全新版本後會發現,主界面裡有了一個相機標誌,點開,對準你想翻譯的物品拍照,只要是輪廓清晰、手機攝像頭能夠清晰完整捕捉的實物,百度翻譯都能夠比較準確地把它的中英文同時呈現出來。
  • 東方園林復牌後迅速跑贏大盤 穩定回調 - 大數據 - IT商業網-解讀...
    即便接下來仍有反覆,但局部性機會已經拉開。當前是比較好的選擇板塊以及個股的時候。  作為民營生態產業第一股,東方園林(002310)周一復牌後,開始逐步吸引市場關注。今開12.73元,收12.89元,最高價13.21元,成交量48.6萬,成交額6.30億。在復牌後第三天,跑贏大盤,穩定回調。
  • 百度翻譯App春節爆紅 網友驚呼拍照就能翻譯太神奇
    鑑定「神器」萌翻天「百度翻譯的高級之處,就在於想翻譯什麼就拍什麼,不必有所顧忌。而且,不論你拍到了什麼,它都能給出一個解釋。不過友情提示下:你要拿出任人調侃人生的態度來接受哦。」有網友微博上發布了若干張實物翻譯結果的截圖後,如此調侃道。從他發布的圖片來看,搞笑的翻譯佔了大部分。比如一張畫出來的一百元人民幣圖案,被翻譯為「大鈔large-denomination note」。這位網友隨後評價說:「媽呀,這是要發呀!我還上毛班,這是在家畫鈔的節奏啊!」
  • 百度與谷歌角逐在線翻譯市場
    首頁 > 動態 > 關鍵詞 > 百度最新資訊 > 正文 百度與谷歌角逐在線翻譯市場
  • 百度翻譯Q1日活暴漲,查單詞練口語一步到位,網友表示「我可以」
    這句英文什麼意思呀?」「媽……」  不得不說,這無數個張口就來的「媽」,常常交織成讓各位「老母親」崩潰的「樂章」!面對不斷張口喊「媽」的「神獸」們,有多少媽媽都想一口懟回去:「有問題請先自己想想再喊媽,不會的詞不能直接查百度翻譯嗎?!」  這個春天,孩子們經歷了「史上最長寒假」,家長們也經歷了一段難忘到「吃不消」的親子時光。
  • 百度小輸當贏,360小贏當輸-虎嗅網
    以下為全文:360搜索上線已經有了半個月,360和百度雙方在這半個月中已經經歷了數次交手,我也來對這場交鋒做一個小小的總結。打法篇百度百度在這場大戰中,因為是流量損失方,所以針對360搜索進行了強力的反擊,打法頗具有進攻性,主要的戰法包括:●通過自有的社區產品(百科、知道、貼吧、文庫等)進行防禦,先是對來自於360的流量全部加上提示,建議使用百度搜索,此後更是直接跳轉至首頁。
  • 「宇宙第一行」突然大漲5.89%,意味著什麼?
    今天大盤再度大漲,意不意外,驚不驚喜? 昨晚美股休市,上午市場走得很糾結,先是銀行、保險拉大盤,然後半導體、生物疫苗突然一波衝高,創指一度大漲20點,大盤震蕩回落。 下午主力還是想清楚了,知道什麼拉什麼板塊才是對的。
  • 3B大戰第一回合:百度小輸當贏,360小贏當輸
    以下為全文:  360搜索上線已經有了半個月,360和百度雙方在這半個月中已經經歷了數次交手,我也來對這場交鋒做一個小小的總結。  輸贏篇  百度:小輸當贏  由於百度是原先的壟斷者,而整個戰火的起因,也是因為自己的流量被360奪走了一部分。現在所面臨的只是被搶走多少的問題。這就是說明,不管往後打下去如何,百度已經必然是損失者了,其再也不可能擁有以前的流量和市場份額了。