...拋棄微軟,清華北大學子聯手創辦,Atman上線3月碾壓谷歌、百度翻譯

2020-12-17 站長之家

對於不是英語或特定語種專業出生的普通大眾而言,一篇無一丁點母語的長篇大論甩你面前時,首先想到的是谷歌翻譯,百度翻譯,然後翻出的句子連不起來啊,還是不懂,接著瞬間滿臉蒙嗶了是不是?

如今得益於人工智慧、深度神經網絡學習、大數據等的快速發展,翻譯已逐漸被顛覆。機器翻譯能模仿人腦「理解語言,生成譯文」。

其準確度、流暢度都得到大幅提高,甚至達到「譯文流暢,符合語法規範,易於理解」的狀態。再拿到一篇陌生語種的文章時,不會出現看不懂的情形。

所以,「未來人工智慧解決語言障礙就像水電一樣去融入人們的生活,成為生活的一部分,甚至感覺不到它的存在」,Atman的創始人兼CEO馬磊這樣對創業邦(微信搜索:ichuangyebang)說。

Atman是國內少有關注機器翻譯並追求自動化的一家創業公司,2016年6月18日正式運營,目前已獲得北極光天使輪投資。

十年機器學習經驗,兩進兩出微軟,後創辦Atman

在網際網路圈做算法的「攻城獅」們是令人佩服的,他們身上也擁有了典型的理科男特質:簡單、淳樸。初次見到馬磊就是這樣,談話間不會用過多華麗的辭藻形容自己的公司,自己的團隊。一個多小時的採訪基本被十年多的工作內容和對行業激情佔滿。

馬磊,清華大學計算機系畢業,曾在微軟研究院和微軟搜索中心供職過,在後者擔任Cortana及相關產品構架師,專長是機器學習。曾完整撰寫過語音識別、統計機器翻譯(SMT)的解碼器(Decoder)代碼。有豐富的Bing搜索的海量數據做傳統和深度機器學習的經驗。

第一次離開微軟是為了創業,也就是10年前出來做基於內容搜索的在線教育,當時的他想,一個工程背景很強、對算法清楚的人,不會跨越不了研究、產品運營推廣等這些階段,但事實證明,還真沒跨越過去。

再次回到微軟後,馬磊吸取創業教訓,來到工程院搜索技術中心,在產品部門待了三年多,潛心學習。也是在這期間,認識了如今一起創業的團隊成員,他們之間對彼此的品質了如指掌。

這其中就有Atman的CTO劉煒,畢業於北大電子系,擅長工程實作和團隊管理,思維穩定細緻。馬磊告訴創業邦(微信搜索:ichuangyebang),「其實一開始劉煒是不願意創業的,被我天天澆水,有天開花了就出來一起幹了」。

第二次離開微軟後,馬磊創辦了Atman,已經有著10多年的機器學習經驗,帶著微軟的文化基因,對二次創業可以說做了充分的準備。

Atman的核心:解決翻譯的流暢度

生活中我們所熟知的好點的翻譯工具無非是谷歌翻譯、百度翻譯,但當你使用的時候,會發現一個問題:即便你有一定的語言知識,這類工具翻譯出的句子依然是晦澀難懂的。它需要我們對句子重新進行組合,以便符合人類的感知行為。這其實超過50%的工作需要我們自己完成。

更別說一些專業領域,比如醫藥、法律等,都是人工在翻譯,因為目前不存在機器翻譯可以勝任這樣一份工作。

所以,不同於這些做廣譜翻譯的大公司,Atman的翻譯平臺目的在於打通翻譯的障礙,平臺不分語言,只要有數據,機器就能自己學習。機器從0開始進入一個領域(零成本進入)也只需要2周時間。所以,進入哪個領域都能高度垂直的做下去。

比如,財經類文章翻譯,世界好的財經網站的文章總和不超過1000萬篇,讓機器學習一遍這些文章,就可以保證財經類文章的翻譯有95%的流暢度,而且能做到實時同步。而這一過程,機器模型自身也會變得越來越好。

馬磊很開心地表示,你以前用谷歌的翻譯,能把人工降到50%(可能還沒一半),加入我們平臺後降到10%,不用再疲憊地去看網頁翻譯,閱讀的心情都不是一個量級的。

當然,他也坦言,「我們期望人儘量少去對翻譯出的文章進行編輯,但現在完全取代人還不可能,畢竟人類的感情、情緒、隱喻的東西對機器而言還是有難度的,但未來應該可以解決」。

所以,在馬磊眼裡人工智慧時代,商業模式是會被顛覆的。

目前,Atman針對C端用戶有一個「量子鏡」項目計劃。目標是精選國內用戶會感興趣的國外高質量內容網站,通過機器翻譯技術,提供翻譯後的中文內容給國內用戶閱讀(按照目前單機的翻譯速度,鏡像一個百萬文章級別的內容網站,需要一個月左右時間)。

而對於B端用戶:機器翻譯主要對某個垂直領域進行翻譯。另外,接下來幾個月計劃開發智能的CAT軟體,以輔助B端客戶做最終的人工校對。

為什麼是Atman而不是巨頭在做這件事

世界上能寫成文字的語言大概有300多種,它們就像網際網路裡面的一個大群,這些群目前還沒有溝通,相當於信息孤島(語言障礙)。而機器翻譯能把信息孤島連接起來,之後整個世界就可以像微信朋友圈那樣了。

而10年前,一家公司流暢性地翻譯全世界的語言,有人感想但做不到。因為根本沒有技術基礎可以進行突破。

如今,人工智慧的快速發展讓這一想法得以實現,但世界的公司都處於這樣優越的條件,包括很多世界級的巨頭,為什麼偏偏是Atman這樣的創業公司先發制人?

首先:團隊,人才沒有區別,但從項目投入的人力資源上反而比大公司好,因為大公司審批機制比較落後。

第二:項目進度,立完項目,創業團隊所有人精力都會搭在這個項目上,單點項目上絕對人數比大公司多。

第三:馬磊認為創業公司狼性文化更強,這點很重要

第四:資金投入,大公司關注所有項目,單點的投資就不如創業公司。

但馬坦言,像Atman這樣的創業公司在方向性上的風險更大,對於大公司而言,無非白投了。而對於創業公司,可能意味著人員重組或者更嚴格的變動等。

但不管怎樣,馬磊告訴創業邦(微信搜索:ichuangyebang),「至少從技術角度,在垂直領域翻譯這塊Atman是第一梯隊的」。

BLEU評分也證明了這一點:

(政治領域的機器翻譯和主要翻譯服務提供商的評分)

註:BLEU評分是國際上通用的客觀評測機器翻譯質量的指標。

相關焦點

  • 百度微軟谷歌正聯手AI2!將共同研發學術搜索工具
    百度微軟谷歌正聯手AI2!、谷歌、百度正聯手AI2一同研發學術搜索工具。 目前三大巨頭微軟、谷歌、百度正聯手AI2一同在開放學術研究(OAS)工作組中研發學術搜索工具。該工作組旨在團結業界,致力於學術搜索工具的研究。
  • 百度工具欄聯手金山愛詞霸推在線翻譯
    【IT168 軟體資訊】近日百度旗下瀏覽器輔助軟體百度工具欄與金山愛詞霸網聯手推出了在線翻譯服務。依靠百度工具欄海量用戶群體和詞庫支持,網民將也能享受到在線翻譯服務。  據介紹,用戶安裝最新版本的百度工具欄後,無需啟動程序,打開IE瀏覽器即可使用該服務。
  • 百度微軟谷歌正聯手AI2 將共同研發學術搜索工具
    原標題:百度微軟谷歌正聯手AI2 將共同研發學術搜索工具 據美國科技新聞網站GeekWire 6月20日消息,微軟、谷歌、百度正聯手AI2一同研發學術搜索工具。
  • Atman 劉昌芳:醫學機器翻譯與機器寫作
    Atman 產品負責人劉昌芳Atman 是一家由微軟亞洲研究院(MSRA)和微軟 Bing 的人工智慧專家創辦的公司,60% 的同事來自微軟。我們為醫學領域用戶提供機器翻譯、機器寫作、知識圖譜和大數據人工智慧產品,致力於成為醫學領域的語言智能專家。
  • 國科大首招本科生 網友調侃從起點碾壓清華北大
    清華?北大?不對,那是因為你不知道有一所叫做「中國科學院大學」的學校,那才是中國科技領域的最高學府。今年9月開始,這所低調的大學將首次招收本科生,網友稱該校大學生將「直接從起點碾壓清華北大」。   一所低調奢華有內涵的學校   很多人只聽過清華、北大、人大、復旦等名校,很少有人知道在我國還有一所叫做中國科學院大學的高校,它是中國科學技術領域最高學府,成立於1978年,前身為中國科學院研究生院,是經國務院批准創辦的第一所研究生院,培養了我國的第一個理學博士、第一個工學博士、第一個女博士、第一個雙學位博士。
  • 百度推在線翻譯服務 打造完美英文閱讀體驗
    百度推在線翻譯服務 打造完美英文閱讀體驗 2010-04-08 eNet&Ciweek
  • 金山詞霸棄谷歌選百度 聯合推在線翻譯服務
    4月8日消息,近日百度旗下瀏覽器輔助軟體百度工具欄與金山愛詞霸網聯手推出了在線翻譯服務。依靠百度工具欄海量用戶群體和詞庫支持,網民將也能享受到在線翻譯服務。據介紹,用戶安裝最新版本的百度工具欄後,無需啟動程序,打開IE瀏覽器即可使用該服務。
  • 硬核測評,谷歌翻譯被碾壓!全球首個翻譯引擎進化歸來,「細節狂魔...
    既然本次更新也包含了簡體中文,抱著一點點的懷疑和一點點的好奇,文摘菌也對DeepL進行了一次簡單的測評,和目前主流的谷歌翻譯、微軟翻譯、百度翻譯、有道翻譯進行了比較。本次測評分為三輪,第一輪方言,第二輪文言文,第三輪學術論文。好,現在我們有請五位選手入場。
  • 硬核測評,谷歌翻譯被碾壓:全球首個翻譯引擎進化歸來,「細節狂魔...
    既然本次更新也包含了簡體中文,抱著一點點的懷疑和一點點的好奇,文摘菌也對DeepL進行了一次簡單的測評,和目前主流的谷歌翻譯、微軟翻譯、百度翻譯、有道翻譯進行了比較。 本次測評分為三輪,第一輪方言,第二輪文言文,第三輪學術論文。好,現在我們有請五位選手入場。 第一輪,我們來看看方言。
  • DeepL進化歸來:人工智慧翻譯引擎,碾壓谷歌的「細節狂魔」
    DeepL Translator是於2017年8月由DeepL GmbH(一家由Linguee支持的創業公司)推出的翻譯服務,支持漢語、英語、德語、法語、日語、西班牙語、義大利語、荷蘭語及波蘭語之間的翻譯。其利用神經網絡訓練翻譯能力。
  • 金山詞霸與百度合作 全線接入百度翻譯
    金山詞霸與百度今日共同宣布達成深度合作協議,金山詞霸網站、PC客戶端、移動客戶端全線接入百度機器翻譯技術,百度詞典將接入金山詞霸多年積累優化的海量詞典內容。據介紹,百度於兩年前組建起機器翻譯研發團隊,主要領銜成員為機器翻譯專家王海峰和吳華,百度歷時一年多時間自主研發了多語言挖掘和機器翻譯核心技術,發布了機器翻譯產品百度翻譯,提供中英、中日文之間的字詞、句子和網頁翻譯。據悉,百度翻譯上線不到一年,日均使用量達到數百萬頻次,近期還將上線英語論文寫作助手。據悉,此次與金山詞霸深度合作,是百度翻譯首次開放API。
  • 射洪4名學子被清華、北大錄取
    >和北京大學錄取其中清華大學3人、北京大學1人北大、清華被譽為中國高校的「絕代雙驕」是廣大學子心中夢寐以求的名校!而每年被兩所大學所錄取的學子也會受到來自社會的各方關注射洪學子也不列外射洪中學7月23日,2020高考成績揭曉。
  • 百度谷歌微軟三巨頭聚首,百度翻譯機現場演示令與會者驚嘆
    新華社東京9月21日電(記者華義)在中英、中日等多種語言互譯模式中自動識別語種,並一鍵翻譯;還可為手機、電腦等設備提供Wi-Fi服務。近日在日本名古屋召開的第16屆機器翻譯峰會上,中國百度公司技術委員會主席吳華介紹了百度機器翻譯最新研究成果,並現場展示了智能Wi-Fi翻譯機。
  • 天才王垠,先後從清華等3所名校退學,還被微軟封殺,如今怎樣了
    而清華大學、北京大學作為"名校"的代表,我們很多人自小便被灌輸"上清華、北大"的人生理想。一方面,這是人出於追求更好事物的理想,另一方面這也說明了清華大學、北京大學的社會地位。一旦上了清華、北大,就已經與光耀門楣、前程似錦劃上了等號。
  • 清華天才王垠退學後,與谷歌、微軟正面剛,現在怎麼樣了?
    1997年王垠參加高考,滿懷鬥志的他一直把清華大學做目標,大家也以為他進入清華是板上釘釘的事情,可是由於"小失誤"王垠與清華擦肩而過。最終考進四川大學,四川大學也是國內的頂尖名校。進入清華後,一朝圓夢,他也成了被很多人羨慕的天才學霸,然而事情並不像眾人所認為的那樣發展。2005年網際網路上一篇《清華夢的粉碎——寫給清華大學的退學申請》在網上引起了軒然大波。清華是多少學子夢想中的天堂啊,多少人為了這個目標歷經艱辛,竟然還有人主動退學?
  • 王海峰:他打造了「百度翻譯」
    記者以「神馬都是浮雲」為例,百度翻譯為「Everything is nothing」,比較接近原意,而谷歌則翻譯成了「Horses are clouds of God」,基本不知所云。與百度翻譯相比,谷歌翻譯明顯體現出本地化不足的特點。而負責組隊實現百度翻譯技術攻關的則是百度基礎技術首席科學家王海峰。
  • 全球首個翻譯引擎進化歸來!谷歌翻譯被碾壓,方言、文言文均可翻譯
    既然本次更新也包含了簡體中文,抱著一點點的懷疑和一點點的好奇,媒體也對DeepL進行了一次簡單的測評,和目前主流的谷歌翻譯、微軟翻譯、百度翻譯、有道翻譯進行了比較。本次測評分為三輪,第一輪方言,第二輪文言文,第三輪學術論文。好,現在我們有請五位選手入場。第一輪,我們來看看方言。
  • 谷歌翻譯PK百度翻譯,人們缺乏中國網際網路技術的自信
    然而基於深度學習的翻譯技術,NMT並不是谷歌首創,百度翻譯使用這一技術在2015年5月(然而許多中國媒體選擇對此視而不見)。 3、谷歌主動推進翻譯App入華。谷歌過去七年都不管無法使用翻譯App的中國用戶,為什麼一夜之間要支持?自然不是程式設計師的突發奇想,一個核心原因是谷歌的主動推動。
  • 必應翻譯被拋棄:Twitter PWA轉用谷歌翻譯
    IT之家3月22日消息 此前,許多公司都使用必應搜索作為其搜索解決方案,如蘋果、Facebook以及Twitter等,這些公司並沒有使用谷歌搜索。不過,情況正在發生變化。去年,蘋果開始轉用谷歌搜索,放棄微軟的必應。
  • 從川大到清華後,天才王垠3次中途退學博士學位,與谷歌微軟鬧翻
    在大家都對他寄予厚望,本以為他能輕鬆考上清華北大的時候,王垠卻在高考時發揮失常,只能與夢想和抱負擦肩而過,以高分考入985院校——四川大學計算機專業。 三次中途退學博士學位,批判谷歌公司 2006年,王垠從清華退學之後,通過考GRE出國到康奈爾大學攻讀計算機專業,要知道康奈爾大學計算機專業全美排名第六