35歲以下科技創新35人之一,這位博士解開美團 AI 的冰山一角!

2020-12-27 騰訊網

受訪者 | 王仲遠

出品 | CSDN(ID:CSDNnews)

提起美團,你首先會想到的是什麼?是那個帶著醒目黃色的美團App,還是每日穿行在大街小巷、為我們送上外賣美食及新鮮水果的快遞小哥?

實際上,美團不僅有這麼接地氣的一面,也有特別「高大上」的一面,比如立足於AI技術的美團大腦和美團BERT

CSDN(ID:CSDNnews)專訪美團AI平臺搜索與NLP部的技術負責人王仲遠博士,為大家揭曉美團在人工智慧領域的「冰山一角」。

美團大腦打造大規模餐飲娛樂知識圖譜平臺

王仲遠表示,美團搜索、大眾點評搜索以及NLP中心都是放在一起的。這幾個重要的團隊之所以要放在一起,是因為在搜索中,NLP是一個非常關鍵且核心的技術。

在過去兩年多的時間裡,隨著美團組織架構的不斷升級,美團NLP中心也開始和搜索部門併為一體。我們都知道,業界有非常多的AI Lab和AI平臺,但大家都面臨一個普遍的困境,即AI落地不達預期。而美團創造性地把AI團隊和業務平臺團隊直接放到一起,這就能使技術在第一時間進行驗證並快速進行落地。

截至目前,美團及大眾點評的平臺上已有累計超過40億的用戶評價。在以往,這些數據只能安靜地躺在數據倉庫中「沉睡」,現在王仲遠帶領團隊通過美團的算力和算法,真正讓AI技術的研究有效地進行了落地。

具體來說,美團除了外賣以外,還涉及到店餐飲、酒店、景點門票和電影票務等綜合性生活服務。近期,如果你在美團App中搜索「口罩」,就能看到附近藥店,距離你很近的快遞小哥也能像送餐一樣將口罩快速送達到你的手中。

眾所周知,在移動網際網路之前的PC時代,人們有任何的需求幾乎都會在搜尋引擎中去搜索。而在移動網際網路時代,搜尋引擎實際上已經被大大弱化了,其原因就是各種垂直App的數據在底層邏輯上並沒有實現互通。而美團憑藉自身豐富的業務場景,有望打破這種「數據」孤立,並藉此成為本地生活服務領域的一個超級App。

王仲遠給我們舉了一個很簡單的例子,當用戶在美團搜索「水餃」時,他的需求其實是有很多種可能的:他可能是想叫一份水餃的外賣,也可能是想去店裡吃堂食,還有可能是想買附近超市裡的冷凍水餃,亦或是想查查水餃的做法,或在美團上買水餃的食材。這種多樣的搜索需求,是否都能在一個App實現呢?是的,美團可以滿足這些需求。

王仲遠表示,現在美團搜索正在進行一項比較重大的改版,預計在2020年二季度會和大家見面。未來的美團搜索,將會成為一個本地生活服務領域的超級搜尋引擎。屆時,用戶可以在美團App、大眾點評App上搜索任何關鍵詞。

傳統上,大家會不自覺地在這兩個App上「小心翼翼」地挑選較短的搜索關鍵詞,比如「火鍋」、「烤串」、「麻辣燙」。但很快,用戶可以隨意表達他們的搜索需求。例如可以搜索「北京三裡屯適合朋友聚餐的西餐廳」,或者「疫情期間最適合遛娃的景點」。這樣的話,用戶的體驗會得到非常明顯的提升。這背後是美團的NLP能力以及美團對於不同業務數據的高效整合能力在全力支撐。

2018 年 5 月,王仲遠開始領導團隊構建美團大規模餐飲娛樂知識圖譜的平臺——美團大腦。這個「大腦」充分挖掘、關聯各個場景數據,使用 AI 算法讓機器「閱讀」用戶針對商戶的公開評論,理解用戶在菜品、價格、服務、環境等方面的喜好,構建人、店、商品、場景之間的知識關聯,從而形成一個「知識大腦」。目前,美團大腦目前包含了 33 類概念、30 億實體、1000 億三元組,這個知識關聯數量級已經達到了世界級的規模。

美團BERT訓練本地生活服務模型

2018年10月,Google對外正式發布BERT模型,這也是自然語言處理領域近年最具突破性的進展之一。

比爾·蓋茨曾說過:「自然語言處理是人工智慧皇冠上的明珠。」想更好地理解這句話,那麼就得先來梳理下AI發展的脈絡。王仲遠歸納說,AI基本可以分為感知階段、認知階段和決策階段。基於當前AI技術演進趨勢,他重點介紹了對於AI感知和AI認知的看法。

關於AI感知,人和動物都擁有視覺和聽覺,這種和大自然的交互,對應到AI技術便是視覺識別和語音識別。關於AI認知,據聯合國調查,世界語言十分複雜,專家估計大約有5000到7000種。而語言也是人類才有的一種交流工具。這也是NLP的難度,比視覺識別和語音識別更難的原因,所有的語言都是人類創造的,而每一種語言的創造方式都不一樣。這就導致NLP面臨一個巨大的困境,即同一套技術,在中文上有效,在英文上未必有效。比如,分詞就是中文獨有的,英文根本不需要分詞,因為它本身就是以單詞的形式存在。並且即便同為中國人,對於分詞也會有不同的意見和理解。

也正因此,NLP分出很多研究分支。此外,近些年隨著深度學習的爆發式增長,行業研究者也希望能夠挖掘出人類常用語言中的共同邏輯,這樣就能讓NLP實現跨語言處理。

2018年11月,在Google提出BERT模型一個月後,美團於同年11月,成立秘密團隊——美團BERT。該團隊成立以來,一直在不斷研究和攻克美團在生活服務領域的技術難題。2019年,美團BERT取得長足的進展。該團隊使用幾百塊GPU和獨有數據,訓練出一個本地生活服務的模型。帶給用戶的直接感受是,在美團和大眾點評中搜索一個詞語,系統的識別性變得越來越高。

MT-BERT整體技術框架

2020年,微軟研究院發起學術評測Citation Intent Recognition,評測要求參賽者根據論文中對某項科研工作的描述,從論文庫中找出與該描述最匹配的Top3論文,美團搜索與NLP部與國內兩所高校組隊,提出了一種基於BERT和LightGBM的多模融合檢索排序解決方案,一舉拿下WSDM Cup 2020 Task 1榜單第一名。

此外,美團知識圖譜組在微軟MARCO比賽中,亦是排名榜首。自2018年比賽發布以來,知識圖譜組團隊所研發的深度閱讀理解TABLE模型在比賽指標 MRR@10上首次突破0.4,而該模型正是基於BERT的Listwise 排序模型,當時微軟官方Twitter還專門發推祝賀美團。

這對於王仲遠以及其團隊來說,都是一種莫大的鼓舞。此外,王仲遠也曾在國際相關的學術會議上發表過40多篇論文。儘管工作非常忙,他還是通過各種途徑學習,比如國際頂級會議上的學術論文,他一定會花時間仔細去閱讀。此外,美團技術團隊內部也經常有一些前沿技術分享會他也會不時去參加,通過各種途徑增加新知識。

王仲遠認為,人工智慧的發展既快又慢。「快」是因為知識更新非常快,他說自己就曾看到很多面試者因為知識沒有跟上時代而慘遭淘汰。「慢」是因為從1940年人工智慧首次被提出以來,至今經過三起三落。2006年深度學習誕生,2012年人工智慧進入爆發階段,但是至今八年的時間,仍有大量問題還沒有解決。

近些年,各大網際網路廠商都在推出自己的人工智慧小助手。這些小助手用來幫大家聽聽音樂、查查天氣以及定下鬧鐘都還可以,但是如果想對它有更大期望,還有很長的一段路要走,很多時候,我們會發現「人工智慧」和「人工智障」有時只是一步之遙。這也說明,在人工智慧領域,我們還是有很多技術亟待突破。這裡要特別提一下,王仲遠博士之所以能對人工智慧有這樣深刻的積累和解讀,也是得益於他多年對AI技術的專注以及積累。

閩地有才子,AI展才華

王仲遠出生於福建省仙遊縣,成長在福建省永安市,得益於父親嚴厲的管理,再加上強大的自驅力,從小學習就非常優秀,經常拿到年級第一名。

但是王仲遠的性格,卻帶著一種「寧靜致遠」的溫和,這點可能是受到性格慈和的母親的影響。「嚴父慈母」的搭配,即讓他的學習得到很好的啟蒙。高考後,他順利考入中國人民大學。在碩士期間,王仲遠說自己有幸在孟小峰教授領導的WAMDM(網絡與移動數據管理)實驗室做項目,其中一個項目還獲得了SIGMOD07 Undergraduate Scholarship獎項,當年全球僅有7位獲獎成員。巧合的是,同樣獲得獎項的一位成員,還是王仲遠日後在Facebook的同事。

碩士畢業時,王仲遠冒險地婉拒百度、騰訊和 IBM 等眾多知名公司研究機構的邀請,選擇堅持等待微軟亞洲研究院的Offer。王仲遠說自己很幸運,微軟亞洲研究院具備很多先天優勢,在剛剛工作時就可以接觸到很多世界級的學者,了解各領域前沿研究已經做到什麼程度,無需摸著石頭過河。

王仲遠在微軟亞洲研究院6年多,從校招生一直做到主管研究員,負責了微軟研究院知識圖譜項目和對話機器人項目。他一直專注於自然語言處理、知識圖譜及其在文本理解方面的研究,取得了不少成績,在國際頂級學術會議如 VLDB、ICDE、IJCAI、CIKM 等發表論文 40 餘篇,並獲得 ICDE 2015 最佳論文獎。

後來,王仲遠在前同事的推薦下,遠程參加了Facebook的面試,為了這次面試,他元旦假期整整準備了三天的時間。幸運的是他還非常順利地拿到了工作籤證,這也讓他得以從國內到矽谷工作,去看到更大的一片天空。

到矽谷後,他感受到和微軟研究院完全不同的畫風,Facebook推行「Move Fast」文化,那裡甚至沒有測試人員,產品上線極快、基本是一周一次。在 Facebook 工作期間,王仲遠所負責的一個項目是做實體連結,就是要把查詢(Query)和知識圖譜進行打通,這也是 NLP 領域一個非常重要的方向。短短半年的時間,效果就提升了80%左右,成為 Facebook內部最重要同時也是世界上最先進的產品級實體連結服務。現在Facebook 的搜索、推薦、廣告、智能助理等許多系統中,也在使用他此前負責的這些技術。

幾年以後,王仲遠感覺中美兩國的人工智慧,已經來到同一個起跑線上,他帶著技術報國的想法回到中國,並選擇加入美團。他認為,AI技術想真正能夠落地,需要算力,需要數據,需要算法模型,更需要豐富的應用場景。美團的應用場景豐富程度,遠超很多網際網路行業的同行。

2019 年1月21日,《麻省理工科技評論》發布了 2018 年「35 歲以下科技創新 35 人」(35 Innovators Under 35)中國榜單,王仲遠獲評為「遠見者」。這就是王仲遠的「AI人生」,現在已經描摹上濃重的色彩,未來必將更加明豔如春。

相關焦點

  • 「35歲以下科技創新35人」中國榜單專欄之王星澤
    自 1999 年起,《麻省理工科技評論》每年都會推出「35歲以下創新35人」(Innovators Under 35)榜單,旨在於全球範圍內評選出被認為最有才華、最具創新精神,以及最有可能改變世界的 35 位年輕技術創新者或企業家,共分為發明家、創業家、遠見者、人文關懷者及先鋒者五類。
  • ...麻省理工科技評論》「35歲以下科技創新35人」2020年中國區榜單
    韓達入選《麻省理工科技評論》「35歲以下科技創新35人」2020年中國區榜單 2020-12-11 13:17 來源:澎湃新聞·澎湃號·政務
  • MIT「35歲以下科技創新35人」榜單揭曉!
    近日,全球青年科技領袖峰會揭曉了中國最權威青年人才榜單—《麻省理工科技評論》「35歲以下科技創新35人」(TR35)評選結果。據悉,《麻省理工科技評論》自1999年起每年在全球範圍內評選35歲以下的科技創新領軍人物,自2017年落地中國以來,這一權威榜單評選得到了國內外眾多專業領域權威人士的支持。在此次TR35中,10餘位青年人才或將為今後我國生命科學領域的騰飛注入新的活力。
  • 全球青年科技領袖峰會在浙江紹興召開 「35歲以下科技創新35人...
    12月10-11日,由浙江省委人才辦、紹興市委市政府、《麻省理工科技評論》主辦的全球青年科技領袖峰會暨《麻省理工科技評論》中國「35歲以下科技創新35人」頒獎典禮在浙江紹興舉行。重磅發布了第四屆《麻省理工科技評論》「35歲以下科技創新35人」中國區榜單,35位上榜者中包括發明家、創業家、遠見者、人文關懷者及先鋒者五大類別,涵蓋生物醫療、智能計算、新能源、新材料等新興技術領域。
  • 山西大學韓拯入選《麻省理工科技評論》「35歲以下科技創新35人」
    12月10日-11日,《麻省理工科技評論》全球青年科技領袖峰會在浙江紹興開幕,同時《麻省理工科技評論》「35歲以下科技創新35人」(Innovators Under 35)2020年中國區榜單發布,山西大學光電研究所教授韓拯光榮上榜。
  • 2020年35歲以下科技創新35人名單揭曉
    剛剛,《麻省理工科技評論》的2020年度「35歲以下科技創新35人」 (Innovators Under 35)中國榜單正式發布。我們一起來看看哪些高校的青年才俊入選了呢?圖源官網從入選人的年齡來看,最小才29歲。且35歲以下,多人已是知名高校的教授,博導,甚至是公司的CEO,都非常的優秀。
  • MIT「35歲以下科技創新35人」榜單揭曉,這10餘位青年科學家如何...
    12月10日,全球青年科技領袖峰會揭曉了中國最權威青年人才榜單—《麻省理工科技評論》「35歲以下科技創新35人」(TR35)評選結果。據悉,《麻省理工科技評論》自1999年起每年在全球範圍內評選35歲以下的科技創新領軍人物,自2017年落地中國以來,這一權威榜單評選得到了國內外眾多專業領域權威人士的支持。在此次TR35中,10餘位青年人才或將為今後我國生命科學領域的騰飛注入新的活力。
  • 「35歲以下科技創新人」榜單新鮮出爐,11位生物醫藥新星入選
    日前,全球知名的《麻省理工科技評論》(MIT Technology Review)在官網上公布了年度全球「35歲以下科技創新35人」榜單(35 innovators under 35)。共有11名生物醫藥行業的年輕領袖上榜。今天,藥明康德團隊將為大家介紹這些生物醫藥行業的未來之星。
  • 博士為何卡35歲?
    1.國家政策 國家政策方面對於博士高校和科研院所有很多相關政策,博士完成學制時間較長,另外國家自然科學基金青年項目申請人男性要求35以下,女性要求40以下。
  • 35秒,我們的船撞了冰山
    NBA賽場,14年前的火箭球員麥迪,35秒13分,絕殺馬刺。鐵達尼號發現冰山到撞擊冰山,35秒+2秒=37秒。我們的船……35秒碰了冰山。對,是我國極地破冰船「雪龍」號。2019年1月19日下午3點47分,一座冰山兀地出現在「雪龍」船頭,從發現到「觸碰」,只用了35秒。35秒前,冰山的白與濃霧的白融合得天衣無縫,仿佛渾然一體。
  • ...生活服務業成「副業創新」沃土 逾8成靈活就業者是35歲以下年輕人
    (原標題:美團報告:生活服務業成「副業創新」沃土 逾8成靈活就業者是35歲以下年輕人)
  • 程式設計師35歲就被勸退 復旦博士:不單是人情味問題
    作為目前收入水平最高的職業之一,程式設計師一度成為很多人的熱門職業選擇,尤其是進入BAT等大型網際網路公司的程式設計師。然而,最近有報導稱某大廠正在「優化「35歲及以上的程式設計師。這個爆料讓人那些35歲的高齡程式設計師不寒而慄,也引發了網絡熱議。日前復旦大學經濟學院助理教授,經濟學博士奚錫燦在媒體發文,評價了35歲程式設計師被勸退一事。他認為,企業當然不是養老院,效率和利潤應該是企業的首要考慮。
  • 35歲,多少人的科研生涯「被結束」了
    35歲是職場分水嶺,事業有成的都當上了管理層,失敗的則很有可能開始送外賣、賣保險、開網約車。但比35歲失業更扎心的,是——「35歲了,我還沒畢業」。▎讀博:延畢才是常態博士人的年齡焦慮,早在讀博期間就已顯露苗頭。坊間有句話:「沒有延期畢業的碩士,沒有正常畢業的博士。」
  • 公司為什麼招聘都喜歡招聘35歲以下的人
    現如今招聘是一個很常見的事情,很多的大型企業無時無刻都在招人,這個招人都是招的人都是有限制的,今天衢州人才網就來說說這個事情。現如今招聘行業有一個潛規則,那麼就是年齡會卡在35歲之下,那麼為什麼會出現這個情況呢?
  • 35位頂尖青年科技領袖齊聚魯迅故裡!TR35榜單即將在此揭曉
    早在 2017 年時,35 歲的張鋒就晉升成為麻省理工學院終身教授。圖 | 《麻省理工科技評論》前主編兼出版人 Jason Pontin 對話張鋒和張鋒一樣在博士期間就嶄露頭角的還有另外一位華人科學家 —— 鮑哲南。
  • 35歲,真的是科研事業的分水嶺?
    對於搞科研的人來說,35歲是一個多少有點敏感的年紀,在這個年紀,有些人也許已經幸運地謀取了一份教職,得以在科學的道路上繼續前行;有些人碩博畢業沒幾年,還在職稱評審道路上奮進,積極肝科研申項目尋求突破;也有的人早已向生活低頭,放棄科研轉行在某個車間或是格子間揮灑汗水...35歲,真的是科研年齡的分水嶺?
  • 美團殺熟,大數據割韭菜的冰山一角
    這一次,美團成為了輿論討伐的對象,對於「美團殺熟」的公眾輿論負面評價持續發酵。事情源起於一篇《我被美團會員割了韭菜》的文章。文章中,作者陳述自己在開通美團外賣會員後,發現常點的一家店鋪,其配送費由非會員的2元變為了6元。再次試驗後,會員依舊比非會員的配送費更高。在文章發出後不久,美團就帶著殺熟的標籤被頂上當日熱搜。
  • 35歲上博士,雖精神可嘉,但改變命運的路絕不止一條
    但對於35歲的表弟,對於已經有相當社會閱歷的他,並且老大不小的他,僅僅通過讀博去改變命運的想法不切實際!在如今的時代,作為芸芸眾生之一,我們需要認清自己在職場中的分量,在社會中的定位。35歲的年紀,不大不小、老大不小的,要思辨清自己有什麼、會什麼、想什麼。人年輕時,會輕易地認為自己無所不能,所有理想都在陽光照耀下充滿希望。
  • 為何現在很多公司,只招聘35歲以下的員工,35歲以上的人怎麼辦?
    大家有沒有注意,很多招聘信息裡面,都寫著:年齡35歲以下;連公務員和企事業單位的最低年齡限制都是35歲。之前有一個HR朋友說的很實在,他告訴我,他們領導經常給他們強調,招人的時候只要年齡超過35歲的,即使對方經驗豐富並且錢要得少也不能要!這是他們公司年齡的底線。
  • 上海啟動「科技青年35人引領計劃」 讓更多年輕人脫穎而出
    不限國籍、不限行業,年齡是唯一的「硬指標」——記者昨天從市科委獲悉,由市科技工作黨委、團市委、中科院上海分院、市青聯指導,市青年科技人才協會主辦的「上海科技青年35人引領計劃」(上海科技35U35,簡稱「ST35」)昨天啟動。