中國AI的底牌與前路:王海峰團隊十篇論文入選ACL的價值釋讀

2020-12-08 電子發燒友

中國AI的底牌與前路:王海峰團隊十篇論文入選ACL的價值釋讀

今年的自然語言處理領域頂級會議 ACL已經放榜,每每AI頂會放榜之時,也是科技企業們集體關注自身學術研究進度的時候。近年來隨著中國科技企業對AI技術的研究日益深入和產學結合的趨勢發展,各個AI頂會上科技企業的出沒也愈發頻繁。從某種程度上來說,一家科技企業被頂會收錄論文的數量,也體現了這家科技企業在AI自主創新上能力。

在ACL 2019中有效投稿數量達到2694篇,相比去年增長高達75%。值得關注的是,百度共有十篇論文被收錄,覆蓋了信息抽娶機器閱讀理解、對話系統、視頻語義理解、機器翻譯等NLP前沿研究方向。對於科技企業來說,這已經屬於在國際頂會上能取得的裡程碑式的成績。

提起ACL,不得不讓人聯想到百度高級副總裁王海峰博士2010年加入百度的王海峰一直橫跨產業和學界兩個領域,還在曾在2013年出任ACL首任主席。在這樣NLP領域領軍人物的帶領下,百度在ACL 2019取得的成績並不意外。

其實現在像王海峰和百度這樣科學家與科技企業的組合併不少見,我們或許可以嘗試從王海峰個人身上,尋找科學家與科技企業共同產生化學反應所需要的特質,看看AI自主創新是如何在這種化學反應下生長的。

一重反應:從學術遠見汲取養分

雖然王海峰在2010年就加入了百度,但大多數科技企業是在AI大潮開始之後開始與科學家們牽手。從2015年開始,從海外的谷歌、Facebook,再到國內的科技巨頭,都開始邀請學界科學家加入、建立屬於自己的研究院。其中原因在於,AI本身就是一種誕生於實驗室,受學術研究所驅動的技術。一家企業是否在學術上具有先進性,幾乎決定了這家企業在AI技術方面的創新能力。

同樣王海峰為百度帶來的,也是學術視角上的遠見。

王海峰對於NLP前沿方向的關注,可以追溯到在哈工大就讀期間,在博士畢業論文中,王海峰就率先將神經網絡方法引入機器翻譯中。在隨後的工作經歷中,王海峰也一直與AI學術界保持著密切的聯繫,像在百度就職期間,王海峰還出任了ACL亞太分會AACL創始主席、IEEE工業顧問委員會委員等等權威學術組織、會議的職務。

作為科學家,與權威學術組織的密切聯繫,讓王海峰可以幫助百度AI很多次踩中AI發展過程中的高點。舉例來講,在很多人尚不知知識圖譜為何物時,百度的知識圖譜技術就在王海峰的支持下逐漸成型,並且在今天為百度AI技術體系提供大量底層支持。對於知識圖譜這類需要大量投入累積的技術來說,遠見之下的率先投入,將為百度帶來顯著的先發優勢。

如果將AI自主創新想像成一顆大樹,學術視角的遠見就是這顆大樹深入土壤的根系,源源不斷地從學界汲取著養分,支撐整棵大樹的成長。

二重反應:用產業視角推動生長

前文提到,科技企業與科學家的組合已經日漸普及。一些在學界堪稱風雨人物的科學家,例如李飛飛、LeCun等等,都有企業任職的經歷。可以說對於科技企業來說,獲取學術視角並非十分困難。

但我們注意到,王海峰和很多科學家不同的是,他從2010年加入百度距今已經將近十年,比大多數科學家更早接觸產業、也擁有更豐富的產業經驗。因此王海峰得以將學術視角與產業思維相結合,在他的影響下,因此我們可以看到百度AI創新通常是在產業思維框架下進行創新。

在百度大腦中,這種趨向格外明顯。作為向產業生態輸出技術的平臺,百度大腦將百度在AI上領先性化入技術API和產品之中。例如推出針對人臉閘機、人臉核驗等等專項解決方案,以及遠場語音開發套件這樣的硬體產品與服務。

這類能夠直面應用環境的技術平臺,可以幫助百度AI更快進入現實場景中進行錘鍊並獲得反饋,幫助百度那些偏於基礎和學術角度的技術創新可以有實際的流向,對企業整體技術生態帶來正向驅動,保持AI自主創新的持續性。

同時藉助王海峰對產業的深入理解,也能讓百度AI對產業需求有著更敏感的感知。例如推出第一款開源中文深度學習平臺PaddlePaddle,就是從產業角度意義非凡的創新突破。一個獨立自主深度學習平臺的存在,可以保證百度AI以及整個中國AI產業在進行技術輸出時獲得更多保障。從宏觀角度來看,同樣也給予了AI自主創新更長線的支持。

在大樹生長的過程中,雖然學術視角提供了營養,但只有結合產業思維,才讓枝丫有了抽條生長的可能性。只有AI創新更具實際意義,創新能力才有了在一家企業裡不斷生長的可能。

三重反應:人才虹吸下的拓張繁茂

這也是為什麼,能夠招攬來科學家的科技企業不在少數,而真正能與科學家一同推動AI自主創新的企業卻寥寥無幾。

而這種在產業和學界都能佔據高位的特點,還為王海峰帶來了另一項重要特質,那就是對人才的吸引和甄別能力。對於企業來說,能夠保持科技創新能力不僅僅需要一位「王海峰」,還有持續的人才補充和更迭。

王海峰的學術能力和在學術組織中的權威性,讓他可以有能力幫助百度吸引來更多學界人才;而在產業中累積的經驗和思維模式,能夠讓他發現哪些學界人才的學術能力更加適合百度。我們可以看到,從早期的吳華到近年來的Kenneth Church、浣軍等人,這些專家有的本在斯坦福這樣的頂級高校任職,有的已經在學術領域聞名遐邇,最終都被百度和王海峰所吸引,為百度AI添磚加瓦。

在人才的不斷組建之下,百度AI可以實現規模化的創新。尤其在視覺、語音、語言與智能等等領域中,這些科學家們正源源不斷的貢獻著力量,學術層面和應用層面皆是如此。

就像在上個月剛剛放榜的國際視覺頂會CVPR上,百度同樣獲得了17篇論文入選的好成績。而在自然語言處理首席科學家吳華的帶領下,百度大腦已經推出了全新的智能對話引擎,引導對話技術進行工業級落地。

從王海峰個人的學術能力來說,帶給百度AI的更多是NLP方面指引。但結合由王海峰協助編織起的人才網絡,就能給予百度AI創新全面能力的補充。藉助養分與生長能力之上不斷擴張繁衍,最終形成一片密林。

跳脫框架、前沿創新:科學家在科技企業中的價值最大化

在這一系列科學家與科技企業的化學反應之下,不難發現百度AI正在自主創新之路上留下一個個穩固的腳印這次入選ACL的論文主題中就可見一斑。

ACL對於中國科技企業來說並不陌生,此前搜狗、科大訊飛等等企業也曾參與過投稿或ACL組織的競賽,並獲得了一定成績。例如科大訊飛曾在ACL下屬組織主辦的第十二屆國際語義評測比賽中獲得基於常識的機器閱讀理解全球第一;字節跳動在去年也曾被收錄過針對於中英,德英和英法三個標準數據集上,有關神經網絡機器翻譯動態解碼機制的論文。

但這些科技企業,再對頂會的攻堅上和百度有著一個顯著的區別。那就是相比百度,這些企業更傾向於在現有的框架和數據集上進行突破鑽研,傾向於在指定的方向上前行。像在某一個競賽中取得名次,或針對某一標準數據集推出算法改進。而百度則更傾向於跳出現有框架之外,去探索更前沿的陌生領域。

像在這次ACL收錄的幾篇論文中,百度AI就提出了包括基於注意力正則化的ARNOR框架(Attention Regularization based NOise Reduction)、語言表示與知識表示深度融合的KT-NET模型、多粒度跨模態注意力機制、基於端到端深度強化學習的共指解析方法等,在人機互動、智能客服、視頻理解、機器翻譯等場景中具有很大的應用價值。

正因為在自主創新上的遠見和高度投入,才能讓科學家在科技企業中的價值最大化,不斷讓百度AI踩中技術發展的關鍵拐點。

結束語

一家科技企業在一次頂會上取得的成就,就如同一場搶灘登陸戰,即使打得再「漂亮」也僅僅是個開始。只是這場戰役讓我們注意到了科學家這一至關重要的元素,以及科學家和科技企業之間所產生的化學反應。

從百度AI和王海峰之間的案例看來,我們可以發現一位科學家的學術能力和產學融合視角,再加上人才號召能力,能夠幫助企業在AI的淨技術研究、應用打造和場景布局中不斷取得自主創新突破。讓AI自主創新能力紮根、生長並不斷繁殖。王海峰在其中的作用就如同一位鍊金者,推動不同元素的碰撞最終迸發能量。

如今在科技產業深受大國博弈影響的背景之下,我們也愈發能夠感知到百度這種全鏈條AI自主創新能力的重要性。此時發布在國際頂會上的論文、開發者手中屬於中國的開發平臺以及那些源源不斷進入應用層面的技術接口,對於百度AI和整個中國AI產業來說,都是在增加手中的底牌,為未來不斷加碼。

從學界賦能產業,卻又不止於產業,或許這就是科學家與科技企業,能夠形成的最好的化學反應。

打開APP閱讀更多精彩內容

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容圖片侵權或者其他問題,請聯繫本站作侵刪。 侵權投訴

相關焦點

  • ACL 2019 27 篇論文實現代碼(持續更新中)
    ACL 2019 共接收了 765 篇論文,目前官網已經全部公布了,官方連結:http://www.acl2019.org/EN/program/papers.xhtml但是官網沒有公布連結,部分論文也沒有展示出來。所以AI研習社給大家整理了343篇論文,供大家學習!
  • AIOpenIndex發布全球人工智慧創新城市榜單,中國32個城市進入世界...
    下圖是中國入選 500 強城市匯總清單。  全球 AI 城市榜單為 AIOpenIndex (http://www.aiopenindex.com/) 全新打造的人工智慧系列榜單。AIOpenIndex 是由清華 AMiner 團隊發起的以數據為基礎的全球性開放平臺,涵蓋學術界和產業界。
  • 創新工場兩篇論文入選ACL 2020,將中文分詞數據刷至新高
    近日,自然語言處理領域(NLP)頂級學術會議 ACL 2020 (https://acl2020.org/)正在火熱舉行。令人振奮的是,來自創新工場大灣區人工智慧研究院的兩篇論文入選。這兩篇論文均聚焦中文分詞領域,是深度學習引入知識後的有益嘗試,將該領域近年來廣泛使用的各數據集上的分數全部刷至新高,在工業中也有著可觀的應用前景。
  • 躋身全球前0.1%!湖北這所高校多篇論文入選ESI高被引論文
    根據最新ESI數據,武漢工程大學電氣學院洪漢玉教授帶領的圖像識別團隊成員中年輕博士黃正華、張耀宗與張天序、洪漢玉等教授合作的4篇論文入選了ESI工程學全球Top1%高被引論文,其中2篇同時入選了ESI工程學全球Top0.1%熱點論文。
  • 獨家對話百度副總裁王海峰:NLP 的路還很長
    王海峰博士也表示,「理解語言、擁有智能、改變世界,希望我們的專欄能一起朝這個方向努力」。此篇專訪作為合作專欄的開篇,希望讀者能從中有所獲益。專欄後續內容,請持續關注機器之心。機器之心:百度在前幾年就上線了機器翻譯系統,我們知道機器翻譯系統可能用到神經網絡、基於規則方法、基於實例的方法,還有基於統計的。這些不同的方法,如何在一個翻譯系統中結合?王海峰:我們在世界上最早把深度學習應用到大規模線上翻譯系統,2015 年 5 月系統正式上線。
  • 河北大學2篇論文入選中國百篇最具影響國際學術論文
    2020年「中國科技論文統計結果發布會」於近日舉行。會上發布了《中國卓越論文統計報告》,並評選出「中國百篇最具影響國際學術論文」。河北大學物理科學與技術學院李志強和生命科學學院劉秀華老師的2篇科技論文入選,位居全國高校並列第四,並列前三高校均為985高校,河北大學是河北省唯一入選高校。
  • 中國AI「再戰」視覺頂會CVPR:百度全方位參與 入選論文達22篇
    (原標題:中國AI「再戰」視覺頂會CVPR:百度全方位參與 入選論文達22篇)
  • 百度王海峰Quora總結百度工程師品質:務實,自驅,負責到底
    【慧聰通信網】近日,百度副總裁王海峰博士受美國問答網站Quora邀請回答網友提問,回答了頗具代表性的十個問題,覆蓋從中國人工智慧的發展階段到百度工程師的日常工作狀態,十問十答的形式,為美國網友打開了解百度,了 【慧聰通信網】近日,百度副總裁王海峰博士受美國問答網站Quora邀請回答網友提問
  • 吳宜燦研究員論文入選第二屆中國科協優秀科技論文
    近日,中國科協公布了「第二屆中國科協優秀科技論文」榜單,中國科學院核能安全技術研究所吳宜燦研究員發表的學術論文《中國鉛基研究反應堆概念設計研究》
  • 全球前0.1%!武漢教授團隊,入選多篇ESI高被引和熱點論文
    6篇、全球Top 0.1% ESI熱點論文3篇,其中陳漢新教授新增4篇高被引論文和3篇熱點論文、肖波齊教授新增2篇高被引論文。是多個專業學會會員、國際會議分會主席和組委會成員,以及二十多個國際著名學術雜誌論文評審專家。長期從事機械系統故障診斷和壽命預測、大型結構設備高清晰度無損檢測、生產過程的質量控制和智能檢測、等領域研究。截止目前,陳漢新教授團隊已有10篇ESI高被引論文和6篇ESI熱點論文。
  • ACL 2018最佳論文公布!計算語言學最前沿研究都在這裡了
    新智元報導 來源:acl2018.org編輯:聞菲、小芹【新智元導讀】ACL 會議是計算語言學領域的首要會議,廣泛涉及自然語言的計算方法及其各類研究領域。ACL 2018將於7月15日至20日在澳大利亞墨爾本舉行。昨天,ACL官網公布了本屆大會的最佳論文,包括3篇最佳長論文和2篇最佳短論文,新智元帶來介紹。
  • NIPS 2017 騰訊AI Lab 八篇論文入選,含1篇Oral
    被譽為神經計算和機器學習領域兩大頂級會議之一的 NIPS(另一個為 ICML)近日揭曉收錄論文名單,騰訊 AI Lab 共有八篇論文入選,位居國內企業前列,其中一篇被選做口頭報告(Oral),該類論文僅佔總錄取數的 1.2%(40/3248),我們將在下文解析。
  • 85種期刊96篇論文上榜!科協優秀科技論文入選名單發布
    近日,中國科學技術協會公布了第五屆優秀科技論文遴選計劃入選論文名單,來自85種國內科技期刊的96篇論文入選其中,基礎研究論文38篇,應用研究論文54篇,綜述類論文4篇。論文入選,《中國電機工程學報》、《中國實驗方劑學雜誌》、《電工技術學報》、《機械工程學報》、《計算機研究與發展》、《Cell Research》、《Science China-Life Sciences》、《Science China Chemistry
  • 一窺ACL 2018 最佳論文
    雷鋒網 AI 科技評論按:隨著定於 7 月 15 日的開會日期逐漸臨近,自然語言處理頂會 ACL 2018 繼公開了接收論文名單之後,今天也公布了包含 3 篇長論文 與 2 篇短論文的最佳論文獲獎名單。
  • 深耕自然語言處理近30年 王海峰獲中國工程科技界最高獎
    該獎項被譽為「中國工程界最高獎項」,旨在對我國工程科技及管理領域做出傑出貢獻的科學家、工程師進行表彰。百度CTO王海峰因其在人工智慧領域、尤其是自然語言處理領域的卓越貢獻,成為AI產業界首位獲此殊榮的科技工作者。光華工程科技獎由中國工程院主管,每兩年頒發一次。自1996年至今,共有304位科學家及1個團體獲獎。
  • 62篇論文入選,算法工廠憑什麼領跑行業?
    本屆 CVPR 號稱十年來最難的一屆,共接收 6656 篇論文,中選 1470 篇,錄用率僅為 22%,為十年來最低的一次。不過,中國軍團依然表現亮眼。學術界清華領銜,商湯則以62 篇論文入選的成績,領跑產業界。成績亮眼,卻有些見怪不怪。畢竟,這已經不是商湯第一次在頂會上「一騎絕塵」。
  • 武漢科技大學一論文入選「中國百篇最具影響國際學術論文」
    近日一則好消息來嘍武科大一篇論文入選「中國百篇最具影響國際學術論文」快來科科一起來看看是哪篇厲害的論文吧2020年中國科技論文統計結果發布會於2020年12月29日舉行。會上發布了《中國卓越論文統計報告》,評選出2019年度「中國百篇最具影響國際學術論文」。我校先進材料與納米技術研究院霍開富教授領導的「先進儲能材料與動力電池團隊」的一篇論文入選。該論文的通訊作者為霍開富教授,博士生安威力和高標副教授為共同第一作者,付繼江教授、博士生項奔和梅士雄為共同作者。
  • 《煤炭學報》再有1篇論文入選!第五屆中國科協優秀科技論文公布
    【能源人都在看,點擊右上角加'關注'】近日,中國科協辦公廳發布了第五屆中國科協優秀科技論文遴選計劃入選論文名單。于斌教授級高級工程師2016年3月發表在《煤炭學報》的論文「特厚煤層綜放開採大空間採場覆巖結構及作用機制」成功入選,截至目前,該論文在中國知網被引用次數100次,下載1197次。于斌教授級高級工程師長期從事煤礦巖層控制與安全高效開採工程技術的研究。
  • 騰訊AI Lab入選20篇論文,含2篇Spotlight
    騰訊AI Lab第三次參加NIPS,共有20篇論文入選,其中2篇被選為亮點論文(Spotlight),涵蓋遷移學習、模仿學習、半監督學習等多個研究主題,去年我們入選論文8篇,含1篇口頭報告(Oral)。
  • 7 Papers & Radios | ACL 2020獲獎論文;貝葉斯深度學習綜述
    (附音頻)論文 1:Beyond Accuracy: Behavioral Testing of NLP Models with CheckList作者:Marco Tulio Ribeiro、Tongshuang Wu、Carlos Guestrin、Sameer Singh論文連結:https://www.aclweb.org