百家爭鳴|國內外NLP領域學術界和工業界的牛人和團隊

2021-02-16 深度學習自然語言處理

作者:滄笙踏歌

zenRRan有改動

根據這幾年的積累,整理了一份國內外學術界和工業界的牛人和大牛團隊,供大家申請碩士、博士、博士後和找工作參考。

國內學校(排名不分先後):

哈工大社會計算與信息檢索實驗室:劉挺老師坐鎮,教師包括:秦兵、張宇、車萬翔、趙妍妍、劉銘、張偉男、丁效等老師,實驗室共7個組,另外王海峰老師也是實驗室兼職博導。

哈工大智能技術與自然語言處理實驗室:王曉龍老師坐鎮,教師包括劉秉權、劉遠超 、孫承傑等老師

哈工大機器智能與翻譯研究室:趙鐵軍老師坐鎮,教師包括楊沐昀、鄭德權、徐冰老師等,另外周明老師是實驗室兼職博導。

哈工大深圳智能計算研究中心:王曉龍老師坐鎮,包括陳清才、湯步洲、徐睿峰、劉濱等老師,實力很強。

哈工大深圳人類語言技術組:徐睿峰老師坐鎮,情感原因發現做的比較好。

哈工大另外做NLP的老師包括:關毅、王軒等。

清華大學自然語言處理與社會人文計算實驗室:孫茂松老師坐鎮,包括劉洋、劉知遠等老師。論文發的非常多。

清華大學交互式人工智慧(CoAI)課題組:朱小燕老師坐鎮,包括黃民烈等老師。Dialogue System做的非常好,論文非常多。

清華大學智能技術與系統國家重點實驗室信息檢索課題組:馬少平老師坐鎮,包括張敏、劉奕群等老師。信息檢索做的非常好,論文非常多,前段時間剛拿了CIKM唯一的最佳論文(因為一作是學生,跟最佳學生論文合二為一了)。

清華大學另外做NLP的老師還有李涓子、唐傑、朱軍等老師,李老師知識圖譜做得好,唐老師數據挖掘(尤其是學者畫像)做得好,朱老師偏向機器學習和貝葉斯等做的很好。

北京大學計算語言學教育部重點實驗室:教師包括:王厚峰、萬小軍、常寶寶、李素建、孫栩、嚴睿、穗志方、吳雲芳等(包含其他實驗室的老師)。萬老師、李老師、常老師等發論文很多。

北京大學語言計算與網際網路挖掘研究組:萬小軍老師、孫薇薇老師。萬老師主要做自動摘要、文本生成、情感分析與計算等,論文非常多。

中科院NLP組主要集中在自動化所模式識別國家重點實驗室下屬的中文信息處理研究組,另外計算所有劉群老師組和軟體所也有孫樂老師做。具體老師包括劉群、宗成慶、趙軍、孫樂、王斌、徐君、張家俊、劉康、韓先培、何世柱等老師。論文非常多。

復旦大學自然語言處理組:黃萱菁、邱錫鵬等老師,發論文很多。

復旦大學知識工場:肖仰華老師知識圖譜做的非常好,論文發的很多。

蘇州大學自然語言處理組:做機器翻譯、情感分析、信息抽取等,論文發的很多。教師包括張民、周國棟、姚建民、李正華、熊得意、李軍輝、洪宇、陳文亮等老師。其中張老師、姚老師、李老師都是哈工大畢業的,張老師也是哈工大的兼職博導,論文很多。

東北大學自然語言處理實驗室:機器翻譯做的非常好,還成立了自己的公司,對外合作很多。姚天順老師是創始人,朱靖波老師坐鎮,教師包括肖桐、任飛亮、張春良等老師。

浙江大學:陳華鈞、趙洲等老師,陳老師知識圖譜做的很厲害。

中國人民大學:文繼榮、趙鑫、徐君、竇志成等老師。文老師現在是院長,之前在MSRA,信息檢索非常厲害。

上海交大:趙海老師,主要做機器翻譯、句法分析等。

東南大學:漆桂林老師,知識圖譜做的很厲害。

大連理工信息檢索實驗室:林鴻飛老師坐鎮,包括楊志豪、王健、張紹武、孫媛媛、張冬瑜、楊亮等老師。主要做信息檢索,隱喻、幽默等語料庫做的非常好。

西湖大學:張嶽老師,之前在新加坡,論文發的非常非常非常多,劍橋2016年統計的全世界發論文的數量好像排第二。

南京大學自然語言處理研究組:包括陳家俊、戴新宇、黃書劍等老師。

天津大學:張鵬老老師,信息檢索做的很好。

北京理工大學:黃河燕老師、張華平老師。黃老師是北京理工大學計算機學院院長,主要研究機器翻譯,擔任好幾個副理事長,享受國務院特殊津貼。中科院的自然語言處理工具包就是張老師做的,另外跟劉群老師合作發了不少論文,我之前工作時實習生開發的NER就是借鑑的他的層疊馬爾可夫模型而二次開發和優化的。

武漢大學語言與信息研究中心:姬東鴻等老師。

廈門大學智能科學與技術系自然語言處理實驗室:包括史曉東等老師,主要做機器翻譯、知識圖譜、信息抽取等。

山東大學:聶禮強老師,信息檢索做的非常好,論文很多。之前在新加坡,新加坡發SIGIR太多了。。。

南開大學:楊徵路老師,主要做信息檢索。

北京郵電大學:王小捷老師。

北京語言大學:於東老師,主要做機器翻譯、人機對話等。

華東師範大學:吳苑斌老師,記得應該是復旦大學黃萱菁老師的學生。

山西大學:李茹老師,山西大學計算機學院副院長。

鄭州大學自然語言處理實驗室:實驗室網頁最近打不開了。

黑龍江大學:付國宏、張梅山等老師。

港澳臺地區的高校(排名不分先後):

臺灣大學自然語言處理實驗室:主要研究方向包括知識圖譜、機器翻譯、問答、自動摘要、信息檢索等,論文非常多。

香港科技大學人類語言技術中心:論文非常多,牛人也不少。

香港中文大學文本挖掘組:主要研究方向包括文本挖掘和信息檢索。

澳門大學自然語言處理與中葡翻譯實驗室:主要做機器翻譯,做的非常好,論文也非常多。

香港理工大學社會媒體挖掘組:主要研究方向包括社會影響力建模、社會媒體分析、觀點摘要、觀點追蹤、跨語言情感分析等,這個實驗室對外合作很多,比如北大李素建老師、MSRA的韋福如老師等。

國內工業界(排名不分先後):

百度王海峰老師以及帶領的自然語言處理部+百度研究院做NLP的一些組,內部NLPC平臺集成了幾十個NLP算子,一些算子每天調用量都能上億次(不要問我為啥知道這麼詳細,因為15-16年我參與開發過2個算子,被加到開發者組了,經常有群郵件告知各算子的調用情況),幾乎涵蓋所有的NLP任務,部分技術在百度AI開放平臺-全球領先的人工智慧服務平臺-百度AI開放平臺開放API,少量技術在github開原始碼;

MSRA周明老師帶領的NLC組,組內論文發的非常多,尤其是幾個高級研究員、主管研究員;

哈工大和科大訊飛聯合實驗室:實驗室主任是劉挺老師,閱讀理解做的非常好;

華為諾亞方舟的劉群老師以及帶領的團隊;

小米:王斌老師坐鎮,王老師翻譯的書相信大部分人都看過吧。

今日頭條的李航老師;

阿里巴巴達摩院語言技術實驗室,在全球6個地點(杭州,北京,西雅圖,矽谷,紐約,新加坡)組建了100多人的國際化團隊。包括司羅,黃非,駱衛華,陳博興,劉曉鍾等,內部搭建了平臺,也做了一些技術評測取得不俗成績。

阿里巴巴、騰訊NLP做的也不少,只是個人感覺都是很多團隊在做,比較分散,沒有集中到一起。如果有人總結比較好的話,歡迎告知。

其他很多創業公司也有大牛坐鎮,只是太多、太分散了,不再贅述,感興趣的可以私聊。

國外學術界:

麻省理工學院:Regina Barzilay, Tommi S. Jaakkola。

卡內基梅隆大學:Jaime Carbonell, Justine Cassell, William Cohen(主要做信息抽取), Chris Dyer(主要做機器翻譯), Scott Fahlman,(主要做只是表示和知識推理),Robert Frederking, Eduard Hovy, Alon Lavie, Lori Levin, Brian MacWhinney,(做的比較雜),Teruko Mitamura,(主要做QA),Tom Mitchell, Eric Nyberg,Kemal Oflazer, Carolyn Penstein Rosé,(主要做聊天),Roni Rosenfeld, Noah Smith, Eric Xing。

約翰·霍普金斯大學:Andreas Andreou,Raman Arora,Jason Eisner, Sanjeev Khudanpur, David Yarowsky, Hynek Hermansky,Mark Dredze, Tom Lippincott,Philipp Koehn,Najim Dehak,Ben van Durme。絕對的NLP領域頂級牛校,研究幾乎涵蓋所有NLP任務,而且做的都非常好,如果非要說主要研究內容的話:句法分析、機器翻譯。

普林斯頓大學:Sanjeev Arora,Karthik Narasimhan。

史丹福大學: Christopher Manning, Daniel Jurafsky, Percy Liang,這幾個人不用贅述了吧,實驗室做的很廣泛,句法分析和詞性標註的工具很有名。

哈弗大學:Stuart Shieber,Alexander Rush,主要做MT、自動摘要和文本生成。

劍橋大學:Edward J. Briscoe,Ann Copestake,Simone Teufel,Paula Buttery,Andreas Vlachos,摘要、文本生成、NLU、句法分析、IR做的都不錯。

牛津大學:Stephen Pulman,Phil Blunsom(MT非常非常厲害)。

加州大學伯克利分校:Dan Klein(主要做IE和MT)。

伊利諾伊大學香檳分校:Margaret M. Fleck (CS),Roxana Girju (Linguistics),Mark Hasegawa-Johnson (ECE),Julia Hockenmaier (CS), Dan Roth (CS),ChengXiang Zhai (CS)。

賓夕法尼亞大學:Mitch Marcus,Dan Roth,Lyle Ungar,Ani Nenkova,Chris Callison-Burch,句法分析做的非常屌,LTAG、Penn Treebank不用過多解釋了吧。

芝加哥大學:John Lafferty(CRF發明人,機器翻譯做的也不錯), John Goldsmith

哥倫比亞大學:Kathy McKeown, Julia Hirschberg,Owen Rambow。

康奈爾大學:Lillian Lee(主要做SA(情感分析)), Thorsten Joachims(深入學習SVM的話應該知道他), Claire Cardie, Yoav Artzi。

俄亥俄州立大學(OSU):Eric Fosler-Lussier(我是因為做對話知道的他), Michael White(主要做NLG), William Schuler(主要做句法分析和MT), Micha Elsner, Alan Ritter, Wei Xu(社交媒體)。

匹茲堡大學:Ashley Kevin, Brusilovsky Peter, Lewis Michael。

多倫多大學:Graeme Hirst, Gerald Penn,Frank Rudzic,Suzanne Stevenson,主要做句法分析、語義分析。

麥吉爾大學:Doina Precup,Jackie Chi Kit Cheung,Joelle Pineau, Prakash Panangaden

蒙特婁大學:Yoshua Bengio,不過多解釋。

喬治亞理工:Eric Gilbert(社會計算領域很有名)。

南加州大學:Jerry Hobbs,Ron Artstein,David DeVault,Kallirroi Georgila,Panayiotis (Panos) Georgiou, Andrew Gordon,Jerry Hobbs,Khalil Iskarous,Kevin Knight,Sungbok Lee, Anton Leuski,Jonathan May,Prem Natarajan,MT、IE、關係挖掘、對話做的都不錯。

華盛頓大學:Tim Althoff,Jeffrey Bilmes,Yejin Choi,Pedro Domingos,Oren Etzioni, Hannaneh Hajishirzi,Noah Smith,Daniel S. Weld,Luke Zettlemoyer,主要做句法分析、MT、對話、IR等。

愛丁堡大學:Shay Cohen(句法分析),Sharon Goldwater,Kenneth Heafield(MT),Frank Keller(句法分析),Mirella Lapata(NLU、NLG),Adam Lopez,Walid Magdy(IR、DM、社會計算),Rico Sennrich(句法分析、MT),Mark Steedman(對話),Ivan Titov(句法分析、NLU),Bonnie Webber(QA)。

新加坡國立大學:NG Hwee Tou(主要做MT和句法糾錯)。

馬裡蘭大學:Philip Resnik, Naomi Feldman,Marine Carpuat,Hal Daumé, 主要做MT和IR。

東北大學:David A. Smith, Byron Wallace, Lu Wang。

加州大學伯克利分校:Dan Klein,主要做NLP和ML交叉研究。

加州大學聖巴巴拉分校:William Wang, 主要做IE(信息抽取)和ML。

加州大學聖克魯茲分校:Marilyn Walker,主要做dialogue。

紐約市立學院(CUNY):Martin Chodorow,Liang huang,Andrew Rosenberg,William Sakas,Virginia Teller。

University of Massachusetts Amherst:Andrew McCallum(CRF、主題模型)、Bruce Croft、James Allan(IR做的非常屌)。

紐約大學:Sam Bowman, Kyunghyun Cho,NLU做的非常好。

北卡羅來納大學教堂山分校(UNC):Mohit Bansal, Tamara Berg,主要做句法分析、多模態對話。

羅切斯特大學:Len Schubert, James Allen(篇章分析、對話做的很好),Dan Gildea(句法分析、MT)。

謝菲爾德大學:Rob Gaizauskas (Head of Group),Mark Hepple,Lucia Specia(MT很厲害),Mark Stevenson(主要做IR和IE),Yorick Wilks(ACL終身成就獎)。

還有很多學校、很多學術界大佬沒整理了,後續再補充吧。另外美國工業界的NLP大牛也很多,比如google、facebook、microsoft、amazon、IBM等公司。

以上就是我這些年的總結,畢竟精力有限,難免掛一漏萬。國內學術界、工業界了解較多,國外了解相對較少,很多只是掃過一些學者的論文或者看過他們的主頁,如果大家有了解的歡迎交流。謝謝!

推薦閱讀:

一大批歷史精彩文章啦

詳解文本分類之多通道CNN的理論與實踐

詳解文本分類之DeepCNN的理論與實踐

介紹4個大神常用而你不常用的python函數

資源 | 鄧力、劉洋等合著的這本NLP經典書籍之情感分析中文版

資源 | 有沒有必要把機器學習算法自己實現一遍?

談談我在自然語言處理進階上的一些個人拙見

從Word Embedding到Bert模型——自然語言處理預訓練技術發展史

相關焦點

  • 明知故問 | AI大牛們為何陸續離開工業界回歸學術界?
    據悉,朱松純教授是華人AI領域的頂級學者。他曾在各種國際頂級期刊上發表論文300餘篇,三次獲得馬爾獎,兩次擔任美國視覺、認知科學、AI領域跨學科合作項目MURI負責人。實際上,無論是「人才回國」引發的愛國主義的熱烈討論,還是AI大牛回歸高校對人才培養和科研學術的推動,近兩年,我們發現AI行業一個明顯的趨勢:越來越多的AI大牛陸續離開工業界回歸學術界。
  • 國內外有名的計算機視覺團隊和大牛匯總
    計算機視覺領域的一些牛人博客,超有實力的研究機構等的網站連結http
  • 1,CV;2,NLP;3,推薦系統?
    催收團隊的人效如何提升?方向與價值@li Eta同學有句話非常關鍵:對於工業界從業者來說,核心工作其實在於「適配」,主要是針對業務環境選擇合適的方法。上面列的這些問題,其實每解決掉一個,都能帶來非常直接的業務收益,但是我接觸到的大多數風控從業者,思維太局限在模型上,導致看到的也是很局限的問題。真實的業務場景有著海量的機會,合適的架構+合適的算法,用到最需要的場景,才是真正的能力。
  • 打算去工業界的別瞎折騰了
    (圖片來源:知乎)針對這一困境,《Nature Materials》今日發表了文章,採訪了一些在學術界和企業界都有過經歷的科研人員。來自英國的Nessa Carey博士是一位生物學家,在工業界和學術界都有著豐富的經歷。她曾在Pfizer等製藥公司擔任過高級研究員的職位,而現在她還是帝國理工學院的客座教授。
  • 中文NLP熱點|AMBERT模型在CLUE等數據集上獲卓越表現
    由「實在智能」算法科學家發起,聯合學界、工業界和開源社區的眾多NLP專家共同參與打造的CLUE,作為中文任務基準評測,正在得到國內同行越來越多的認可。今年5月,「實在智能」算法團隊聯合學界、工業界和開源社區的眾多NLP專家共同發起了「Chinese GLUE」,即中文自然語言理解評價標準體系——CLUE Benchmark(Chinese Languege Understanding Evaluation Benchmark)簡稱為 CLUE項目。
  • 【NLP】競賽必備的NLP庫
    import spacynlp = spacy.load("en_core_web_sm")text = ("When Sebastian Thrun started working on self-driving cars at " "Google in 2007, few people outside of the
  • NLP領域最優秀的8個預訓練模型(附開源地址)
    在本文中,我將介紹一些頂級的預訓練模型,你可以用它們來開始你的自然語言處理之旅,並複製該領域的最新研究成果。如今,自然語言處理(Natural Language Processing,NLP)應用已經變得無處不在。我似乎總是不經意間發現一些網站和應用程式,以這樣的或那樣的形式利用了自然語言處理技術。簡而言之,現在就是涉足自然語言處理領域的絕佳時機。
  • 百度杯NLP競賽:實體搜索成為自然語言處理研究領域新課題
    3月初,百度、中國計算機學會(CCF)聯合啟動了「百度杯」CCF國際自然語言理解與智能分析技術競賽——NLP Challenge,此次競賽是雙方首次舉辦的NLP領域技術大賽,面向海內外NLP領域的研究人員。 競賽以「實體搜索」作為賽題,以期能在該領域中取得全新的進展,探索NLP技術的各種可能,結合百度各產品的應用,讓技術更好地連接人與服務。
  • nlp領域發生了新的技術突破,用attention機制研究nlp領域
    近期,nlp領域發生了一系列的技術突破。包括:attention機制,cnn,adaptive attention network(an),兩層cnn相比較,an表現優於一層的cn。lstm,已經有了兩種不同的,看似性能和效率差異不大的attention機制:rnnattention,lstmattention。今天我們將從這兩種attention機制開始研究nlp領域突破性技術!
  • 斯坦福NLP團隊發布最新自然語言處理Python庫
    【導讀】斯坦福NLP團隊,於1月29日發布了新版的自然語言處理Python庫:StandfordNLP,不同於以前java系的CoreNLP,
  • 「CCF-NLP走進高校」系列高校NLP研究分享報告會(華南理工大學站)圓滿結束
    周國棟教授首先對組織者的準備以及報告嘉賓的到來表示熱烈的歡迎和衷心的感謝,並指出,以自然語言處理為代表的人工智慧技術受到了學術界和工業界的廣泛關注,第一期CCF-NLP走進高校報告會在華南理工大學召開,可謂正當其時、恰逢其勢。隨後,另一位開場嘉賓、東道主華南理工大學蔡毅教授也介紹了華南理工大學及其團隊在NLP領域的研究情況。
  • 打包帶走,競賽必備的NLP庫
    import spacynlp = spacy.load("en_core_web_sm")text = ("When Sebastian Thrun started working on self-driving cars at " "Google in 2007, few people outside of the
  • 數據競賽必備的NLP庫總結!
    import spacynlp = spacy.load("en_core_web_sm")text = ("When Sebastian Thrun started working on self-driving cars at " "Google in 2007, few people outside of the
  • 2019自然語言處理前沿論壇 五大議題全面解析NLP技術前沿
    論壇圍繞語義計算、自動問答、語言生成、人機對話及機器翻譯五大議題,與學術界、工業界一線青年專家學者共同探討NLP領域的最新技術進展、產業應用及發展趨勢。目前全連接自注意力模型在自然語言處理領域取得廣泛成功。模型層面,他分析和對比了CNN、RNN、Transformer的基本原理和優缺點,還介紹了如何設計模型,以更好地融合局部和非局部的語義矩陣關係。邱錫鵬介紹了研究組最新提出的star-transformer模型[4],通過引入中間節點,大幅降低了模型複雜度。
  • 計算機科學博士進入工業界的出路在哪裡?
    但是,與所有其他學科一樣,只要你想進入學術界做研究——先拋開當高校教授還是企業研究員不說——要成為「學者」,博士學歷是必須的。 所以,計算機科學專業讀博 or 不讀博,實際上就成了「計算機科學博士進入工業界的出路在哪裡?」
  • 全球第一,福大這支團隊厲害啦!
    @ICCAD 2019)的最終結果,由數學與計算機科學學院吳英傑教授和陳建利教授以及ACM核心隊員(鄒鵬、吳媛媛、陳龍江、李進)組成的福州大學師生團隊斬獲第一名。此問題是系統級FPGA布線問題的時間復用技術所帶來的延時問題,旨在為FPGA中每個網絡布線使其滿足連通性,並為每個連接信號分配傳輸速率使同連接線上的分配滿足傳輸約束且使系統的最大延時和運行時間目標儘可能小。本屆賽事從2019年2月1日開始至9月6日截止,最終提交的程序由Synopsys公司進行結果分析與測試評分。測試評分分為運行時間和總性能兩方面,共有9組測試例子。
  • 香港科技大學楊強教授:AI學術的前沿工作,也要從工業界獲得靈感|...
    您覺得潘院士為什麼會強調工業界的作用?在六十年代到不久以前,學術界都是科研的先行者。比如,像人工智慧這樣的概念完全是學術界先提出的 。但是現在有點不同了,大學逐漸變成一個很保守的(環境),就好像到了一個朝代的末尾,大家都開始不進取了,然後就有鴉片戰爭來敲開國門,讓人警醒了,說「啊,世界已經變了。」
  • ...同濟大學合作推出區塊鏈領域全球首本國際期刊「IET Blockchain」
    近年來,隨著研究的進步和技術的成熟,區塊鏈技術迅速由金融界延伸至工業、商業和社會生活,覆蓋內容分配、數據管理、能量貿易、供應鏈監控等各個方面。在我國,該技術連同人工智慧和物聯網,已成為國家戰略意義上的重點學科。隨著區塊鏈技術與應用在全球範圍內的迅速普及,學術界和工業界亟需一本國際權威的高水平學術期刊進行交流探討,推動基礎研究的深入和產業應用的發展。
  • 百家爭鳴!國內外基因治療CDMO市場布局
    美國不惜重金髮展基因治療相關技術,顯然對這一領域十分看好。近兩年,中國在基因治療領域政策發布也非常密集,對基因編輯等技術給予了大量支持。預計到2024年,全球基因治療市場規模將達到千億元規模。伴隨著基因治療發展,基因治療CDMO也進入發展快車道。
  • 「CCF-NLP走進高校」系列分享報告會(華南理工大學站)圓滿結束
    周國棟教授首先對組織者的準備以及報告嘉賓的到來表示熱烈的歡迎和衷心的感謝,並指出,以自然語言處理為代表的人工智慧技術受到了學術界和工業界的廣泛關注,第一期CCF-NLP走進高校報告會在華南理工大學召開,可謂正當其時、恰逢其勢。隨後,另一位開場嘉賓、東道主華南理工大學蔡毅教授也介紹了華南理工大學及其團隊在NLP領域的研究情況。