11篇論文、首屆同傳研討會、技術分享,百度AI閃耀ACL2020

2020-12-13 機器之心Pro

近日,第58屆國際計算語言學協會年會ACL 2020(The Association for Computational Linguistics)於線上開啟。這次會議,百度共有11篇論文被錄用,覆蓋自然語言處理眾多前沿研究方向;百度聯合谷歌、Facebook、清華大學等全球頂尖機構,共同舉辦首屆同聲傳譯研討會;在線上展臺主題技術TALK環節,百度還就開放域人機對話技術、ERNIE核心技術等業內關注的話題展開分享,展現了中國企業在自然語言處理及人工智慧領域的技術創新與落地實踐能力。

ACL成立於1962年,是自然語言處理領域影響力最大、最具活力的國際學術組織之一。自成立之日起,致力於推動計算語言學及自然語言處理相關研究的發展和國際學術交流。百度的自然語言處理技術,在技術創新及應用上始終保持領先,一直被視為自然語言處理研究界的「第一梯隊」,此次在ACL 2020大會中的亮眼表現,正是源於百度在技術領域的長期積累。

百度11篇論文被收錄,紮實AI技術彰顯國際影響力

ACL2020共收錄百度11篇論文

除了在國際 AI 學界的影響力外,ACL 無論是審稿規範還是審稿質量,都是當今 AI 領域國際頂級會議中公認的翹楚。

本屆大會百度共有11篇論文被收錄,覆蓋了人機對話系統、情感分析/預訓練表示學習、NLP 文本生成與摘要、機器翻譯/同聲翻譯、知識推理、AI 輔助臨床診斷等諸多自然語言處理界的前沿研究方向,提出了包括端到端開放域生成模型PLATO、面向開放域對話的基於圖譜的對話管理機制、情感知識增強的語言模型預訓練方法、基於圖表示的多文檔生成式摘要方法 GraphSum 等諸多新框架、新算法、新數據,不僅極大提升了相關領域的研究水平,也將推動人機互動、機器翻譯、智慧醫療等場景的技術落地應用。

此次 ACL 2020的審稿周期,從去年12月一直持續到今年4月,相比往年幾乎增加了一倍。會議投稿數量為 3088 篇,共有 779 篇論文被接收,包括 571 篇長論文和 208 篇短論文,接收率僅為25.2%。百度11篇論文被收錄的成績,不僅意味著研究成果得到了國際學術界的認可,也證明了其研究本身在實驗嚴謹性、思路創新性等方面的實力。

領銜舉辦ACL 2020首屆機器同傳研討會,百度技術領先性得到公認

同聲傳譯以其高效的信息傳遞方式,廣泛應用於國際會議、商務會談、新聞發布、法律訴訟等多種跨語言交流場景。機器同傳結合了機器翻譯(Machine Translation)、語音識別(Automatic Speech Recognition)和語音合成(Text-To-Speech)等人工智慧技術,已經成為重要的前沿研究領域。目前,機器同傳還需要攻克高魯棒性、高翻譯質量、低延時的相關問題。

本次會議中,百度聯合國內外頂尖企業和高校共同舉辦全球首屆同聲傳譯研討會,匯集包括機器翻譯、語音處理和人類口譯領域的研究和從業人員,共同就機器同傳架構、翻譯模型、數據資源等問題展開研討。

百度技術委員會主席、百度自然語言處理首席科學家吳華受邀做線上報告

研討會有多場高質量主題演講,百度技術委員會主席、百度自然語言處理首席科學家吳華等國內外多名專家就機器同傳研究現狀、面臨挑戰以及未來發展進行探討,加深了機器同傳與口譯兩個領域之間的交流,極大地推動了機器同傳技術發展以及機器和人工同傳的協同合作。

在本次研討會同期舉辦的國際首屆同傳評測比賽中,百度行業首發業內最大規模面向真實場景的中英同傳數據,涵蓋信息技術、經濟、文化、生物、藝術等多個領域。同時,基於百度深度學習平臺飛槳的一站式AI開發實訓平臺百度大腦AI Studio,百度為參賽選手提供在線編程環境、免費GPU算力、海量開源算法和開放數據,幫助開發者快速創建和部署模型。

展現多個技術亮點,百度線上臺主題技術TALK引關注

在本次大會的線上展臺主題技術TALK環節,百度也展現出多個亮點,體現出百度領先的技術創新與落地實踐能力,圍繞ERNIE核心技術、開放域人機對話技術、智慧醫療、生物醫藥等業內關注的話題,百度獻上了精彩的演講。

在展臺主題技術TALK環節,百度研究人員做出主題為《ERNIE的技術原理、平臺與應用》的分享。百度提出了知識增強的語義表示模型 ERNIE 及持續學習語義理解框架 ERNIE 2.0,在16 個中英文任務上超越國際最好效果,取得了 SOTA 的效果。去年12月,ERNIE 在國際權威的通用語言理解評估基準 GLUE上首次突破90大關,超越人類三個點,取得全球第一。今年3月,在全球最大規模的國際語義評測 SemEval 上獲得5項世界冠軍。

近期,百度又相繼發布了面向生成的預訓練技術 ERNIE-Gen 和知識增強的視覺-語言預訓練模型 ERNIE-ViL。ERNIE-Gen 首次提出基於多流機制生成完整語義片段,在5個生成類任務上取得了SOTA效果。ERNIE-ViL首次將場景圖知識融入多模態預訓練, 刷新了5項多模態任務紀錄,並登頂權威榜單VCR。在剛剛舉行的世界人工智慧大會上,百度文心(ERNIE)知識增強語義理解技術與平臺獲得了大會最高榮譽獎項「卓越人工智慧引領者」(SAIL)獎。

在《基於意圖圖譜的開放域對話生成框架》分享中,百度研究人員介紹到,為了提升多輪對話下的整體對話質量,提出基於意圖圖譜的對話生成框架,在該框架中引入顯式的對話管理機制,以增強對多輪對話流的控制能力。在公開數據集上的實驗結果表明,以上模型或系統在主題連貫性、對話目標引導成功率等關鍵多輪效果指標上顯著超越基線模型。

同時,百度藉助這次展臺技術Talk發布了業界首個基於隱變量的大規模對話模型PLATO以及基於PLATO相關工作擴展升級的PLATO-2。該模型使用了最多16億參數,發布了中英文版本。其中,英文效果超越了Google的Meena和Facebook AI Research的Blender,中文模型也遠超過現有基線。

在主題為《基於計算語言學的新冠病毒分析和疫苗設計算法》的分享中,針對新冠疫情,百度研究人員把自然語言處理領域的經典句法分析算法移植到核酸序列結構分析,介紹了全球首個線性時間的 RNA 結構預測算法 LinearFold,可以將新冠病毒基因組全序列結構分析的時間從55分鐘降低到 27 秒。在此基礎上,百度還研發出了全球首個mRNA 疫苗序列設計算法 LinearDesign,可以設計出結構最穩定的疫苗序列。對於新冠S蛋白,該算法16分鐘內就可設計出優化疫苗序列,解決了mRNA疫苗研發中的一個重大難題。目前,百度正在積極推進和中國疾控中心、各大疫苗公司和科研機構的合作。

在主題為《自然語言處理和知識圖譜技術在臨床輔助決策中的應用研究》的演講中,百度研究人員分享了靈醫智惠在臨床輔助決策中應用。以百度世界領先的中文自然語言處理和知識圖譜等技術為基礎,靈醫智惠打造了強大的醫療認知計算能力,形成了醫療場景下的語言、知識和認知計算三位一體的臨床輔助決策引擎。

近年來,中國 AI 企業、開發者及高校在國際AI頂會上的表現也愈發亮眼。ACL2020大會中,無論是論文入選量、領銜舉辦研討會、同傳比賽,百度都展現出中國 AI 行業頭雁的實力。百度NLP是百度AI技術和應用的萌芽起點和帶動力量,始終聚焦核心前沿,持續引領技術創新,持續引領中國NLP技術發展方向,不僅為此次大會交上了一份滿意的答卷,也為中國AI崛起、走向世界發展貢獻了重要的力量。

相關焦點

  • 百度領銜!NLP界「奧斯卡」ACL 2020將舉辦首屆同傳Workshop
    研討會期間,百度還將舉辦國際首屆同傳評測,以進一步促進技術交流與發展。眾所周知,國際計算語言學協會(ACL,The Association for Computational Linguistics)成立於1962年,是自然語言處理領域影響力最大、最具活力的國際學術組織之一,自成立之日起,致力於推動計算語言學及自然語言處理相關研究的發展和國際學術交流。
  • 國際頂會ACL 2020上的大動作!百度領銜舉辦首屆同聲傳譯研討會
    研討會期間,百度還將舉辦國際首屆同傳評測,以進一步促進技術交流與發展。眾所周知,國際計算語言學協會(ACL,The Association for Computational Linguistics)成立於1962年,是自然語言處理領域影響力最大、最具活力的國際學術組織之一,自成立之日起,致力於推動計算語言學及自然語言處理相關研究的發展和國際學術交流。
  • 11篇入圍論文,一次國際頂尖研討會,百度AI ACL 2020見真章
    近日,國際自然語言處理領域頂級學術會議「國際計算語言學協會年會」(ACL 2020)公布了今年大會的論文錄用結果。根據此前官方公布的數據,本屆大會共收到 3429 篇投稿論文,投稿數量創下新高。其中,百度共有11篇論文被大會收錄,再次展現出在自然語言處理領域的超高水準。
  • 百度11篇AI論文被ACL 2020收錄 都寫了什麼?
    近日,國際自然語言處理領域頂級學術會議「國際計算語言學協會年會」(ACL 2020)公布了今年大會的論文錄用結果。根據此前官方公布的數據,本屆大會共收到 3429 篇投稿論文,投稿數量創下新高。其中,百度共有11篇論文被大會收錄,再次展現出在自然語言處理領域的超高水準。
  • 百度聯合谷歌、Facebook、Upenn等舉辦ACL 2020同聲傳譯研討會
    ACL 2020中召開。研討會期間,百度還將舉辦國際首屆同傳評測。眾所周知,國際計算語言學協會(ACL,The Association for Computational Linguistics)成立於1962年,是自然語言處理領域影響力最大、最具活力的國際學術組織之一,自成立之日起,致力於推動計算語言學及自然語言處理相關研究的發展和國際學術交流。
  • 百度又有11篇論文被ACL 2020收錄,頂尖AI實力持續耀眼國際舞臺
    近日,國際自然語言處理領域頂級學術會議「國際計算語言學協會年會」(ACL 2020)公布了今年大會的論文錄用結果。根據此前官方公布的數據,本屆大會共收到 3429 篇投稿論文,投稿數量創下新高。其中,百度共有11篇論文被大會收錄,再次展現出在自然語言處理領域的超高水準。
  • 被ACL 2020收錄11篇NLP論文?百度:小意思,見慣了
    近日,國際自然語言處理領域頂級學術會議「國際計算語言學協會年會」(ACL 2020)公布了今年大會的論文錄用結果。根據此前官方公布的數據,本屆大會共收到 3429 篇投稿論文,投稿數量創下新高。其中,百度共有11篇論文被大會收錄,再次展現出在自然語言處理領域的超高水準。
  • 前瞻研究和落地應用兼顧,ACL 2020百度11篇被收錄論文解讀
    前瞻研究和落地應用兼顧,ACL 2020百度11篇被收錄論文解讀 2020-04-21 17:47
  • 繼CVPR、AAAI大豐收後,百度又有11篇論文被ACL 2020錄用
    近日,國際自然語言處理領域頂級學術會議「國際計算語言學協會年會」(ACL 2020)公布了今年大會的論文錄用結果。根據此前官方公布的數據,本屆大會共收到 3429 篇投稿論文,投稿數量創下新高。其中,百度共有11篇論文被大會收錄,再次展現出在自然語言處理領域的超高水準。
  • 第二屆國際機器同傳評測開啟報名通道
    結合機器翻譯、語音等技術的機器同傳,是人工智慧領域重要的前沿課題。為推動技術進步,百度、谷歌、華為以及格勒諾布爾-阿爾卑斯大學將在自然語言處理權威會議 NAACL 聯合舉辦第二屆國際機器同傳研討會。作為本次大會的重要實踐環節,將繼續舉辦國際機器同傳評測。本次評測於2020年12月28日正式啟動,面向全球開啟報名通道。
  • ACL 2019放榜!百度王海峰團隊十篇論文上榜
    5月15日,自然語言處理領域最頂尖的國際學術會議之一「國際計算語言學協會年會」(ACL 2019)論文接收結果終於放榜,據官方數據顯示有效投稿達到2694篇,同比增長75%。而百度共有高達十篇論文被大會收錄,展現出不俗的技術積澱與國際水準。
  • 年中最頂尖AI論壇4天19場!百度翻譯同傳堪稱「超級翻譯官」
    機器同傳成研究熱點,百度翻譯提出多項創新近年來,得益於人工智慧技術的綜合進步,結合語音技術和機器翻譯技術的機器同聲傳譯成為國際前沿研究的熱點。機器同傳面臨一系列國際公認的難題,如語音識別錯誤傳遞、翻譯質量與時間延遲難以平衡等。
  • 百度王海峰領銜百度AI再創佳音 10篇論文被ACL 2019錄取
    近日,自然語言處理(NLP)領域的國際頂級學術會議「國際計算語言學協會年會」(ACL 2019)公布了今年大會論文錄用結果,百度共有十篇論文被大會收錄,展現出在該領域的技術積澱和國際水準。由百度高級副總裁、AI技術平臺體系(AIG)和基礎技術體系(TG)總負責人、百度研究院院長王海峰領銜的百度AI取得新一輪創新突破。
  • ACL 2019盛大開幕 百度NLP技術實力亮相引行業熱潮
    本屆大會,王海峰博士和百度高級技術總監趙世奇博士作為執委會成員,參與討論決定ACL整體決策和重要發展方向。ACL於去年宣布成立了ACL亞太分會(AACL),王海峰博士為創始主席。首屆AACL大會將於2020年在中國蘇州舉行,百度技術委員會主席、百度自然語言處理首席科學家吳華將出任首屆AACL 程序委員會聯合主席。
  • AI同傳效果媲美人類,百度翻譯出品全球首個上下文感知機器同傳模型
    魚羊 發自 凹非寺  量子位 報導 | 公眾號 QbitAI  AI同傳領域又有新進展,這次突破來自百度。  百度機器翻譯團隊創新性地提出了全球首個感知上下文的機器同傳模型,並基於此發布了最新的語音到語音的機器同傳系統:DuTongChuan(度同傳)。
  • 百度發布AI同傳,有哪些核心技術?
    上個月,由於科大訊飛「AI同傳造假」事件,AI同傳被推上輿論的風口浪尖。不過,這件事顯然並沒有影響到AI同傳技術的發展。PZdednc在10月19日的百度大腦行業創新論壇的現場上,出現了百度的AI同傳。
  • 打破語言壁壘,百度翻譯同傳為智源大會構建跨國溝通橋梁
    機器同傳成研究熱點,百度翻譯提出多項創新近年來,得益於人工智慧技術的綜合進步,結合語音技術和機器翻譯技術的機器同聲傳譯成為國際前沿研究的熱點。機器同傳面臨一系列國際公認的難題,如語音識別錯誤傳遞、翻譯質量與時間延遲難以平衡等。
  • 百度AI閃耀國際舞臺:入選22篇論文 斬獲8項冠軍 主辦2場Workshop
    近日,全球計算機視覺頂會CVPR 2020首次召開線上大會,百度不僅入選22篇接收論文,一舉拿下8項挑戰賽冠軍,涵蓋視頻動作分析、動作識別、圖像增強、智慧城市等多個領域,還主辦了2場重量級學術Workshop,在國際舞臺盡顯中國AI硬實力。這不僅從側面反映了百度傾斜AI「新基建」的策略已有成效,也再次讓中國自有的深度學習平臺飛槳閃耀全球。
  • 第二屆北京智源大會拉開帷幕 百度翻譯同傳助力國際溝通無障礙
    6月21日至24日,2020北京智源大會盛大開幕,五位圖靈獎得主、十多位院士、一百多位專家學者齊聚一堂,共同探討人工智慧的下一個十年。受疫情影響,本屆大會以在線直播的形式舉行,吸引了全球學術界、產業界超過2.5萬人報名參會。為了更好的幫助國內外觀眾理解報告內容,百度翻譯為本次大會提供了機器同傳服務。
  • 第二屆北京智源大會拉開帷幕,百度翻譯同傳助力國際溝通無障礙
    機器同傳成研究熱點,百度翻譯提出多項創新近年來,得益於人工智慧技術的綜合進步,結合語音技術和機器翻譯技術的機器同聲傳譯成為國際前沿研究的熱點。機器同傳面臨一系列國際公認的難題,如語音識別錯誤傳遞、翻譯質量與時間延遲難以平衡等。