聚焦多模態自然語言處理等AI技術,京東智聯雲亮相NLPCC 2020

2021-01-08 36kr

近年來,人工智慧 (AI) 在涉及單一模態如語音、自然語言和視覺等領域,取得了重大突破。在單一模態的任務上,如物體識別、語音識別、機器翻譯等,AI 系統在特定數據集上的表現水平與人類相當。隨著單模態人工智慧潛在問題的解決,研究人員意識到更高層次的AI任務往往涉及到跨多種模式的更複雜的信息處理。同時,局限於單一模態的研究往往不能充分利用跨模態信息。因此,研究多模態建模與學習方法具有重要的意義。

.

在本次國際自然語言處理與中文計算會議 (NLPCC 2020)上,  京東智聯雲舉辦了第一屆「多模態自然語言處理研討會」。該研討會邀請了多位學術大咖進行學術分享,吸引了自然語言處理、多模態、圖像處理等多領域眾多學者參與。會中,各位學者就跨語言跨模態信息處理、多模態預訓練、AI與藝術、視覺與語言交互、多模態對話系統等領域的研究熱點和技術應用展開討論,反響熱烈。

看點1 多模態自動摘要生成

多模態已成為新聞報導和信息交流的主要呈現形式,多模態自動摘要技術,旨在利用計算機自動實現從多個模態的信息中壓縮生成摘要的過程,可以廣泛應用於新聞推送和電商推薦等多個領域。

在本次研討會中,來自中科院自動化所的研究員張家俊,為大家介紹其所在的課題組近年來在多模態摘要方法和評價等方面的研究進展。張家俊重點介紹了異源多模態摘要生成的研究方法變遷:從抽取式方法到生成式方法,再到目前融入多模態注意力機制的圖文式摘要生成方法等。同時,他也介紹了多模態自動摘要的自動評價方法: 綜合考慮文本和圖片重要性以及文本圖片相關性更加貼近人工打分。

 .

看點2 多模態預訓練模型

預訓練模型的出現,使自然語言處理由原來的手工調參、依靠機器學習專家的階段,進入到可以大規模、可複製的大工業施展階段。此階段基於預訓練模型+微調機制,具備很高的可擴展性,展現出很高潛力。而當前研究也從單一語言擴展到多模態。

微軟亞洲研究院的高級研究員段楠博士,為大家介紹了多模態預訓練模型的最新研究進展。他首先回顧了典型的預訓練模型。隨後,重點介紹了3種最新的多模態預訓練模型:Unicoder主要應用於跨語言的語言理解和生成任務;Unicoder VL專注於視頻語言任務,對視頻片段和對應的自然語言描述進行聯合建模;CodeBERT則關注在代碼語言任務。段博士也和與會學者一起討論了當前多模態預訓練的問題和可能的未來方向。

 .

看點3 人工智慧藝術與設計

 「AI+藝術是一個跨界領域。藝術家的想像力往往啟發著科學家的創造力,而在AI時代,藝術家用人工智慧機器學習相關技術來創作藝術,表達自己的想法和概念,設計師用神經網絡模型創造自己的設計工具和助手。」

清華大學未來實驗室博士後高峰,分享了AI技術在藝術與設計領域的創新性應用。其團隊開發的道子智能繪畫系統,利用計算機將自然圖像以風格遷移的方式轉變成藝術圖像,根據所得藝術圖像進行水墨畫繪作,實現技術與藝術間的跨界融合。高博士也介紹了道子在服裝設計、工業設計、裝置藝術等領域的探索成果。

 .

看點4 多模態智能分析

多模態智能分析是近期的研究熱點。來自北航的劉偲教授圍繞視覺和語言的交互介紹兩方面的內容進行了分享。

她首先介紹了視覺關係檢測的研究,包括人-物關係檢測,人-物關係分割,視頻關係檢測等方面的內容。其次,她指出視覺指代表達和指代分割,對於智慧機器人和交互式圖像編輯等實際應用有重要意義。 傳統的視覺指代表達方法採用兩階段式架構,模型複雜且速度受限,而傳統的指代分割方法聚焦於多模態特徵融合,缺乏利用語言信息進行上下文建模和推理的能力。在本次討論中,她給出了針對性的解決方法。

 .

看點5 多模態對話系統

對話系統一直是自然語言理解領域一個重要的研究內容,它可以使人們更便捷的與機器進行交互,而多模態的對話系統是非常重要的一個研究方向。

平安壽險AI研發團隊的楊海欽博士,分享了多模態對話系統在平安人壽各種場景的應用,包括保單回訪服務和視頻櫃員客服等。在本次講座中,楊博士重點介紹了多模態對話系統的核心和創新技術,實際部署經驗以及如何應用該系統來降低運營成本,同時增加用戶體驗。

 .

在此次NLPCC 會議中,京東智聯雲成功舉辦了第一屆「多模態自然語言處理研討會」,吸引眾多參會學者的積極參與和熱烈討論。同時,京東AI研究院NLP算法科學家吳友政博士,受大會邀請作「智能人機互動及其應用」的主題分享,此外,京東AI研究院一篇論文被大會收錄並進行口頭匯報。

相關焦點

  • 京東AI研究院獲QuAC機器閱讀理解競賽冠軍,模型能力業界領先
    這也意味著以零售、物流、金融、客服等優質場景為依託的京東 AI 研究院,在機器閱讀理解能力上取得了突飛猛進的成果。圖 1QuAC 挑戰賽官方成績榜單(https://quac.ai)目前,QuAC 是人機多輪對話交互領域複雜度最高的數據集,要求模型具備強大的上下文語義理解、指代推理、省略語義恢復和知識推理等能力,這也吸引了全球頂級科研院所和企業研究機構參加。
  • 人與AI溝通未來——中業科技亮相NLPCC2020
    河南日報客戶端記者 張永恆利用人工智慧與機器溝通一直是人類的一個夢想,而NLP-自然語言處理技術便是這把開啟夢想的「鑰匙」。10月14日-18日,由中國計算機學會主辦, 中國計算機學會中文信息技術專業委員會及鄭州大學承辦的「2020年第九屆自然語言處理與中文計算會議(NLPCC 2020)」在鄭州舉行,數十位國內外自然語言處理技術的學術大咖,以及多家人工智慧行業領軍企業,匯聚在此,共同預見人與AI溝通的未來。
  • 京東姚霆:推理能力,正是多模態技術未來亟需突破的瓶頸!
    當然,拍照購只是京東電商的眾多應用之一,跨模態技術應用還有很多,比如推薦和信息流廣告,內容審核也可以結合海量的商品圖像與對應的商品語義屬性,學習圖像語義特徵表達。另外,我們在使用京東 App 時可能都有過被智能客服接待的經歷,這背後的技術,就是在任務驅動型的多輪對話中融入視覺到語言的跨模態轉換技術,讓智能客服可以自動地對用戶上傳的圖片或視頻進行自動應答。
  • 京東智聯雲攜手海澱區 擴寬應急管理信息化建設新疆界
    在北京市「海澱區應急公共服務平臺」上,一場雲上「春耕節」正開展得如火如荼。3月19日,海澱區應急公共服務平臺上新「春耕」服務板塊,海澱區攜手京東智聯雲,以數位技術實力助農惠農,為春耕生產保駕護航,不斷拓寬應急管理信息化建設的新疆界。一年之計在於春,春耕農牧正當時。如何保證防疫工作有序開展?全力組織春耕生產,確保不誤農時?
  • 京東雲與AI 10篇論文被AAAI 2020收錄,京東科技實力亮相世界舞臺
    美國時間2月7-12日,AAAI 2020大會在紐約正式拉開序幕,AAAI作為全球人工智慧領域的頂級學術會議,每年評審並收錄來自全球最頂尖的學術論文,這些學術研究引領著技術的趨勢和未來。京東雲與AI在本次大會上有10篇論文被AAAI收錄,涉及自然語言處理、計算機視覺、機器學習等領域,充分展現了京東用技術驅動公司成長的發展模式以及技術實力,技術創新和應用落地也成為這些論文最吸引行業關注的亮點。
  • 京東智聯雲(麗水)智能設計中心為企業開啟服務
    -好設計幫你從賣得出到賣得好 北京2020年9月28日 /美通社/ -- 浙江省近年來提出要進一步提升工業設計發展水平,發揮其在提升企業自主創新能力和國際競爭力、改造提升傳統產業和培育發展新興產業中的支撐引領作用。
  • 2019自然語言處理前沿論壇 五大議題全面解析NLP技術前沿
    5月26日,由百度與中國計算機學會中文信息技術專委會、中國中文信息學會青工委聯合舉辦的「2019自然語言處理前沿論壇」正式召開。本屆論壇主題為「機器之『讀、寫、說、譯』—— 探尋NLP未來之路」。論壇圍繞語義計算、自動問答、語言生成、人機對話及機器翻譯五大議題,與學術界、工業界一線青年專家學者共同探討NLP領域的最新技術進展、產業應用及發展趨勢。
  • 從京東 618 導購機器人說起,機器如何更理解人類?
    在京東JOY強大的對話能力中,基於開放域目標驅動的生成式對話服務來自於人工智慧企業「深思考人工智慧」(iDeepWise.ai)。其在多模態深度語義理解、人機對話等核心AI技術上已不斷突破創新。這些新技術的不斷迭代,也在一步步推動AI實現商業化落地。AI對話機器人背後的黑科技究竟是什麼?
  • 騰訊AI Lab 2020 年度回顧
    虛擬人:或是人類的虛擬化身,或是數字世界原住民 虛擬人是一類多模態技術,涉及計算機視覺、語音識別和生成、自然語言理解和生成等多種技術。根據來源的不同,虛擬人可大致分為兩類:人類的數位化模型和虛擬世界原生虛擬人。
  • 復旦大學陳俊坤:自然語言處理中的多任務學習 | AI 研習社職播間第...
    公開課回放視頻網址:http://www.mooc.ai/open/course/574?=chenjunkun分享嘉賓:陳俊坤,復旦大學計算機系在讀碩士,導師是邱錫鵬副教授,主要研究方向為自然語言處理,多任務學習等。其研究工作曾在 AAAI, IJCAI 上發表。
  • 自然語言處理前沿論壇在京召開 學者專家共探機器之讀、寫、說、譯
    5月26日,由百度與中國計算機學會中文信息技術專委會、中國中文信息學會青工委聯合舉辦的「2019自然語言處理前沿論壇」正式召開。本屆論壇主題為「機器之『讀、寫、說、譯』—— 探尋NLP未來之路」。
  • 自然語言處理學術會議AACL線上召開 聚焦亞太地區NLP技術進展
    同時,按照ACL年會慣例,此次亞太分會年會與第十屆國際自然語言處理聯席會議(International Joint Conference on Natural Language Processing, IJCNLP)聯合召開。會議匯集來自學界、業界的百餘位自然語言處理領域的專家大咖,圍繞語義表示與理解、知識圖譜、對話系統、信息抽取與文本挖掘、機器翻譯等前沿技術方向進行了深入交流與探討。
  • ...2020年清華大學劉知遠新書《自然語言處理表示學習技術》(全英文)
    內容簡介 · · · · · ·《Representation Learning for Natural Language Processing(自然語言處理表示學習技術)》本書全面介紹了自然語言處理表示學習技術的理論
  • CCF NLPCC 2018 自然語言處理與中文計算國際會議
    CCF 自然語言處理與中文計算國際會議 (NLPCC) 是由中國計算機學會主辦的中文信息技術專業委員會年度學術會議,是專注於自然語言處理及中文計算領域的國際會議。去年,第六屆自然語言處理及中文計算大會(NLPCC 2017)在大連成功舉辦。為此,雷鋒網(公眾號:雷鋒網)AI科技評論曾採訪 CCF 中文信息技術專委會主任、微軟亞洲研究院副院長周明博士及 CCF 中文信息技術專委會秘書長、北京大學趙東巖研究員,了解了中國 NLP 研究及 NLPCC 大會的發展歷程及未來規劃。
  • 2019自然語言處理前沿論壇:聚焦機器「讀、寫、說、譯」,探尋NLP...
    以語言和知識為研究對象的自然語言處理(NLP)技術是人工智慧的核心問題之一。5月26日,百度、中國計算機學會中文信息技術專委會和中國中文信息學會青工委聯合舉辦「2019自然語言處理前沿論壇」。百度高級副總裁、ACL Fellow王海峰博士為論壇做開場致辭。他表示,「語言是人類思維和交流的載體,同時也是人類知識凝練和傳承的載體。
  • 實踐入門NLP:基於深度學習的自然語言處理
    特別是最近兩年,基於深度學習的自然語言處理逐漸取得了一定進展,在人機對話、問答系統、語言翻譯等方向的應用也一直是自然語言處理中的熱門話題,而這些應用的實現,基本依賴於底層技術和模型的進步,再加上自然語言處理領域也算是一個多學科交叉的行業,自然語言處理的未來發展對於很多相關學科和方向都具有深遠的影響力。
  • 京東雲黑科技矩陣大曝光,「雲+AI」能否超出你的想像?| Q薦讀
    平臺應用工程師 張星京東人工智慧業務部算法工程師 陳東東本期技術沙龍聚焦「機器學習」與「計算機視覺」,揭秘京東 AI 在智慧零售、智慧物流、智慧金融等領域的生態布局與解決方案,講解京東拍照購、以圖搜圖、智能鑑黃等技術的實現原理, Intel 如何有效將 AI 部署到邊緣端。
  • 多模態話語:翻譯不只是語言文字
    儘管機器翻譯的質量差強人意,但人工智慧技術的突破,以及市場需求的不斷擴大等,機器翻譯也實現向神經網絡翻譯的躍進,翻譯質量也得到一定程度的提升。此外在現代科學技術的發展下,為人們日常生活、工作、學習中獲取信息特工更加便捷和多元的途徑,打破各國文化知識壁壘的同時,人們也在環境變化中提出更多的需求。
  • Gartner最新報告:百度翻譯整合多項AI能力 多模態翻譯助跨國交流
    Gartner分析師認為,百度有一個領先且宏偉的(advanced and ambitious)目標,融合自然語言處理、語音、計算機視覺等人工智慧技術,為用戶提供實時、高質量的多模態翻譯服務。在全球化發展背景下,隨著企業業務和生態系統不斷向全球不同區域擴展,企業獲取全球化信息的需求日益凸顯,機器翻譯成為剛需。