雲知聲-中科院自動化所語言與知識計算聯合實驗室三篇論文被 ACL...

2020-12-06 中國網科學頻道

日前,自然語言處理領域國際頂級會議 ACL 2020 (Association for Computational Linguistics)論文接收結果公布。大會共收到 3429篇投稿論文,投稿數量創下新高。作為計算語言學和自然語言處理領域最重要的頂級國際會議,ACL錄取論文代表了自然語言處理領域在過去一年最新和最高的科技水平以及未來發展潮流。

本屆大會,雲知聲-中科院自動化所「語言與知識計算聯合實驗室」共有3篇論文被收錄,分別在醫療對話的自動信息抽取、國際疾病分類(ICD)自動編碼,以及 ICD自動編碼可解釋性等領域取得突破。這些最新的自然語言處理算法將為後續研究提供極具價值的經驗和方向,已在雲知聲醫療業務率先應用。

一種面向醫學對話的醫學信息提取器

MIE: A Medical Information Extractor towards Medical Dialogues

如今,電子病歷已經成為現代醫療的重要組成部分,但是目前書寫電子病歷費時費力,已經成為醫生的沉重負擔。如果能夠從醫療對話中自動地抽取醫學信息,將極大緩解醫生書寫病歷的壓力。

本文提出一個面向醫患對話文本的信息抽取系統,它可以從對話中抽取出症狀、檢查、手術、一般信息及其相應的狀態。這些抽取出的信息將有助於醫生書寫病歷,或者更進一步地應用於病歷的自動生成。研究團隊收集並標註了1120段在線問診的醫患對話作為數據集,採用滑動窗口形式進行標註,和序列標註相比,減緩了標註難度。在此基礎上,針對醫療問診對話文本的特點和難點,提出一種基於深度匹配的神經網絡模型,能夠考慮到對話的多輪結構,利用注意力機制捕捉對話中不同輪次之間的交互信息,從而完善醫學信息的抽取。

圖1:典型的醫學對話窗口和相應的帶注釋的標籤

HyperCore:基於雙曲空間和共現圖表示的 ICD自動編碼

HyperCore: Hyperbolic and Co-graph Representation for Automatic ICD

Coding

國際疾病分類(International Classification of Dieases,ICD)是由世界衛生組織發起的,針對各種疾病做出的國際通用的統一分類方法,這種方法賦予每種疾病一個獨特的編碼。ICD編碼的普及和應用能夠極大促進世界範圍內疾病的信息共享和臨床研究,並對健康狀況研究、保險索賠、發病率和死亡率統計產生積極的影響。

長期以來,ICD編碼一直由專業編碼員人工完成。人工編碼耗時費力,而且非常容易出錯,同時不斷更新 ICD代碼版本會導致代碼數量大幅度增加,對編碼人員的要求越來越高。數據顯示,在美國每年因為編碼錯誤以及用於提升編碼質量的相關成本超過250億美元。

為了緩解人工編碼的問題,一些工作開始嘗試利用機器自動完成 ICD編碼任務。但是現有的方法獨立地預測每個編碼,而忽略了編碼的兩個重要特徵——層級性和共現性。

在本文中,研究團隊提出了使用雙曲空間和共現圖卷積神經網絡針對性地建模上述兩種性質。具體來說,提出了一種雙曲線表示方法來利用編碼的層次結構。此外,提出了一種共現圖卷積網絡來利用編碼的共現性。在國際公開數據集上的實驗取得了最好的效果。

圖2:自動ICD編碼任務的示例

Clinical-Coder:面向中文臨床記錄的 ICD-10自動編碼

Clinical-Coder: Assigning Interpretable ICD-10 Codes to Chinese Clinical Notes

國際疾病分類(ICD)作為世衛組織成員國在衛生統計中共同採用的對疾病進行編碼的標準分類方法,是目前國際上通用的疾病分類方法。目前廣泛使用的國際疾病分類第十次修訂版(簡稱 ICD-10)的編碼數量達到了72,184個,是以前版本(ICD-9)的五倍多。

為了緩解人工編碼耗時、費力、容易出錯的問題,很多工作開始研究利用機器進行自動的 ICD編碼。這些方法雖然取得了很大的成功,但仍然面臨著預測結果可解釋性問題的嚴峻挑戰,可解釋的結果對臨床醫學決策具有重要意義。

針對此問題,並結合中文的語言特點,研究團隊提出了一種基於空洞卷積和N-gram語言模型的ICD自動編碼方法,利用空洞卷積捕獲非嚴格匹配的語義片段證據,利用 N-gram捕獲嚴格匹配的語義片段證據,進而二者聯合使用,共同提升預測結果的可解釋性。實驗結果顯示,該方法不僅能在中文數據集上取得顯著的效果,在國際公開的英文數據集上也有不錯的效果。

圖3:兩種語義片段證據類型-非嚴格匹配和嚴格匹配

值得一提的是,在醫療領域,雲知聲-中科院自動化所語言與知識計算聯合實驗室基於自然語言處理技術構建的醫療知識圖譜已儲備約 50萬醫學概念,超過 169萬醫學術語庫和 398萬醫學關係庫,涵蓋了絕大部分藥品、疾病、科室與檢查,規模達國際領先水準,並在語音病歷,病歷生成、病歷質控、輔助診斷系統等具體應用中發揮了重要支撐作用。

關於 ACL:ACL是自然語言處理領域頂級國際學術會議,由計算語言學學會(Association for Computational Linguistics)主辦,每年舉辦一次。其接收的論文覆蓋了語言模型、句法分析、語義分析、篇章分析等計算語言學基礎研究以及信息抽取、問答系統、對話生成、機器翻譯、自動文摘、情感分析、社會計算等自然語言處理應用研究等眾多方向。第 58屆 ACL年會 ACL 2020原定於 7月 5日-10日在美國華盛頓西雅圖舉行,因疫情影響今年將改為在線會議。

相關焦點

  • 雲知聲-中科院自動化所聯合實驗室獲CCKS2020醫療命名實體識別評測...
    會上公布了CCKS-2020技術評測結果,雲知聲-中科院自動化所語言與知識計算聯合實驗室在「面向中文電子病歷的醫療命名實體識別評測任務」中獲得冠軍,並斬獲該任務唯一技術創新獎。CCKS由中國中文信息學會語言與知識計算專業委員會主辦,是知識圖譜、語義技術、連結數據等領域的核心會議。
  • 中科院自動化所聯合實驗室獲CCKS2020醫療命名實體識別評測冠軍
    會上公布了CCKS-2020技術評測結果,雲知聲-中科院自動化所語言與知識計算聯合實驗室在「面向中文電子病歷的醫療命名實體識別評測任務」中獲得冠軍,並斬獲該任務唯一技術創新獎。CCKS由中國中文信息學會語言與知識計算專業委員會主辦,是知識圖譜、語義技術、連結數據等領域的核心會議。
  • 雲知聲&航空工業瀋陽所「人機語言理解聯合實驗室」落戶廈門
    8月20日,中國航空工業集團公司瀋陽飛機設計研究所&雲知聲「人機語言理解聯合實驗室」成立大會暨人工智慧與航空產業發展高峰論壇在廈門集美湖豪生大酒店召開。,航空工業光電設備研究所副所長朱榮剛,中國航空無線電電子研究所副所長丁勇飛 ,廈門火炬高新區管委會副主任郭清賢,廈門市工信局副局長鄧建華,廈門市科技局副局長黃慰萍,雲知聲創始人/CEO黃偉、副總裁李霄寒,以及其他來自航空院所、企業、學院的領導和嘉賓蒞臨現場,共同見證「人機語言理解聯合實驗室」的成立,交流探討AI與航空產業融合新趨勢、新經驗。
  • 雲知聲&航空工業瀋陽所"人機語言理解聯合實驗室"落戶廈門
    聯合實驗室在廈門掛牌,瀋陽、北京、上海等地聯動,整合南北人才和市場資源,聚焦人才培養和科研成果產業化。之後,雙方將基於人機語言理解、人機混合智能、智能輔助決策等智能化應用開展研發創新。未來,&34;深度融合,為航空系統小型化、輕量化、智能化及智能自主可控提供有力支撐。
  • 出門問問&中科院自動化研究所共建語言智能與人機互動聯合實驗室
    機器之心原創作者:高靜宜3 月 29 日,「語音智能與人機互動聯合實驗室」在北京成立,該實驗室由中國人工智慧公司出門問問與中科院自動化研究所模式識別國家重點實驗室自然語言處理與機器翻譯研究團隊聯合建立,將專注於自然語言理解、多輪對話管理、問答系統、機器翻譯等人機語音交互核心技術研發領域
  • 螞蟻安全實驗室與中科院聯合論文被AAAI-21收錄
    摘要:以創新的雙維度時序建模框架提升交易風險評估效率人工智慧領域的國際頂級學術會議AAAI於近期公布了2021年會議的審稿結果,螞蟻安全天筭實驗室安全專家、安全機器智能團隊成員宋博文(花名千輕)與中科院計算所莊福振副研究員團隊的聯合研究論文《Modeling the Field Value Variations and Field
  • 一窺ACL 2018 最佳論文
    雷鋒網 AI 科技評論按:隨著定於 7 月 15 日的開會日期逐漸臨近,自然語言處理頂會 ACL 2018 繼公開了接收論文名單之後,今天也公布了包含 3 篇長論文 與 2 篇短論文的最佳論文獲獎名單。
  • 螞蟻安全實驗室與中科院聯合論文被AAAI-21收錄—中國經濟網
    摘要:以創新的雙維度時序建模框架提升交易風險評估效率  人工智慧領域的國際頂級學術會議AAAI於近期公布了2021年會議的審稿結果,螞蟻安全天筭實驗室安全專家、安全機器智能團隊成員宋博文(花名千輕)與中科院計算所莊福振副研究員團隊的聯合研究論文《Modeling the Field Value Variations and Field Interactions
  • 度小滿與中科院自動化所聯合培養博士後,布局情感算法
    9月15日,度小滿金融與中國科學院自動化研究所(以下簡稱中科院自動化所)在北京舉辦了「聯合培養博士後項目」啟動儀式。雙方將建立聯合培養博士後人員的管理機制,共同開展人工智慧及相關領域的博士後聯合招收培養,圍繞雙方主要業務科研領域,培養人工智慧領域方面的博士後人才。
  • 度小滿攜手中科院自動化所聯合培養博士後 加碼金融新基建
    來源:金融界網站 9月15日,度小滿金融與中國科學院自動化研究所(以下簡稱中科院自動化所)在北京舉辦了「聯合培養博士後項目」啟動儀式。雙方將建立聯合培養博士後人員的管理機制,共同開展人工智慧及相關領域的博士後聯合招收培養,圍繞雙方主要業務科研領域,培養人工智慧領域方面的博士後人才。
  • 中科院自動化所智能感知與計算研究中心11篇論文被CVPR接收 | CVPR...
    雷鋒網(公眾號:雷鋒網) AI 科技評論按:本文作者郭瑞娥,首發於中科院自動化所不論你是論文錄用作者,還是即將參會的企業機構,歡迎聯繫 AI 科技評論小編(微信號:aitechreview)報導/合作喲。智能感知與計算研究中心為中科院自動化所獨立建制的科研部門,致力於研究泛在智能感知理論與技術以及與之相伴的海量感知數據的智能分析與處理。智能感知與計算研究中心在今年的 CVPR 2018 上共有 11 篇論文被接收,再次創下歷史新高。
  • 填補人工智慧人才缺口,度小滿攜手中科院自動化所聯合培養博士後
    同天上午,作為百度AI生態率先畢業的度小滿金融,與中國科學院自動化研究所(以下簡稱中科院自動化所)在北京舉辦了一場以人工智慧人才培養為主題的籤約儀式,雙方將建立聯合培養博士後人員的管理機制,為博士後人員提供面向人工智慧領域的科研與實戰環境,共同探索人工智慧技術在金融領域的前沿應用,促進科技創新成果轉化。
  • 清華大學人工智慧研究院知識中心成立儀式隆重舉行,發布知識計算...
    中國中文信息學會語言與知識計算專委會主任。研究方向為知識工程、語義 Web 和文本挖掘。近年來在重要國際會議和學術期刊上發表論文 100 餘篇,編著出版《Mining User Generated Content》,《Semantic Mining in Social Networks》。主持國家自然科學基金重點課題、歐盟第七合作框架等多項國家、國際和部委項目。
  • 7 Papers & Radios | ACL 2020獲獎論文;貝葉斯深度學習綜述
    而在另一項用戶調查中,使用 CheckList 的 NLP 從業者創建的測試數量是未使用 CheckList 的兩倍,發現的 bug 數量是後者的三倍 。商業情感分析模型的 Checklist。情感分析測試。用戶研究結果。推薦:本文斬獲 ACL 2020 最佳論文獎。
  • 華為首發全生命周期知識計算解決方案,讓鋼企一年省2000萬
    張鈸院士指出,在人工智慧頂級國際會議 IJCAI 上,關於深度學習的論文只佔全部論文的 1/3,其中 60% 的論文來自中國;而另外 2/ 3 的關於知識表示、知識推理等的論文中,則幾乎沒有來自中國的論文。業界致力於知識計算的公司也是寥寥無幾。但華為雲提前邁出了關鍵一步,2018 年就提出了行業 AI 的落地理念,致力於企業知識圖譜和知識計算平臺的構建。
  • ACL 2020 清華大學 THUNLP 系列解讀
    清華大學自然語言處理實驗室(THUNLP)由孫茂松教授領導,主要從事中文信息處理、社會計算和知識圖譜研究,實驗室 「二劉老師」(劉洋、劉知遠)是我國NLP領域的青年代表,劉洋教授在機器翻譯領域造詣頗深,劉知遠副教授則聚焦語言理解與知識計算
  • 報名丨中關村火花系列活動——中科院自動化所成果項目路演
    北京中自投資管理有限公司是中科院自動化所下屬成果轉化服務機構,是中關村管委會2019年認定的技術轉移服務平臺。本次活動由北京中自投資管理有限公司與中關村技術經理人協會聯合主辦,旨在推動自動化所待轉化項目尋找落地場景,推動開展投融資對接,促進成果轉化落地發展。
  • ...知識計算解決方案,讓鋼企一年省2000萬,合金成分預測精準度超 95%
    張鈸院士指出,在人工智慧頂級國際會議 IJCAI 上,關於深度學習的論文只佔全部論文的 1/3,其中 60% 的論文來自中國;而另外 2/ 3 的關於知識表示、知識推理等的論文中,則幾乎沒有來自中國的論文。業界致力於知識計算的公司也是寥寥無幾。
  • 中科院海洋所與獐子島漁業召開聯合實驗室年會
    中科院海洋所與獐子島漁業召開聯合實驗室年會2012-03-07 11:42:00  水產養殖網  出處:獐子島        瀏覽量: 1842 次 我要評論 &nbsp&nbsp&nbsp&nbsp3月4日,中科院海洋所與獐子島漁業在青島召開海洋生態養殖聯合實驗室
  • ACL 2019 27 篇論文實現代碼(持續更新中)
    ACL 2019 共接收了 765 篇論文,目前官網已經全部公布了,官方連結:http://www.acl2019.org/EN/program/papers.xhtml但是官網沒有公布連結,部分論文也沒有展示出來。所以AI研習社給大家整理了343篇論文,供大家學習!