騰訊天衍實驗室斬獲CCKS2020試驗裝備NER任務冠軍

2020-12-11 CIO時代網

騰訊天衍實驗室斬獲CCKS2020試驗裝備NER任務冠軍

騰訊天衍實驗室斬獲CCKS2020試驗裝備NER任務冠軍

2020-11-16 16:17:46  來源:網際網路搶沙發

2020-11-16 16:17:46  來源:網際網路

摘要:

科技是提升醫療服務能力的有效手段,許多知名機構和科研工作者們長期致力於技術研究,並展現出應有的實力。

關鍵詞: 騰訊
      聚焦CCKS2020 騰訊天衍實驗室致力於大數據推動醫療應用

科技是提升醫療服務能力的有效手段,許多知名機構和科研工作者們長期致力於技術研究,並展現出應有的實力。近日,第十四屆全國知識圖譜與語義計算大會(CCKS2020)舉辦的知識圖譜與語義計算技術評測競賽結果公布,騰訊天衍實驗室從213支參賽隊伍中脫穎而出,斬獲試驗裝備鑑定領域實體抽取(NER)任務冠軍,體現了在實體抽取和知識圖譜領域的技術實力。

  (圖:CCKS 2020大會官網)

針對性數據與模型設計 奪得NER任務冠軍

第十四屆全國知識圖譜與語義計算大會由中國中文信息學會語言與知識計算專業委員會主辦,已經成為國內知識圖譜、語義技術、連結數據等領域的核心學術會議,聚集了自然語言理解、知識獲取、智能問答、圖資料庫等相關技術領域的研究人員和學者。CCKS技術評測則旨在為研究人員提供測試知識圖譜與語義計算技術、算法、及系統的平臺和資源,促進國內知識圖譜領域的技術發展。針對此次大會,CCKS 2020技術評測共設立8個相關主題評測任務,包含新冠知識圖譜構建與問答、面向中文電子病歷的醫療實體及事件抽取,面向試驗鑑定的命名實體識別等,吸引了眾多知名企業和高校的踴躍參與。在面向試驗鑑定的命名實體識別的主題評測任務中,騰訊天衍實驗室奪得冠軍。

  (圖:面向試驗鑑定的命名實體識別評測獲獎名次)

何為命名實體識別?簡言之,如何從海量的文本或網頁的原始數據中提取有價值的信息是行業知識圖譜構建的關鍵因素,信息抽取(Information Extraction,IE)作為自然語言處理技術的任務,重點在於從機器可讀取的非結構化或半結構化的文本中抽取信息,而命名實體識別(NER)則是IE任務的核心和基礎技術,旨在從文本中查找每個提及的命名實體並標記其類型。相比於通用領域NER任務,此次競賽任務由於試驗目的不同、被試對象有著自身較為特殊的語言形式,對NER任務帶來了全新的挑戰:一方面,試驗鑑定領域的可用標註語料稀少,訓練集只有400條;另一方面,實體類別間語義複雜度較高,需要依賴專業領域知識和準確的上下文理解。

針對此次實體識別任務,騰訊天衍實驗室全面識別任務特點,從數據和模型層面進行針對性的設計。首先,針對訓練數據樣本較少且樣本序列長度較長的問題設計了一種基於動態規劃的文本分割方法,將較長樣本分割為多個樣本,同時在切割時使得保留最多原始文本信息的前提下冗餘數據最少。其次,在模型層面上,基於樣本上下文依賴較強且位置關係明顯的特點,在輸入層把領域分詞信息融合到模型中,並且針對性的選取TENER、RTransfomer作為編碼器;編碼器的輸出結合CRF做實體的序列標註,針對模型輸出的結果進行融合和詞典矯正,最終結果為F值0.72128,奪得該賽道冠軍。

持續創新輸出技術實力 加速醫療科研領域落地應用

獲此成績非一朝一夕,在此之前,騰訊天衍實驗室就在日常的業務中把實驗室長期積累的相關技術落地到醫療領域的多個場景中,並且在實踐應用中進一步夯實技術實力。

比如疫情期間,騰訊天衍實驗室基於騰訊健康小程序推出的患者同小區查詢助手極大的方便了用戶查詢同小區患者信息,疫情智能問答助手則可以7*24小時解答用戶關於疫情的相關問題助力公眾科學防疫抗疫,累積服務用戶2000萬查詢人次。兩個智能助手應用到的核心技術之一就是NER技術,通過NER技術從無結構化文本中抽取相關實體並結合關係分類快速構建精準圖譜,從而支撐上層各項智能化應用。

具體來說,患者同小區查詢助手,主要利用NER技術從官方公布的患者信息文件中抽取出關鍵實體並構建患者畫像圖譜,從而實現患者同小區智能查詢的各項功能。對於疫情問答工具,則主要基於衛健委、醫院等公布的文檔,利用NER技術從中抽取治療、診斷、藥物、地區等相關實體,基於這些實體快速構建新冠肺炎相關的知識圖譜,利用知識圖譜支撐用戶問答服務,從而提高問答的準確性和智能性。

  NER為核心技術的疫情工具圖譜構建流程

騰訊天衍實驗室致力於長期在自然語言基礎能力、語言理解、信息抽取、知識圖譜構建等進行研究創新,並將成果運用到落地的醫療自然語言等場景,目前已構建醫療行業大規模知識圖譜,支持了數百家醫院的輔診、導診、疾病輔助診斷、智能用藥等產品,助力醫保、醫院、疾控中心和其他醫療機構的智能化知識挖掘和管理難題,實現知識化轉型。

在醫療健康領域,騰訊天衍實驗室專注於AI算法研究及落地,旨在依託NLP、知識圖譜、大數據、醫療影像等技術系統,將算法能力輸出到騰訊健康小程序、QQ瀏覽器、微信搜一搜等終端應用。與此同時,騰訊天衍實驗室還與鍾南山院士以及復旦腫瘤醫院等頭部醫院建立聯合實驗室,與牛津大學、蒙特婁大學、天津大學、微眾銀行AI部門等單位建立長期科研合作關係,目前已發表包括NIPS、KDD等多篇頂級學術論文,通過聯合社會各界進行技術深入研究,騰訊天衍實驗室將進一步加速科研應用落地,以服務於臨床應用。

第三十屆CIO班招生 法國布雷斯特商學院碩士班招生 北達軟EXIN網絡空間與IT安全基礎認證培訓 北達軟EXIN DevOps Professional認證培訓

責編:chenjian

相關焦點

  • 讓機器「讀懂」醫療 天衍實驗室獲CHIP2020評測兩大獎項
    日前,第六屆中國健康信息處理大會(CHIP 2020)舉辦的中文醫學信息處理評測競賽圓滿結賽,騰訊天衍實驗室依託其在醫學領域的長期技術積累和創新探索,一舉獲得「中文醫學文本命名實體識別」賽道冠軍、「中文醫學文本實體關係抽取」賽道亞軍。
  • 騰訊天衍實驗室奪世界機器人大賽「雙冠」
    日前,「2020世界機器人大賽-BCI腦控機器人大賽」公布成績,騰訊天衍實驗室和天津大學高忠科教授團隊組成的C2Mind戰隊,經過多輪賽程的激烈比拼,入圍BCI(Brain-computer interface,腦-機接口)腦控機器人大賽「運動想像範式」賽題決賽,最終成功斬獲技術賽
  • 騰訊天衍實驗室奪世界機器人大賽雙冠軍
    雷鋒網消息,日前,「2020世界機器人大賽-BCI腦控機器人大賽」公布成績,騰訊天衍實驗室和天津大學組成的C2Mind戰隊,入圍BCI腦控機器人大賽「運動想像範式」賽題決賽,最終斬獲技術賽「顳葉腦機組」一等獎,以及技術錦標賽「顳葉腦機有訓練集一等獎」兩項冠軍。
  • 騰訊天衍實驗室奪2020世界機器人大賽-BCI腦控機器人大賽雙冠軍
    打開APP 騰訊天衍實驗室奪2020世界機器人大賽-BCI腦控機器人大賽雙冠軍 IoT科技評論 發表於 2020-12-24 14:02:05
  • 騰訊天衍實驗室奪世界機器人大賽雙冠軍 運動想像算法應用場景廣泛
    原標題:騰訊天衍實驗室奪世界機器人大賽雙冠軍,新算法突破BCI瓶頸日前,「2020世界機器人大賽-BCI腦控機器人大賽」公布成績,騰訊天衍實驗室和天津大學高忠科教授團隊組成的C2Mind戰隊,經過多輪賽程的激烈比拼,實力入圍BCI腦控機器人大賽「運動想像範式」賽題決賽,最終成功斬獲技術賽「顳葉腦機組」一等獎,以及技術錦標賽「
  • 零氪科技斬獲CHIP2020關係抽取、術語標準化2項冠軍
    醫療科技企業零氪科技在中國健康信息處理大會(CHIP 2020)上奪得2個冠軍、2個季軍!CHIP2020 是中國中文信息學會(CIPS)醫療健康與生物信息處理專業委員會主辦的關於醫療、健康和生物信息處理和數據挖掘等技術的年度會議,是中國健康信息處理領域最重要的學術會議之一,會議聚焦「數據和知識驅動的醫療AI」,聚集全國頂尖的醫療信息處理學者與醫療專家。
  • 雲知聲-中科院自動化所聯合實驗室獲CCKS2020醫療命名實體識別評測...
    日前,第十四屆全國知識圖譜與語義計算大會(CCKS-2020)在南昌召開。會上公布了CCKS-2020技術評測結果,雲知聲-中科院自動化所語言與知識計算聯合實驗室在「面向中文電子病歷的醫療命名實體識別評測任務」中獲得冠軍,並斬獲該任務唯一技術創新獎。
  • 騰訊《2021數字科技前沿應用趨勢》:網際網路下一站,在星辰大海
    騰訊研究院主辦的「2021騰訊科技向善暨數字未來大會」上發布了這樣一份報告:《2021數字科技前沿應用趨勢》(以下簡稱報告)。該報告由騰訊研究院和騰訊14大實驗室聯合發布,逐一訪談了騰訊公司AI Lab、多媒體實驗室、地圖平臺部、反病毒實驗室、科恩實驗室、量子實驗室、Robotics X實驗室、騰訊雲區塊鏈、天衍實驗室、未來網絡實驗室、希波實驗室、雲鼎實驗室、優圖實驗室、自動駕駛實驗室的負責人和科學家,並得到了原國家信息化專家諮詢委員會常務副主任周宏仁,中國工程院鄔賀銓院士、中國工程院李伯虎院士的指導。
  • 騰訊數平精準推薦 | 橫掃ICDAR 2019,斬獲七項冠軍
    騰訊數平精準推薦團隊(Data Platform Precision Recommendation, Tencent-DPPR)在本屆比賽中斬獲7項冠軍,成績遙遙領先其他參賽隊伍。這也是繼2017年團隊勇奪4項官方認證冠軍後再創佳績,同時也標誌著騰訊OCR技術穩居國際第一流水準。
  • 智聯測試 築夢軍工——2020軍工裝備試驗與測試技術交流年會在西安...
    中國經濟周刊一經濟網訊 11月5~6日,2020軍工裝備試驗與測試技術交流年會在西安隆重召開。本次年會由國防科技工業自動化測試創新中心、中國航空工業技術裝備工程協會、中國飛行試驗研究院院士工作站、航空工業測控技術發展中心、中國航空學會測試技術分會、飛行試驗測試航空科技重點實驗室主辦,中國飛行試驗研究院、航空工業北京長城航空測控技術研究所承辦,《測控技術》雜誌社、《中國測試》雜誌社、狀態監測特種傳感技術航空科技重點實驗室、飛行仿真航空科技重點實驗室參與協辦。
  • 海軍畢昇艦新武器裝備試驗記事:曾處置飛彈卡彈
    作為中國海軍專門設計的第一艘裝備試驗艦,以活字印刷術發明者名字命名的畢昇艦堪稱中國承受風險最大的軍艦——各種新型艦載武器要先在畢昇艦上試驗首發成功後,才能正式列裝作戰艦艇,一年出海200餘天,每一次都是生死考量。這,是一份勇敢者的事業。北緯26度的海水,畢昇艦首任艦長趙萬和艦員們至今印象深刻。那次,像往常一樣,畢昇艦解纜遠航,執行某新型艦載武器發射任務。
  • 深海載人裝備國家重點實驗室牽頭研製的「奮鬥者」號全海深載人...
    近日,「奮鬥者」號全海深載人潛水器圓滿完成萬米海試任務,順利返航抵達三亞。中共中央總書記、國家主席、中央軍委主席習近平發來賀信,致以熱烈的祝賀,向所有致力於深海裝備研發、深淵科學研究的科研工作者致以誠摯的問候。
  • 深蘭科技斬獲CCKS2020三冠,實力助推知識圖譜、語義計算發展
    11月12~15日,國內知識圖譜和語義計算等領域的核心學術會議CCKS2020,在江西南昌成功舉行,深蘭科技DeepBlueAI團隊首次參加即斬獲三冠一亞,成為本屆會議唯一獲得多個冠軍的隊伍。
  • 騰訊A*0*E聯合戰隊斬獲DEF CON CTF 2020決賽冠軍 刷新中國戰隊新...
    北京時間8月10日早晨,2020 DEF CON CTF全球總決賽正式落下帷幕。由於疫情原因,今年的DEF CON CTF總決賽改為線上比賽,在經歷了三天三夜的鏖戰之後,騰訊A*0*E聯合戰隊以970分的成績從16戰隊中脫穎而出,斬獲全球頂級CTF賽事總冠軍,刷新了中國戰隊在DEF CON CTF的最好記錄。DEF CON CTF是網絡安全領域公認最知名、最具影響力的網絡安全技術競賽。
  • 騰訊安全戰隊斬獲「護網杯」雙料冠軍!包攬2018國內三大安全賽事冠軍
    科技快報以騰訊安全科恩實驗室為主力聯合騰訊多個部門組成的騰訊安全戰隊,從來自中央企業、基礎電信企業、網際網路企業、工業網際網路企業、高校等近3000支戰隊中脫穎而出,斬獲整體賽事的一等獎和單項賽的第一名,成為本屆「護網杯」的雙料冠軍。科技快報
  • 海南電網與中國電器研究院籤署了智能電網裝備適應性實驗室共建協議
    打開APP 海南電網與中國電器研究院籤署了智能電網裝備適應性實驗室共建協議 王祝華 發表於 2020-01-13 10:13:59
  • 騰訊傑出科學家 領銜未來實驗室
    【深圳商報訊】(記者 陳姝)1月8日,騰訊宣布,騰訊Robotics X實驗室及騰訊AI Lab負責人張正友博士,成為騰訊首位17級研究員/傑出科學家,17級是騰訊最高專業職級。 張正友領導創建了世界領先的機器人實驗室Robotics X,並致力推進人機協作的下一代機器人研究。
  • 國內最大海洋石油水下裝備試驗中心落成
    工人日報客戶端12月26日電 近日,國內最大海洋石油水下裝備測試試驗中心在山東省東營市落成並投產,對解決海洋工程水下裝備在國產化過程中的「卡脖子」問題,打破國外的專利壟斷和技術封鎖,實現科技強國戰略目標具有重要的意義。
  • 天津大學自動化學院高忠科教授團隊在2020世界機器人大賽獲得雙冠軍
    本站訊(通訊員 趙啟慧)近日,2020世界機器人大賽-BCI腦控機器人大賽公布成績,天津大學自動化學院高忠科教授團隊和騰訊天衍實驗室組成的C2Mind戰隊,入圍BCI腦控機器人大賽決賽,最終斬獲技術賽「顳葉腦機組」一等獎,