據悉2018年全國知識圖譜和語義計算大會將於2018年8月14日至8月17日在天津召開,會議前期CCKS系列評測任務早已拉開帷幕,睿至大數據控股子公司睿力科技公司(英文簡稱Keenpower)憑藉出色的專業能力在任務四——「開放領域的中文問答」中,拔得頭籌。
CCKS系列評測旨在為研究人員提供測試知識圖譜與語義計算技術、算法、及系統的平臺和資源,促進國內知識圖譜領域的技術發展,以及學術成果與產業需求的融合和對接,CCKS 2018共設立4個相關主題評測任務,分別是:面向中文電子病歷的命名實體識別、面向音樂領域的命令理解、智能客服問句匹配以及開放領域的中文問答。
本次睿力科技所參與的是「開放領域的中文問答」。該任務基於開放領域知識庫的中文問答,簡稱COQA (Chinese Open-domain Question Answering)。即對於給定的一句中文問題,問答系統從給定知識庫中選擇若干實體或屬性值作為該問題的答案。問題均為客觀事實型,不包含主觀因素。理解並回答問題的過程中可能需要進行實體識別、關係抽取等子任務。這些子任務的訓練可以使用額外的資源,但是最終的答案必須來自給定的知識庫。
據專業人士解答,該測評任務比較的是從人類語言文字到現實世界實體映射的準確度,是知識圖譜的基礎性任務。
本次測評任務所面向的問題域屬於問題域——搜索意圖準確度提高問題,整個業界尤其是在企業領域進行搜索大都是通過基於搜尋引擎進行實現,傳統做法在搜索精度上難以有效提升,尤其是針對句子的搜索準確度更低。
「知識圖譜技術」作為人工智慧技術的核心技術之一,可以解決從語言文字到現實世界實體的映射、基於實體關聯關係的推理與分析。基於知識圖譜技術,可以為司法、電商、網際網路金融、公安、國安、城管等行業提供精準化的搜索、個性化的推薦、面向自然語言的智能問答、案卷自動編寫、趨勢預測與研判等服務。
睿力科技作為本次任務的冠軍,長期專注於挖掘數據內部的深度關係,採用知識圖譜、深度學習等手段構造了一體化的數據分析平臺,並創造性的將雲計算、圖計算、流計算等多樣化的計算方式融於一體,打造了擁有自主智慧財產權的「數據云圖」產品,幫助客戶深入挖掘數據價值,實現數據「激活」。
本次測評中,睿力科技團隊綜合運營CNN神經網絡、文本相似度計算等技術,有效提升了從語言文字到現實世界實體的映射準確度問題。
目前該測評任務已經結束,在目前的比賽結果排名中,睿力科技團隊獲得測評比賽的第一名。
北京睿至大數據有限公司作為企業數位化轉型戰略級夥伴,致力打造中國卓越的雲計算及大數據運營商。睿至大數據以「客戶需求」為先,秉承「極致創新」理念,專注於雲計算、大數據與智慧城市等領域的創新研究與行業實踐。
2014年成立以來,實現了跨越式發展:以產業前瞻研究和行業深度理解為雙引擎,基於雲計算、大數據等先進技術形成了貫穿企業數位化轉型生命周期的「全棧式」產品及解決方案,包括IT戰略諮詢、規劃、設計、實施、運營與商業模式創新等,目前,政府、能源、金融、電信、醫療和教育等行業客戶已與睿至大數據開展深入的合作。