來源 | AI前線 作者 | 劉暉
知識圖譜作為人工智慧的重要研究領域,其核心理念可追溯到第一次人工智慧浪潮。但直至進入人工智慧下半場,當具備能理解、會思考、可解釋等特徵的認知智能成為突破自身天花板的關鍵,知識圖譜才得以蓬勃發展。近年來,知識圖譜技術熱度不減,作為實現認知智能的核心驅動力,已廣泛應用在金融、電商、醫療、政務等諸多領域。
知識圖譜究竟能解決哪些問題、應用在哪些場景?其技術架構如何發展演變?又將如何支撐實現認知智能的終極目標?成為技術圈熱議的焦點。
InfoQ 基於對知識圖譜技術生態的深刻觀察,重磅發布《知識圖譜:打破人工智慧的認知天花板》研究報告。帶您探索知識圖譜如何實現機器的辨識、思考與主動學習,梳理知識圖譜技術體系與產業鏈結構,剖析實現認知智能的技術挑戰與發展趨勢,探求知識圖譜將如何打破人工智慧的認知天花板。
兩個認識維度
知識圖譜是實現人工智慧從「感知」躍升到「認知」的基礎。本質上,知識圖譜是一種由關聯性知識組成的網狀知識結構,對機器而言表現為圖譜,其形成過程即建立對行業或領域的理解和認知,擁有規範的層次結構和強大的知識表示能力。
具體來說,在內容維度,知識圖譜是一種表達規範、關聯性強的高質量數據表示;在技術維度,知識圖譜可解釋為一種使用圖結構描述知識和建模萬物關聯關係的技術方法。
圖 從數據到認知智能(資料來源:InfoQ 研究院)
三個價值特徵
在知識圖譜的價值維度,首先,當人工智慧進入以場景為牽引的深度應用階段,數據治理需要基於業務戰略高度進行邏輯性的存儲和應用,而知識圖譜有助於實現業務戰略高度的行業數據治理;其次,知識圖譜實現了基於語義連接的知識融合和可解釋性,成為人類思維與機器路徑思維的轉換器;最後,知識圖譜藉助概念上下位關係、屬性類型及約束、圖模型實體間關聯關係,結合業務場景定義的關係推理規則,實現了對推理和決策的有力支撐,使其在更多領域得以廣泛應用。
知識圖譜技術體系
知識圖譜的構建是一項龐大而複雜的工程,不僅需要算法模型的持續優化,更需要持續的知識運營以及工程系統的搭建,最終形成知識網絡並得以應用。從知識圖譜的構建技術來看,主要包含知識圖譜表示、知識存儲、知識抽取、知識融合、知識推理等關鍵組成部分。在其發展演進過程中,經歷了從人工群體智慧構建到自動獲取構建的轉變,知識圖譜與深度學習的融合成為重要發展方向。
圖 知識圖譜的構建技術體系(資料來源:InfoQ 研究院)
產業鏈結構
從知識圖譜的產業鏈結構來看,知識圖譜上遊產業涉及數據採集標註、雲服務、硬體資源、資料庫等數據和技術支撐,第三方數據服務商通過數據採集、標註旨為構建知識圖譜提供規範、豐富、持續更新的原始數據資源池。
中遊從事知識圖譜的設計與構建,以應用場景為導向,設計知識圖譜的表達方式和粒度,包括提供用於知識圖譜分析、應用的各類套件工具及解決方案,並通過知識抽取、知識融合、知識補全與推理、知識檢索與分析等環節構建完成。
下遊知識圖譜的應用正由大規模、簡單場景,向小規模、複雜場景轉變。智能搜索、智能推薦、智能出行等大規模、簡單知識應用、單一應用模式的場景逐漸成熟,知識圖譜開始在金融、能源、工業、醫療等數據資源有限、知識深度應用的複雜場景發揮關鍵作用。
圖 知識圖譜產業鏈結構(資料來源:InfoQ 研究院)
技術挑戰與發展趨勢
當前,知識圖譜的主要技術挑戰在於缺失多元知識來源和表示形式帶來的推理能力不足,以及欠缺具備深度知識的行業知識圖譜快速工業化能力。關於未來發展趨勢,一方面,伴隨應用場景不斷深入專業領域,知識圖譜將從知識服務延伸至深層決策和預測服務,成為構建商業決策類、預測類應用的底層關鍵技術;另一方面,場景驅動下的知識圖譜技術生態將呈現系統化發展趨勢,與知識表示、自然語言處理、機器學習、圖資料庫、多媒體處理等關聯技術相互融合,深度賦能應用場景。