36氪獲悉,7月11日,「極驗」舉行Graph Learning 創新大會暨極驗 2019 圖數據建模平臺發布會,並發布新產品——圖數據建模平臺。
36氪曾多次報導極驗。極驗成立於 2012 年,是一家驗證安全技術服務提供商。36氪曾報導,極驗的核心產品為是一款嵌入 PC 端或移動端登陸頁的驗證滑塊,用來取代傳統的輸入型驗證碼。背後的技術支持包括用戶的生物特徵,比如滑鼠移動軌跡等行為軌跡的分析,結合動態更新的資料庫和全網聯防技術,在 SaaS 後臺,極驗也為網站提供實時的數據分析和預警功能。
本次發布的新產品圖數據建模平臺,是極驗在圖數據建模領域探索數年後,研發的一套符合建模需求的底層數據引擎,支持企業級圖數據深度學習建模,企業能夠一站式完成建模操作。
圖數據是什麼?在企業紛紛線上化,做數位化轉型的時期,會產生大量數據。對於不少AI公司通過深度學習來訓練神經網絡而言,大量的數據是必要的,但對於更多的具有特定關係的關係數據,現在的挖掘則很少,比如對於社交網絡中的關係,則適合用圖數據來表達,因為圖數據可以囊括裡面的節點(社交帳號、帖子),以及用戶間的關係(關注、轉發)等。
另外,應用圖數據來做深度學習,能夠做到端對端的自動學習,以往的深度學習很多還是靠手工規則來提取,像這類人工環節就可以省去,提高企業從系統底層搭建數據平臺的效率。
在技術架構方面,疊圖技術框架的核心包括中間三層,分別存儲層、操作層和建模層。
存儲層與操作層合稱為圖存儲引擎,主要完成對圖數據分布式存儲以及圖數據操作的抽象接口。在這一層的設計上,極驗圍繞圖分區、圖數據的結構設計與存儲,以及整個數據系統的索引設計與優化來做了大量開發工作,以支撐上層數據操作的高效性,比如隨機遊走、子圖採樣等。
而在落地場景場面,極驗圖建模平臺可以適用於風控和營銷兩大類業務場景。
以車險反欺詐為例,一起車輛事故的數據有很多,車輛損傷數據就包括褶皺、凹陷、開裂、擦傷等等;另外還有車輛屬性信息,來自不同的廠商,不同的年份,版本也不相同。這些數據之間存在著複雜關係,比如當車輛的發動機損壞的時候,往往也會伴隨著其他的零配件損壞。通過建立車險理賠的圖,利用圖神經網絡,可以很好的發現一些風險模式,比如線上風險、二手車風險、人傷碰瓷、理賠人員問題等等。
疊圖集成了大規模圖數據分布式建模能力,以 Web 端提供服務,企業可以直接上手使用,不需要專家也可以進行建模,降低了建模門檻。其次,極驗將整個建模流程固化到平臺上,後期模型的維護成本也大大降低。
在性能方面,極驗圖數據建模平臺完成百萬節點構圖需要的時間不到20秒。而對於 1 億節點,5 億邊規模的數據,極驗在 10 個 worker 上的構圖時間只需要 150 秒。在讀取性能上,極驗可將子圖採樣的時間控制在 100 毫秒以下,顯卡不會出現計算延時。
對於未來的發展方向,極驗表示,除了風控和營銷外,醫學藥物挖掘、圖像識別、智慧城市等研究方向,也有圖技術的發展空間;另外,近年來頗為流行的技術中臺、數據中臺等概念,疊圖也可以從數據的關聯度出發,將各類數據進行整合建模,提升中臺的建設效率。