2015年全年,中國大數據項目規模超過100億,預計到2020年中國企業級大數據市場應用規模將突破200億元,其中私有數據的市場規模佔大部分,私有數據無疑是大數據挖掘領域的紅海;但是,因私有數據私有性,連接性差、流通壁壘高等特點,相較於公開數據,對私有數據進行挖掘後的價值增值空間並不明顯。
這是大數據產品平臺天眼查聯合國際數據挖掘協會中國分會(KDD China)舉辦的2016大數據論壇上透露的信息。
大數據按照訪問權限劃分,可分為私有數據和公開數據。談到大數據的價值問題,一般觀點認為那些被特殊權限包裹起來的,不是每個人都能夠自由訪問調用的數據才具有價值,例如銀行交易記錄、抵押信息、醫療數據、通訊數據、電商交易數據等。因為「物以稀為貴」,私有數據具有天然的高價值屬性,因此,大量機構和企業在大數據領域都聚焦於私有數據的價值挖掘,比如醫療領域的拍醫拍、電商領域的百分點。
而與私有數據不同,公開數據是指每個人都能夠訪問的數據,具有公開、透明、種類繁多等特徵。人們日常生活中隨處可接觸到的諸如行政處罰信息、土地出讓公示、法院公告、新聞、外匯交易信息、股票交易信息、商標公示信息、專利公示、域名備案、水質量、城市汙染查詢、災害預警、航班動態等,都是公開數據,但卻較少人關注其價值,較少有機構能夠有挖掘其價值的技術能力,因此價值挖掘空間大。
「可以說,公開數據的價值增長空間,比私有數據更大。」天眼查創始人、董事長,國家「千人計劃」專家柳超指出。
KDD CHINA主席、香港科技大學計算機系主任楊強教授則認為,少量公開數據的獲取難度不大,但是真正對於商業決策有幫助的大量公開數據的收集難度是很大的,搜索、整理、挖掘、呈現出其中的關聯關係,並呈現出一個具象化的結果,這個難度就更大,所以我們需要一個更加高效、直接的方法幫助我們把雜亂的信息轉換為決策支持。
而柳超研發的天眼查,就是一個以公開數據為切入點,以關係為核心的數據產品平臺。目前,天眼查已經構建了完整的、集數據採集、數據清洗、數據聚合、數據建模、數據產品化為一體的公開大數據解決方案,針對政府機關、金融機構、律師事務所、傳媒機構等多個領域提出大數據解決方案。
在此次論壇上,天眼查還與KDD發布了聯合學術計劃,由天眼查提供業界最前沿的工業技術和實戰經驗,KDD提供最前沿的學術研究視野,共同發力公開數據的商業未來。
「像天眼查這樣的大數據分析公司,他們都面臨著一個問題,怎麼去創造它的商業價值?」第一財經傳媒有限公司CEO周健工認為,公開數據到目前為止最成功的公司就在媒體行業,「彭博用全世界各種各樣交易所公開的交易數據匯集在自己的終端裡面,首先它給你提供數據,在數據基礎上給你提供各種各樣分析的工具,甚至可以為一些金融機構,比如一個債券交易,衍生品交易,甚至是一個電商,設計一個各種各樣交易的策略,我認為這是公開數據領域最成功的一個商業機構。」