從公安大數據業務切入,挖掘更多數據價值:明略數據完成 2 億元 B...

2021-01-08 36kr

大數據概念在國內炒的過熱,落地大數據應用的產品並不多。原因一方面在於底層數據的非結構化存儲,數據挖掘技術難度大;另一方面在於數據挖掘多樣化模型建立的技術難度。從it時代到DT時代,大家都在談大數據概念而無法落地,而一旦系統應用到具體場景,完成大量非結構化的數據存儲和挖掘的工作,大數據領域可能是座金礦。

36氪近日獲悉,大數據應用公司明略數據已經完成B輪2億元人民幣融資,大數據應用作為一個剛剛興起的領域,這筆融資規模已經較為可觀。這輪融資由紅杉資本中國基金領投,分享投資、任子行(A股上市公司)和A輪投資人矽谷天堂共同參與,資金主要用於產品的優化和機器學習上的實踐。

公司的主要業務是對大規模的數據進行處理,比如數據治理、數據分析和數據關聯關係挖掘等。前期主要通過對公安、金融、稅務、工業等幾個領域進行定製化的數據服務。比如針對公安機構的需求,利用數據間的聯繫,尋找破案線索,完成對犯罪嫌疑人的甄別、布控及相關情報工作,金融系統則可運用在風控和金融風險預警上。

相對來說,對於大數據領域的應用挖掘很多還只能停留在結構化數據的處理,明略數據實現了不同資料庫的非結構化清洗和易購化處理,再進行分布式和關聯性的挖掘。

通過前期和各個領域服務的數據模型和業務沉澱,明略數據目前已經開發出相應的大數據存儲和挖掘系統,為企業提供平臺化的服務。主要三大產品分別是:MDP大數據安全平臺,DataInsight分布式大數據挖掘平臺,以及SCOPA大數據關聯關係挖掘系統。

其中MDP大數據安全平臺主要是幫助客戶存儲海量數據,並提供高性能計算框架,和細粒度權限控制的安全保障。大數據平臺目前已有不少開源系統,但在可用性上相對較低,而明略數據的大數據平臺,通過了工信部數據產品測試,實現平臺上數據的相對「高可用」。

分布式大數據挖掘平臺DataInsight,則提供對海量並行數據挖掘的功能,實現單機版應用場景中的可並行數據計算。SCOPA系統則是對於數據關聯關係的挖掘,對於顯性的數據進行隱形的挖掘。比如在公安領域,則可對犯罪的線索進行追蹤,幫助公安機關進行破案。在金融領域,則可實現對金融欺詐、內幕交易的預警等等。系統的價值在於對不同的應用場景,進行不同的功能輸出。

創始人吳明輝早先創業建立大數據監測系統「秒針」,在14年開始側重大數據挖掘業務拓展,並創立明略數據。

針對國內大數據的應用情況,吳明輝認為,目前政府和企業的數據大都還停留在非結構化的階段,企業或政府本身對數據的應用程度較低,但這正是公司的機會。明略數據通過對非結構的數據進行易構化處理,在不同的資料庫中,把數據進行整理和清洗,在進行挖掘和應用工作。

和美國大數據公司FBI的運用場景一樣,中國大數據的應用首先開始於公安系統。由於傳統的IT軟體和設備已經無法處理龐大的數據,而明略數據的需要做的,就是針對公安機關的不同部門和不同需求提供定製化的服務。據公司介紹,明略數據目前服務的公安機構有省市一級的,運算能力在PB級以上。

數據的安全性對於企業和機構尤為重要,明略數據在安全上的做法是:

  1)服務模式上,主要通過企業的私有雲上做數據處理,並不會脫離物理領域;

  2)在流程上,和企業籤訂保密協議,制定嚴格的保密制度,在具體的政府業務中,還需通過政審;

  3)在技術上,主要通過對數據進行脫敏處理,數據的處理也可實現審計功能,所有的操作都可記錄下來。

在過去的兩年裡,明略數據業務覆蓋公安、金融、稅務、工業、精準營銷、數據互聯六大領域,目前的業務重點在於公安領域,並對這一領域的標杆客戶進行維護,未來向其他領域拓展。吳明輝告訴36氪,公安機關作為大數據運用難度最高的應用場景,在這一領域做到最大之一,其他的市場也將更有能力拓展。

在公共安全領域,明略數據主要和省市的公安和國安部門合作。這和美國的 Palantir 發展路徑似乎相似:先從公共安全領域切入,在做更多的業務拓展建立自己對這一領域的業務理解。未來也會對更多的行業標杆客戶進行業務實踐。當然,按照 Palantir 獨角獸級別的公司,這一領域的市場潛力仍然巨大。

目前國內的大數據挖掘領域的有九次方大數據,前者的市場估值也達到數十億元。業內預測,隨著IT時代到DT時代的轉換,大數據領域將迎來一個投資熱點。

明略數據團隊有300人,主要在技術領域,創始人吳明輝為北大計算機系背景,作為一個奧數保送北大的理科生,吳明輝是一個在數據領域的連續創業者,CTO馮是聰也在相關領域有多年經驗。


相關焦點

  • 「死磕」底層數據技術|明略科技的數據縱橫
    換句話說,數據給我們帶來了兩個重要的改變:更多信息、更少成本。大數據帶來變革的同時,也對數據處理的底層技術有著更高的要求。只有找到如何管控越來越多數據的方法,才能實現數據價值最大化。雖然,目前各行各業對大數據的研究比較火熱,但對於大數據治理的研究還處於起步階段。
  • 「死磕」底層數據技術 | 明略科技的數據縱橫
    大數據是人們獲得新的認知,創造新的價值的源泉,大數據是改變市場、組織機構,以及政府和公民關係的方法。這是更具有人文色彩和社會意義的詮釋。顯然,也更加清楚地指明了大數據帶來的思維變革、商業變革和管理變革。換句話說,數據給我們帶來了兩個重要的改變:更多信息、更少成本。大數據帶來變革的同時,也對數據處理的底層技術有著更高的要求。
  • 大數據_數據挖掘技術分類及應用
    大數據簡介   大數據(big data),指無法在一定時間範圍內用常規軟體工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。研究機構Gartner給出了這樣的定義。
  • 大數據中數據挖掘的基本步驟
    挖掘出潛在的模式,幫助決策者調整市場策略,減少風險,作出正確的決策。   數據挖掘是什麼   數據挖掘指從資料庫的大量數據中揭示出隱含的、先前未知的並有潛在價值的信息的非平凡過程。   數據挖掘步驟:   1、定義問題   在開始知識發現之前最先的也是最重要的要求就是了解數據和業務問題
  • 吳信東:數據挖掘算法的經典與現代
    其中,明略科技首席科學家、明略科學院院長吳信東做了題為《數據挖掘算法回顧:經典與現代》報告,總時長為1個小時左右,內容主要分為三個部分:數據挖掘中代表性的領域、數據挖掘的經典算法、2006年之後的現代數據挖掘技術。下文是本場報告的文字版,由 AI 科技評論編輯。
  • 乾貨 面向大數據的時空數據挖掘
    面向大數據的時空數據挖掘的重要性  20世紀90年代中後期,數據挖掘領域的一些較成熟的技術,如關聯規則挖掘、分類、預測與聚類等被逐漸用於時間序列數據挖掘和空間結構數據挖掘,以發現與時間或空間相關的有價值的模式,並且得到了快速發展。
  • 明略科技入選愛分析中國知識圖譜廠商全景報告
    近日,中國領先的產業數位化研究與諮詢機構愛分析發布《中國知識圖譜廠商全景報告》,在金融、政府與公共服務、能源與工業、零售4大行業的13個應用場景中,明略科技均被評為具備成熟解決方案和落地能力的知識圖譜廠商。  在數字經濟時代,數據是重要的生產要素。數據挖掘能力是企業數位化轉型成功的基石。
  • 智慧公安大數據研判平臺開發方案警務通APP開發
    公關機關在推進警務信息化進程中,不但要建設全省警務雲,匯聚全警數據和社會數據,加快各警種之間的信息資源融合,還要橫向打通各業務版塊,為全警信息化建設和應用提供公共的技術環境和服務支撐。由此可見,移動警務終端不但是公安大數據信息採集源,而且是一線警務人員警務處理最重要的助手,在公安大數據建設中具有舉足輕重的作用,因此,越來越受到各省公安機關的日益重視。目前全國各地公安都在加快移動警務體系的建設,將公安信息化應用從桌面應用向移動終端拓展。
  • 大數據的七大核心具體價值
    事實上,大數據已經開始並將繼續影響我們的生活,接下來讓我們共同探索大數據的核心價值吧!當然這是需要藉助於一些具體的應用模式和場景才能得到集中體現的。《大數據時代》一書作者維克託認為大數據時代有三大轉變:「第一,我們可以分析更多的數據,有時候甚至可以處理和某個特別現象相關的所有數據,而不是依賴於隨機採樣。更高的精確性可使我們發現更多的細節。
  • 阿里雲肖力:雲計算大數據應該變成「雲數據大計算」
    肖力認為關鍵在於兩點:數據在線和計算能力。這也是」雲計算大數據「應該叫做」雲數據大計算「的原因——雲數據即數據在線,大計算則強調數據的分析和計算能力。在我眼裡,數據沒有大和小之分,它最重要的是在線;只有打破數據孤島,讓數據發生更多的匯聚,更多的交換,更多的更新和挖掘,才能產生更大的價值,這就是「大計算」。
  • 數據猿發布產業全景圖:2020中國數據智能產業圖譜1.0版
    每輛車每秒至少傳送10000個信號,技術人員無法同時處理這麼多數據。 智慧城軌維保系統是智慧城軌建設的核心系統之一,明略科技提供的面向城軌維保業務提供智能化解決方案,與雲計算,大數據,5G,人工智慧等技術深度融合。
  • 什麼叫數據挖掘_數據挖掘技術解析
    統計技術對數據集進行挖掘的主要思想是:統計的方法對給定的數據集合假設了一個分布或者概率模型(例如一個正態分布)然後根據模型採用相應的方法來進行挖掘。   2、關聯規則   數據關聯是資料庫中存在的一類重要的可被發現的知識。若兩個或多個變量的取值之I司存在某種規律性,就稱為關聯。關聯可分為簡單關聯、時序關聯、因果關聯。
  • 4大數據分析算法,精準數據挖掘,解決你99%的運營需求
    2)對屬性數據的再定義有時候我們也需要根據一些屬性信息重新定義類型,如細分地區可以匯總進行大區的劃分,從而形成新的可以分類的屬性數據。但是這部分數據視業務需求和數據而定。如下圖中某汽車品牌對其車輛的價值進行了A,B,C,D的劃分,分析2020年1月份不同分類價值對應的車輛數,原來的車輛價值是一個連續性的數值型數據,但是經過分類後,方便分析人員進行數據統計,同時也方便業務人員的數據查詢和理解。
  • FineBI:數據挖掘的車,開了
    我是帆軟數據挖掘的產品經理,在FineBI的新版本5.0中,你們將看到數據挖掘功能,這是我們第一次做數據挖掘功能,自然是要廣而告之了。市場部的同事來找我,希望我來寫一篇文章宣傳一下,作為產品經理,責無旁貸嘛。傳統宣傳三段論:功能業務價值好大->我們功能做得真好->客戶給我們的評價很棒。
  • 12款實用的數據挖掘工具
    數據在當今世界意味著金錢。隨著向基於app的世界的過渡,數據呈指數增長。然而,大多數數據是非結構化的,因此需要一個過程和方法從數據中提取有用的信息,並將其轉換為可理解的和可用的形式。數據挖掘或「資料庫中的知識發現」是通過人工智慧、機器學習、統計和資料庫系統發現大數據集中的模式的過程。
  • 為什麼說,大數據是從流式計算開始切入的?
    大數據說了很多年,我說雷聲大,雨點小,這您同意嗎?為什麼?關鍵在創造的價值,如果僅僅是輔助決策,效果難以顯現,如何才能夠立竿見影?從技術上,對應的就是流式計算,因為它對應的是業務,能夠帶來收入的應用。什麼是流式大數據?有哪些應用?現在就讓我們一起回顧下流計算平臺的發展歷史,以及如何在企業中運用。
  • 數據科學50人·吳明輝:用數學思維,打破數據悖論
    作者 | 程一祥題圖 | 站酷海洛吳明輝,明略數據、秒針系統創始人兼董事長,本科畢業於北京大學數學學院,北京大學人工智慧實驗室碩士。他從事軟體工程開發和算法研究近二十年,是國內企業級服務領域裡全能型企業家。他所創辦的秒針和明略兩家大數據公司,都已經成長為中國數據科學領域的獨角獸企業。
  • 看見數據的力量 | 大華多維大數據帶「感」而生
    多維大數據實現面向多維感知數據的價值計算,洞察時空數據價值形成數據標籤,並進一步將時空數據、感知數據和業務數據進行融合挖掘,實現數據價值最大化。   人員活動軌跡還原,智能分析自動預警   可視化指揮調度,全方位聯合作戰   突破業務系統煙囪式建設模式   打通數據壁壘   全面挖掘安防數據價值   推動智慧警務登上「新臺階」!
  • 電子商務大數據挖掘常用算法
    (2)由數據量固有變化引起的,是自然發生的,反映了數據集數據分布特徵,如氣候變化、顧客的新的購買模型、基因突變等。(3)數據測量和收集誤差,主要是由於人為錯誤、測量設備故障或存在噪音。異常數據(離群點)揭示了日常活動中的異常規律,具有顯著的商業價值。
  • 「熱點新知」鄔賀銓:數據價值挖掘的挑戰
    本次大會匯集兩院院士、政府嘉賓以及大數據龍頭企業代表,圍繞加快數字產業化,助推產業數位化,構建大數據新產業新業態新模式,共同探討未來大數據產業生態建設與發展的機遇與挑戰。會上,中國工程院院士、中國網際網路協會諮詢委員會主任鄔賀銓發表了《數據價值挖掘的挑戰》的主題演講。