DataPipeline——為客戶連接一切數據、應用和設備

2021-01-18 騰訊網

本產品由DataPipeline投遞並參與「數據猿年度金猿策劃活動——2020大數據產業創新服務產品榜單及獎項」評選。

DataPipeline 實時數據融合產品通過多種實時數據技術,支持廣泛的數據節點類型,協助企業構建以業務目標為導向的數據鏈路,按需快速定製、部署、執行數據任務,以支持從傳統數據處理到實時數據應用的各類場景。

應用場景/人群

某股份制商業銀行實時數據管道項目

主要應用場景:

●客戶行為等實時數據的標準化補全並分發到各個應用系統;

●業務系統的實時帳戶變動與指標變化傳輸到GaussDB作為實時分析依據;

●實時數據加載到Redis作為業務實時查詢使用;

●主數據系統數據和數據倉庫數據加載到SequoiaDB作為歷史數據查詢使用。

某持牌金融科技服務公司資料庫準實時數據採集項目

主要應用場景:

●多源異構:DB2,Oracle,MySQL等多種資料庫進行近實時的數據採集功能,並對數據源建立高效的管理功能,實現對數據源、目的地的數據連接統一管理管理,通過界面進行數據源與目的地註冊,刪除數據源,同時根據需求不斷迭代支持新的資料庫;

●實時採集:利用解析資料庫歸檔日誌的方式,實現秒級的數據變更捕獲,將解析的變更記錄傳送到數據目的地中,包括日誌中提取數據變更的增、刪、改等DML操作記錄,以及新增表、刪除表、添加欄位、刪除欄位等自動同步到目的地中;

●標準管理:統一的可視化管理頁面,提供平臺級別的數據管理功能,包括產品權限、數據時效管理和安全管控等方面功能,為數據工程師、運維人員提供直觀的數據任務地圖,隨時可以洞悉數據的最新動態,極大提升運維工作效率和效益。

產品功能

基於日誌的實時增量數據獲取技術保證實時數據全面、準確。DataPipeline 實時數據融合產品支持數十種主流資料庫作為數據節點,打破企業域內各類異構數據技術構成的樊籬,讓存儲在不同類型數據節點中的數據隨需可得;採用基於日誌的增量數據獲取技術(Log-based change data capture),為主數據管理、數據倉庫、大數據平臺提供實時、準確的數據變化,從而使得客戶可以根據最新數據進行運營管理與決策制定;支持一對多數據分發,針對數據分發、外部數據管理等場景,確保整個企業使用的數據準確、可靠、一致。

使用分層管理按需服務的配置型平臺來提升 IT 敏捷開發效率。一方面保證數據節點的安全性、穩定性、業務連續性,一方面為數據應用提供更多的自主性,使客戶可以將數據獲取的範圍、數據任務的生命周期、系統資源投入的多寡等權限更多的交給實際使用數據的業務部門及應用開發人員。提升敏捷開發效率,實現多速 IT,從而在業務需求變化時從容應對,達成數位化轉型目標。

通過高容錯的分布式系統和卓越的性能來降低風險。DataPipeline實時數據融合所有組件均支持高可用,融合引擎基於容器化分布式集群部署,支持動態擴縮容;在節點管理、鏈路管理、任務管理中均有各個層次穩定性相關策略配置。針對數據採集、消息隊列及數據加載的各個組件都進行了一系列專門的性能優化,完全滿足客戶從數據遷移、數據交換到實時數據服務、實時數據分析的各類時間窗口要求和時效性要求。

產品優勢

DataPipeline實時數據融合以專業化產品的方式提供給用戶進行配置式構建,大大降低了企業搭建基礎平臺的研發成本與運維成本,讓客戶能夠將時間精力與優質資源投入到數據價值釋放與商業價值實現上去。

企業級平臺的建設周期從三到六個月減少為一周以內,財務成本由300萬+減少到50萬以內,數據融合任務的研發交付時間從2周減少為5分鐘;

通過多種實時數據技術,支持廣泛的數據節點類型,協助客戶構建以業務目標為導向的數據鏈路,支持從傳統數據處理到實時數據應用的各類場景;

使用分層管理按需服務的配置型平臺來提升敏捷開發效率 ,實現多速 IT,從容應對業務變化,達成數位化轉型目標。

使用客戶/人群

DataPipeline服務了百餘家客戶。在銀行、保險、證券、資管、零售、能源、製造業、汽車、商業地產、醫療、網際網路科技等重點領域被廣泛使用,服務了中國人壽、民生銀行、山東城商行聯盟、財通證券、中國石油、金風科技、法國威立雅集團、吉利汽車集團、星巴克、百勝中國、玫琳凱、太平鳥、龍湖地產、陽光城集團、邵逸夫醫院、叮噹快藥、正保遠程教育集團等在各自行業信息化水平領先的客戶。

市場價值

DataPipeline實時數據融合平臺滿足了行業領先客戶對數據處理與分析的更高要求,幫助客戶通過更加專業全面、更加靈活穩定、更加敏捷高效的方式處理異構數據融合中紛繁複雜的各種問題,解除傳統數據集成工具的時效性束縛,打破多種異構數據管理工具的技術壁壘,是先進企業釋放實時數據價值最好的選擇。

產品所屬企業·DataPipeline:

DataPipeline致力於成為中國的世界級數據中間件廠商。堅持技術驅動,深耕企業服務,不斷創新產品與服務,利用實時數據融合產品打破技術壁壘,讓客戶專注數據價值釋放。DataPipeline 核心團隊分別來自谷歌、Yelp、亞馬遜、IBM、甲骨文、中科院等國內外知名企業,皆擁有數十年大數據開發和項目經驗。目前已經成功服務了星巴克、金風科技、財通證券、龍湖地產、喜茶、玫琳凱、叮噹快藥、智慧圖、銷售易等多家行業領先的企業客戶,行業覆蓋零售、製造、金融、醫療、能源、政府和網際網路等,在平臺功能和服務能力上均得到了國內市場的普遍好評。

2019 年獲得百度風投領投,經緯中國、清流資本跟投的數千萬 A+ 輪融資,目前公司總部位於北京,並且在北京、南京分別設有研發和服務中心。未來,DataPipeline 將加速提升數據融合平臺的硬實力,持續優化行業客戶服務的軟實力,全面提升公司的核心競爭力。

相關焦點

  • DataPipeline創始人陳誠:連接一切數據、應用與設備
    中國社科院發布的《中國大數據應用發展藍皮書》指出,中國大數據正快速發展為對數量巨大、來源分散、格式多樣的數據進行採集、存儲和關聯分析,從中發現新知識、創造新價值、提升新能力的新一代信息技術和服務業態。 中國軟體網記者近期對DataPipeline創始人&CEO陳誠進行了專訪。
  • 微軟專為Win10設備推出定製版SIM卡和應用
    【天極網IT新聞頻道】【Yesky新聞頻道消息】 為了讓消費者能夠更輕鬆地用上LTE數據網絡,微軟計劃為Windows 10設備推出定製版SIM卡和Cellular data應用。微軟專為Win10設備推出定製版SIM卡和Cellular data應用  據悉,微軟SIM卡允許用戶在沒有合約束縛的前提下,用上各大運營商的行動網路。
  • Salesforce:客戶連接和互動報告
    導語:本文是雲服務軟體巨頭 Salesforce 更新了《客戶連接狀況報告》(第三版),調查了全球 8000 多名消費者和商業買家,了解客戶互動和參與對企業的影響;作者經過編譯,分享給大家。
  • Pipeline 和 Transformer
    在深入討論之前,我們先從兩個方面著手:Transformer:Transformer是指具有fit()和transform()方法的對象,用於清理、減少、擴展或生成特徵。簡單地說,transformers幫助你將數據轉換為機器學習模型所需的格式。OneHotEncoder和MinMaxScaler就是Transformer的例子。
  • 工業4.0在能源場景中的應用(二)——非常規汽油田
    非常規油氣田與常規型有同樣的生命周期原則(勘探、評估、制定計劃、執行、生產、棄置),但仍然有需要特備關注的具體環節:• 生產運作與鑽井運作平行工作• 基於環保原則,需要特別關注水務處理• 基礎設施的重複利用,比如鑽探設備• 利用物流而非固定設施(如固定輸油管道)將原油(原氣)輸送給客戶• 環境保護與管理要時刻銘記,制定規則並做好公共關係
  • 雙無線電連接:將增強設備的可用性、多功能性和可靠性
    物聯網設備連接拓撲 物聯網連接設備可大致分為三類: 1 直接連接到遠程基礎設施的設備 GPRS、CDMA等技術使我們的智慧型手機或物聯網設備可直接連接到電信塔。隨著Sigfox、LoRa和NBIOT等LPWAN技術的出現,可在降低電流消耗和數據速率的情況下實現相似的連接範圍。
  • 深入對比數據科學工具箱: SparkR vs Sparklyr
    Parquet 是一種高性能列式存儲文件格式,比CSV文件強在內建索引,可以快速查詢數據,目前普遍應用在模型訓練過程。"20180318"')       Sparklyr:       由於 Sparklyr 通過 dplyr 接口操作,所以,所有數據操作幾乎和 MySQL 完全一樣,學習成本≈0。
  • FATE1.0重磅發布:首個可視化聯邦學習產品與聯邦pipeline生產服務...
    作為全球首個聯邦學習工業級技術框架,FATE支持聯邦學習架構體系與各種機器學習算法的安全計算,實現了基於同態加密和多方計算(MPC)的安全計算協議,能夠幫助多個組織機構在符合數據安全和政府法規前提下,有效和協作地進行數據使用和聯合建模。
  • 如何使用pipeline function獲得實時輸出
    但你如果需要在客戶端實時的輸出函數執行過程中的一些信息,在Oracle 9i以後則可以使用管道函數(pipeline function)。 PIPELINED(關鍵字)表明這是一個管道函數,管道函數的返回值類型必須為集合,在函數中,PIPE ROW語句被用來返回該集合的單個元素,函數則以一個空的RETURN語句結束,以表明它已經完成。
  • 機器學習中不平衡數據集分類示例:乳腺鉬靶微鈣化攝影數據集分類
    其中98%的候選圖像不是癌症,只有2%被有經驗的放射科醫生標記為癌症。在本教程中,您將發現如何開發和評估乳腺癌鉬靶攝影數據集的不平衡分類模型。完成本教程後,您將知道:如何加載和探索數據集,並從中獲得預處理數據與選擇模型的靈感。
  • 將Python中的字典數據轉化為DataFrame
    編譯:老齊與本文相關的圖書推薦:《數據準備和特徵工程》在數據科學項目中,通常用Pandas的read_csv或者read_excel從相應文件中讀入數據,此外,對於數據量不大的時候,可能還有下面的情形出現:import pandas as pddata = {『key1』: values, 『key2』:values, 『key3』
  • 如何使用PySpark來利用機器學習模型對流數據進行預測?
    對於離散流,其數據流可以直接從數據源接收,也可以在對原始數據進行一些處理後接收。構建流應用程式的第一步是定義要從中收集數據的數據資源的批處理持續時間。如果批處理持續時間為2秒,則將每2秒收集一次數據並將其存儲在RDD中。這些RDD的連續序列鏈是一個DStream,它是不可變的,可以通過Spark用作一個分布式數據集。考慮一個典型的數據科學項目。
  • 大數據的應用與弊端
    隨著網際網路時代的到來,也誕生出了很多領域,現在大家最關心的是大數據領域,那到底什麼是大數據,大數據可以應用在哪些領域和行業呢?大數據的應用有沒有什麼弊端呢?下面問您詳細解答大數據(big data,mega data),或稱巨量資料,指的是需要新處理模式才能具有更強的決策力、洞察力和流程優化能力的海量、高增長率和多樣化的信息資產。1.理解客戶、滿足客戶服務需求  大數據的應用現在在這領域是最廣為人知的。重點是怎樣應用大數據更好的了解客戶以及他們的喜好和行為。
  • 行車記錄儀和雷達追蹤器氣密性檢漏設備應用和優勢
    安裝行車記錄儀後,能夠記錄汽車行駛全過程的視頻圖像和聲音,可為交通事故提供證據。雷達追蹤器就是可以定位並且具有追蹤的功能。很多汽車都安裝有行車記錄儀和雷達追蹤器。現在很多戶外騎行的愛好者,喜歡電摩的人也開始在自己的車上安裝行車記錄儀和雷達追蹤器。
  • 「首席看應用架構」輪詢,SSE 和WebSocket,如何選擇合適的?
    我們需要開發一個儀錶板Web應用程式,該應用程式可以流轉來自(GitHub / Twitter / .. etc)等網站的活動列表。 這個應用程式的目的是從上面列出的各種方法中選擇合適的一種。1.使用輪詢:輪詢是一種技術,客戶端通過該技術定期向伺服器請求新數據。 我們可以通過兩種方式進行輪詢:短輪詢和長輪詢。
  • 雙無線電連接:在物聯網應用中實現兩全其美
    物聯網設備的迅速崛起及其廣泛的應用案例也大大增加了其設計的複雜程度和多功能。選用一種合適的互聯通訊方案對任何一個物聯網設備來講都是至關重要的,但往往單獨的一種互聯方式無法滿足其所有的功能需求。本文著重論述了將近程和遠程通訊方式結合在一起使用的需求,以顯著提高物聯網設備的整體性能和多功能的特性。
  • 工業大數據的技術與應用
    其以產品數據為核心,極大延展了傳統工業數據的範圍,同時還包括工業大數據相關技術和應用。工業大數據的主要來源有如下3類。此類數據是工業領域傳統的數據資產,在移動網際網路等新技術應用環境下正在逐步擴大範圍。 2、設備物聯數據 設備物聯數據主要指工業生產設備和目標產品在物聯網運行模式下,實時產生收集的涵蓋操作和運行情況、工況狀態、環境參數等體現設備和產品運行狀態的數據。此類數據是工業大數據新的、增長最快的來源。狹義的工業大數據即指該類數據,即工業設備和產品快速產生且存在時間序列差異的大量數據。
  • 北緯科技:物聯網應用主要是公司針對企業客戶提供的物聯網連接及...
    北緯科技:物聯網應用主要是公司針對企業客戶提供的物聯網連接及管理服務 2020-12-11 16:32:57 來源: 同花順金融研究中心
  • ...人、CEO張啟亮:到2025年,通過邊緣計算連接的設備有望達到80%左右
    「平臺承載的數據未來是有限的,邊緣計算+5G會推動端到端的計算能力,我們未來的大型設備和其他的設備的計算,有可能大部分數據在邊緣層解決掉,如果都到平臺層解決,流量、平臺都會產生巨大的壓力,到今年為止,邊緣計算連接的設備數量還不到15%,到2025年,有可能通過邊緣計算連接的設備達到80%左右,未來邊緣計算會推動工業網際網路上雲上設備的速度