張建偉:百度大數據平臺流式shuffle服務

2020-12-06 IT168

  【IT168 現場報導】2016年10月27日-29日,2016中國系統架構師大會(SACC 2016)在北京萬達索菲特大飯店盛大開幕。作為中國規模最大的架構師豪門盛會,本屆大會以「架構創新之路」為主題,站在創新的風口上,與大家共同打造一場通過架構創新及各種IT新技術來帶動企業轉型增效,助力架構師們騰飛的技術盛會。

  大會雲集了國內外頂尖專家,共同探討雲計算和大數據等技術背景下,如何通過架構創新及各種IT新技術來帶動企業轉型增效。本屆大會共設置兩個主場分享時段,24個技術交流專場時段;邀請來自網際網路、電子商務、金融、電信、政府、行業協會等20多個領域,150多位技術專家及行業領袖來分享他們的經驗;並將吸引4000多名系統運維、架構師、及各種企業的IT決策人士參會,為他們提供最具價值的交流平臺。

  中國系統架構師大會來到了第二天,我們迎來了主題為「雲和大數據下的架構實踐及優化」的主場2,今天上午第三位演講嘉賓是百度基礎架構部分布式計算架構師張建偉,他演講的題目是《百度大數據離線計算平臺流式shuffle服務》。


▲百度基礎架構部分布式計算架構師 張建偉

  背景

  據張老師介紹,百度私有雲架構最底層有百度自研的高精硬體,上層包括集群作業系統Matrix,Normandy統一資源調度。

  百度大數據離線計算平臺:

  一般Shuffle模式:

  Shuffle作為大數據離線計算平臺中最重要的模塊,其性能直接影響作業的運行時效性和平臺資源消耗。為進一步提高平臺計算效能,百度研發了新型的流式Shuffle服務,降低框架資源消耗,提升框架計算有效性,進一步強化平臺計算能力。

  百度大數據離線平臺發展歷程

  談到平臺發展歷程時,張老師首先介紹主要的離線計算模型——MapReduce,百度從2007年開始引進Hadoop 0.15.1,隨後快速發展,2011年百度的MR單集群規模達到5000臺,到2013年已經多達1.3萬臺,這也是截止到目前為止全世界最大的單集群。Hadoop全集群規模為10萬量級,作業量達到了百萬量級,日均CPU利用率超過80%,遠超業界同行,百度開放雲底層依賴的大規模集群調度、資源隔離等技術能力世界領先。

  除了在規模方面不斷擴大,百度一直在Hadoop性能分析方面進行了大量的優化。2013年的測試結果顯示,百度內部MR實現相比於開源Hadoop性能提升30%。典型優化,例如Hadoop中的Shuffle,我們將其做成一個統一的shuffle服務,不再佔用Map或Reduce槽位。比如對關鍵熱點函數採用SSE向量化等。

  架構

  流式Shuffle服務已成功應用於百度十萬級規模的離線計算平臺,收益顯著。面向架構師、大數據應用者、大數據框架開發者等人群,張老師主要介紹了流式shuffle&內存push(map數據不落盤);Pipeline;Shuffle結果高度預聚合&多副本持久化;負載均衡與流控;去重與異常處理;多路輸入多路輸出(MIMO)。

  關鍵技術

  ShuffleMaster:

  Writer:

  Shuffler:

  Reader:所有Map完成後,調度Reduce,直接讀取DFS排好序的數據,去重&數據驗證,多路歸併排序。

  Map Pipeline:Map端Writer,要等Shuffler將數據持久化到DFS後,才能將發送的rpc buffer釋放,所有發送的數據被Shuffler持久化後,Map才能安全退出。

  收益與總結

  收益,流式shuffle:減少舊shuffle map merge、reduce pull時間消耗;內存Push:map端不落盤;Shuffler內存聚合:聚合度高,減少map端seek,減少reduce端merge路數,減少IO;Pipeline:大大提高中小作業map端運行速度;中間數據持久化:避免重算(對dag作業尤為重要)。

  流式Shuffle服務,push instead of pull;Shuffle過程交給能拿到更多全局信息、更專業的shuffler來做;Map、Shuffler、Reduce,每個都做自己最適合做且擅長做的事情;Shuffle與Reduce解耦,簡化Reduce,也為解決分桶不均問題提供可能;Pipeline;無縫的流線,減少無謂的等待。

  問題:更多的網絡io(萬兆網卡,網絡不是瓶頸);Shuffler資源共享,作業間可能互相影響(讓Shuffler資源非瓶頸)。

  下一步計劃

  ▲更多信息盡在IT168現場報導專題:http://www.it168.com/redian/sacc2016/

相關焦點

  • 大數據賦能金融:文思海輝金融流式大數據處理平臺解決方案
    流式大數據:實時的大數據處理技術然而,現有的傳統批量數據處理方式在數據時效性等方面相對滯後,已無法滿足金融機構大量的數據處理需求,流式大數據處理技術隨之興起。流式大數據又被稱為實時大數據,能夠極大限度地挖掘數據潛在價值,在複雜情況下可以滿足金融機構對數據處理分析的及時性、準確性需求。
  • 為什麼說,大數據是從流式計算開始切入的?
    大數據說了很多年,我說雷聲大,雨點小,這您同意嗎?為什麼?關鍵在創造的價值,如果僅僅是輔助決策,效果難以顯現,如何才能夠立竿見影?從技術上,對應的就是流式計算,因為它對應的是業務,能夠帶來收入的應用。什麼是流式大數據?有哪些應用?現在就讓我們一起回顧下流計算平臺的發展歷史,以及如何在企業中運用。
  • 百度地圖大數據平臺累計提供服務超22.4億次
    近日,百度地圖公布本周最新復工指數,全國(除港澳臺)復工指數已達69.95%,較3月10日提高5.8個百分點。與此同時,據百度地圖遷徙大數據平臺統計,2020年2月10日-3月13日的全國城內出行強度已恢復至2019年同期的70%,截至3月14日遷徙規模指數已逐漸接近去年水平。
  • 22.4億次服務!百度地圖遷徙大數據、全國實時路況平臺化身抗疫...
    近日,國際數據調研機構IDC發布《新冠肺炎疫情刺激數據智能市場跨越式前進》報告(以下簡稱「報告」),復盤2019-2020年COVID-19新冠肺炎疫情發展過程,並分析數據智能技術在疫情類重大公共應急事件中的全景應用。針對百度地圖的相關戰「疫」舉措,報告從時空大數據、POI數據及出行服務三個方面,解析其如何基於數據智能技術助力新冠肺炎疫情防控。
  • Spark Streaming:大規模流式數據處理的新貴
    提到Spark Streaming,我們不得不說一下BDAS(Berkeley Data Analytics Stack),這個伯克利大學提出的關於數據分析的軟體棧。從它的視角來看,目前的大數據處理可以分為如以下三個類型。 複雜的批量數據處理(batch data processing),通常的時間跨度在數十分鐘到數小時之間。
  • 百度實時計算平臺的實現和應用
    基於TM平臺實現的多路數據流式join解決方案,已具備超大時間窗流式join計算能力,時間窗可到「天」級別,保證數據不丟不重,達到了業界先進水平,並已應用於百度多條業務線的點擊日誌、展現日誌的join計算。
  • 百度智能雲時空數據管理平臺亮相 打造一體化數據中臺
    百度智能雲時空數據管理平臺的五大特點:  多源異構時空數據的融合存儲  時空數據管理平臺採用混合式數據存儲分布式架構設計,以時序時空資料庫為核心。同時具備數據資源目錄、數據查詢統計、元數據管理、血緣分析等功能,提升用戶對數據資產的應用管理能力。  通用空間數據服務的發布  產品積極擁抱GIS行業生態,遵循行業通用標準協議,在多源時空數據存儲的基礎之上  提供OGC標準地圖服務的高性能發布能力,支持WMS、WFS、WCS、WMTS、3D Tiles等二三維地圖服務,支持時空大數據的高效共享交換。
  • 開源的Flume系統實現流式數據收集的應用場景分析
    在生產環境中,通常會部署各種類型的服務,比如搜索、推薦、廣告等,這些服務均會記錄大量流式日誌。比如搜索系統,當用戶輸入一個查詢詞時,該搜索行為會以日誌的形式被後端系統記錄下來,當並發訪問用戶數非常多時,搜索系統後端將實時產生大量日誌。
  • Talking Data 閻志濤:流式大數據和即時交互分析技術
    大數據技術逐漸變成企業的標配,漫長的等待數據分析結果已經不合時宜,延遲更低的流式大數據處理技術,即時分析變得越來越重要。在本論壇將給大家帶來行業中領先的流式大數據,即時交互式分析技術的相關分享。大數據應用論壇以「流式大數據和即時交互分析技術」為主題,邀請閻志濤 (TalkingData研發副總裁)擔任論壇出品人,網易資深數據研發工程師黃祥為、蘇寧易購IT總部大數據平臺高級技術經理陳豐、中東新媒體首席架構師王成光、武漢光電國家研究中心謝長生教授等嘉賓發言探討。以下內容根據演講整理,未經本人審定。
  • 流式數據處理介紹
    Apache Storm作為一種「跟Hadoop相似但能更快出結果」的技術將流處理普及,之後Storm被作為一種大數據技術而被廣泛應用,而當下這一領域出現了很多競爭者。為什麼需要流處理?大數據技術就是處理海量數據並獲取其中的價值,但這些價值並非完全一樣。一些數據在發生後不久更有價值並隨著時間推移其價值迅速下降。
  • 【BDTC先睹為快】百度沈國龍:BML百度大規模機器學習雲平臺實踐
    在推薦系統論壇,本次大會邀請到了百度基礎架構部高級架構師沈國龍擔任演講嘉賓,進行題為「 BML百度大規模機器學習雲平臺實踐」的主題演講,分享百度機器學習平臺BML的底層框架實現,包括框架演進、算法研究過程等,以及在不同的業務場景下是如何應用這些算法。沈國龍在接受CSDN的會前採訪中表示,大數據其實是一個綜合學科,開發者需要具備多方面的知識儲備才能勝任。
  • 百度地圖時空大數據再獲認可!
    此次成都市規劃設計研究院與百度地圖牽手合作,將依託百度地圖時空大數據,突破傳統普查途徑存在的數據屬性維度少、數據統計不全面、空間解析度低的局限。百度地圖慧眼將為成都市規劃設計研究院提供覆蓋常住人口、實際管理服務人口、人口數量、人口結構等時空大數據,輔助其探索人口變化規律和人地關係,提升國土空間規劃人口專題研究的效率和科學性。
  • UCloud優刻得上線高性能流式數據處理引擎UFlink
    行駛中的汽車發出GPS定位信息,電商買賣、金融交易、傳感器測量、可穿戴設備等,這些網際網路的應用,產生了大量數據,這些數據以「流式」狀態產生,如果可以實時分析這些數據,就能更好的指導業務決策。  為了滿足用戶對流式數據的處理需求,UCloud(優刻得)近日推出了高性能流式數據處理引擎——UFlink。
  • 大數據分析平臺解析:什麼是Apache Spark?
    【IT168資訊】Apache Spark是一款快速、靈活且對開發者友好的工具,也是大型SQL、批處理、流處理和機器學習的領先平臺。2009年,Apache Spark從美國U.C. Berkeley的 AMPLab為起步,現在已經成為世界上主要的大數據分布式處理框架之一。
  • 地圖將成為服務的核心 百度的位置在哪
    有消息人士透露,5月份Uber中國將全面切換到百度地圖。  百度糯米在整合完成之後通過差異化地票務大戰,成為第三大O2O平臺(前兩大是大眾點評和美團網),百度地圖功不可沒。這體現了地圖對於O2O應用的三大價值:  1、入口價值:百度地圖本身擁有海量用戶,相關報告指出已是第一大地圖應用,並且使用相對高頻。它在導航、定位諸多場景下,將潛在用戶導入到糯米。
  • 南海區海洋大數據管理與服務平臺上線
    12月12日,南海區海洋大數據管理與服務平臺正式投入使用。該平臺由自然資源部南海局所屬南海信息中心建設,實現了南海區海洋大數據的集中管理、「一張圖」展示、在線製圖和數據共享服務,將推進南海區海洋數據資源整合,更好地為相關單位提供大數據支撐。
  • Hortonworks的DataFlow 3.0平臺簡化流式分析應用軟體的開發
    (NASDAQ: HDP)今天宣布面向市場推出其新一代開源移動數據平臺Hortonworks DataFlow (HDF)3.0。HDF使客戶能夠在數據中心和雲端實現所有數據的實時收集、挑選和分析,並在此基礎上採取相應的行動。  物聯網的發展帶來了來自行動裝置、可穿戴技術和傳感器的全新模式的數據,企業可通過這些數據實時發現可行動情報。
  • 車企的數據底座、車主的智能掌中寶 百度地圖發布車用數據服務方案
    百度地圖響應國家戰略導向,基於行業領先的位置數據及強大AI技術,全新發布新一代網際網路車用數據服務方案,覆蓋車載導航、自動駕駛、手車互聯、車生活等全域場景,將為車企提供強大的數據服務支撐,為車主帶來智能出行體驗。
  • 臨床型流式細胞儀大盤點(2019版)
    Navios的流式細胞分析儀與先進的光學設計結合提高靈敏度和信號解析度,可用於多色檢測和高速數據採集。(儀器信息網)產品覆蓋單雷射6通道至雙雷射8通道絕大多數的臨床應用;自有雷射器技術,成功應用於流式的新型光電子檢測及信號處理技術;獨創的螢光空間耦合技術;自主研發的通用流式分析軟體技術平臺,模塊化開放式設計,中英文界面一鍵切換,簡潔易懂的軟體界面,不需專業操作人員,即可輕鬆上手。(儀器信息網)如有遺漏歡迎各位大咖前來補充......
  • 時空大數據與智能技術的時代共舞,百度地圖給2020的答案
    對了,如果你的記性夠好,大概還記得一句廣為流傳的順口溜:無網不問路,問路找百度。但如果你以為地圖產品只能做導航這件事,那真的是「村裡斷網」太久了。早在幾年前,地圖產品就已經在萬物互聯、處處皆數據的大背景下,開始了技術導向的「無聲進化」,爭相點亮AI生產、時空大數據、語音交互、圖像識別等等「技能點」。在智能技術的加持下,各個地圖平臺之間也進一步拉開體驗差距。