Spark大數據分析實戰
1、Spark簡介
初識SparkSp ark生態系統BDASSp ark架構與運行邏輯彈性分布式數據集2、Spark開發與環境配置
Spark應用開發環境2置使用Intelli i開發Spark遠程調試Spark程序Spark編譯配置Spark源碼閱讀環境3、BDAS簡介
SQL on SparkSpark StreamingGr aphXMIlib4、Lamda架構日誌分析流水線
日誌分析概述日誌分析指標Lamda架構構建日誌分析數據流水線5、基於雲平臺和用戶日誌的推薦系統
Azure雲平臺簡介系統架構構建Node. js應用數據收集與預處理Spark Str eamine實時分析用戶日誌MLlib離線訓練模型6、Twi ter情感分析
系統架構Twitter數據收集數據預處理與Cassandr a存儲Spark Streami ng熱點Twitter分析Spark Str eaming在線情感分析Spark SQL進行Twi tter分析Twitter可視化7、熱點新聞分析系統
新聞數據分析系統架構爬蟲抓取網絡信息新聞文本數據預處理新聞聚類Spark Elastic Sear ch構建全文檢索引擎8、構建分布式的協同過濾推薦系統
推薦系統簡介協同過濾介紹基於Spark的矩陣運算實現協同過濾算法基於Spark的MI1ib實現協同過濾算法案例:使用MLlib協同過濾實現電影推薦9、基於Spark的社交網絡分析
社交網絡介紹社交網絡中社團挖掘算法Spark中的K均值算法案例:基於Sp ark的F acebook社團挖掘社交網絡中的鏈路預測算法Spark MLlib中的Logistic回歸案例:基於Spark的鏈路預測算法10、基於Spark的大規模新聞主題分析
主題模型簡介主題模型LDASpark中的LDA模型案例:Newse oups新聞的主題分析11、構建分布式的搜尋引擎
搜尋引擎簡介搜索排序概述查詢無關模型P ageRank基於Spark的分布式P ageRank實現案例: Google"eb Graph的PageR: ank計算查詢相關模型Ranking SVMSpark中支持向童機的實現案例:基於MSLR數據集的查詢排序
轉發+關注,然後私信回復關鍵字 「888」 或者「666」 即可獲得Spark實戰、Hadoop實戰、阿里巴巴中臺實戰書籍的免費領取方式。
阿里巴巴中臺戰略思想與架構實戰(含內部實施手冊)
本書講述了阿里巴巴的技術發展史,同時也是一部網際網路技術架構的實踐與發展史。
第一部分
第1章阿里巴巴集團中臺戰略引發的思考
1.1 阿里巴巴共享業務事業部的發展史
1.2 企業信息中心發展的癥結
第2章構建業務中臺的基共享服務體系
2.1 回歸SOA的本質一服務重用
2.2 服務需要不斷的業務滋養
2.3 共享服務體系是培育業務創新的土壤
2.4 賦予業務快速創新和試錯能力
2.5 為真正發揮大數據威力做好儲備
2.6 改變組織陣型會帶來組織效能的提升
第二部分共享服務體系搭建
第3章分布式服務框架的選擇
3.1 淘寶平臺"服務化」歷程
3.2 "中心化"與"去中心化"服務框架的對比
3.3 阿里巴巴分布式服務框架HSF
3.4 關於微服務
第4章共享服務中心建設原則
4.1 淘寶的共享服務中心概貌
4.2 什麼是服務中心
4.3 服務中心的劃分原則
第5章數據拆分實現資料庫能力線性擴展
5.1 資料庫瓶頸阻礙業務的持續發展
5.2 資料庫分庫分表的實踐
第6章異步化與緩存原則
6.1 業務流程異步化
6.2 資料庫事務異步化
6.3 事務與柔性事務
6.4 大促秒殺活動催生緩存技術的高度使用
第7章打造數位化運營能力
7.1業務 服務化帶來的問題
7.2 鷹眼平臺的架構
7.3 埋點和輸出日誌
7.4 海量日誌分布式處理平臺
7.5 日誌收集控制
7.6 典型業務場景
第8章打造平臺穩定性能力
8.1 限流和降級
8.2 流量調度
8.3 業務開關
8.4 容量壓測及評估規劃
8.5 全鏈路壓測平臺
8.6 業務-致性平臺
第9章共享服務中心對內和對外的協作共享
9.1 服務化建設野蠻發展帶來的問題
9.2 共享服務平臺的建設思路
9.3 共享服務平臺與業務方協作
9.4 業務中臺與前端應用協作
9.5 業務中臺績效考核
9.6 能力開放是構建生態的基礎
第三部分阿里巴巴能力輸出與案例
第10章大型央企網際網路轉型
10.1 項目背景
10.2 項目實施
10.3 客戶收益
10.4 筆者感想
10.5 項目後記
第11章時尚行業品牌公司網際網路轉型
11.1 項目背景
11.2 供應鏈的改造
11.3 基於SCRM的全渠道整合營銷
Hadoop實戰實踐
1、Hadoop簡介
什麼是HadoopHadoop項目及其結構Hadoop的體系結構Hadoop與分布式開發Hadoop計算模型一- MapRedueHadoop的數據管理2、Hadoop的安裝與配置
在Linux.上安裝與配置Hadoop在windows.上安裝與配置Hadoop安裝和配置Hadoop集群日誌分析及幾個小技巧3、Hadoop應用案例分析
Hadoop在Yahoo!的應用Hadoop在eBay的應用Hadoop在百度的應用Hadoop在F acebook的應用Hadoop平臺上的海裡數據排序4、MapReduce計算模型
為什麼要用MapReduceMapReduce計算模型MapReduce任務的優化Hadoop流Hadoop Pipes5、開發MapReduce應用程式
系統參數的配置配置開發環境編寫MapReduce程序本地測試運行MapReduce程序網絡用戶界面性能調優MapReduce工作流6、MapReduce應用案例
單詞計數數據去重排序單表關聯多表關聯7、MapReduce工作機制
MapRe duce作業的執行流程錯誤處理機制作業調度機制shuffle和排序任務執行8、Hadoop I/0操作
I/0操作中的數據檢查數據的壓縮數據的I/0中序列化操作針對MapReduce的文件類9、HDFS詳解
Hadoop的文件系統HDFS簡介HDFS體系結構HDFS的基本操作HDFS常用Java API詳解HDFS總得讀些數據流HDFS命令詳解10、Hadoop的管理
HDFS文件結構Hadoop的狀態監視和管理工具Hadoop集群的維護11、Hive詳解
Hive簡介Hive的基本操作HiveQL詳解Hive的網絡(WebUI) 接口Hive的JDBC接口Hive的優化12、HBase詳解
HBase簡介HBase的基本操作HBase體系結構HBase數據模型HBase與RDBMSHBase與HDFSHBase客戶端Jave APIHBase編程實例之M apReduce模式設計13、Mahout詳解
Mahout簡介Mahout的安裝和置Mathout API簡介Mathout中的聚類和分類Mahout應用:建立一個推薦引擎14、Pig詳解
PIg簡介Pi e的安裝和2置Pig Latin語言用戶定義函數Pia實例Pie進階15、ZooKeeper詳解
Zoeeper 簡介ZooKeeper的安裝和配置ZooKeeper的簡單操作Zookeeper的特性Zookeeper的leader選舉Zookeeper鎖服務使用Zookeep er創建應用程式17、Avro詳解
Avro簡介Avr 0的C/C++實驗Avr 0的Java實現GenAro (AwTo IDL) 語言Avro SASI概述18、Chulkwa詳解
Chulxwa簡介Chulkw a架構可靠性Chulkw a集群搭建Chulkw a數據流的處理Chulkw a與其他監控系統比較19、Hadoop的常用插件與開發
Hadoop Studi o簡介和使用Hadoop Eclipse簡介和使用Hadoop Stre aming簡介和使Hadoop Li bhdfs簡介和使用
轉發+關注,然後私信回復關鍵字 「666」 或者「888」 即可獲得Spark實戰、Hadoop實戰、阿里巴巴中臺實戰書籍的免費領取方式。