大數據技術專業屬於交叉學科:以統計學、數學、計算機為三大支zhi撐性學科;生物、醫學、環境科學、經濟學、社會學、管理學為應用拓展性學科。
此外還需學習數據採集、分析、處理軟體,學習數學建模軟體及計算機程式語言等,知識結構是二專多能複合的跨界人才(有專業知識、有數據思維)。
大數據時代則對從業人員素質的要求越來越高,因為數據處理變得越來越複雜,數據人才的競爭也越來越激烈,很多大公司都在尋找尖端人才。而且,大到國防、金融,小到跟生活息息相關的物流、購物、醫療、交通等,都日益需要大數據的支撐。大數據正在成為一門「顯學」。
對於大數據開發的學習,重在掌握基本知識以及實踐應用,合理安排基礎知識的學習,可以起到事半功倍的效果,以下是比較經典的大數據開發學習路線:
第一階段:JavaSE+MySql+Linux
Java語言入門 → OOP編程 → Java常用Api、集合 → IO/NIO → Java實用技術 → Mysql資料庫 → 階段項目實戰 → Linux基礎 → shell編程
第二階段:Hadoop與生態系統
Hadoop → MapReduce → Avro → Hive → Hbase → Zookeeper → Flume → Kafka → Sqoop → Pig
第三階段:Storm與Spark及其生態圈
Storm → Scala → Spark→ Spark SQL → Spark Streaming → Spark機器學習
第四階段:其他
Mahout機器學習 → R語言 → Python
第五階段:項目實戰、技術綜合運用
手機公司系統 → 傳統廣告怎麼用大數據 → 類網際網路電商網站 → 網站日誌收集清洗系統 → 網站流量統計分析系統