首先需要下載Spark
1.官網地址 http://spark.apache.org/2.文檔查看地址 https://spark.apache.org/docs/2.1.1/3.下載地址 https://archive.apache.org/dist/spark/
Local模式
Local 模式就是指的只在一臺計算機上來運行 Spark.
通常用於測試的目的來使用 Local 模式, 實際的生產環境中不會使用 Local 模式.
解壓Spark安裝包
把安裝包上傳到/opt/software/下, 並解壓到/opt/module/目錄下
tar -zxvf spark-2.1.1-bin-hadoop2.7.tgz -C /opt/module
然後複製剛剛解壓得到的目錄, 並命名為spark-local:
運行官方的PI的案例
bin/spark-submit\--class org.apache.spark.examples.SparkPi \--master local[2] \./examples/jars/spark-examples_2.11-2.1.1.jar 100
結果展示
用run-examples來運行!
bin/run-example SparkPi 100
使用 Spark-shell
首先創建兩個文本文件
打開 Spark-shell
bin/spark-shell
查看進程和通過 web 查看應用程式運行情況
運行 wordcount 程序
sc.textFile("input/").flatMap(_.split(" ")).map((_, 1)).reduceByKey(_ + _).collect
通過WEB UI 來查看程序