您的位置:首页 > 运维架构 > Linux

Mac下安装Spark开发环境(Linux系统可参照)

2016-10-31 21:21 281 查看


Mac下安装Spark开发环境(Linux系统可参照)

之前一直使用VNC在远程集群上进行Spark程序开发,但是网络的不稳定以及集群时常升级让人头疼。在这里我在自己的Mac上

搭建单机Spark开发环境,作为学习开发已经足够。Linux系统用户也可以参考。


一、本机环境

Macbook pro retina with 8G memory


二、准备工作

JDK 1.6.05

Scala 11.4

Spark下载界面下载Spark
1.2.0。我在Mac上并没有使用hdfs(可根据个人需求选择性安装),选择Hadoop1.X版本,最后点

击第4项的spark-1.2.0-bin-hadoop1.tgz直接下载即可。




三、配置环境

首先解压Spark压缩包:

tar -zxvf spark-1.2.0-bin-hadoop1.tgz



然后进行系统变量配置:

sudo vim /etc/profile



配置环境变量如下:



配置好之后进入解压后的Spark目录下的conf目录,执行如下命令
cp spark-env.sh.template spark-env.sh



修改spark-env.sh中的内容,加入如下配置:
export SCALA_HOME=/usr/local/scala
export SPARK_MASTER_IP=localhost
export SPARK_WORKER_MEMORY=4g



进行本机SSH配置,在主目录下输入如下命令:

ssh-keygen –t rsa –P ''

然后一直按回车直到结束,接着输入命令:
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
最后需要做的一件事是在System Preferences->Sharing中选中Remote Login选项(对于Linux系统可以忽略此步骤直接看第四步)



此时可以使用ssh locahost命令测试SSH免密码通讯是否配置成功。


四、运行Spark

1.启动Spark

首先进入Spark目录中的sbin子目录运行如下脚本启动Spark:

./start-all.sh



输入 jps 命令查看Spark是否运行:



可以看到Master 和 Worker进城都已经启动

2.使用spark shell 进行测试

进去Spark目录下的bin子目录运行如下脚本启动Spark shell:

spark-shell

当看到如下界面的时候你已经成功了:



恭喜你,继续享受Spark吧。

转自:老杨的博客
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  spark scala