当前位置: 首页 > news >正文

Spark HA on yarn 最简易安装。

 

机器部署:

准备两台机以上linux服务器,安装好JDK,zookeeper,hadoop

spark部署

master:hadoop1,hadoop2(备用)

worker:hadoop2,hadoop3,hadoop4

软件准备

spark下载网址:http://spark.apache.org/downloads.html

当前最新版本为2.11,下载你所需要的spark版本,注意spark版本与hadoop版本要相互匹配。

 

 安装步骤:

1.上传spark安装包到linux

2. 解压安装包到指定位置(比如说我的在apps下)

 tar -zxvf spark-1.6.3-bin-hadoop2.6.tgz -C apps/

3.配置spark

进入spark安装目录conf下

cd apps/spark-1.6.3-bin-hadoop2.6/conf/spark-env.sh

重命名spark-env.sh.template
mv spark-env.sh.template spark-env.sh

修改spark-env.sh

在该配置文件中添加配置

export JAVA_HOME=/home/kinozk/apps/jdk1.8.0_9

export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=zk1,zk2,zk3 -Dspark.deploy.zookeeper.dir=/spark"

export HADOOP_CONF_DIR=/home/kinozk/apps/hadoop/etc/hadoop

重命名并修改slaves.template

mv slaves.template slaves

vi slaves

在该文件中红添加字节嗲你所在位置(woker节点)

hadoop2

hadoop3

hadoop4

保存退出

 

将配置好的Spark拷贝到其他节点上

scp -r spark-1.6.3-bin-hadoop2.6/ hadoop2:$PWD

scp -r spark-1.6.3-bin-hadoop2.6/ hadoop3:$PWD

scp -r spark-1.6.3-bin-hadoop2.6/ hadoop4:$PWD

配置环境变量

这里就不说了,跟配置hadoop,zookeeper时的配置方式下相同,

启动集群

先启动zookeeper,然后启动hadoop,最后启动spark

需要注意的是,spark与hadoop中都有start-all.sh命令,因此启动spark时进入spark安装目录的跟目录下

 在hadoop1上执行sbin/start-all.sh脚本,然后在hadoop2上执行sbin/start-master.sh启动第二个Master

登录spark管理界面查看集群状态(主节点):http://hadoop1:8080/

 此时hadoop1节点status为alive,hadoop2节点status为standby

在hadoop1 上kill掉master进程,再登录spark管理界面查看集群状态(主节点):http://hadoop2:8080/查看hadoop2状态,是否被切换为alive状态

 

 

转载于:https://www.cnblogs.com/kinoliu/p/7050354.html

相关文章:

  • jade 入门教程
  • SICP-1.5-控制结构
  • C++面试题集(最全的C\C++试题集和答案)
  • java多态的理解
  • [导入]创建一个存储过程,根据系部编号查出男生、女生人数
  • 安装OpenResty开发环境
  • Vc中的文件路径问题
  • Servlet Filter
  • 通过WCF服务,采用多线程技术上传大文件到SharePoint文档库解决方案(初稿)
  • 6月21日云栖精选夜读:国内首位!Node.js社区将阿里云工程师张秋怡吸纳为CTC成员...
  • ASP.NET存储Session的StateServer
  • SegmentFault 技术周刊 Vol.27 - Git 学习宝典:程序员走江湖必备
  • 在VC中使用自定义资源,FindResource,LoadResource,LockResource
  • 第0课 从0开始
  • Table转换Div+CSS_工具下载
  • ES6指北【2】—— 箭头函数
  • 【干货分享】SpringCloud微服务架构分布式组件如何共享session对象
  • 【剑指offer】让抽象问题具体化
  • 2017 前端面试准备 - 收藏集 - 掘金
  • AWS实战 - 利用IAM对S3做访问控制
  • Create React App 使用
  • Flex布局到底解决了什么问题
  • Java 网络编程(2):UDP 的使用
  • Linux快速配置 VIM 实现语法高亮 补全 缩进等功能
  • PHP CLI应用的调试原理
  • React组件设计模式(一)
  • storm drpc实例
  • Three.js 再探 - 写一个跳一跳极简版游戏
  • vue脚手架vue-cli
  • 深入体验bash on windows,在windows上搭建原生的linux开发环境,酷!
  • 验证码识别技术——15分钟带你突破各种复杂不定长验证码
  • 一个完整Java Web项目背后的密码
  • 3月27日云栖精选夜读 | 从 “城市大脑”实践,瞭望未来城市源起 ...
  • 智能情侣枕Pillow Talk,倾听彼此的心跳
  • ​iOS安全加固方法及实现
  • #Linux杂记--将Python3的源码编译为.so文件方法与Linux环境下的交叉编译方法
  • #我与Java虚拟机的故事#连载19:等我技术变强了,我会去看你的 ​
  • $ is not function   和JQUERY 命名 冲突的解说 Jquer问题 (
  • (NO.00004)iOS实现打砖块游戏(十二):伸缩自如,我是如意金箍棒(上)!
  • (办公)springboot配置aop处理请求.
  • (多级缓存)多级缓存
  • (考研湖科大教书匠计算机网络)第一章概述-第五节1:计算机网络体系结构之分层思想和举例
  • (六)Hibernate的二级缓存
  • (原創) 未来三学期想要修的课 (日記)
  • (转)chrome浏览器收藏夹(书签)的导出与导入
  • (转)利用ant在Mac 下自动化打包签名Android程序
  • ******IT公司面试题汇总+优秀技术博客汇总
  • .[hudsonL@cock.li].mkp勒索加密数据库完美恢复---惜分飞
  • .net6+aspose.words导出word并转pdf
  • .netcore 获取appsettings
  • .NET成年了,然后呢?
  • :“Failed to access IIS metabase”解决方法
  • @Autowired和@Resource的区别
  • @ConfigurationProperties注解对数据的自动封装
  • [ 蓝桥杯Web真题 ]-布局切换