当前位置: 首页 > news >正文

Spark 1.1.0 安装测试 (分布式 Yarn-cluster模式)

Spark版本:spark-1.1.0-bin-hadoop2.4 (下载:http://spark.apache.org/downloads.html)

服务器环境的情况,请参考上篇博文 hbase centOS生产环境配置笔记

(hbase-r是ResourceManager; hbase-1, hbase-2, hbase-3是NodeManager)

 

1. 安装和配置 (yarn-cluster模式的文档参考:http://spark.apache.org/docs/latest/running-on-yarn.html)

  yarn-cluster模式运行程序,spark会将程序jar包保存至hdfs,然后自动通过yarn的配置,分布式运行在各台NodeManager上。故这个模式下,无须指定Spark的master和slaves。

 

  (1) 安装scala

  下载rpm包,安装

  

  (1) 本次Spark将在所有机器上安装:hbase-0, hbase-r, hbase-1, hbase-2, hbase-3。

  解压后目录中的文件拷贝至 /hbase/spark,以下配置文件的路径都是相对于该目录下。全部配置好了以后,安装目录,环境变量等,都将复制在所有机器上。

  

  (2) 环境变量, ~/.bashrc

export SPARK_HOME="/hbase/spark"
export SCALA_HOME="/usr/share/scala"
export SPARK_CLASSPATH="$SPARK_CLASSPATH:/hbase/hbase/lib"
 
 
 

 

  (3) 设置Spark Properties,conf/spark-defaults.conf

# options for Yarn-cluster mode
spark.yarn.applicationMaster.waitTries          10
spark.yarn.submit.file.replication              1
spark.yarn.preserve.staging.files               false
spark.yarn.scheduler.heartbeat.interval-ms      5000
spark.yarn.max.executor.failures                6
spark.yarn.historyServer.address                hbase-r:10020
spark.yarn.executor.memoryOverhead              512
spark.yarn.driver.memoryOverhead                512

 

  (4) 在防火墙上设置所有机器之间互相可以内网访问所有端口(单独设置特定的端口范围太过麻烦了,hadoop, hbase, spark, yarn, zookeeper等各种监听端口太多了)。

   

  (3) 测试 java example

./bin/spark-submit --class org.apache.spark.examples.JavaSparkPi --master yarn-cluster --num-executors 3 --driver-memory 1024m  --executor-memory 1024m --executor-cores 1 lib/spark-examples*.jar 20

  运行成功后,在控制台可以看到

     yarnAppState: FINISHED
     distributedFinalState: SUCCEEDED
     appTrackingUrl: http://hbase-r:18088/proxy/application_1414738706972_0011/A

  然后访问 appTrackingUrl,可以看到如下结果,可以看到 FinalStatus:SUCCEEDED

                    Application Overview
         User:       webadmin
         Name:       org.apache.spark.examples.JavaSparkPi
   Application Type: SPARK
   Application Tags:
        State:       FINISHED
     FinalStatus:    SUCCEEDED
       Started:      3-Nov-2014 15:17:19
       Elapsed:      43sec
     Tracking URL:   History
     Diagnostics:
   ApplicationMaster
    Attempt Number       Start Time          Node     Logs
   1                 3-Nov-2014 15:17:19 hbase-1:8042 logs

 

 

 

转载于:https://www.cnblogs.com/got-my-way/p/4065777.html

相关文章:

  • 唐僧给悟空的信
  • JS 操作页面基础操作:禁止另存 防止复制 防止选择
  • [转] 浅谈 MVC3 WebMail 发送邮件
  • 检查android设备是否支持某些功能
  • View Controller 容器
  • 详解HTTP协议(二)
  • 网站优化过程中关键字选择的六大项
  • HIbernate的“1+N”问题
  • 剑指Offer——二叉树的深度
  • 匈牙利算法求解任务分配问题
  • asp.net 各种小窍门
  • 开源协议的比较
  • Windows无法访问指定设备路径或文件,您可能没有合适的权限访问这个项目
  • Visual Studio + web deploy部署web服务器到IIS过程记录
  • MVC 3 基本操作增加修改
  • 《用数据讲故事》作者Cole N. Knaflic:消除一切无效的图表
  • 【挥舞JS】JS实现继承,封装一个extends方法
  • 【译】React性能工程(下) -- 深入研究React性能调试
  • bearychat的java client
  • es6--symbol
  • gf框架之分页模块(五) - 自定义分页
  • js中forEach回调同异步问题
  • Linux中的硬链接与软链接
  • MobX
  • MySQL Access denied for user 'root'@'localhost' 解决方法
  • NLPIR语义挖掘平台推动行业大数据应用服务
  • nodejs实现webservice问题总结
  • Redux 中间件分析
  • SpringBoot几种定时任务的实现方式
  • Spring声明式事务管理之一:五大属性分析
  • vue自定义指令实现v-tap插件
  • 分享一个自己写的基于canvas的原生js图片爆炸插件
  • 回顾2016
  • 看图轻松理解数据结构与算法系列(基于数组的栈)
  • 前端学习笔记之观察者模式
  • 推荐一个React的管理后台框架
  • 想使用 MongoDB ,你应该了解这8个方面!
  • 一些基于React、Vue、Node.js、MongoDB技术栈的实践项目
  • 用Canvas画一棵二叉树
  • 翻译 | The Principles of OOD 面向对象设计原则
  • ​LeetCode解法汇总2182. 构造限制重复的字符串
  • ###项目技术发展史
  • (20050108)又读《平凡的世界》
  • (Oracle)SQL优化技巧(一):分页查询
  • (搬运以学习)flask 上下文的实现
  • (含react-draggable库以及相关BUG如何解决)固定在左上方某盒子内(如按钮)添加可拖动功能,使用react hook语法实现
  • (十七)Flask之大型项目目录结构示例【二扣蓝图】
  • (原創) 如何優化ThinkPad X61開機速度? (NB) (ThinkPad) (X61) (OS) (Windows)
  • ./configure,make,make install的作用(转)
  • .NET 分布式技术比较
  • .NET 服务 ServiceController
  • .NET 依赖注入和配置系统
  • .Net 应用中使用dot trace进行性能诊断
  • .net遍历html中全部的中文,ASP.NET中遍历页面的所有button控件
  • .NET使用存储过程实现对数据库的增删改查