当前位置: 首页 > news >正文

spark 整合 yarn

spark 整合 yarn


1、在master节点上停止spark集群    
    cd /usr/local/soft/spark-2.4.5/sbin
   
    ./stop-all.sh

    
2、spark整合yarn只需要在一个节点整合, 可以删除node1 和node2中所有的spark文件

    分别在node1、node2 的/usr/local/soft目录运行
    rm -rf spark-2.4.5/
    

3、 进入 /spark-2.4.5/conf目录,增加 hadoop 配置文件地址
    cp /usr/local/soft/spark-2.4.5/conf
    
    vim spark-env.sh
    
    直接在文件最后加上
    export HADOOP_CONF_DIR=/usr/local/soft/hadoop-2.7.6/etc/hadoop
    

4、 进入/usr/local/soft/hadoop-2.7.6/etc/hadoop目录,修改yarn-site.xml文件(往yarn提交任务需要增加两个配置)
 
    先关闭yarn
    stop-all.sh
    
    cd /usr/local/soft/hadoop-2.7.6/etc/hadoop
    
    vim yarn-site.xml
    
    
    在<configuration> </configuration>之间加上 :
    <property>
    <name>yarn.nodemanager.pmem-check-enabled</name>
    <value>false</value>
    </property>

    <property>
    <name>yarn.nodemanager.vmem-check-enabled</name>
    <value>false</value>
    </property>
    

5、同步到其他节点
    cd /usr/local/soft/hadoop-2.7.6/etc/hadoop
    
    scp -r yarn-site.xml node1:`pwd`
    scp -r yarn-site.xml node2:`pwd`
    


    
    再启动yarn
    start-all.sh
    
    
    master:50070  -- 检查HDFS 
    master:8088   -- 检查Yarn
    
    
6、测试
   spark有两种模式 :
   (1) standalone client模式   日志在本地输出,一般用于上线前测试(bin/下执行)

    cd /usr/local/soft/spark-2.4.5/examples/jars

    提交spark任务
    spark-submit --class org.apache.spark.examples.SparkPi --master yarn-client spark-examples_2.11-2.4.5.jar 100


    (2) standalone cluster模式   上线使用,不会再本地打印日志   减少io
    
    cd /usr/local/soft/spark-2.4.5/examples/jars
    
    提交spark任务
    spark-submit --class org.apache.spark.examples.SparkPi --master yarn-cluster spark-examples_2.11-2.4.5.jar 100
    
    
    
    获取yarn程序 cluster模式 下的执行日志 , 执行成功之后才能获取到
    yarn logs -applicationId application_1560967444524_0003

相关文章:

  • Elementui的el-dropdown组件使用与案例
  • ansible 模块进阶及变量
  • JS学习总结
  • 安卓开发拉起其他应用的常用方式
  • 项目经理究竟一年能挣多少钱?一起来看看
  • 人力资源招聘社会校企类型招聘系统校园招聘小程序
  • 基于PLC的全自动洗衣机控制系统课设
  • WDC西部数据闪存业务救赎之路,会成功吗?
  • 嵌入式实验---实验一 通用GPIO实验
  • 行列视(RCV)在生产数据监督中的优势
  • enum库
  • SSM实现设置商品秒杀券的后端设计思路
  • 互联网广告相关概念
  • Pyinstaller 打包exe后,打开出现can‘t find package tkdnd 报错
  • 科技云报道:推进工业新质生产力机器人有望成为AI下一个新引擎?
  • 《Java编程思想》读书笔记-对象导论
  • Angularjs之国际化
  • ERLANG 网工修炼笔记 ---- UDP
  • Git初体验
  • Linux编程学习笔记 | Linux IO学习[1] - 文件IO
  • node-glob通配符
  • Python3爬取英雄联盟英雄皮肤大图
  • SpringBoot 实战 (三) | 配置文件详解
  • vue 个人积累(使用工具,组件)
  • XML已死 ?
  • 观察者模式实现非直接耦合
  • 记录:CentOS7.2配置LNMP环境记录
  • 说说动画卡顿的解决方案
  • 通信类
  • 学习JavaScript数据结构与算法 — 树
  • 用 vue 组件自定义 v-model, 实现一个 Tab 组件。
  • 正则学习笔记
  • 3月27日云栖精选夜读 | 从 “城市大脑”实践,瞭望未来城市源起 ...
  • 数据库巡检项
  • ​​快速排序(四)——挖坑法,前后指针法与非递归
  • ​经​纬​恒​润​二​面​​三​七​互​娱​一​面​​元​象​二​面​
  • ​云纳万物 · 数皆有言|2021 七牛云战略发布会启幕,邀您赴约
  • #C++ 智能指针 std::unique_ptr 、std::shared_ptr 和 std::weak_ptr
  • #Lua:Lua调用C++生成的DLL库
  • (k8s)Kubernetes本地存储接入
  • (二)windows配置JDK环境
  • (二刷)代码随想录第16天|104.二叉树的最大深度 559.n叉树的最大深度● 111.二叉树的最小深度● 222.完全二叉树的节点个数
  • (附源码)springboot码头作业管理系统 毕业设计 341654
  • (附源码)ssm教师工作量核算统计系统 毕业设计 162307
  • (剑指Offer)面试题34:丑数
  • (论文阅读26/100)Weakly-supervised learning with convolutional neural networks
  • (排序详解之 堆排序)
  • (十五)devops持续集成开发——jenkins流水线构建策略配置及触发器的使用
  • (四)opengl函数加载和错误处理
  • (算法设计与分析)第一章算法概述-习题
  • (完整代码)R语言中利用SVM-RFE机器学习算法筛选关键因子
  • (一)【Jmeter】JDK及Jmeter的安装部署及简单配置
  • (转)Windows2003安全设置/维护
  • (转载)从 Java 代码到 Java 堆
  • .NET Core 2.1路线图