当前位置：首页 > news >正文

spark 整合 yarn

news 来源：原创 2024/9/29 11:37:23

spark 整合 yarn

1、在master节点上停止spark集群
cd /usr/local/soft/spark-2.4.5/sbin

./stop-all.sh

2、spark整合yarn只需要在一个节点整合, 可以删除node1 和node2中所有的spark文件

   分别在node1、node2 的/usr/local/soft目录运行
   rm -rf spark-2.4.5/

3、进入 /spark-2.4.5/conf目录，增加 hadoop 配置文件地址
cp /usr/local/soft/spark-2.4.5/conf

   vim spark-env.sh

直接在文件最后加上
export HADOOP_CONF_DIR=/usr/local/soft/hadoop-2.7.6/etc/hadoop

4、进入/usr/local/soft/hadoop-2.7.6/etc/hadoop目录，修改yarn-site.xml文件（往yarn提交任务需要增加两个配置）

先关闭yarn
   stop-all.sh

   cd /usr/local/soft/hadoop-2.7.6/etc/hadoop

   vim yarn-site.xml


   在<configuration> </configuration>之间加上 :
   <property>
   <name>yarn.nodemanager.pmem-check-enabled</name>
   <value>false</value>
   </property>

   <property>
   <name>yarn.nodemanager.vmem-check-enabled</name>
   <value>false</value>
   </property>

5、同步到其他节点
   cd /usr/local/soft/hadoop-2.7.6/etc/hadoop

   scp -r yarn-site.xml node1:`pwd`
   scp -r yarn-site.xml node2:`pwd`

   再启动yarn
   start-all.sh


   master:50070 -- 检查HDFS
   master:8088 -- 检查Yarn


6、测试
spark有两种模式 :
(1) standalone client模式日志在本地输出，一般用于上线前测试(bin/下执行)

cd /usr/local/soft/spark-2.4.5/examples/jars

提交spark任务
spark-submit --class org.apache.spark.examples.SparkPi --master yarn-client spark-examples_2.11-2.4.5.jar 100

   (2) standalone cluster模式上线使用，不会再本地打印日志减少io

   cd /usr/local/soft/spark-2.4.5/examples/jars

   提交spark任务
   spark-submit --class org.apache.spark.examples.SparkPi --master yarn-cluster spark-examples_2.11-2.4.5.jar 100



   获取yarn程序 cluster模式下的执行日志，执行成功之后才能获取到
   yarn logs -applicationId application_1560967444524_0003

相关文章：

Elementui的el-dropdown组件使用与案例

ansible 模块进阶及变量

JS学习总结

安卓开发拉起其他应用的常用方式

项目经理究竟一年能挣多少钱?一起来看看

人力资源招聘社会校企类型招聘系统校园招聘小程序

基于PLC的全自动洗衣机控制系统课设

WDC西部数据闪存业务救赎之路，会成功吗？

嵌入式实验---实验一通用GPIO实验

行列视（RCV）在生产数据监督中的优势

enum库

SSM实现设置商品秒杀券的后端设计思路

互联网广告相关概念

Pyinstaller 打包exe后，打开出现can‘t find package tkdnd 报错

科技云报道：推进工业新质生产力机器人有望成为AI下一个新引擎？

《Java编程思想》读书笔记-对象导论

Angularjs之国际化

ERLANG 网工修炼笔记 ---- UDP

Git初体验

Linux编程学习笔记 | Linux IO学习[1] - 文件IO

node-glob通配符

Python3爬取英雄联盟英雄皮肤大图

SpringBoot 实战 (三) | 配置文件详解

vue 个人积累(使用工具，组件)

XML已死？

观察者模式实现非直接耦合

记录：CentOS7.2配置LNMP环境记录

说说动画卡顿的解决方案

通信类

学习JavaScript数据结构与算法 — 树

用 vue 组件自定义 v-model，实现一个 Tab 组件。

正则学习笔记

3月27日云栖精选夜读 | 从 “城市大脑”实践，瞭望未来城市源起 ...

数据库巡检项

快速排序（四）——挖坑法，前后指针法与非递归

经纬恒润二面三七互娱一面元象二面

云纳万物 · 数皆有言｜2021 七牛云战略发布会启幕，邀您赴约

#C++ 智能指针 std::unique_ptr 、std::shared_ptr 和 std::weak_ptr

#Lua：Lua调用C++生成的DLL库

（k8s）Kubernetes本地存储接入

（二）windows配置JDK环境

（二刷）代码随想录第16天|104.二叉树的最大深度 559.n叉树的最大深度● 111.二叉树的最小深度● 222.完全二叉树的节点个数

（附源码）springboot码头作业管理系统毕业设计 341654

(附源码)ssm教师工作量核算统计系统毕业设计 162307

（剑指Offer）面试题34：丑数

（论文阅读26/100）Weakly-supervised learning with convolutional neural networks

（排序详解之堆排序）

（十五）devops持续集成开发——jenkins流水线构建策略配置及触发器的使用

(四)opengl函数加载和错误处理

（算法设计与分析）第一章算法概述-习题

（完整代码）R语言中利用SVM-RFE机器学习算法筛选关键因子

（一）【Jmeter】JDK及Jmeter的安装部署及简单配置

(转)Windows2003安全设置/维护

（转载）从 Java 代码到 Java 堆

.NET Core 2.1路线图