当前位置: 首页 > news >正文

在ubuntu系统上使用Hadoop搭建集群

在ubuntu系统上使用Hadoop搭建集群在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

两台ubuntu(注意:hosts、config以及hadoop中的主节点、附属节点的主机名应保持一致)参考博客

1、配置ssh(默认连接方式 ssh 用户名@主机ip)使得免ip、免用户名登录(ssh 自定义主机名)

  • 修改/etc/hosts文件添加主机名和ip的映射,使得免ip
    外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

  • 修改~/.ssh/config 文件使得免用户名
    外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

2、安装hadoop并配置hadoop环境变量、安装java并配置JAVA_HOME(参考博客)

3、修改/usr/local/hadoop/etc/hadoop 中的几个配置文件

  • hadoop-env.sh:配置运行时的环境,指定JAVA_HOME的安装目录:export JAVA_HOME=安装目录(注意必须直接指出安装路径,不能使用$JAVA_HOME,否则运行时会报错找不到JAVA_HOME)
    外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

  • slaves(标明所有的附属节点主机名,使用该主机名可以直接ssh登录主机)(该文件仅master节点持有)把所有从节点的主机名写到这儿就可以,这是告诉hadoop进程哪些机器是从节点。每行写一个,例如
    外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

    前提是你已经为每个节点进行了hostname的命名。而且每个节点的hosts文件你修改了本地dns的指向,让这些主机指向约定好的IP。然后每个节点的hosts文件保持同步。

  • 核心配置文件:core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml
    外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传
    core-site.xml:文件系统采用hdfs实现、临时数据存放的位置、缓冲区大小,实际工作中根据服务器性能动态调整、开启hdfs的垃圾桶机制,删除掉的数据可以从垃圾桶中回收
    外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传
    hdfs-site.xml:
    外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传
    mapred-site.xml
    外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传
    yarn-site.xml:这个文件就是配置资源管理系统yarn了,其中主要指定了一些节点资源管理器nodemanager,以及总资源管理器resourcemanager的配置。 可以看到这个配置中,跟mapreduce框架是相关的。
    外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

4、将hadoop文件夹发送给其他的slave节点、删除其中的slaves文件、在各个slave节点上配置hadoop环境变量、安装java并配置JAVA_HOME(参考博客)

5、启动(在master节点)

  • 执行NameNode的格式化:hdfs namenode -format(第一次启动服务前进行的操作,之后再开启集群无需此操作)

  • 启动 Hadoop:
    start-dfs.sh
    start-yarn.sh
    mr-jobhistory-daemon.sh start historyserver

  • 可以在master和slave节点上使用jps命令查看各个节点所启动的进程

    master
    外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传
    slave1
    外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

  • 关闭集群
    stop-yarn.sh
    stop-dfs.sh
    mr-jobhistory-daemon.sh stop historyserver

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 向量数据库Faiss的搭建与使用
  • vivado 定义时间约束
  • 七,Spring Boot 当中的 yaml 语法使用
  • 虚幻地形高度图生成及测试
  • 数据结构树(C语言版)
  • 华为OD机试 - 猜数字 - 穷举搜索(Java 2024 E卷 100分)
  • docker实战基础三(Docker基础命令)
  • 深度学习100问54:什么是自动图像描述
  • Pyspark中的ROW对象使用
  • [Doc][px4][ros2][gazebo][yolov8]PX4-ROS2-Gazebo-YOLOv8
  • SQL 数据查询
  • 《JavaEE进阶》----8.<SpringMVC实践项目:【简易对话留言板(数据存在内存中)】>
  • 3134. 找出唯一性数组的中位数
  • Go父类调用子类方法(虚函数调用)
  • k8s中pod基础及https密钥、horber仓库
  • 【Amaple教程】5. 插件
  • 【跃迁之路】【669天】程序员高效学习方法论探索系列(实验阶段426-2018.12.13)...
  • 8年软件测试工程师感悟——写给还在迷茫中的朋友
  • android百种动画侧滑库、步骤视图、TextView效果、社交、搜房、K线图等源码
  • CSS进阶篇--用CSS开启硬件加速来提高网站性能
  • jQuery(一)
  • leetcode378. Kth Smallest Element in a Sorted Matrix
  • Making An Indicator With Pure CSS
  • nginx 配置多 域名 + 多 https
  • 阿里云Kubernetes容器服务上体验Knative
  • 分享几个不错的工具
  • 给初学者:JavaScript 中数组操作注意点
  • 开源地图数据可视化库——mapnik
  • 收藏好这篇,别再只说“数据劫持”了
  • 问:在指定的JSON数据中(最外层是数组)根据指定条件拿到匹配到的结果
  • 我从编程教室毕业
  • 测评:对于写作的人来说,Markdown是你最好的朋友 ...
  • ​人工智能书单(数学基础篇)
  • # 睡眠3秒_床上这样睡觉的人,睡眠质量多半不好
  • #pragma data_seg 共享数据区(转)
  • (Java数据结构)ArrayList
  • (附源码)ssm高校实验室 毕业设计 800008
  • (七)c52学习之旅-中断
  • (转)IIS6 ASP 0251超过响应缓冲区限制错误的解决方法
  • (转)ObjectiveC 深浅拷贝学习
  • (转)Oracle 9i 数据库设计指引全集(1)
  • (转)利用ant在Mac 下自动化打包签名Android程序
  • (转)真正的中国天气api接口xml,json(求加精) ...
  • ****Linux下Mysql的安装和配置
  • .NET MVC、 WebAPI、 WebService【ws】、NVVM、WCF、Remoting
  • .net 微服务 服务保护 自动重试 Polly
  • .NET程序员迈向卓越的必由之路
  • .NET与java的MVC模式(2):struts2核心工作流程与原理
  • .net之微信企业号开发(一) 所使用的环境与工具以及准备工作
  • 。Net下Windows服务程序开发疑惑
  • /etc/motd and /etc/issue
  • :中兴通讯为何成功
  • @Autowired 与@Resource的区别
  • @synthesize和@dynamic分别有什么作用?
  • [2019.2.28]BZOJ4033 [HAOI2015]树上染色