当前位置: 首页 > news >正文

实验3 Hadoop集群运行环境搭建和使用

实验3 Hadoop集群运行环境搭建和使用

  • 一、实验介绍

本节实验旨在引导学生通过实际操作搭建一个基本的Hadoop集群,并进行基本的使用验证。实验包括在集群节点上添加域名映射以实现节点间的相互识别,配置免密SSH登录以便无密码访问各节点,安装和配置JDK以满足Hadoop的运行需求。此外,本实验还涉及创建命令和文件同步脚本来维持集群的一致性,安装和配置Hadoop分布式文件系统(HDFS),以及对主节点的格式化和整个Hadoop集群的启动。最后,学生将通过查看进程和验证HDFS环境来检查集群的运行状况。本实验在于让学生深入理解Hadoop集群的运行机制和配置过程,从而掌握大数据技术的核心概念和实践技能。学生将学习如何在分布式计算环境中配置和管理关键组件,这对于处理和分析健康医疗等领域的大规模数据集至关重要。通过这一实践,学生不仅能够熟悉Hadoop集群的搭建流程,还能够增强对分布式数据存储和处理的综合理解,为未来在大数据领域的工作或研究打下坚实的基础。

二、实验目的

1.了解Hadoop及其在健康医疗大数据应用中的作用。

2.熟悉理集群环境格式化和启动的步骤,以及如何验证HDFS环境是否正常工作。

3.掌握Hadoop集群的基本搭建流程,包括域名映射、SSH免密登录、JDK安装和配置等。

三、实验准备

1.所需安装包:jdk-8u231-linux-x64.tar.gz、hadoop-3.2.1.tar.gz、xshell、xftp;

2.获取3台虚拟机master、salve1、slave2的IP地址;

3.试验操作以单人进行。

四、实验步骤

在正式配置Hadoop分布式集群环境之前,利用ifconfig或者hostname -i命令查看三台虚拟机对应的IP地址,后续实验为了方便均利用xshell进行连接三台机器。在本实验中三台虚拟机的IP地址为如下表所示。

虚拟机名称

IP地址

账号

密码

master

192.168.107.128

root

hadoop

slave1

192.168.107.129

root

hadoop

slave2

192.168.107.130

root

hadoop

利用xhell进行连接虚拟机。打开xshell->新建,在名称中输入master,在主机中输入你自己的虚拟机IP。

然后单击用户身份验证,在用户名处输入账号:root,在密码处输入密码:hadoop。然后点击确定->连接即可,用同样的方式连接为slave1、slave2创建连接。

1.添加域名映射 

修改hosts文件,添加所有主机IP地址和主机名对应关系。

# vi /etc/hosts

输入下述内容(根据自己的IP进行修改

192.168.107.128 master

192.168.107.129 slave1

192.168.107.130 slave2

修改完成后,按下ESC键输入:wq保存退出。可用cat命令查看修改后的hosts文件内容。

# cat /etc/hosts

按照同样的方式将上传内容配置到slave1、slave2中的/etc/hosts文件。

2.配置免密登录

使用命令生成服务器密钥。(输完命令按四次回车,三台机器均需要操作

# ssh-keygen

进入/root/.ssh/目录,可查看生成的密钥。

# cd /root/.ssh/
# ll

使用ssh-copy-id命令拷贝公钥到目标主机。(所有节点都需进行下列操作,在提示处输入yes

# ssh-copy-id master
# ssh-copy-id slave1
# ssh-copy-id slave2

三台节点处理完成后,利用ssh登录目标主机,可发现三台节点间可以任意切换,不再需要输入密码。登录后可利用exit退回上一级节点。

例如在master节点中利用ssh slave1切换到slave1。可以看见前面由master变成了slave1。

3.安装和配置JDK

利用xftp将jdk-8u231-linux-x64.tar.gz、hadoop-3.2.1.tar.gz上传到master节点的/usr/local/install_pack/目录下。

进入安装包目录(提前将安装包上传到install_pack目录下)

#cd /usr/local/install_pack/

解压JDK安装包到/usr/local/software目录下,输入下列命令

# tar -zxvf jdk-8u231-linux-x64.tar.gz -C /usr/local/software/ 

查看

# ls -lrt /usr/local/software

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 创建索引遇到这个Bug,19c中还没有修复
  • 粒子向上持续瀑布动画效果(直接粘贴到记事本改html即可)
  • 【AI实战攻略】保姆级教程:用AI打造治愈动画vlog,轻松打造爆款,快速涨粉!
  • maxcompute使用篇
  • 8. 防火墙
  • Nginx从入门到入土(二): 学习内容与安装
  • LeetCode 面试经典150题 190.颠倒二进制位
  • 微服务Docker相关指令
  • 第三章 Smart X超融合测试历程第三天
  • 边缘计算网关在工业中的应用
  • ⭐ Unity + OpenCV 实现实时图像识别与叠加效果
  • MySQL---创建数据库(基于SQLyog)
  • MySQL系列—11.Redo log
  • 深度学习速通系列:如何使用文本标注工具进行命名实体识别?
  • 关于http的206状态码和416状态码的意义、断点续传以及CORS使用Access-Control-Allow-Origin来允许跨域请求
  • 《Javascript高级程序设计 (第三版)》第五章 引用类型
  • 【跃迁之路】【477天】刻意练习系列236(2018.05.28)
  • 10个最佳ES6特性 ES7与ES8的特性
  • CSS选择器——伪元素选择器之处理父元素高度及外边距溢出
  • Django 博客开发教程 16 - 统计文章阅读量
  • Javascript Math对象和Date对象常用方法详解
  • JavaScript学习总结——原型
  • Js实现点击查看全文(类似今日头条、知乎日报效果)
  • Linux各目录及每个目录的详细介绍
  • OSS Web直传 (文件图片)
  • PAT A1050
  • Python 基础起步 (十) 什么叫函数?
  • SpringCloud集成分布式事务LCN (一)
  • UEditor初始化失败(实例已存在,但视图未渲染出来,单页化)
  • 分类模型——Logistics Regression
  • 入门到放弃node系列之Hello Word篇
  • 为什么要用IPython/Jupyter?
  • 温故知新之javascript面向对象
  • Nginx实现动静分离
  • 选择阿里云数据库HBase版十大理由
  • ​3ds Max插件CG MAGIC图形板块为您提升线条效率!
  • ​queue --- 一个同步的队列类​
  • #### go map 底层结构 ####
  • #nginx配置案例
  • #VERDI# 关于如何查看FSM状态机的方法
  • $ is not function   和JQUERY 命名 冲突的解说 Jquer问题 (
  • $emit传递多个参数_PPC和MIPS指令集下二进制代码中函数参数个数的识别方法
  • (4)logging(日志模块)
  • (M)unity2D敌人的创建、人物属性设置,遇敌掉血
  • (react踩过的坑)antd 如何同时获取一个select 的value和 label值
  • (六)软件测试分工
  • (十二)devops持续集成开发——jenkins的全局工具配置之sonar qube环境安装及配置
  • (转) Android中ViewStub组件使用
  • (转)Spring4.2.5+Hibernate4.3.11+Struts1.3.8集成方案一
  • ***检测工具之RKHunter AIDE
  • .bat批处理(十一):替换字符串中包含百分号%的子串
  • .desktop 桌面快捷_Linux桌面环境那么多,这几款优秀的任你选
  • .Net Core缓存组件(MemoryCache)源码解析
  • .net dataexcel winform控件 更新 日志
  • .NET 编写一个可以异步等待循环中任何一个部分的 Awaiter