当前位置: 首页 > news >正文

Hadoop3:HDFS-通过配置黑白名单对集群进行扩缩容,并实现数据均衡(实用)

一、集群情况介绍

我的本地虚拟机,一共有三个节点,hadoop102、hadoop103、hadoop104

二、白名单

创建白名单文件whitelist,通过白名单的配置,只允许集群包含102和103两台机器可以存储数据,104无法存储数据。

需求

1、创建白名单

这个位置是任意选择的,因为,hadoop配置文件都在这里,所以我就放这个下面了。
cd /opt/module/hadoop-3.1.3/etc/hadoop	
vim whitelist

2、HDFS关联白名单

hdfs-site.xml配置文件中增加dfs.hosts配置参数

<!-- 白名单 -->
<property><name>dfs.hosts</name><value>/opt/module/hadoop-3.1.3/etc/hadoop/whitelist</value>
</property>

3、分发配置文件

xsync whitelist hdfs-site.xml

4、重启集群

第一次配置白明单,需要重启集群。

myhadoop stop
myhadoop start

5、查看页面

发现只有102和103节点

6、查看进程状态

发现104正常启动的

7、从104上传文件

 cd /opt/module/hadoop-3.1.3/
hadoop fs -put NOTICE.txt /

可以正常上传

查看页面
只有102和103有数据块,并且副本数依然是3个

8、重新配置104到白名单


分发文件

xsync whitelist

刷新节点,无需重启

hdfs dfsadmin -refreshNodes


查看页面
节点添加成功,且104也自动增加一份副本数据。

9、结论

通过上述实验,我们证明了,104被排除出集群了,可以上传文件,只是104的客户端功能。
但是,104无法存储数据块了。
实现了预期效果。
且,再次修改白名单,无需重启集群。

三、动态扩容

集群运行状态下,进行服务器节点的增加扩容。
新节点的初始化配置

添加新节点到集群

1、添加新节点到白名单文件

cd /opt/module/hadoop-3.1.3/etc/hadoop
vim whitelist
xsync whitelist

2、单点启动新节点的Hadoop

hdfs --daemon start datanode
yarn --daemon start nodemanager

3、刷新集群白名单配置

hdfs dfsadmin -refreshNodes

4、新节点测试

上传一个文件到集群

hadoop fs -put wc.jar /


发现,无需重启集群,我们就给集群新增了一个节点,并能正常使用。

5、集群数据均衡

一般,我们新增一个节点之后,这个节点是没有数据的。
所以,我们需要进行一次数据均衡操作,这样,才能让新增的节点分担集群压力。

cd /opt/module/hadoop-3.1.3/
sbin/start-balancer.sh -threshold 10
sbin/stop-balancer.sh

命令解释
sbin/start-balancer.sh -threshold 10
对于参数10,代表的是集群中各个节点的磁盘空间利用率相差不超过10%,可根据实际情况进行调整。

sbin/stop-balancer.sh
停止均衡操作
注意:由于HDFS需要启动单独的Rebalance Server来执行Rebalance操作
所以尽量不要在NameNode上执行start-balancer.sh,而是找一台比较空闲的机器。

四、黑名单配置实现退役服务器

1、说明

黑名单:表示在黑名单的主机IP地址不可以,用来存储数据。
企业中:配置黑名单,用来退役服务器

通过定义可以知道,黑名单的IP必定在白名单中。否则,没意义。

2、配置黑名单

cd /opt/module/hadoop-3.1.3/etc/hadoop
vim blacklist

3、HDFS关联黑名单

hdfs-site.xml配置文件中增加dfs.hosts配置参数

<!-- 白名单 -->
<property><name>dfs.hosts</name><value>/opt/module/hadoop-3.1.3/etc/hadoop/blacklist</value>
</property>

4、分发配置

xsync blacklist hdfs-site.xml

5、刷新集群配置

hdfs dfsadmin -refreshNodes

6、查看网页

正在退役105服务器
因为105有数据,所以,需要一段时间

数据同步完成后的状态

wc.jar的副本多了一个103,说明,105的副本拷贝到103上了。

6、停止105的Hadoop服务

hdfs --daemon stop datanode
yarn --daemon stop nodemanager

需要到10分钟30秒后,才会从页面清除节点信息。

7、数据均衡

一般,退役一个节点,也要进行一次数据均衡

sbin/start-balancer.sh -threshold 10

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • DOM 实例:深入理解文档对象模型
  • Android --- 运行时Fragment如何获取Activity中的数据,又如何将数据传递到Activity中呢?
  • 初识c++(命名空间,缺省参数,函数重载)
  • 安全防御实验2
  • 函数(实参以及形参)
  • 交换机的二三层原理
  • 速盾:如何加强网站的安全性
  • 【web]-f12-iphone6
  • 分手后如何走出夜晚的抑郁,告别失眠困扰?
  • 短视频SEO矩阵系统:源码开发与部署全攻略
  • keepalive检测VIP地址漂移主备切换
  • JAVA-----String类补充
  • 使用Spring Boot实现分布式锁
  • (补充):java各种进制、原码、反码、补码和文本、图像、音频在计算机中的存储方式
  • Linux Mac 安装Higress 平替 Spring Cloud Gateway
  • 分享一款快速APP功能测试工具
  • 时间复杂度分析经典问题——最大子序列和
  • 【108天】Java——《Head First Java》笔记(第1-4章)
  • 【从零开始安装kubernetes-1.7.3】2.flannel、docker以及Harbor的配置以及作用
  • export和import的用法总结
  • python 装饰器(一)
  • XForms - 更强大的Form
  • 创建一种深思熟虑的文化
  • 分享一个自己写的基于canvas的原生js图片爆炸插件
  • 更好理解的面向对象的Javascript 1 —— 动态类型和多态
  • 探索 JS 中的模块化
  • 在Docker Swarm上部署Apache Storm:第1部分
  • SAP CRM里Lead通过工作流自动创建Opportunity的原理讲解 ...
  • 浅谈sql中的in与not in,exists与not exists的区别
  • ​【经验分享】微机原理、指令判断、判断指令是否正确判断指令是否正确​
  • # 消息中间件 RocketMQ 高级功能和源码分析(七)
  • #、%和$符号在OGNL表达式中经常出现
  • #Linux(帮助手册)
  • #鸿蒙生态创新中心#揭幕仪式在深圳湾科技生态园举行
  • (33)STM32——485实验笔记
  • (C语言)fread与fwrite详解
  • (Matlab)遗传算法优化的BP神经网络实现回归预测
  • (Redis使用系列) Springboot 使用redis实现接口Api限流 十
  • (Windows环境)FFMPEG编译,包含编译x264以及x265
  • (不用互三)AI绘画:科技赋能艺术的崭新时代
  • (顶刊)一个基于分类代理模型的超多目标优化算法
  • (独孤九剑)--文件系统
  • (二)windows配置JDK环境
  • (附源码)springboot电竞专题网站 毕业设计 641314
  • (附源码)计算机毕业设计SSM基于java的云顶博客系统
  • (七)Java对象在Hibernate持久化层的状态
  • (转)shell调试方法
  • *setTimeout实现text输入在用户停顿时才调用事件!*
  • .NET 2.0中新增的一些TryGet,TryParse等方法
  • .net core 外观者设计模式 实现,多种支付选择
  • .NET Framework 和 .NET Core 在默认情况下垃圾回收(GC)机制的不同(局部变量部分)
  • .NET/C# 避免调试器不小心提前计算本应延迟计算的值
  • .NetCore发布到IIS
  • .net的socket示例
  • .Net开发笔记(二十)创建一个需要授权的第三方组件