当前位置: 首页 > news >正文

【HDFS】Decommision(退役) EC数据节点剩最后几个块卡住的问题

一、背景

近期操作退役EC集群的节点。在退役的过程中,遇到了一些问题。特此总结一下。

本文描述的问题现象是:
每一批次退役10个节点,完全退役成功后开始操作下一批。
但是,中间有一批次有2台节点的Under Replicated Blocks一直是1,不往下降。
处于Decommissioning状态卡住了很久。如果不人为干预的话,会一直卡住,无法退役成功。

二、问题排查、源码分析

1、首先确定卡在了哪个块的复制上。

将 org.apache.hadoop.hdfs.server.blockmanagement.DatanodeAdminManager这个LOG的级别修改为TRACE级别。
这样在DatanodeAdminManager#isSufficient方法里就会有TRACE日志打印出来,告诉我们哪个块有问题。

如下图所示,我们知道卡在了blk_-9223372034543410656_197486297这个块上。

2、 使用fsck -blockId 看看这个块属于哪个文件?
如下图所示。另外我们注意到,此块有一个internal block已经是DECOMMISSIONED状态了(0390节点上那个,这个细节很重要。)

相关文章:

  • 超低功耗32位单片机MM32L0130
  • 【Android】隐藏settings中的二级菜单
  • 【Kubernetes】k8s中容器之间、pod之间如何进行网络通信?
  • 【比较mybatis、lazy、sqltoy、mybatis-flex操作数据】操作批量新增、分页查询(二)
  • 计算机网络(2)-----数据链路层
  • 集合篇之ArrayList
  • 【软件测试】--功能测试4-html介绍
  • untiy 室内灯光最佳实践
  • 爬取博客的图片并且将它存储到响应的目录
  • C#高级:DataGridView的详解
  • 练习2-线性回归迭代(李沐函数简要解析)
  • 命令行启动mongodb服务器的问题及解决方案 -- Unrecognized option: storage.journal
  • springboot 实现本地文件存储
  • SD NAND:为车载显示器注入智能与安全的心脏
  • selenium测试工具用来模拟用户浏览器的操作
  • [rust! #004] [译] Rust 的内置 Traits, 使用场景, 方式, 和原因
  • 《网管员必读——网络组建》(第2版)电子课件下载
  • 【笔记】你不知道的JS读书笔记——Promise
  • 【腾讯Bugly干货分享】从0到1打造直播 App
  • const let
  • CSS3 聊天气泡框以及 inherit、currentColor 关键字
  • k个最大的数及变种小结
  • Twitter赢在开放,三年创造奇迹
  • VirtualBox 安装过程中出现 Running VMs found 错误的解决过程
  • 代理模式
  • 基于Mobx的多页面小程序的全局共享状态管理实践
  • 技术发展面试
  • 批量截取pdf文件
  • 区块链共识机制优缺点对比都是什么
  • 使用docker-compose进行多节点部署
  • 一个项目push到多个远程Git仓库
  • 在weex里面使用chart图表
  • 【云吞铺子】性能抖动剖析(二)
  • # 飞书APP集成平台-数字化落地
  • #### go map 底层结构 ####
  • #每天一道面试题# 什么是MySQL的回表查询
  • (07)Hive——窗口函数详解
  • (4)通过调用hadoop的java api实现本地文件上传到hadoop文件系统上
  • (补)B+树一些思想
  • (转)原始图像数据和PDF中的图像数据
  • (转载)Google Chrome调试JS
  • .class文件转换.java_从一个class文件深入理解Java字节码结构
  • .NET 3.0 Framework已经被添加到WindowUpdate
  • .NET MVC、 WebAPI、 WebService【ws】、NVVM、WCF、Remoting
  • .net MVC中使用angularJs刷新页面数据列表
  • .net web项目 调用webService
  • .net 开发怎么实现前后端分离_前后端分离:分离式开发和一体式发布
  • .NET设计模式(11):组合模式(Composite Pattern)
  • .NET性能优化(文摘)
  • @ModelAttribute 注解
  • [BUUCTF NewStarCTF 2023 公开赛道] week3 crypto/pwn
  • [BZOJ] 2044: 三维导弹拦截
  • [C#]DataTable常用操作总结【转】
  • [ffmpeg] aac 音频编码
  • [Hadoop in China 2011] 蒋建平:探秘基于Hadoop的华为共有云