当前位置: 首页 > news >正文

【银河麒麟高级服务器操作系统】数据中心系统异常卡死分析处理建议

了解银河麒麟操作系统更多全新产品,请点击访问:https://product.kylinos.cn

1.服务器环境以及配置

【机型】浪潮NF5280M5

处理器:

Intel

内存:

1T

【内核版本】

4.19.90-24.4.v2101.ky10.x86_64

【OS镜像版本】

银河麒麟高级服务器操作系统 Kylin-Server-10-SP2-Release-0524-x86_64

2.问题现象描述

宕机时间凌晨2点09分左右,系统异常卡死,后手动重启系统,恢复的故障环境。需系统层面,分析排查。

3.问题分析

分析系统日志,可知,系统重启时间为02:54左右。查看重启时间之前的messages日志信息,未看到有效报错日志,只有内核层面正常记录的audit审计模块相关日志信息输出,如图1、图2和图3:

图1

图2

图3

进一步分析,查看系统sar和kdump内核崩溃相关日志信息。发现此系统,未安装系统性能监控工具sysstat、禁用了kdump内核崩溃收集服务。如图4和图5:

图4 kdump服务disable禁用

图5 未安装sysstat

   

查看bmc日志,搜索error关键字,未排查到此次系统卡死,跟系统相关的信息,如图6:

图6

4.问题分析结果

综上,日志分析情况,未能通过系统和bmc日志,排查到有效报错信息。因未启用kdump服务,未收集到内核崩溃相关日志,无法判断系统卡死,是否跟系统内核有关。未安装系统性能监控工具sysstat, 没有收集到,系统性能日志,同样无法分析判断,系统卡死,是否跟CPU、内存、磁盘IO等资源异常使用有关。

5.后续计划与建议

建议,系统层,开启kdump服务,安装系统性能监控工具sysstat。等下次问题复现,收集到这些日志信息,可进一步分析,明确问题方向。

  1. 开启kdump服务,命令如下:

启动服务

#systemctl start kdump

#systemctl enable kdump

查看服务状态

# kdumpctl status

# systemctl status kdump.service

  1. 安装性能监控工具sysstat,命令如下:

软件包下载链接:

https://update.cs2c.com.cn/NS/V10/V10SP2/os/adv/lic/updates/x86_64/Packages/sysstat-12.2.1-6.ky10.x86_64.rpm

#rpm -ivh sysstat-12.2.1-6.ky10.x86_64.rpm

# systemctl start sysstat

# systemctl enable sysstat

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 算法·二分
  • 24.js获取元素尺寸、元素偏移量、获取文档尺寸
  • 高职Web全栈式开发实训室解决方案
  • 用微客云搭建一套外卖霸王餐系统赚CPS佣金
  • MySQL InnoDB存储引擎
  • 网信大数据信用报告查询怎么查?网信大数据有什么作用?
  • Excel的Index+MATCH组合使用方法
  • laravel设计模式详解
  • Redis实践经验
  • 深度学习基础与实战:Python实现
  • spark任务,使用 repartition 对数据进行了重新分区,但任务输入数据大小仍存在不均衡
  • mmtracking单目标跟踪数据集说明以及自定义数据集
  • 重载车辆驾驶舱地板的监测与故障诊断
  • Opencv图像处理(全)
  • 【建议收藏】一万字图文并茂,终于有人把GPT的玩法整理全了
  • [PHP内核探索]PHP中的哈希表
  • Android 初级面试者拾遗(前台界面篇)之 Activity 和 Fragment
  • Docker容器管理
  • JAVA SE 6 GC调优笔记
  • Markdown 语法简单说明
  • Netty+SpringBoot+FastDFS+Html5实现聊天App(六)
  • React+TypeScript入门
  • React系列之 Redux 架构模式
  • Solarized Scheme
  • vue学习系列(二)vue-cli
  • 那些被忽略的 JavaScript 数组方法细节
  • 深入体验bash on windows,在windows上搭建原生的linux开发环境,酷!
  • 使用权重正则化较少模型过拟合
  • 云栖大讲堂Java基础入门(三)- 阿里巴巴Java开发手册介绍
  • 走向全栈之MongoDB的使用
  • 你学不懂C语言,是因为不懂编写C程序的7个步骤 ...
  • ​​快速排序(四)——挖坑法,前后指针法与非递归
  • ​决定德拉瓦州地区版图的关键历史事件
  • ​中南建设2022年半年报“韧”字当头,经营性现金流持续为正​
  • # 消息中间件 RocketMQ 高级功能和源码分析(七)
  • $().each和$.each的区别
  • %check_box% in rails :coditions={:has_many , :through}
  • (30)数组元素和与数字和的绝对差
  • (42)STM32——LCD显示屏实验笔记
  • (二)丶RabbitMQ的六大核心
  • (附源码)springboot车辆管理系统 毕业设计 031034
  • (附源码)计算机毕业设计ssm电影分享网站
  • (附源码)小程序儿童艺术培训机构教育管理小程序 毕业设计 201740
  • (入门自用)--C++--抽象类--多态原理--虚表--1020
  • (太强大了) - Linux 性能监控、测试、优化工具
  • (一)Docker基本介绍
  • (正则)提取页面里的img标签
  • (转)菜鸟学数据库(三)——存储过程
  • (转)为C# Windows服务添加安装程序
  • *(长期更新)软考网络工程师学习笔记——Section 22 无线局域网
  • .NET Windows:删除文件夹后立即判断,有可能依然存在
  • .NET 表达式计算:Expression Evaluator
  • .net 后台导出excel ,word
  • .NET 事件模型教程(二)
  • .net 受管制代码