当前位置: 首页 > news >正文

zabbix之 自动发现磁盘io util 监控

一、iostat

Zabbix并没有提供模板来监控磁盘的IO性能,所以我们需要自己来创建一个。iostat主要用于监控系统设备的IO负载情况,iostat首次运行时显示自系统启动开始的各项统计信息,之后运行iostat将显示自上次运行该命令以后的统计信息。用户可以通过指定统计的次数和时间来获得所需的统计信息。所以在使用iostat监控系统IO负载的时候,不要直接iostat取结果,而是iostat -dxkt 1 2取结果,否则得到的数据根本不正确

iostat常用参数说明
-c           #仅显示CPU统计信息.与-d选项互斥.
-d           #仅显示磁盘统计信息.与-c选项互斥.
-k           #以K为单位显示每秒的磁盘请求数,默认单位块.
-t            #在输出数据时,打印搜集数据的时间.
-V           #打印版本号和帮助信息.
-x           #输出扩展信息.


avg-cpu段:
 %user: 在用户级别运行所使用的CPU的百分比.
 %nice: nice操作所使用的CPU的百分比.
 %sys: 在系统级别(kernel)运行所使用CPU的百分比.
 %iowait: CPU等待硬件I/O时,所占用CPU百分比.
 %idle: CPU空闲时间的百分比.
Device段:
tps: 每秒钟发送到的I/O请求数.
Blk_read /s: 每秒读取的block数.
Blk_wrtn/s: 每秒写入的block数.
Blk_read:   读入的block总数.
Blk_wrtn:  写入的block总数.


rrqm/s:每秒读请求被合并次数
wrqm/s:每秒写请求被合并次数
r/s:每秒完成的读次数
w/s:每秒完成的写次数
rkB/s:每秒读数据量(kb)
wkB/s:每秒写数据量(kb)
avgrq-sz:平均每次IO请求的扇区大小
avgqu-sz:平均每次IO请求的队列长度(越短越好)
await:平均每次IO请求等待时间(毫秒),一般的系统IO等待时间应该低于5ms,如果大于10ms就比较大了。这个时间包括了队列时间和服务时间,也就是说,一般情况下,await大于svctm,它们的差值越小,则说明队列时间越短,反之差值越大,队列时间越长,说明系统出了问题。
r_await:读的平均耗时(毫秒)
w_await:写入平均耗时(毫秒)
svctm:平均每次IO请求处理时间(毫秒),如果svctm的值与await很接近,表示几乎没有I/O等待,磁盘性能很好,如果await的值远高于svctm的值,则表示I/O队列等待太长,系统上运行的应用程序将变慢。
%util:IO队列非空比例,该参数暗示了设备的繁忙程度。一般地,如果该参数是100%表示设备已经接近满负荷运行了

二、在被监控端上编写自动发现和监控磁盘IO脚本

脚本目录/etc/zabbix/zabbix_agentd.d/scripts

1、磁盘发现脚本
disk_discovery.sh 
#!/bin/bash
diskarray=(`cat /proc/diskstats |grep -E "\bsd[a-z]\b|\bxvd[a-z]\b|\bvd[a-z]\b"|awk '{print $3}'|sort|uniq  2>/dev/null`)
length=${#diskarray[@]}
printf "{\n"
printf  '\t'"\"data\":["
for ((i=0;i<$length;i++))
do
        printf '\n\t\t{'
        printf "\"{#DISK_NAME}\":\"${diskarray[$i]}\"}"
        if [ $i -lt $[$length-1] ];then
                printf ','
        fi
done
printf  "\n\t]\n"
printf "}\n"

2、磁盘io监控脚本
 disk_status.sh 
#/bin/sh
Device=$1
DISK=$2
case $DISK in
         rrqm)
            iostat -dxkt 1 2|grep "\b$Device\b"|tail -1|awk '{print $2}'
            ;;
         wrqm)
            iostat -dxkt 1 2|grep "\b$Device\b"|tail -1|awk '{print $3}'
            ;;
          rps)
            iostat -dxkt 1 2|grep "\b$Device\b"|tail -1|awk '{print $4}'
            ;;
          wps)
            iostat -dxkt 1 2|grep "\b$Device\b" |tail -1|awk '{print $5}'
            ;;
        rKBps)
            iostat -dxkt 1 2|grep "\b$Device\b" |tail -1|awk '{print $6}'
            ;;
        wKBps)
            iostat -dxkt 1 2|grep "\b$Device\b" |tail -1|awk '{print $7}'
            ;;
        avgrq-sz)
            iostat -dxkt 1 2|grep "\b$Device\b" |tail -1|awk '{print $8}'
            ;;
        avgqu-sz)
            iostat -dxkt 1 2|grep "\b$Device\b" |tail -1|awk '{print $9}'
            ;;
        await)
            iostat -dxkt 1 2|grep "\b$Device\b" |tail -1|awk '{print $10}'
            ;;
        svctm)
            iostat -dxkt 1 2|grep "\b$Device\b" |tail -1|awk '{print $11}'
            ;;
         util)
            iostat -dxkt |grep "\b$Device\b" |tail -1|awk '{print $12}'
            ;;
esac

3、zabbix配置文件
UserParameter=disk.discovery[*],/etc/zabbix/zabbix_agentd.d/scripts/disk_discovery.sh
UserParameter=disk.status[*],/etc/zabbix/zabbix_agentd.d/scripts/disk_status.sh $1 $2
4、重启客户端服务
5、在服务端测试
zabbix_get -s 192.168.1.211 -k 'disk.discovery[*]

三、zabbix控制台操作

1、配置-模板-template os linux-自动发现规则 -创建发现规则



2、监控项原型(键值[]中的数值必须大写,否则会报错)
Cannot create item: item with the same key “diskio.x.[[xxxxxx]] already exists


3、图形原型(名称后边要带哪个磁盘的动态名称,否则会报错如下)
zabbix3 Cannot create graph: graph with the same name “Disk IO” already exists


4、zabbix检测中图形中既可以看到相应的图形

转载于:https://www.cnblogs.com/andy6/p/10015974.html

相关文章:

  • 通用点赞设计思路
  • MVVM模块化架构
  • EF Core中执行Sql语句查询操作之FromSql,ExecuteSqlCommand,SqlQuery
  • 随手记统一监控平台Focus设计解析
  • Centos7 系统启动docker报错 inotify add watch failed
  • 以OpenGL/ES视角介绍gfx-hal(Vulkan) Texture接口使用
  • 阿里云应用高可用服务公测发布
  • JAVA入门到精通-第57讲-SQLserver数据类型
  • 利用keepalived实现高可用nginx(修改正)
  • iPhone XS JavaScript性能飙升背后的秘密
  • Java 基础语法
  • 变频电源是什么,变频电源的基础知识的认识
  • springboot配置Druid数据源
  • 红帽高级总监谈OpenJDK的未来:Java的未来从未如此光明
  • 如何设置计算机IP地址
  • 【Redis学习笔记】2018-06-28 redis命令源码学习1
  • 【跃迁之路】【463天】刻意练习系列222(2018.05.14)
  • Apache的80端口被占用以及访问时报错403
  • css选择器
  • css属性的继承、初识值、计算值、当前值、应用值
  • HTML5新特性总结
  • Java到底能干嘛?
  • Java的Interrupt与线程中断
  • Java面向对象及其三大特征
  • js递归,无限分级树形折叠菜单
  • LeetCode算法系列_0891_子序列宽度之和
  • Map集合、散列表、红黑树介绍
  • MobX
  • PAT A1017 优先队列
  • Sass Day-01
  • Vim Clutch | 面向脚踏板编程……
  • 电商搜索引擎的架构设计和性能优化
  • 分享一份非常强势的Android面试题
  • 技术:超级实用的电脑小技巧
  • 力扣(LeetCode)56
  • 前端之Sass/Scss实战笔记
  • 前嗅ForeSpider教程:创建模板
  • 如何学习JavaEE,项目又该如何做?
  • 自动记录MySQL慢查询快照脚本
  • 大数据全解:定义、价值及挑战
  • ​520就是要宠粉,你的心头书我买单
  • ​LeetCode解法汇总2182. 构造限制重复的字符串
  • ​linux启动进程的方式
  • !!java web学习笔记(一到五)
  • # .NET Framework中使用命名管道进行进程间通信
  • #调用传感器数据_Flink使用函数之监控传感器温度上升提醒
  • $.extend({},旧的,新的);合并对象,后面的覆盖前面的
  • (+3)1.3敏捷宣言与敏捷过程的特点
  • (1)SpringCloud 整合Python
  • (NO.00004)iOS实现打砖块游戏(九):游戏中小球与反弹棒的碰撞
  • (pojstep1.3.1)1017(构造法模拟)
  • (附源码)ssm教师工作量核算统计系统 毕业设计 162307
  • (论文阅读11/100)Fast R-CNN
  • (十三)Java springcloud B2B2C o2o多用户商城 springcloud架构 - SSO单点登录之OAuth2.0 根据token获取用户信息(4)...
  • (译)2019年前端性能优化清单 — 下篇