压测模版
一、环境
XX环境
系统链路
(系统框架图、领域模型)
当前线上流量分布
(如果有可以参考线上,没有就是摸高)
二、涉及系统&应用
应用名称 | 涉及接口 | 备注 |
三、风险点分析
(依赖:功能外部依赖影响、线上环境影响)
四、压测准备
压测请求准备的数据,注意有点地方可能有redis,可能导致单个账户的请求和多个不一样
压测接口 | 场景 | 压测任务 |
五、压测步骤
受影响消费方
暂无
压测停止条件
-
- 出现系统/错误告警
- 接口RT出现明显拐点
- 影响到线上环境
压测流量停止/拦截
停止:压测任务停止、压测机停止(测试)
拦截:针对压测租户UID进行限流(开发)、机器下线
压测执行
- 确认相关方知会情况
- 压测任务试运行、单机施压能力摸底
- 线上水位更新,监控、盯屏人确认
- 根据压测任务执行顺序与步长,启动任务
- QPS增量调整,线上水位监控,步长间观察5分钟
- 若触发停止条件,根据实际情况判断应急(压测平台熔断or阶梯式降低TPS)
- 若达到压测目标水位,维持10分钟
- 流量阶梯式降低,完成压测
- 压测时间(开始时间,结束时间)
六、压测过程
接口 | 应用 | 机器数量 | STEP1 | STEP2 | STEP3 | STEP4 | ||||||||
QPS | 负载 | RT | QPS | 负载 | 平均RT | QPS | 负载 | 平均RT | QPS | 负载 | 平均RT | |||
XXX | XXX-APP1 | N | 300 | cpu:xx.xx% 内存:xx.xx% | 平均:xx.xx 95%:xx.xx | 600 | cpu:xx.xx% 内存:xx.xx% | 平均:xx.xx 95%:xx.xx | 800 | cpu:xx.xx% 内存:xx.xx% | 平均:xx.xx 95%:xx.xx | 1000 | cpu:xx.xx% 内存:xx.xx% | 平均:xx.xx 95%:xx.xx |
XXX-APP2 | N | cpu:xx.xx% 内存:xx.xx% | cpu:xx.xx% 内存:xx.xx% | cpu:xx.xx% 内存:xx.xx% | cpu:xx.xx% 内存:xx.xx% |
数据库状态(有截图贴上)
- qps
- cpu
- 内存
应用指标状态(有截图贴上)
- 接口rt
- cpu
- 内存
- load:load1、load5、load15
七、压测结论
八、监控盯盘及负责人
-
- 应用:XXX-APP
- 监控:(链接)
- 盯盘:XXX、XX
- 负责人:XXX、XX