当前位置: 首页 > news >正文

kafka单条消息过大导致线上OOM,运维连夜跑路了!

1 线上问题

kafka生产者罢工,停止生产,生产者内存急剧升高,导致程序几次重启。

查看日志,发现Pro程序爆异常kafka.common.MessageSizeTooLargeException。

查看kafka配置,默认单条消息最大1M,当单条消息长度超过1M,就会出现发送到broker失败,从而导致消息在producer的队列一直累积,直到Pro OOM。

赶紧修改kafka配置,解决问题。

2 修改步骤

  • 修改kafka的broker配置:message.max.bytes(默认1000000B),单条消息最大长度。使用kafka时,应预估单条消息的最大长度,不然会发送失败
  • 修改kafka的broker配置:replica.fetch.max.bytes (默认1MB),broker可复制的消息的最大字节数。应该比message.max.bytes大,否则broker会接收此消息,但无法将此消息复制出去,从而造成数据丢失
  • 修改消费者程序端配置:fetch.message.max.bytes (默认1MB) – 消费者能读取的最大消息。应该≥message.max.bytes。若不调节该参数,会导致消费者无法消费到消息,且不会爆出异常或警告,导致消息在broker累积

按需调整上三参数。

3 是否参数调节得越大越好

或者说,单条消息越大越好?参考http://www.mamicode.com/info-detail-453907.html说法:

3.1 性能

通过性能测试,kafka在消息为10K时吞吐量达到最大,更大消息降低吞吐量,在设计集群的容量时,尤其要考虑。

3.2 可用的内存和分区数

Brokers会为每个分区分配replica.fetch.max.bytes参数指定的内存空间,假设

replica.fetch.max.bytes=1M

且有1000个分区,则需近1G内存,确保分区数最大的消息不会超过服务器内存,否则OOM。

消费端的fetch.message.max.bytes指定最大消息需要的内存空间,同样,分区数最大需要内存空间不能超过服务器内存。所以,若你有大消息要传送,则在内存一定时,只能:

  • 使用较少分区数
  • 或使用更大内存的服务器

3.3 GC

更大的消息会让GC更长(因为broker需分配更大的块),关注GC日志和服务器日志信息。若长时间的GC导致kafka丢失了zk的会话,则需配置zookeeper.session.timeout.ms参数为更大的超时时间。

相关文章:

  • ValidateCode验证码的使用详解(初学看完都会用)
  • 肝了一周总结的SpringBoot常用注解大全,一目了然!
  • 无线电信号密钥WiFi完整版学习教程
  • Linux----paste命令使用详解
  • 【LSTM时序预测】基于灰狼算法优化长短时记忆网络GWO-LSTM实现风电功率预测附Matlab代码
  • 语音识别芯片LD3320介绍
  • Java的List之坑系列--Collections#unmodifiableList仍然可变
  • 我的一周年创作纪念日
  • idea中推送本地仓库和远程仓库后代码回退
  • Ultra-high Resolution Image Segmentation via Locality-aware Context Fusion
  • Windows取证——数据恢复(Fat32文件系统和NTFS文件系统)
  • 记一次 .NET 某安全生产信息系统 CPU爆高分析
  • 阻塞队列的使用
  • TypeScript 对象的简单使用和操作包含number对象等
  • 【 Apifox】Apifox的前置操作与后置操作
  • 【108天】Java——《Head First Java》笔记(第1-4章)
  • ERLANG 网工修炼笔记 ---- UDP
  • ES2017异步函数现已正式可用
  • mysql_config not found
  • 更好理解的面向对象的Javascript 1 —— 动态类型和多态
  • 力扣(LeetCode)22
  • 融云开发漫谈:你是否了解Go语言并发编程的第一要义?
  • 你学不懂C语言,是因为不懂编写C程序的7个步骤 ...
  • 专访Pony.ai 楼天城:自动驾驶已经走过了“从0到1”,“规模”是行业的分水岭| 自动驾驶这十年 ...
  • ​VRRP 虚拟路由冗余协议(华为)
  • (zz)子曾经曰过:先有司,赦小过,举贤才
  • (阿里巴巴 dubbo,有数据库,可执行 )dubbo zookeeper spring demo
  • (四) Graphivz 颜色选择
  • .locked1、locked勒索病毒解密方法|勒索病毒解决|勒索病毒恢复|数据库修复
  • .NET CLR基本术语
  • .NET Core中的去虚
  • .NET Remoting学习笔记(三)信道
  • .NET 中 GetProcess 相关方法的性能
  • @Repository 注解
  • @synthesize和@dynamic分别有什么作用?
  • [2019/05/17]解决springboot测试List接口时JSON传参异常
  • [Avalon] Avalon中的Conditional Formatting.
  • [C#]无法获取源 https://api.nuge t.org/v3-index存储签名信息解决方法
  • [C++]模板与STL简介
  • [C++从入门到精通] 14.虚函数、纯虚函数和虚析构(virtual)
  • [CTO札记]盛大文学公司名称对联
  • [DAX] MAX函数 | MAXX函数
  • [ISCTF 2023]——Web、Misc较全详细Writeup、Re、Crypto部分Writeup
  • [LeetCode]剑指 Offer 42. 连续子数组的最大和
  • [OS] linux常见问题汇总
  • [paper] lift,splat,shooting 论文浅析
  • [Real world Haskell] 中文翻译:第二章 类型与函数
  • [Salesforce组件开发][LWC] 弹出框开发
  • [scikit-learn] 第一章 初识scikit-learn及内置数据集介绍
  • [Spark][Python]DataFrame中取出有限个记录的例子
  • [TCP] TCP/IP 基础知识词典(2)
  • [USACO12DEC]逃跑的BarnRunning Away From…
  • [VisualStudioCode]_[VSCODE]_[C/C++开发环境配置-问题解决和补充]
  • [Vue 配置] Vite + Vue3 项目配置 Tailwind CSS
  • [笔记] Nios II基本函数整理