当前位置: 首页 > news >正文

Kafka的分区副本机制

目录

生产者的分区写入策略

轮询策略

随机策略

按key分配策略

乱序分区

自定义分区策略

实现步骤:

消费者组Rebalance机制

Rebalance触发时机

Rebalance的不良影响

消费者分区分配策略

Range范围分配策略

RoundRobin轮询策略

Stricky粘性分配策略


生产者的分区写入策略

  • 轮询策略
  • 随机策略
  • 按key写入策略
  • 自定义分区策略

轮询策略

默认的策略,也是使用最多的策略,可以最大限度保证所有的消息平均分配到每一个分区。

如果在生产消息的时候,key为null,则使用轮询算法均衡的分配分区。

随机策略

随机策略,就是随机的将每条消息随机的分配到每个分区。

按key分配策略

按key分配策略,有可能会出现数据倾斜,例如:某个key包含了大量的数据,因为key的值所有的数据都分配到了一个分区,造成分区的消息数量远远大于其他分区。

乱序分区

                轮询和随机策略都会导致一个问题,就是生产到kafka的数据都是乱序存储的,而按照key存储的也是一定程度上的有序,也是局部有序,但又有可能导致数据倾斜,所以要结合实际情况取舍。

  • 在Kafka中生产者是有写入策略,如果topic有多个分区,就会将数据分散在不同的partition中存储

  • 当partition数量大于1的时候,数据(消息)会打散分布在不同的partition中

  • 如果只有一个分区,消息是有序的

自定义分区策略

实现步骤:

1.自定义分区器

public class KeyWithRandomPartitioner implements Partitioner {private Random r;@Overridepublic void configure(Map<String, ?> configs) {r = new Random();}@Overridepublic int partition(String topic, Object key, byte[] keyBytes, Object value, byte[] valueBytes, Cluster cluster) {// cluster.partitionCountForTopic 表示获取指定topic的分区数量return r.nextInt(1000) % cluster.partitionCountForTopic(topic);}@Overridepublic void close() {}
}

2.在kafka生产者配置中,自定义使用自定义分区器的类名

props.put(ProducerConfig.PARTITIONER_CLASS_CONFIG, KeyWithRandomPartitioner.class.getName());

消费者组Rebalance机制

        Kafka的Rebalance称之为再平衡,是kafka确保Consumer group下所有consumer如何达成一致,分配订阅的topic的每个分区的机制。

Rebalance触发时机

1.消费者组中consumer的个数发生变化。

例如:有新的consumer加入到消费者组,或者是某个consumer停止了。

2.订阅的topic的个数发生变化

消费者可以订阅多个主题,假设当前的消费者组订阅了三个主题,但有一个主题突然被删除了,此时也需要发生再均衡。

3.订阅的topic分区数发生变化


Rebalance的不良影响
  1. 发生Rebalance时,consumer group下的所有consumer都会协调在一起共同参与,Kafka使用分配策略尽可能达到最公平的分配
  2. Rebalance过程会对consumer group产生非常严重的影响,Rebalance的过程中所有的消费者都将停止工作,直到Rebalance完成

消费者分区分配策略

Range范围分配策略

Range范围分配策略是Kafka默认的分配策略,它可以确保每个消费者消费的分区数量是均衡的。

注意:Rangle范围分配策略是针对每个Topic的。

配置

算法公式

n = 分区数量 / 消费者数量

m = 分区数量 % 消费者数量

前m个消费者消费n+1个

剩余消费者消费n个

RoundRobin轮询策略

RoundRobin轮询策略是将消费者以及消费者的所订阅的所有topic的所有partitions按照字典序排序(topic和分区的hashcode进行排序)。然后通过轮询方式逐个将分区以此分配给每个消费者。

配置

配置消费者的partition.assignment.strategy为org.apache.kafka.clients.consumer.RoundRobinAssignor

Stricky粘性分配策略

从Kafka 0.11x开始,引入此类分配策略,主要目的:

  1. 分区分配尽可能均匀
  2. 在发生rebalance的时候,分区的分配尽可能与上一次分配保持相同

没有发生rebalance时,Striky粘性分配策略和RoundRobin分配策略类似。

上面如果consumer2崩溃了,此时需要进行rebalance。如果是Range分配和轮询分配都会重新进行分配,例如:

通过上图,我们发现,consumer0和consumer1原来消费的分区大多发生了改变。接下来我们再来看下粘性分配策略。

        我们发现,Striky粘性分配策略,保留rebalance之前的分配结果。这样,只是将原先consumer2负责的两个分区再均匀分配给consumer0、consumer1。这样可以明显减少系统资源的浪费,例如:之前consumer0、consumer1之前正在消费某几个分区,但由于rebalance发生,导致consumer0、consumer1需要重新消费之前正在处理的分区,导致不必要的系统开销。(例如:某个事务正在进行就必须要取消了)        

相关文章:

  • 小熊家务帮day19-day21 订单模块2(取消订单,退款功能等)
  • OBS 录屏软件 for Mac 视频录制和视频实时交流软件 安装
  • 类和对象(上续)
  • 力扣 T62 不同路径
  • leetcode389:找不同
  • XUbuntu24.04之制作ISO镜像启动盘(二百四十八)
  • module ‘django_cas_ng.views‘ has no attribute ‘login‘
  • 备战 清华大学 上机编程考试-冲刺前50%,倒数第5天
  • VM渗透系统合集(下载链接)
  • Objective-C的初始化方法中,应该如何读写属性
  • svnadmin备份和还原
  • 大模型训练的艺术:从预训练到增强学习的四阶段之旅
  • 数字IC必备知识点:【0】文章汇总
  • 爱德华三坐标软件ACdmis.AC-dmis密码注册机
  • 大模型开发Semantic Kernel 简介
  • 【402天】跃迁之路——程序员高效学习方法论探索系列(实验阶段159-2018.03.14)...
  • 2017前端实习生面试总结
  • CSS居中完全指南——构建CSS居中决策树
  • DOM的那些事
  • Java|序列化异常StreamCorruptedException的解决方法
  • Kibana配置logstash,报表一体化
  • React16时代,该用什么姿势写 React ?
  • storm drpc实例
  • 笨办法学C 练习34:动态数组
  • 构建二叉树进行数值数组的去重及优化
  • 精彩代码 vue.js
  • 一起参Ember.js讨论、问答社区。
  • 用 vue 组件自定义 v-model, 实现一个 Tab 组件。
  • 原生Ajax
  • 字符串匹配基础上
  • mysql面试题分组并合并列
  • ​3ds Max插件CG MAGIC图形板块为您提升线条效率!
  • ​Base64转换成图片,android studio build乱码,找不到okio.ByteString接腾讯人脸识别
  • ​Z时代时尚SUV新宠:起亚赛图斯值不值得年轻人买?
  • ​决定德拉瓦州地区版图的关键历史事件
  • # Redis 入门到精通(八)-- 服务器配置-redis.conf配置与高级数据类型
  • (1)(1.11) SiK Radio v2(一)
  • (2022版)一套教程搞定k8s安装到实战 | RBAC
  • (24)(24.1) FPV和仿真的机载OSD(三)
  • (DFS + 剪枝)【洛谷P1731】 [NOI1999] 生日蛋糕
  • (k8s)Kubernetes本地存储接入
  • (补充):java各种进制、原码、反码、补码和文本、图像、音频在计算机中的存储方式
  • (第30天)二叉树阶段总结
  • (五)关系数据库标准语言SQL
  • (转)linux下的时间函数使用
  • (转)从零实现3D图像引擎:(8)参数化直线与3D平面函数库
  • ***汇编语言 实验16 编写包含多个功能子程序的中断例程
  • .NET CORE 第一节 创建基本的 asp.net core
  • .NET 将多个程序集合并成单一程序集的 4+3 种方法
  • .NET编程——利用C#调用海康机器人工业相机SDK实现回调取图与软触发取图【含免费源码】
  • .net操作Excel出错解决
  • .NET框架设计—常被忽视的C#设计技巧
  • .pings勒索病毒的威胁:如何应对.pings勒索病毒的突袭?
  • [ CTF ] WriteUp- 2022年第三届“网鼎杯”网络安全大赛(白虎组)
  • [AI Embedchain] 开始使用 - 全栈