当前位置: 首页 > news >正文

Kafka 架构

1 整体架构

在这里插入图片描述

1.1 Zookeeper

Zookeeper 是一个分布式协调服务,用于管理 Kafka 的元数据。它负责维护 Kafka 集群的配置信息、Broker 列表和分区的 Leader 信息。
Zookeeper 确保了 Kafka 集群的高可用性和可靠性。
但 Zookeeper 已经成为 Kafka 性能瓶颈,Kafka 正在逐渐去 Zookeeper 化。

1.2 Broker

每个kafka server称为一个Broker,多个borker组成kafka cluster。

1.3 Topic

Topic 是 Kafka 中用于组织数据的逻辑单元,类似于数据库中的表。
一个Broker上可以创建一个或者多个Topic。同一个topic可以在同一集群下的多个Broker中分布

1.4 Partition

Partition 是 Topic 的子单元,用于实现数据的分布式存储和并行处理。每个 Partition 是一个有序的、不可变的消息队列,新的消息追加到队列末尾。
Kafka 会为每个 Topic 维护了多个 Partition。
每个 Partition 有一个 Leader 和多个 Follower 副本。Leader 负责处理所有读写请求,Follower 副本被动地从 Leader 同步数据。如果 Leader 发生故障,Zookeeper 会选举一个新的 Leader 以保证高可用性。比如图中,Broker 1 是 Topic 1 的 Partition 1 的 Leader,是 Partition 2、3 的 Follower。

2 生产者与消费者

在这里插入图片描述

2.1 生产者

生产者是向 Kafka 发送数据的客户端应用程序。生产者将消息发送到特定的 Topic 和 Partition 中。

向 Partition 发送数据的过程:

  • 生产者根据分区策略(如轮询、哈希分区键)选择目标 Partition
  • 生产者将消息发送到选定的 Partition,Leader 接收到消息后将其追加到日志中。
  • 生产者可以选择等待 Leader 确认消息已写入并复制到一定数量的 Follower 后再继续发送下一个消息,以确保数据可靠性。

2.2 消费者

消费者是从 Kafka 中读取数据的客户端应用程序。消费者订阅一个或多个 Topic,并从中消费消息。
消费者组

  • 消费者组是 Kafka 的一项功能,允许多个消费者共同消费一个 Topic 的消息。
  • 每个消费者组中的消费者都会从一个或多个 Partition 中读取消息,但同一 Partition 的消息只会被一个组内的消费者读取,以实现负载均衡。
  • 如果一个消费者挂掉,组内的其他消费者会自动接管它的分区,以确保消息不会丢失。

消费数据的过程:

  • 消费者启动时连接到Kafka集群并订阅一个或多个主题。
  • 通过poll方法,消费者从分配的分区中拉取消息并进行处理。
  • 处理完成后,消费者会提交偏移量以标识已处理的位置。
  • Kafka会在消费者数量变化时触发分区再均衡,确保每个分区都有消费者进行消费,避免数据丢失或重复消费。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 快速排序(Quick_Sort)
  • python一点通: Async异步函数很好,但是如何有效执行阻塞任务?
  • chatgpt 推荐的一些关于提高认知的书,我先存一下
  • OJ3829大石头的搬运工
  • 定时器更新界面,线程报错
  • Hack The Box(黑客盒子)Redeemer篇
  • C++设计模式-外观模式,游戏引擎管理多个子系统,反汇编
  • STM32F103C8移植uCOSIII并以不同周期点亮两个LED灯(HAL库方式)【uCOS】【STM32开发板】【STM32CubeMX】
  • 软件测试--第六章、系统功能测试
  • 自动化专业之半导体行业入门指南
  • Spring Boot通过自定义注解和Redis+Lua脚本实现接口限流
  • 牛客网刷题 | BC120 争夺前五名
  • TiDB-从0到1-配置篇
  • Linux下软件安装
  • 【ROS2大白话】四、ROS2非常简单的传参方式
  • 「译」Node.js Streams 基础
  • DataBase in Android
  • gops —— Go 程序诊断分析工具
  • HashMap剖析之内部结构
  • java多线程
  • java取消线程实例
  • JS变量作用域
  • Laravel5.4 Queues队列学习
  • node-sass 安装卡在 node scripts/install.js 解决办法
  • python 学习笔记 - Queue Pipes,进程间通讯
  • Python代码面试必读 - Data Structures and Algorithms in Python
  • Spring声明式事务管理之一:五大属性分析
  • unity如何实现一个固定宽度的orthagraphic相机
  • 思考 CSS 架构
  • 1.Ext JS 建立web开发工程
  • ​中南建设2022年半年报“韧”字当头,经营性现金流持续为正​
  • ‌内网穿透技术‌总结
  • # Pytorch 中可以直接调用的Loss Functions总结:
  • ## 1.3.Git命令
  • #WEB前端(HTML属性)
  • #数学建模# 线性规划问题的Matlab求解
  • #我与Java虚拟机的故事#连载16:打开Java世界大门的钥匙
  • $NOIp2018$劝退记
  • (12)目标检测_SSD基于pytorch搭建代码
  • (7) cmake 编译C++程序(二)
  • (Mac上)使用Python进行matplotlib 画图时,中文显示不出来
  • (NO.00004)iOS实现打砖块游戏(九):游戏中小球与反弹棒的碰撞
  • (附源码)springboot金融新闻信息服务系统 毕业设计651450
  • (附源码)计算机毕业设计ssm高校《大学语文》课程作业在线管理系统
  • (力扣)循环队列的实现与详解(C语言)
  • (六)Hibernate的二级缓存
  • (七)微服务分布式云架构spring cloud - common-service 项目构建过程
  • (三)docker:Dockerfile构建容器运行jar包
  • (顺序)容器的好伴侣 --- 容器适配器
  • (原創) 如何動態建立二維陣列(多維陣列)? (.NET) (C#)
  • (转载)Google Chrome调试JS
  • *Django中的Ajax 纯js的书写样式1
  • .CSS-hover 的解释
  • .net core webapi 部署iis_一键部署VS插件:让.NET开发者更幸福
  • .NET DataGridView数据绑定说明