从零学习Kafka：生产者分区机制

📅 2026/6/25 14:02:43

分区的核心逻辑在从零学习Kafka集群架构和基本概念一文中我们了解了 Kafka 中分区的概念它的主要作用一个是支持系统的可伸缩性另一个是负载均衡。生产者在写入数据时实际是要写入到指定的分区。换句话说分区是 Kafka 中消息组织的最基础的单位。除了做负载均衡外分区还有一个作用就是保证业务消息的处理顺序。当你调用producer.send(record)时Kafka 需要先确定数据要写到哪个分区。具体逻辑如下如果显示指定了 Partition直接把数据写到指定分区如果没有显示指定 Partition但指定了 Key把数据写到 Key 所对应的分区既没有指定 Partition也没有指定 Key使用 Kafka 的默认策略来分配数据分区策略到这里你可能想问Kafka 到底是如何判断一条数据应该分配到哪个分区的呢别急我们现在就来介绍 Kafka 的分区策略。按 Key 分配策略如果我们在消息中指定了消息键Kafka 会将相同 Key 的消息发送到相同的分区。具体方式是使用 murmur2 算法对 Key 进行 Hash即abs(murmur2(key)) % numPartitions。这个策略是为了实现局部有序性。轮询策略如果没有指定 Key在旧版本中Kafka 默认使用的是轮询策略也就是对消息按顺序分配。如下图第一条消息分配到 partition0第二条消息分配到 partition1第三条消息分配到 partition2。轮询策略的好处就是负载非常均衡它能最大限度保证消息被平均分配到所有分区上但它的缺点也比较明显这样分配会导致每个批次都很小会有很多小请求从而影响吞吐量。粘性策略为了解决轮询策略的问题Kafka 又引入了新的分区策略——粘性策略。它的逻辑是消息默认跟随上一个消息的分区直到批次被填满或者等待时间到了。这样做的好处是可以极大的提高消息的批处理效率。随机策略旧版本的 Kafka 也支持随机策略它的逻辑就是每次生成一个随机数然后计算出对应的分区。这个策略本身的目的也是希望能做到负载均衡但是实际效果不如轮询策略因此在新版本中就不会使用了。自定义策略最后再介绍一下自定义策略自定义分区策略的方法也很简单。只需要在自定义类中实现接口org.apache.kafka.clients.producer.Partitioner然后在partition()方法中实现自己的分区逻辑。partition 方法提供了很多入参包括消息相关的 topic、key、keyBytes、value、valueBytes也包括集群相关的 cluster。一般情况下这么多信息足够你计算出对应消息需要发送到哪个分区。int partition(String topic, Object key, byte[] keyBytes, Object value, byte[] valueBytes, Cluster cluster);关键参数介绍完了分区策略之后我们再看几个分区相关的配置参数。第一个是batch.size在介绍粘性策略时我们提到了批次填满时消息会分配到新的分区。这个参数就是用来控制批次大小的默认是 16KB批次越大吞吐量越高。第二个参数是linger.ms也是用于粘性策略的。它控制的是等待时间默认是 0ms。生产环境可以设置成 5 - 100 ms。总结本文我们的视角从服务端过渡到了客户端先从生产者的分区机制入手。了解了为什么需要分区以及分区的几种策略最后又介绍了两个配置参数。下一节我们将一起了解生产者端的性能提升利器——压缩。分类: Kafka学习笔记

新闻详情

相关阅读

3分钟搞定Mac NTFS读写难题：Free-NTFS-for-Mac免费终极解决方案

Java反序列化漏洞实战：从JNDI注入到恶意服务器搭建

Kotlin的sealed interface：结合密封类与接口的优势

ROS中tf时间穿梭原理与六参数API实战指南

LangChain OutputParser实战：房产文本结构化解析方案

A-59F多功能语音模组：扩音防啸叫+双波束，智能对讲全场景解决方案

VMware Unlocker 4.2.8 深度解析：非苹果硬件macOS虚拟化技术实现与最佳实践

GPT-4的2%激活率真相：稀疏MoE架构原理与工程实践

如何用开源模型做可验证的AI实践：从Llama3到树莓派部署

计算机毕业设计之基于Java的流浪动物收养系统设计与开发

技术线上面试代码写完就以为通关？留学生利用黑盒测试自证风控「蒸汽教育分享」

暗黑2存档编辑器终极指南：5分钟快速掌握d2s-editor完整使用教程

3个步骤让小爱音箱变身AI语音助手：MiGPT深度体验指南

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用