kafka吞吐量提升总结

前言

原本自以为阅读了很久kafka的源码,对于kafka的了解已经深入到一定程度了,后面在某大厂的面试中,面试官询问我,如果需要提升kafka的性能,应该怎么做,我发现我能答上来的点非常的少,也暴露了我在学习时候缺少总结,导致要用的时候很难一次性快速表达出来,也让我错过了一个大厂的offer,尽管我在面试之后迅速做了相关问题总结,而且已经过去了半年,但是我还是会时不时想起这件事,所以想专门写一篇kafka性能提升的总结文章来超度那件事,让它不要再纠缠与我了,

一 生产者

1.1 配置优化

1 增加每个分区的消息批的大小( batch.size: 16k),适当增加批的最大缓存时间( linger.ms)让生产者累积器中的每个Sender可以累积更多的消息再发送,减少网络请求次数,同时也能增加broker硬盘IO的存储效率(每次顺序写入的多)

2 增加生产者中累积器的内存缓冲区(buffer.memory: 32M)大小,当累积器的缓冲区用完时,也会吧消息发送给broker,通过增加增加生产者中累积器,也可以减少网络请求次数

4 压缩消息(compression.type:none-默认不压缩),可以选择 gzip、snappy、lz4、zstd 等。减少网络传输的数据量,但是会增加cpu负担,可以在网络流量和cpu之间找到一个平衡点

5 在必要条件时,可以吧ack设置为0,但是会使得丢消息的概率提高

1.2 代码优化

1 多线程生产,多个线程使用多个生产者并行生产消息

2 异步生产,生产者发送消息本身涉及网络IO,而且除了异常处理外我们不太需要关注返回结果,所以可以通过线程池等异步生产消息,避免堵塞主线程,提升系统整体性能

3 批量生产和压缩:尽管kafka生产者本身已经通过批量生产做了性能优化,但是这个并不妨碍我们在必要的时候自行积累数据批量发送(甚至手动压缩)来减少网络IO,提升整体吞吐量,毕竟kafka的批量生产和压缩都是通用的算法,有时候我们可能根据业务数据的特点使用更加高效的批量生产和压缩

二 消费者

2.1 配置优化

1 调整每次拉取消息的量(fetch.min.bytes和fetch.max.bytes)减少网络IO

2.2 代码优化

1 并行处理,消费者内部使用多线程处理消息。

2.3 部署优化

1 通过分区和消费者的关系,可以知道如果分区数和消费者数相同时候,可以充分利用并行处理能力

三 broker

3.1 配置优化

1 节点配置的优化,比如IO线程数(handler的数量:num.io.threads),网络线程数(Processor的数量:num.network.threads),还有套接字缓冲区的大小(socket.send.buffer.bytes/socket.receive.buffer.bytes)

3 对kafka的jvm进行调优,比如内存和 GC方面优化

5 优化分区副本的放置,确保高可用的同时,避免跨数据中心的复制延迟

3.2 部署优化

1 适当增加topic的分区数,充分运用到多个broker资源和broker内部的并行处理能力,但需注意过多的分区可能导致的问题。

2 使用固态硬盘等增加硬盘性能,优化文件存储目录的布局以减少 I/O 竞争,如果有多个硬盘,尽量让日志文件分布在多个硬盘上

3 采用 LogDir 多个目录分散写入负载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/322.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

OpenHarmony外设驱动使用 (十三),Vibrator

OpenHarmony外设驱动使用 (十三) Vibrator 概述 功能简介 为了快速开发马达驱动,基于HDF(Hardware Driver Foundation)驱动框架开发了马达(Vibrator)驱动模型。马达驱动模型,屏蔽…

【Harmony OS】作业四 布局

目录 一. 单选题(共6题,6分) 1. (单选题, 1分)关于容器组件 Row 和 Column,下面说法错误的是? 2. (单选题, 1分)下列哪种组合方式可以实现子组件从父子组件单向状态同步? 3. (单选题, 1分)下面哪个组件层次结构是错误的&…

嵌入式学习Day27

进程: 进程是操作系统中的一个基本概念,指的是正在执行的程序实例。每个进程都有独立的内存空间、系统资源和执行状态。操作系统通过进程管理来分配资源、调度任务和确保系统的稳定性。 进程的组成 代码段:存储程序的指令。数据段&#xf…

《数据结构初阶》【八大排序——巅峰决战】

【八大排序——巅峰决战】目录 前言:---------------排序竞赛---------------一、比赛背景:二、赛前须知:三、比赛进行中……头文件Sort.hStack.h 实现文件Sort.cStack.c 测试文件 四、比赛结果:五、颁奖仪式:--------…

超简单 FishSpeech 本地部署

FishSpeech1.5可以说是目前最受欢迎的语音模型了。由于项目需要,在本地进行搭建,并记录下搭建过程,方便后人。 1. 基本硬件环境 CPU:N年前的 Intel(R) Core(TM) i5-3470 CPU @ 3.20GHz, 32G内存GPU:N年前的 NVIDIA GeForce GTX 1080 Ti,11G显存2. 基本软件环境 操作系统…

手搓四人麻将程序

一、麻将牌的表示 在麻将游戏中,总共有一百四十四张牌,这些牌被分为多个类别,每个类别又包含了不同的牌型。具体来说,麻将牌主要包括序数牌、字牌和花牌三大类。序数牌中,包含有万子、条子和筒子,每种花色…

Python结合ollama和stramlit开发聊天机器人

Python结合ollama和stramlit开发聊天机器人 一、环境准备1、streamlit安装2、langchain安装3、ollama的安装 二、Ollama平台聊天机器人实现1、需求2、模型调用3、前端实现页面呈现代码实现 三、详细代码地址四、参考资源 一、环境准备 1、streamlit安装 # 通过 pip 安装 pip …

EtpBot:安卓自动化脚本开发神器

EtpBot 是什么? EtpBot是一款专为安卓设备设计的自动化脚本开发工具,支持用户通过编写脚本实现自动化操作。该模块提供了丰富的API接口,涵盖点击、滑动、输入、截图等常见操作,帮助开发者快速构建自动化任务。ETPBot支持多设备并行…

AI|Java开发 IntelliJ IDEA中接入本地部署的deepseek方法

目录 连接本地部署的deepseek: IntelliJ IDEA中使用deepseek等AI: 用法一:让AI写代码 用法二:选中这段代码,右键,可以让其解释这段代码的含义。这时显示的解释是英文的。 连接本地部署的deepseek&#…

Python爬虫(33)Python爬虫高阶:动态页面破解与验证码OCR识别全流程实战

目录 一、技术背景与行业痛点二、核心技术与实现路径2.1 动态页面处理方案对比2.2 Selenium深度集成实践2.3 OCR验证码破解方案1. 预处理阶段:2. 识别阶段:3. 后处理阶段 三、典型应用场景解析3.1 电商价格监控系统1. 技术架构2. 实现效果 3.2 社交媒体舆…

智能IoT未来与边缘生态共建 | 2025 高通边缘智能创新应用大赛第六场公开课来袭!

系列公开课作为知识传递的重要窗口,持续为开发者群体输送前沿技术与实践经验。5月29日(周四)晚8点,2025高通边缘智能创新应用大赛第六场线上公开课即将开启! 本次课程以“探索智能IoT未来,共创边缘智能生态…

算法第26天 | 贪心算法、455.分发饼干、376. 摆动序列、 53. 最大子序和

弹性算法理论基础 想清楚 局部最优 是什么,如果可以推导出全局最优,那就是正确的贪心算法 455. 分发饼干 题目 思路与解法 class Solution:def findContentChildren(self, g: List[int], s: List[int]) -> int:res 0i 0j 0g.sort()s.sort()whi…