kafka不支持读写分离原理分析

 更新时间:2023年11月07日 10:08:06   作者:cartoon  
这篇文章主要为大家介绍了kafka不支持读写分离原理分析,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪

引言

前段时间在看 kafka 相关内容,发现 kafka “所有的”读写流量都在主 partition 上,从 partition 只负责备份数据。

那么为什么 kafka 从 partition 不跟其他中间件一样承接读流量?

读写分离的初衷

读写分离的初衷我觉得是利用读流量 & 写流量不同的特性做针对性的优化,而这两种流量我觉得区别如下

读流量写流量
业务特性展示类的业务操作类业务
流量占比
可接受数据延迟较大非常小
增长的可预见性高峰/安全攻击可能会突发增长总体平稳

使用 kafka 的业务特征

  • 操作型业务,consumer 消费 producer 生产的消息,进行自身业务,这个消息就类似于 trigger
  • 可支撑的流量较大,并且可支撑下游 consumer 较多,rebalance 需要一定的时间

kafka 架构

  • 以 topic 为单位,一 topic 可拆分多个 partition,每个 partition 都可以有多个从 partition,不同 partition 分布在不同 broker 上
  • 以 partition 为单位,形成 AR(Assigned Repllicas),ISR(In Sync Repllicas),OSR(Out Sync Repllicas),主 partition 接收到消息后按照 ack 策略同步到 ISR 中从 partition

    ack = 0,producer 发出消息后就不管了

    ack = 1,producer 发出消息写入主 partition 所在 broker 的磁盘就算成功

    ack = all,producer 发出消息写入主 partition 以及 ISR 上所有副 partition 的磁盘才算成功

kafka 没有主从读写分离的原因

  • 不能主从读写分离的原因

    kafka 承接的大多是操作型业务,这部分读操作对数据延迟非常敏感。

    kafka 主从同步为半同步复制,并且有部分 partition 在 OSR 上,数据延迟较大

    kafka 主 partition 接收到消息后,可以根据 ack 策略落盘,如果不是 all 的话存在数据丢失的风险

  • 不需要主从读写分离的原因

    kafka 本身就是多 partition 的架构,不同 parition 在不同的 broker 上,多主节点的结构本身分流了流量

    kafka 本身就有成熟的 rebalance 机制,partition 上线与下线都比较无感

以上就是kafka不支持读写分离原理分析的详细内容,更多关于kafka不支持读写分离的资料请关注脚本之家其它相关文章!

相关文章

  • Git获取本地分支对应的远端服务器分支名的方法

    Git获取本地分支对应的远端服务器分支名的方法

    这篇文章主要介绍了Git获取本地分支对应的远端服务器分支名的方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-10-10
  • 检查前端元素的小技巧(适合新手)

    检查前端元素的小技巧(适合新手)

    随着web前端技术的不断发展,各种新工具也不断涌现,我们需要灵活掌握,随时更新技术知识和方法,这篇文章主要介绍了检查前端元素的小技巧,文中通过图文介绍的非常详细,需要的朋友可以参考下
    2025-09-09
  • Git拉取指定文件或者文件夹的实现方式

    Git拉取指定文件或者文件夹的实现方式

    Git拉取指定文件或文件夹的步骤包括:初始化仓库、设置远程仓库地址、启用SparseCheckout模式、设置要拉取的目录模式、拉取指定目录,在操作过程中可能会遇到权限问题和分支同步问题,需要根据实际情况进行调整
    2025-11-11
  • 关于base64编码的原理及实现方法分享

    关于base64编码的原理及实现方法分享

    我们的图片大部分都是可以转换成base64编码的data:image。 这个在将canvas保存为img的时候尤其有用
    2012-03-03
  • Git进行版本控制的实战指南

    Git进行版本控制的实战指南

    Git是一种分布式版本控制系统,广泛应用于软件开发中,它可以记录和管理项目的历史修改,并支持多人协作开发,通过Git,开发者可以轻松地跟踪代码变更、合并分支、回退版本等操作,所以本文给大家详细介绍了Git版本控制的实战指南,需要的朋友可以参考下
    2025-09-09
  • 算法系列15天速成 第九天 队列

    算法系列15天速成 第九天 队列

    可能大家都知道,线性表的变种非常非常多,比如今天讲的“队列”,灰常有意思啊
    2013-11-11
  • spark大数据任务提交参数的优化记录分析

    spark大数据任务提交参数的优化记录分析

    这篇文章主要介绍了spark大数据任务提交参数的优化记录分析,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-05-05
  • Git中代码回退的完全指南

    Git中代码回退的完全指南

    在软件开发过程中,代码回退是一个不可避免的操作,无论是修复错误、撤销不当的更改,还是处理合并冲突,掌握 Git 的回退技巧都能让你的开发工作更加流畅,本文将详细介绍 Git 中各种回退代码的方法,涵盖常见场景和边界情况,并提供实用的操作示例,需要的朋友可以参考下
    2025-08-08
  • vscode怎么编译运行

    vscode怎么编译运行

    本文给大家分享的是vscode怎么一键编译运行的方法,非常的简单实用,有需要的小伙伴可以参考下
    2020-02-02
  • Fiddler Everywhere 4.0.1的破解及禁止更新的方法(最新推荐)

    Fiddler Everywhere 4.0.1的破解及禁止更新的方法(最新推荐)

    Fiddler Everywhere是个好东西,无论抓包还是调试接口都很好用,只是现在收费了,为了白嫖就决定折腾一下,如果一开始通过设置文件夹权限禁止更新,也会导致进不了使用界面而无法使用,下面说一下具体的解决过程
    2023-11-11

最新评论