首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
春与秋其代序
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
400
文章 202
沸点 198
赞
400
返回
|
搜索文章
最新
热门
分布式幂等体系(Idempotency System)—— 如何从单接口防重复进化到全链路幂等保障?
为什么“幂等”是分布式系统最关键的工程概念之一? 并发写入 重试机制 MQ 至少一次投递 网络超时 + 客户端重发 不做幂等 = 订单重复扣钱、优惠券发多张、库存扣穿 幂等的四类场景
零宕机发布体系(Zero-Downtime Deployment)—— 如何让系统在不停机条件下完成版本切换?
为什么“零宕机上线”是企业级系统的硬指标? 多租户 SaaS 不能宕机 金融交易系统不能断 政务平台不可中断 零宕机发布是高可用体系的最后一块拼图
系统碎片化治理(Fragmentation Governance)—— 大型系统如何避免越做越乱?
为什么系统越做越大就越混乱? 多团队并行 功能快速堆叠 老代码无人敢改 结果就是: 组件碎片化、逻辑碎片化、数据碎片化、技术碎片化 这就是“系统碎片化”。
全链路容量评估体系(Capacity Planning)—— 如何让系统从“能跑”到“可预测可扩容”?
为什么“容量评估”是决定系统能否活下去的核心能力? 系统崩溃不是因为坏 是因为 超出容量却无人知晓 容量规划是大厂 SRE/架构的核心任务之一 容量评估的三大核心指标
数据一致性校验平台(Consistency Check Platform)—— 如何构建大型系统的数据自愈能力?
为什么中大型系统一定会出现“数据不一致”? 分布式系统没有绝对一致 事件丢失、任务失败、双写失序、缓存滞后、补偿延迟 数据不一致不是“有没有”,而是“何时出现 & 如何发现”
可回放调试体系(Replay Debugging)—— 大型分布式系统的终极排障能力
为什么日志 + 可观测性也不足以解决所有线上问题? 分布式系统不是单点可重现 用户行为、状态、调用链变化巨大 很多线上问题:本地复现不了、测试环境复现不了、灰度环境复现不了
分层事件总线架构(Layered Event Bus)—— 解耦大型系统的终极方法
为什么事件总线是“大型系统的生命线”? 复杂系统不是靠 RPC 扩展的 一切大型系统最终都要走向 事件驱动(EDA) 单层事件系统会导致混乱,分层事件总线 才是真解法
全链路灰度回滚体系 —— 如何让大型系统实现真正的“可控上线 & 秒级回滚”?
为什么所有大型系统都需要“灰度 + 回滚”? 灰度不是为了慢,而是为了 最小化风险。 回滚不是“git revert”,是系统级逆转能力。 真正成熟的后端,一定能做到 “上线不慌,回滚不难” 。
分布式锁体系设计 —— 如何在复杂业务中保证一致性与高性能?
为什么分布式锁一直被“低估”? 很多系统不是因为 DB 慢,而是因为并发写入导致一致性问题 分布式锁是防止混乱写入的基础能力 但做不好会变成性能黑洞 分布式锁的正确使用场景
SaaS 多租户数据迁移体系 —— 如何在不停机条件下完成租户迁移、分库分表与归档?
多租户系统为什么最怕“迁移”? 租户迁移 = 真实世界的“搬家” 停机不可能、数据量巨大、业务正在运行 数据迁移是 SaaS 系统最难的问题之一 租户数据迁移常见场景
下一页
个人成就
文章被点赞
7
文章被阅读
54,748
掘力值
5,492
关注了
0
关注者
21
收藏集
0
关注标签
0
加入于
2022-11-11