首页
沸点
课程
AI Coding
数据标注
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
生产应急
订阅
jawoo
更多收藏集
微信扫码分享
微信
新浪微博
QQ
17篇文章 · 0订阅
基于系统稳定性建设,你做了哪些事情?(下)
上期聊完了如何提升系统可靠性,我们继续聊,如何提升系统可用性及稳定性。 2、提升系统可用性,缩短故障时间,快速止损 故障时长 = 发现问题时长 + 定位问题时长 + 解决问题时长 上线规范: 上一章在
如何做一场高质量的复盘
开启掘金成长之旅!这是我参与「掘金日新计划 · 12 月更文挑战」的第1天,点击查看活动详情 正视故障和复盘的意义 故障也有积极意义 在复杂系统中,故障是必然的,无法彻底避免。从定性的角度来看,并非所
【稳定性】秘密武器--功能开关技术 | 京东物流技术团队
针对改动范围大、影响面广的需求,我通常会问上线了最坏情况是什么?应急预案是什么?你带开关了吗? 。当然开关也是有成本的,接下来本篇跟大家一起交流下高频发布支撑下的功能开关技术理论与实践结合的点点滴滴。
一次生产环境P0级事故分析
某年某月某日,排查造成一场P0级别的事故的原因,经过几个通宵,一堆人头脑风暴,最终发现过程很残酷,但是结果很可笑。
概念解读稳定性保障
本文站在 QA 的角度,基于业内成功经验和已有的官方标准,尝试从底层逻辑出发盘一盘稳定性质量保障的由来和落地方向。
实时数仓混沌演练实践
实时数仓业务侧的混沌演练,从0到1,在经过一系列的探索实践后,通过主备链路比对方式,演练期间对于异常波动的指标,可以快速识别感知,从演练结果上,取得了不错的成效,但也存在一定的局限性。
最全Linux应急响应技巧,看这一篇就够了
Linux环境下处理应急响应事件往往会更加的棘手,因为相比于Windows,Linux没有像Autorun、procexp这样的应急响应利器,也没有统一的应急响应处理流程。所以,这篇文章将会对Linu
混沌演练实践(一)
混沌工程是通过主动制造故障场景并根据系统在各种压力下的行为表现确定优化策略的一种系统稳定性保障手段,简单说就是通过主动注入故障的方式、提前发现问题,然后解决问题规避风险。
业务数据迁移上云的一些技术思考 | 京东云技术团队
在支持京东集团内部及京东云外部客户的业务迁移到京东公有云及京东私有云、京东政务云的过程中,技术服务组积累了相关业务系统数据迁移的一些管理和技术经验,以案例的形式分享给大家,希望对大家的业务迁移工作有所
一文了解电商大促系统的高可用保障思路 | 京东云技术团队
本文面向受众可以是运营、可以是产品、也可以是研发、测试人员,作者希望通过如下思路(知历史->清家底->明目标->定战略->做战术->促成长)帮助大家能够了解电商大促系统的高可用保障,减少哪些高深莫测的