首页
首页
BOT
沸点
课程
直播
活动
AI刷题
NEW
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
TakinTalks稳定性社区
掘友等级
数列科技
「TakinTalks」是联合业界专家共同发起的稳定性技术交流平台,面向技术管理者与一线技术专家,定期探讨行业前沿技术,分享最佳实战经验。让技术知识的传播没有界限。
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
定位时长缩减90%:酷家乐如何提升系统故障根因分析准确率?
# 一分钟精华速览 # 酷家乐开发魔方语言的目的是解决其2B SaaS系统在复杂微服务架构下的故障定位难题,以提升系统稳定性并加速故障恢复。由于原监控工具操作复杂,需要人工逐项点击且依赖
TakinTalks_高峰流量场景之容量保障与压测平台
结合历史集中式运动沉淀,促进效率提升、做好大促保障联合行业先进技术,为对峰值流量场景和分布式系统稳定性感兴趣的人群及相关从业者,提供有指导意义的实践手册,为大家带来一份解决实际问题的实操手册。
哈啰出行高质量故障复盘法:“3+5+3”(附模板)
如果你是一个故障的复盘owner,你会怎么去组织一场复盘会?怎么才能高质量复盘,深度挖掘故障背后的隐藏风险?
团队新人多,稳定性经验不足,研发质量怎么保障?|TakinTalks论道
一分钟精华速览 在研发和稳定性保障过程中,人与设备、程序、组织的交互是一个复杂的过程,虽然人们极少会恶意犯错,但由于受特定情景下的实际条件影响,人为失误也时有发生,那么,如何尽可能减少这些失误的发生?
去哪儿是如何做到大规模故障演练的?
相比在分布式系统上进行随机的故障注入实验,基于混沌工程的大规模自动化故障演练,不仅能将“作战演习”常态化,还能通过提高覆盖面而获得更高的产出价值,帮助更全面地完善故障应急预案和处理体系。
去哪儿的常态化容量保障是怎么做的?
大多数时候,我们聊的都是“双十一”等大型活动下的容量保障,但除了个别典型峰值场景外,系统日常也会有各类容量保障的需求,去哪儿网作为国内最大的旅行平台之一,在各类场景中摸索出了一套常态化的容量保障方法。
美图是如何搭建压测监控一体化平台的?
美图架构平台团队的主要工作,是给业务提供技术支撑,保障业务的稳定性;在减少故障方面,架构团队和 SRE 团队有比较紧密的配合和较多的实践。
TakinTalks—高峰流量场景实践之混沌工程与故障排查实践
11月5日,去哪儿网高级技术总监朱仕智,ebay流量运维团队负责人杨胜辉,分享混沌工程及故障排查的优秀实践。
TakinTalks——高峰流量场景之系统预案及压测演练实践
节假日、旅游的季节周期属性,使流量波动特征不仅鲜明,而且频率较高。在此背景下,系统稳定性保障尤为重要,成为常态考虑的问题。本次分享主要从系统稳定性影响因素角度,分享系统预案、及压测演练实践经验。
故障复盘究竟怎么做?美图SRE结合10年经验做了三大总结(附模板)
GoogleSRE 里有这样一个数据,大概 75% 的故障都是因为人为操作、人为变更引起的,因此人的因素也需要重点关注。
下一页
个人成就
文章被点赞
14
文章被阅读
8,321
掘力值
574
关注了
0
关注者
12
收藏集
0
关注标签
2
加入于
2021-05-17