首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
SRE运维进阶之路
掘友等级
公众号:SRE运维进阶之路
获得徽章 5
动态
文章
专栏
沸点
收藏集
关注
作品
赞
4
文章 4
沸点 0
赞
4
返回
|
搜索文章
最新
热门
kube on kube 实现思路分享
这里的 kube on kube , 是指建立 K8s 元集群,纳管其他业务 K8s 集群,通过声明式 API 管理集群的创建、增删节点等。 参考 https://github.com/kubean-
我们的虚拟化变革之旅
黑暗时代 我们最初采用oVirt作为我们的虚拟化平台,事实证明它是一个很好的产品,具有几个显着的优势。其开源性质使我们能够利用广泛的功能和定制选项。 然而,尽管它具有优势,我们还是遇到了一些缺点和问题
Calico 异常重启问题复盘
Calico 异常重启问题复盘 影响范围和故障时间线 影响范围 线下环境 node-xx 物理机上 Pod 网络不可用 影响时间线(2023-07-23 22:09 ~ 22:14) [22:13]
K8s 无备份,不运维
出故障时,就知道是谁在裸泳 🙃 K8s 投产使用,备份是保命手段,必须要上,建议做一个 checklist,巡检通过,集群才能对外提供服务,比如,这样👇 备份方案制定 物理备份:etcd 备份,保存某
巧用 shell-operator 配置 K8s Pod 保护策略
保障 Pod 高可用分为以下几个方面 资源池划分 :打污点、独占、隔离 Qos 分级 & 优先级:按应用等级保障稳定性 自动弹性伸缩 HPA Pod 干扰预算 PDB 本篇主要介绍第四点: 巧用 Sh
Linux 性能基准测试工具及测试方法
上篇文章 todo ,给我们的经验教训,就是上线前,基准测试的重要性,这篇文章着重介绍一下「Linux 性能基准测试工具及测试方法」 还是老规矩,先请性能领域的大师布伦丹·格雷格(Brendan Gr
什么?相同型号物理机 容器性能不如虚拟机?
事件经过 [xx:xx] 流量突增,接口大量超时 [xx:xx] 限流 [xx:xx] 重启,虚拟机能重启成功,容器重启失败,容器流量摘除,暂时恢复 [xx:xx] 扩容, 容器虚拟机均扩容 [xx:
SRE 学习路线
SRE 工作职责 SRE(Site Reliability Engineering)站点可靠性工程是一种结合软件工程和运维运营原则的角色和方法论,旨在在系统、服务或产品的设计、开发、部署和运维过程中,
使用ChatGPT进行百度SRE岗面试复盘
总结最近面试的 SRE、DevOps 真题,从经验方案、云原生、稳定性、可观测性、DevOps、K8s基础知识 几方面提问,然后我通过 ChatGPT 回答,不得不说,ChatGPT 回答的真好,内容
K8s 一条默认参数引起的性能问题
问题时间线 [xx:xx] 开发收到业务反馈接口响应超时 [xx:xx] 开发&SRE&中间件 联合排查代码、网关、底层网络问题,无果 [xx:xx] 测试环境复现排查 [xx:xx] 利用差异法、排
下一页
个人成就
文章被点赞
14
文章被阅读
14,263
掘力值
580
关注了
26
关注者
20
收藏集
1
关注标签
13
加入于
2018-10-01