首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
运维开发故事
掘友等级
公众号运维开发故事
公众号运维开发故事团队
获得徽章 6
动态
文章
专栏
沸点
收藏集
关注
作品
赞
25
文章 25
沸点 0
赞
25
返回
|
搜索文章
运维开发故事
公众号运维开发故事
·
6月前
关注
使用DaemonSet实现heapdump文件自动化管理
一、引言 1、为什么要获取heapdump文件 heapdump文件是Java应用遭遇OOM后的诊断报告,记录了某一时刻 JVM 堆中对象的详细使用情况,是 JVM 堆内存...
0
评论
分享
运维开发故事
公众号运维开发故事
·
6月前
关注
SRE 如何提升自己在团队中的影响力?
昨天在微信群看到一个很有意思的话题:SRE如何提升自己在团队中的影响力? 该问题一出,群里讨论异常激烈: 有人说:要量化,比如本周发现并解决了多少问题,优化提升了多少效率。...
0
评论
分享
运维开发故事
公众号运维开发故事
·
7月前
关注
深入剖析Alertmanager:解锁告警管理的核心逻辑
一、引言 在当今复杂的IT系统架构中,监控体系对于保障系统的稳定运行至关重要。而Alertmanager作为监控体系里关键的一环,在处理告警信息、确保相关人员及时响应等方面...
1
评论
分享
运维开发故事
公众号运维开发故事
·
7月前
关注
KVM虚拟化之设备透传
显卡透传 查看显卡PCI地址 会看到类似下面的输出,其中包含显卡的 PCI 地址,例如 0000:03:00.0: 确认 IOMMU 支持 确保主机启用了 IOMMU 支持...
0
评论
分享
运维开发故事
公众号运维开发故事
·
7月前
关注
[kubectl-resource-view]: 一款用于查看k8s资源使用情况的插件
1.简介 一款自己编写的k8s 命令行插件,用于查看k8s node和pod资源的 cpu、 memory、 gpu的request 和limit 使用情况。 2.安装 可...
0
评论
分享
运维开发故事
公众号运维开发故事
·
7月前
关注
服务器又被黑了,可咋办
发生 正在为公司呕心沥血之际,收到好友消息:说服务器是不是中招了? 随即叫他看看能不能找到CPU使用率高的进程,但他使用top命令,未发现异常进程。 使用htop,也一样未...
0
评论
分享
运维开发故事
公众号运维开发故事
·
7月前
关注
告警平台V1.0版本
监控无数,告警乱飞,历史难查,进度难寻。 随着接入监控的团队和集群越来越多,告警管理也变的异常重要。由于网络的限制,无法使用类似快猫、睿象云等SAAS告警系统,所以就自己开...
0
评论
分享
运维开发故事
公众号运维开发故事
·
1年前
关注
急速Boost,让数据跑得更快 -- Ceph缓存技术全解析
在 Ceph 分布式存储系统中,缓存池(cache pool)是一种特殊的存储池,用于提升数据访问速度。缓存池通常用于将热点数据(frequently accessed d...
1
评论
分享
运维开发故事
公众号运维开发故事
·
1年前
关注
接口拨测 Plus 版本
之前写了一个《开发一个接口监控的Prometheus Exporter》,当时只是单纯的实现了一个简单的Exporter,但是基本能满足要求,最近对接口监控的需求做了升级,...
0
评论
分享
运维开发故事
公众号运维开发故事
·
1年前
关注
kvm安装windows虚拟机并安装virtio驱动
windows虚拟机安装在kvm环境上,除了要使用需要的windows文件外,还需要挂载virtio的驱动,以便用来识别virtio的硬盘,驱动的下载地址为:https:/...
0
评论
分享
运维开发故事
公众号运维开发故事
·
1年前
关注
Kubernets的NVIDIA设备插件安装方案实践
环境:centos7 kubernetes版本:1.24 前言:这两天在搞大模型服务,之前也没了解过GPU相关的服务,因此整理了一个关于如何能够使用gpu节点文档。 1、现...
1
评论
分享
运维开发故事
公众号运维开发故事
·
1年前
关注
Kubernetes中的事件收集以及监控告警
Kubernetes中的事件监控 随着微服务以及云原生的发展,越来越多的企业都将业务部署运行到Kubernetes中,主要是想依托Kubernetes的可扩展、可伸缩、自动...
0
评论
分享
运维开发故事
公众号运维开发故事
·
1年前
关注
JVM 性能调优之通过 JProfile 和 JFR 分析系统瓶颈提升系统性能
生成 jfr JDK飞行记录器(JFR)是一种结构化日志记录工具, 它记录广泛的系统级(system-level)事件。类似于飞机上的黑盒子,它会持续记录飞行数据,用于调查...
0
评论
分享
运维开发故事
公众号运维开发故事
·
1年前
关注
开发一个接口监控的Prometheus Exporter
想必大家对于黑盒监控都不陌生,我们经常使用blackbox_exporter来进行黑盒监控,在K8s中进行黑盒监控可以参考这里。 既然已经有成熟的工具,为何自己还要再来尝试...
1
评论
分享
运维开发故事
公众号运维开发故事
·
2年前
关注
Ceph RBD和QEMU块设备qos测试
关于ceph的qos Ceph,作为一个高度可扩展的分布式存储系统,已经成为云计算和大数据时代的关键基石。随着企业和组织对数据存储的需求日益增长,Ceph 通过其强大的特性...
0
评论
分享
运维开发故事
公众号运维开发故事
·
2年前
关注
应用获取客户端真实IP
背景信息 因为产品需要,要在应用端获取到真实的客户端IP,访问链路如下: 由于应用前面经过了多次代理,所以默认情况下是获取不到真实IP的。 基本概念 在实现之前,先简单了解...
2
评论
分享
运维开发故事
公众号运维开发故事
·
2年前
关注
Java Steam 常用 API
现在 Java 17 和 Java 11 基本上可以和 Java8 平分 JDK 装机比例。下面是我常用的一些 Strem API 操作。除了分组、转换、排序,如果大家还有...
0
评论
分享
下一页
个人成就
文章被点赞
282
文章被阅读
266,814
掘力值
6,849
关注了
1
关注者
152
收藏集
0
关注标签
0
加入于
2021-01-28