首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
运维开发故事
掘友等级
公众号运维开发故事
公众号运维开发故事团队
获得徽章 6
动态
文章
专栏
沸点
收藏集
关注
作品
赞
25
文章 25
沸点 0
赞
25
返回
|
搜索文章
运维开发故事
公众号运维开发故事
·
2天前
关注
K8s中明明配置了HPA,但是没扩容
Kubernetes 的 Horizontal Pod Autoscaler(HPA)是一种根据观察到的 CPU 利用率或其他自定义指标自动扩展 Pod 副本数的控制器。它...
0
评论
分享
运维开发故事
公众号运维开发故事
·
2天前
关注
一文搞定 Linux 与 Windows 双系统修复
centos 文件系统修复 1. 挂载 ISO 并进入救援模式 将 CentOS 的安装 ISO 挂载到虚拟机/CD-ROM,或者插入启动盘。 重启系统,从 ISO 启动。...
0
评论
分享
运维开发故事
公众号运维开发故事
·
2天前
关注
开发 Operator 调度 GPU 实例资源池
前面我们介绍了《开发K8s Chat 命令行工具》和《开发 K8s GPT 故障诊断工具》两篇和 K8s 相关的文章,本篇文章我们将把 K8s、AI、云 三者结合起来,开发...
0
评论
分享
运维开发故事
公众号运维开发故事
·
11天前
关注
一次CentOS7 glibc灾难的全链路修复
背景 有一台Centos 7的服务器执行系统命令提示GLIBC的错误,在后来排查中发现是有更新过系统,系统中同时存在centos7和centos8的包导致系统库损坏,这台服...
0
评论
分享
运维开发故事
公众号运维开发故事
·
11天前
关注
AIOps系列 | 开发 K8s GPT 故障诊断工具
前面我们介绍了 《开发 K8s Chat 命令行工具》,实现了通过和 Kubernetes 进行交互的方式进行运维,虽然文章中所描述的功能比较简单,但是可以以此进行扩展,丰...
0
评论
分享
运维开发故事
公众号运维开发故事
·
11天前
关注
Elasticsearch 知识点全景整理(面试 & 学习指南)
一、核心概念与数据模型 基本对象 Master Node:负责集群管理、分片调度。 Data Node:负责数据存储和检索。 Coordinating Node:协调查询。...
0
评论
分享
运维开发故事
公众号运维开发故事
·
11天前
关注
AIOps系列 | 开发一个 K8s Chat 命令行工具
在前面我们介绍了[[03.大模型入门实战]]和 [[04.Agent入门实战]],了解了 AI 开发的基本流程,本章节我们将使用讨论如何将 Kubernetes 和 AI ...
0
评论
分享
运维开发故事
公众号运维开发故事
·
11天前
关注
AIOps系列 | Agent 入门实战
上个章节我们介绍了《大模型入门实战》,初步了解了如何在不同的场景下接入大模型。本章我们将介绍如何通过大模型来构建智能体Agent。主要将通过以下几个小节进行介绍: 什么是A...
0
评论
分享
运维开发故事
公众号运维开发故事
·
11天前
关注
AIOps系列 | 大模型入门实战
AIOps 的实现离不开现在大模型的大力发展,所以要做 AIOps 相关的业务,就需要了解并使用大模型相关知识。本次内容将从以下6个章节介绍大模型相关的知识。 Prompt...
0
评论
分享
运维开发故事
公众号运维开发故事
·
11天前
关注
AIOps系列 | 基础设施即代码
概述 讲 AIOps 的时候为什么要讲 基础设施即代码(Infrastructure as Code,简称IaC) 呢? 在企业中,不论是先进的技术也好,还是优秀的思想也罢...
0
评论
分享
运维开发故事
公众号运维开发故事
·
2月前
关注
AIOps系列 | 基础理论学习
在正式进入AIOps实践之前,先简单普及下相关的理论知识,我们会从以下几个方面进行介绍: 从精益、敏捷、DevOps到AIOps 什么是AIOps 大模型和AIOps AI...
0
评论
分享
运维开发故事
公众号运维开发故事
·
2月前
关注
基于Prometheus的自动化巡检
前言 目前,大部分公司都采用Prometheus + Grafana这一套来做指标监控,所以在Prometheus中也有大量的指标数据。为了满足日常工作中的巡检,可以基于P...
0
评论
分享
运维开发故事
公众号运维开发故事
·
2月前
关注
MCP 教程-智能化设计交付:如何使用Cursor IDE的MCP功能将Figma设计稿一键转换为前端代码
还在手动从设计稿提取样式、编写基础代码?试试 Cursor IDE 的模型上下文协议(MCP)功能吧。通过使用 MCP Server - Figma-Context-MCP...
1
1
分享
运维开发故事
公众号运维开发故事
·
2月前
关注
提升GPU利用率:探索NVIDIA的MIG与MPS虚拟化技术
1. 背景 目前GPU卡资源紧张且业务需求逐渐递增,存在整卡不够分配或GPU利用率低造成资源浪费的情况。 我们也不可否认还有非常多的应用场景对算力的需求不大,比如: AI推...
0
评论
分享
运维开发故事
公众号运维开发故事
·
2月前
关注
探秘AI时代的Kubernetes新范式:大模型+MCP协议实践心得
一、AI世界的"USB-C"革命:MCP协议深度解析 🔌 什么是MCP协议? **模型上下文协议(Model Context Protocol)**是由Anthropic...
0
评论
分享
运维开发故事
公众号运维开发故事
·
2月前
关注
探索AI+k8s:如何使用Deepseek大模型增强k8s-dashboard
一、导读 Kubernetes(简称K8s)的普及让开发和运维工作变得更加高效,但它的复杂性却让许多人在使用时面临挑战。从网络配置到故障排查,每一步都需要深入的技术积累。然...
0
评论
分享
运维开发故事
公众号运维开发故事
·
2月前
关注
告警平台2.0——仿出强大
在《告警平台1.0》中,我们实现了告警平台,可以实现纳管通过AlertManager推送的告警信息,然后进行灵活的告警通知发送。 在这个基础上,我们可以实现对告警进行认领、...
1
评论
分享
运维开发故事
公众号运维开发故事
·
2月前
关注
2025年K8s最新高频面试题,看看你能答对几个?
Kubernetes的核心组件有哪些,各自作用是什么? Master节点组件: kube-apiserver:集群的控制入口,提供REST API接口。 kube-sche...
0
评论
分享
运维开发故事
公众号运维开发故事
·
2月前
关注
基于DaemonSet的Process Exporter监控实践指南
导语 作为一名Kubernetes管理员,你是否经历过: ✅ 服务正常却找不到CPU飙升的根本原因?✅ 容器进程异常但无法快速定位根源?✅ 缺乏完整的进程级监控体系导致故障...
0
评论
分享
下一页
个人成就
文章被点赞
279
文章被阅读
246,525
掘力值
6,799
关注了
1
关注者
150
收藏集
0
关注标签
0
加入于
2021-01-28