普罗米修斯：那个“偷”了宙斯火种，现在帮你盯着服务器的男人🔥 普罗米修斯（Prometheus）：那个“偷”了宙斯火种

🔥 普罗米修斯（Prometheus）：那个“偷”了宙斯火种，现在帮你盯着服务器的男人

别慌，监控不是玄学，是科学 + 一点点幽默感

🏛️ 开篇：这货到底是谁？

如果你刚踏入云原生的大门，你大概率会听到一个名字——Prometheus。

第一次听到这名字，我以为是要开个希腊神话读书会。后来才发现，这玩意儿是云原生监控界的扛把子，Kubernetes 的“官方标配”，CNCF 基金会的第二个毕业项目（第一个是 K8s）。

在神话里，普罗米修斯从奥林匹斯山偷了火种带给人类。
在技术世界里，它干的事一模一样：从你的服务器、容器、数据库里把“火种”（指标数据）偷出来，放到你面前，让你看清楚——这系统到底是熊熊燃烧，还是只剩最后一口气🔥

🎯 核心优势：为啥偏偏是它？

市面上的监控工具多了去了，Zabbix、Nagios、InfluxDB……Prometheus 凭啥出圈？

1️⃣ Pull，不是 Push —— 霸道总裁式监控 👔

老派监控大多是 Push 模式：你得在服务器上装一个 Agent，让它“主动汇报”：“报告大王，我 CPU 还行，内存还行……”

Prometheus 不一样。它是个霸道总裁👇

它根本不管你愿不愿意，直接跑去你的服务器门口敲门：
“开门！把指标交出来！CPU、内存、磁盘，统统交给我！”

这叫 Pull 模式。

👉 好处是什么？
如果服务器挂了，Push 模式下监控系统还在傻等“汇报”，根本不知道这货是不想说话还是真挂了。
而 Pull 模式下，Prometheus 去抓数据，抓不到——立刻报警：这孙子失联了！

安全感，就是我自己去确认。

2️⃣ 指标体系：你不是在存数字，你是在画心电图 📈

Prometheus 的数据类型不多，就四种，但每种都直击灵魂。

我用人话 + 生活比喻，包你一次记住👇

类型	比喻	说明
Counter	🚽 “今天上了几次厕所？”	只增不减，重启归零。你不关心“现在正在上”，只关心“是不是拉肚子了，频率怎么这么高”。
Gauge	🚻 “现在厕所里蹲了几个人？”	可增可减，反映当前状态。突然爆满？说明大家摸鱼，赶紧扩容坑位。
Histogram	⏱️ “上厕所平均多久？最长多久？”	统计分布。95%的人5分钟解决，剩下5%……建议送医。
Summary	📊 和 Histogram 类似，但更“精打细算”	直接给你分位数，比如“99%的请求都在200ms内完成”。

记住这套比喻，面试官问你 Prometheus 数据类型，你就问他：“你上厕所吗？” 😏

📐 恰到好处的比例：监控到底要配多少？

很多新手一上来就陷入“监控焦虑”：

“我是不是要把每个 if else 都埋个指标？
是不是要把每个 SQL 执行时间都记下来？”

冷静。我给你一个 80/20 黄金法则 👇

80% 的故障，只需要监控 20% 的核心指标就能发现。

那 20% 是什么？两大法宝：

🧠 USE 法 —— 看机器

USE 是 Utilization（使用率）、Saturation（饱和度）、Errors（错误数）。

把这当成年体检：

使用率：心跳多少？
饱和度：累不累？是不是身体被掏空？
错误数：有没有吐血？

把这三点监控好，你的机器就算穿上了防弹衣 🛡️

🍲 RED 法 —— 看服务

RED 是 Rate（请求速率）、Errors（错误数）、Duration（请求耗时）。

把服务想象成一家火锅店：

Rate：一晚上来了多少桌客人？
Errors：多少桌因为没吃到毛肚掀桌子？
Duration：客人从进门到吃到嘴里，等了多久？

这套组合拳打下来，你哪怕只盯着 20% 的指标，也能解决 80% 的线上事故。

🧱 架构比例：单机能扛多大？

有人问：“老王，我集群上千节点，Prometheus 那单机数据库扛得住吗？”

Prometheus 的设计哲学很朴实：单机跑天下，集群靠联邦。

一个 Prometheus 实例，处理 几千个目标、几百万条时间序列，那是它的舒适区 ✅
想玩“无限扩容”？请上 Thanos 或 VictoriaMetrics 🚀

比喻一下：

Prometheus 是前线拼命干活的特种兵，
Thanos 是后方做全局分析的“灭霸”。

让专业的人做专业的事，这个比例永远成立。

🚀 实战篇：本地搭个 Prometheus，先爽一把

理论说了那么多，手早就痒了吧？
来，我们花 5 分钟，在你的电脑上搭一个 Prometheus，体验一把“盗火者”的快感 🔥

1️⃣ 下载 Prometheus

去官网 prometheus.io/download 或者直接命令行搞定（以 Linux/macOS 为例）：

wget https://github.com/prometheus/prometheus/releases/download/v2.45.0/prometheus-2.45.0.darwin-amd64.tar.gz
tar xvfz prometheus-*.tar.gz
cd prometheus-*

Windows 用户请直接下载 .exe 版本，解压后得到 prometheus.exe。

📦 这玩意儿不到 100MB，比你手机里一个游戏安装包还小，却能让你的系统“开天眼”。

2️⃣ 配置 prometheus.yml —— 告诉它该“偷”谁

解压后目录里有一个 prometheus.yml，这是它的“任务清单”。打开它，修改 scrape_configs 部分：

yaml

global:
  scrape_interval: 15s   # 每15秒偷一次数据

scrape_configs:
  - job_name: "prometheus"   # 监控自己
    static_configs:
      - targets: ["localhost:9090"]

  - job_name: "my-java-app"   # 等会儿我们要集成的 Java 应用
    static_configs:
      - targets: ["localhost:8080"]

🧠 解释：

scrape_interval：普罗米修斯多久去“敲门”一次。15 秒足够，别太频繁，小心把服务器问烦了。

targets：要监控的“人”的地址和端口。

这里先配了 Prometheus 自己（端口 9090），等会儿我们 Java 应用跑起来，再加进去。

3️⃣ 启动！让火种开始燃烧

在命令行执行：

bash

./prometheus --config.file=prometheus.yml

Windows 用户直接双击 prometheus.exe。

打开浏览器，访问 http://localhost:9090，你会看到一个漂亮的 Web UI。
在搜索框输入 prometheus_target_interval_length_seconds，点 Execute，如果出现数据 —— 恭喜！你的普罗米修斯已经醒来了！ 🎉

💡 这时候它正在“偷”自己的数据，像个自恋狂一样天天照镜子。

☕ Java 集成：给你的代码装上“火种探测器”

Prometheus 已经准备好了，现在轮到我们的 Java 应用了。
我们要做的，就是把应用的“心跳、体温、血压”暴露出来，让 Prometheus 来抓。

这里我们用 Micrometer —— 它是 Java 界的“监控翻译官”，能把各种监控系统（Prometheus、Datadog、Graphite）的方言统一成普通话。

1️⃣ 添加依赖（以 Maven 为例）

在你的 pom.xml 中加入：

xml

<dependency>
    <groupId>io.micrometer</groupId>
    <artifactId>micrometer-core</artifactId>
    <version>1.12.0</version>
</dependency>
<dependency>
    <groupId>io.micrometer</groupId>
    <artifactId>micrometer-registry-prometheus</artifactId>
    <version>1.12.0</version>
</dependency>

如果你是 Spring Boot 项目，更简单，直接加：

xml

<dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-actuator</artifactId>
</dependency>
<dependency>
    <groupId>io.micrometer</groupId>
    <artifactId>micrometer-registry-prometheus</artifactId>
</dependency>

Spring Boot 会自动帮你配置好大部分东西，懒人福音 😎

2️⃣ 配置暴露端点

非 Spring Boot 项目：你需要创建一个 MeterRegistry 并暴露一个 HTTP 端点（比如用 Spark 或 Servlet）。

Spring Boot 项目：在 application.properties 中加上：

properties

management.endpoints.web.exposure.include=prometheus,health,info
management.metrics.export.prometheus.enabled=true

重启应用，访问 http://localhost:8080/actuator/prometheus，如果看到一堆以 # HELP 和 # TYPE 开头的文本，恭喜你 —— 你的 Java 应用已经开始“冒烟”了 🚬

📊 这些文本就是 Prometheus 最爱的“指标数据”，格式叫 Prometheus Exposition Format，人类勉强能读，机器爱得发狂。

3️⃣ 自定义埋点 —— 你想监控什么就监控什么

光靠自动采集的 JVM、CPU、线程指标不够，你得监控业务相关的数据。
比如你想统计“用户登录成功次数”：

java

import io.micrometer.core.instrument.MeterRegistry;
import io.micrometer.core.instrument.Counter;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.stereotype.Service;

@Service
public class LoginService {

    @Autowired
    private MeterRegistry meterRegistry;

    public void loginSuccess(String username) {
        // 业务逻辑...
        
        // 埋点：登录成功计数器
        Counter.builder("user.login.success")
                .tag("username", username)   // 可以按用户分组
                .description("用户登录成功次数")
                .register(meterRegistry)
                .increment();
    }
}

再比如你想监控一个缓存的大小（Gauge 类型）：

java

// 假设你有一个缓存对象 cache
meterRegistry.gauge("cache.size", cache, Cache::size);

🔥 从此，你的代码不再是“黑盒”，而是像一个透明厨房 —— 食客能看见每道菜是怎么炒出来的。

4️⃣ 把 Java 应用加入 Prometheus 的“偷窃名单”

回到之前的 prometheus.yml，把 Java 应用的 target 加进去：

yaml

scrape_configs:
  - job_name: "my-java-app"
    metrics_path: "/actuator/prometheus"   # Spring Boot 默认路径
    static_configs:
      - targets: ["localhost:8080"]

重启 Prometheus，过几秒去它的 Web UI 搜索 user_login_success_total，你就能看到你埋的计数器在欢快地增长了 🎈

🚨 避坑指南：别把报警玩成“狼来了”

Prometheus 很强大，但它有个“致命弱点”——它不会讲故事。

它只给你冷冰冰的数字。
如果你一上来就配了 2000 个报警规则，恭喜你，你将迎来：

半夜三点手机狂震 📱
报警风暴来袭 🌪️
服务器没崩，你先崩了 😵

正确的比例是：

报警规则的数量 ≈ 你愿意半夜爬起来处理的数量 × 1.5

每个报警都应该是可行动的：

❌ “CPU 使用率偏高” → 然后呢？
✅ “CPU 使用率连续 5 分钟 > 90%，且无法自动扩容” → 这个值得你起床

🎁 结尾：做盗火者，别做纵火犯

Prometheus 给了我们“偷火”的能力——把系统的真实状态带到我们面前。

但火用好了是温暖，用不好就是火灾。

监控的价值，不在于你配了多少规则，
而在于关键时刻，你只收到那一声真正能救命的“狼来了”。

愿你像普罗米修斯一样勇敢，
但别像他一样被绑在石头上天天被鹰啄肝 🦅

玩转监控，从 Prometheus 开始。 🔥

📚 延伸彩蛋：一句话总结

场景	比喻
Pull 模型	霸道总裁亲自查岗
Counter	上厕所次数，只增不减
Gauge	蹲坑人数，实时波动
Histogram	上厕所耗时分布
USE 法	机器体检报告
RED 法	火锅店经营报表
单机 + Thanos	特种兵 + 灭霸
Micrometer	监控界的翻译官 🌐

如果你觉得这篇文章让你对 Prometheus 从“一脸懵”变成了“有点意思”，欢迎点赞、收藏、转发三连 👇

你的每一次转发，都是对一个熬夜修 bug 的技术人的温柔 ❤️