PostgreSQL 数据库管理工程师|AI 技术方向

0 阅读5分钟

当数据库开始“听懂”人话,你的技能树该往哪儿长?

最近总有人问我:“AI 火了,数据库这行是不是要凉?”

我通常回一句:“恰恰相反,数据库工程师的黄金时代,可能才刚刚开始。”

 

你想想,不管是训练大模型,还是做 RAG(检索增强生成),数据才是 AI 的粮食。而粮食怎么存、怎么取、怎么喂给模型——这活,还得靠数据库。

 

今天想跟你聊聊 PostgreSQL,以及一个正在悄悄崛起的新物种:懂 AI 的 PostgreSQL 管理工程师。

 

为什么偏偏是 PostgreSQL?

先别急着杠,MySQL 也很棒,Oracle 也很稳。但你要是留意过最近 AI 圈子里的技术动向,会发现一个现象:PostgreSQL 的出镜率,高得离谱。

1. 它能存向量了

AI 应用里,最时髦的检索方式不是查 ID,而是“找相似”。比如你搜“开心的狗”,系统不是匹配关键词,而是把这句话转成一组数字(也就是向量),然后去数据库里找最接近的那组数字对应的图片。

 

PostgreSQL 有个插件叫 pgvector,装上之后,它就能像存普通数字一样存向量,还能做相似度搜索。

这意味着什么?你不需要再单独搭一套向量数据库(比如 Pinecone、Milvus),少维护一套系统,少踩一堆坑。对中小团队来说,这诱惑力太大了。

2. 它天生爱“吃” Python

搞 AI 的人,十个有九个离不开 Python。PostgreSQL 支持 PL/Python,可以直接在数据库里写 Python 脚本,跑模型推理、做数据清洗。

这相当于把数据库变成了一个“会思考”的执行器:数据不用搬来搬去,直接在库里完成预处理。

3. 生态里藏着“AI 全家桶”

除了 pgvector,还有 pg_analytics 跑分析,PostGIS 处理空间数据,MADlib 甚至集成了机器学习算法(线性回归、聚类啥的)。

PostgreSQL 已经不是传统意义上的数据库,更像是一个数据计算平台。

 

从“管库房的”到“AI 数据架构师”

如果你现在还是只盯着慢 SQL、做备份恢复,说实话,替代性挺强的。云厂商的托管数据库加几个监控报警,能顶掉不少基础工作。

 

但 AI 方向的出现,给 PostgreSQL DBA 开了一扇新门。

 

1. 你要懂一点“向量”和“嵌入”

不再是只关心索引是不是 B-tree,还得知道什么是“向量索引”(比如 HNSW、IVFFlat)。

不再是只调 SQL 性能,还得会分析召回率、准确率——这些以前是算法工程师的活,现在数据库也得背一部分。

2. 你要能搭“数据流水线”

AI 应用的数据流往往是:业务库 → 预处理 → 向量化 → 存储 → 检索。

这一整套链条,得有人搭、有人盯。懂 PostgreSQL 的人最适合做这件事,因为你清楚数据在哪个环节容易丢、哪个环节容易慢。

3. 你要会跟算法工程师“吵架”

以前 DBA 只跟开发打交道,现在还要跟算法工程师 PK。

人家说“我要用专业的向量数据库”,你得有理有据地告诉他:PostgreSQL 配合 pgvector,能满足 90% 的场景,而且你们少维护一套系统,数据一致性更好,上线更快。

这不是吵架,是博弈,也是价值。

 

未来前景:这个岗位会消失,还是会涨价?

老实说,纯“增删改查”的 DBA 岗位确实在减少。但懂 AI 的 PostgreSQL 工程师,我看到的趋势是:需求暴涨,供给稀缺。

 

1. AI 应用落地,需要“中间人”

现在很多公司卡在“算法模型有了,不知道咋上线”。模型需要数据,数据需要存储和检索,而传统的业务数据库(比如 MySQL)对 AI 不友好。

PostgreSQL 成了天然的桥梁——既能存业务数据,又能存向量数据,还能跑一些简单的模型推理。

懂 PostgreSQL 的人,自然就成了连接算法团队和工程团队的“中间人”。这种角色,不可替代。

 

2. 开源生态,让 PostgreSQL 更有生命力

PostgreSQL 这几年社区越来越活跃,新特性一个接一个。今年刚出的 pgvector 0.6.0,性能又翻了一倍。

背后的逻辑是:社区在拼命让 PostgreSQL 适应 AI 时代。作为工程师,你只需要跟上节奏,就能吃到这波红利。

 

3. 不是“替代”,而是“进化”

别担心被 AI 替代。AI 需要数据,数据需要数据库,数据库需要人。

只是这个“人”的要求变了:

 

l 以前,懂 SQL、懂备份、懂高可用,就够了。

l 现在,你最好还懂一点机器学习基础,知道 embedding 是什么,知道怎么调向量索引的参数。

 

怎么开始?给你三条实在的建议

如果你对这个方向感兴趣,可以直接动手:

 

1、 装个 pgvector 玩一玩

官方文档很友好,花一个周末,把 OpenAI 的 embedding 接进去,做个简单的“图片搜索” demo。跑通了,你就入门了。

2、 关注 PostgreSQL 的 AI 扩展

除了 pgvector,还有 pg_similarity、pg_embedding、pg_diskann。不需要都精通,但要知道它们能解决什么问题。

3、 跟算法同学喝杯咖啡

聊聊他们现在最头疼的数据问题。你会发现,很多问题 PostgreSQL 其实能帮忙解决,只是他们不知道。

你能做那个“搭桥”的人,就已经领先很多人了。

 

写在最后

数据库工程师这个岗位,过去十年有点像“隐形人”——系统稳的时候没人理,出问题的时候全员找你。

但在 AI 时代,数据成了核心资产,懂数据的人,自然站到了舞台中央。

PostgreSQL 恰好站在了传统数据库和 AI 世界的交汇点。

你想继续做一个“修水管的”,还是成为一个“搭桥的人”?

答案,其实已经很明显了。

如果你觉得这篇文章有点意思,不妨点个赞、转给团队里那个正在犹豫要不要学点新东西的 DBA 朋友。 可以私信小编可获得PG资料 说不定,下次你们团队搞 AI 项目,他就是那个“关键先生”。