💡核心观点 AI 产品经理做的不是"给产品加个 AI 功能",而是设计一个完整的智能系统。这篇直接摊开我最近做的几个项目——公司的、个人的都有——你看完大概就知道我们每天在干啥了。 |
上一篇写了从画画转行到 AI产品经理,我把方法拆成了四层,讲述了我转行的来时路。有很多朋友加我好友,问我:大佬你是怎么转的啊,需要哪些技能,AI 产品经理和传统产品经理到底有什么区别?你们每天在干啥?我能转吗?
你们的心情,我真的特别能体会。尤其是那些还在家待业的朋友——每次和你们聊完,我都能感觉到那种压在心里的焦虑,还有反复拉扯自己的内耗,以及站在路口不知道该往哪走的迷茫。说实话,我也是一步步从那种状态里蹚过来的,太知道那种滋味了。
说实话我也很难一句话讲清楚。这样吧,这篇直接摊开我最近做的几个项目——公司的、自己的都有——你看完大概就知道了。也许会很干,理解起来会很难,但相信我,认真看完你一定有收获。同时也不要焦虑,咱们慢慢来。
先说下我每天怎么干活的
我在公司负责的事比较杂:整体前端的原型设计、Agent 端的行为设计、以及把新功能接入公司已有的运营后台。
对接的人不少。往上对领导的需求,横向跟产品同事协作,然后跟前后端工程师、UI 设计师、测试都要打交道。
所有沟通的起点是我写的PRD。
但这个 PRD 跟传统产品经理写的不太一样。传统 PRD 主要描述界面和交互流程,我的 PRD 里面还得写清楚:这个 Agent 在什么条件下触发、接收什么信息、怎么判断、输出什么格式、做不到的时候怎么兜底。
评审会上讨论的也不太一样。按钮放哪聊得少,聊得多的是"这个场景 AI 搞不定怎么办""模型返回格式不稳定前端怎么兜""这条数据回流到哪里"。
说白了就是,写 PRD 的时候得把 Agent 当成一个不太靠谱但很聪明的新员工——什么事交给它、什么事不能交、它搞砸了你怎么收场,都得提前想好。
内容审核 Agent
这个项目挺有挑战的,也是我做得比较细的一个。
背景
公司有大量多媒体内容需要审核:音频、图片、文档、会议记录等等。之前靠人工一条条过,效率很低,而且部分内容涉及隐私,处理上有很多限制。
我的任务是设计一个审核 Agent,把这些不同形式的内容统一审查。
接到这个需求的时候我拆了一下,发现它其实是三个递进的问题:先得把各种格式的内容"读懂",然后才能判断有没有问题,最后还得保证判断是准的。每一步都有坑。
第一步:让机器"读懂"多媒体内容
文本文档直接读就行,但录音、图片、视频、会议记录——形式完全不一样,得先"翻译"成文本。
音频内容是第一个难点。要做语音转文字,但因为涉及隐私数据,不能丢给外部 API,必须本地部署。
我找了几个本地 ASR 模型,拉了一批真实音频做对比评测——主要看三个维度:转录准确率、方言和口音的识别能力、长音频的处理速度。
评测完发现一个问题:**口语化内容的准确率比书面文本差一截。**实际对话里夹杂大量口头禅、重复、打断、甚至方言混说,转出来的文本经常缺字错字。特别是专业术语和人名,转录模型基本靠猜。
这个问题在转录环节解决不了,只能在后面的审查环节做容错——比如关键词匹配的时候不能只做精确匹配,得加模糊匹配和近音词匹配,不然"敏感词"被转录成了"敏干词"就直接漏了。
图片和海报走 OCR。这里的坑是排版复杂——宣传图上的文字有大有小、有横有竖、有的还压在背景图上,普通 OCR 经常只提取到一部分。也做了本地 OCR 模型的对比评测,主要看中文识别准确率和复杂排版下的表现。
这一步折腾完,最终搭出来一条管线:不管什么格式进来,先过对应的解析模块(ASR / OCR / 文档解析),统一输出成结构化文本。后面的审查环节只跟文本打交道,不用管原始内容是什么形式。
**这个"统一转文本"的设计很关键。**如果针对每种媒体格式分别写审查逻辑,后面维护起来就是噩梦。把"理解内容"和"判断内容"拆成两层,每层只管自己的事,加新格式的时候只需要加一个解析模块,审查逻辑一行不用改。
第二步:关键词打底,Agent 兜底
文本拿到了,怎么判断有没有问题?
最直觉的方案是维护一个敏感词库,做关键词匹配。我一开始也是这么做的——把已知的敏感词、黑名单术语全灌进去,跑精确匹配和模糊匹配。
速度很快,成本很低,确实能够拦住了一批明确违规的内容。
但很快问题就来了。
测试反馈:**误报太多。**同一个词在不同场景下含义完全不同——在正常业务沟通里出现是完全合理的,但关键词匹配不管语境,命中就标红。运营得一条条去看、一条条去解除,比不做审查还累。
光靠关键词不行,得加一层"懂语境"的。
所以我在关键词之上加了Agent 兜底。流程变成这样:
|
有人可能会问:**为什么不全交给 Agent?**两个原因:成本和速度。公司每天审核的内容量不小,每条都过一遍大模型,API 调用费用扛不住,响应速度也跟不上。关键词能解决 80% 的明确 case,Agent 只处理那 20% 需要"动脑子"的。
这个设计的核心思路其实和我做 AI 助手是一样的:**不是什么都交给 AI,而是想清楚哪些环节需要 AI、哪些不需要。**关键词是规则,Agent 是智能——规则管"确定的",智能管"不确定的",各司其职。
第三步:反复磨准确率
审查系统最怕两件事:误报和漏放。
误报多了,运营天天来申诉"这条没问题为什么被标了",信任就崩了;漏放了,出事就是大事。
上线之前我把历史内容灌进管线跑了好几轮——看命中情况,逐条核对误报和漏放。每一轮测试完调敏感词库(有些词该加、有些词该放宽匹配条件),调 Agent 的判断 prompt(让它在特定场景下更严或更松),调置信度阈值(Agent 判断把握不大的推人工复核)。
这个过程没什么捷径,就是改一个参数、跑一轮测试、看结果、再改。和调 RAG 的逻辑一模一样。
我在运营后台做了一个审核结果看板,运营可以对每条结果标"正确"或"误判"。这些反馈数据回流过来,持续优化敏感词库和 Agent 的判断策略。审查系统不是上线就完事的产品,是一个需要持续养的系统。
现在管线已经交付给后端了。
AI 助手重构
这个项目目前还在设计阶段,还没进开发评审。但它是我花思考时间最多的一个,也最能体现 AI 产品经理到底在"设计"什么。
旧版有多烂
公司之前的 AI 助手,说实话就是套了个大模型。
用户问一个问题,模型把整个思考过程连带回答一坨全吐出来。一大段混乱的文字,没有思维链展示,没有结构化输出,看着就头疼。
但这还不是最大的问题。最大的问题是它是个信息孤岛——没有接入我们的课程数据,不认识我们的用户,不知道平台上有什么内容。用户问"有没有适合我的课程",推荐的东西永远都是那几样热卖课。
也没有联网搜索,用户信息收集不了,画像更做不了。
总结就是:不认识用户、不认识产品、不会说人话。
我在设计什么
拿到这个重构任务,第一件事不是画原型,是想清楚一个问题:这个 AI 助手到底应该是什么?
不是一个通用聊天机器人,是一个认识我们产品、理解我们用户的业务助手。想清楚这个定位,后面所有设计决策都有了锚点。
场景拆分
旧版是一个大而全的 Agent 啥都干,效果啥都不行。我的方案是按场景拆成独立模块:
|
每个场景有自己的 Agent 逻辑和 prompt,该调哪个由路由层判断。这样做的好处是每个场景可以单独调优——课程推荐的 prompt 和深度研究的 prompt 完全是两套逻辑,硬塞在一个 Agent 里互相干扰,拆开之后各管各的。
记忆架构
这是我花时间最多的部分。
不同 Agent 有不同的记忆,但最终都要归到一个地方——用户画像。
比如用户在"深度研究"场景里聊了半小时 Python 爬虫,这段对话的记忆不只是留在深度研究模块里,还要提取出关键信息(用户对 Python 爬虫感兴趣、有一定基础、目标是做数据采集)回流到用户画像。下次用户打开"课程推荐"的时候,Agent 已经知道该推什么了。
短期记忆是当前对话的上下文,长期记忆是用户画像。每次 Agent 回答之前,都要先过一遍用户画像,带着对这个用户的了解去回应,而不是每次都从零开始。
前端怎么呈现
模型的思考过程和关键的工具调用,知识检索折叠起来,用户看到的是干净的结构化回答。课程推荐用卡片呈现,关键信息一目了然,不是一堆纯文字糊在一起。
接入运营后台
公司本来就有运营后台,我把 AI 助手相关的功能接了进去——对话质量、用户反馈、推荐准确率、异常 case,运营直接在后台看,不用找开发跑 SQL。
这个项目的原型和 Agent 设计方案目前已经做完了,接下来准备进评审。具体开发落地和踩坑的事,等后面再聊。
场景怎么拆、记忆怎么流转、上下文怎么组织——这些东西在传统产品经理的工作里根本不存在,但在 AI 产品设计里是最核心的部分。 |
SkillForge — 多领域的 Skill 平台
这个是个人项目 -- skills.yangsir.net
skills.sh 上有 8 万多个 Skill,但大部分是英文、而且同一个skill有很多不同的版本,没有任何分类,搜出来一堆自己翻,噪音太多,于是我做了 SkillForge,将大部分 Skills 分类为 26 个垂直领域分类——产品经理的 Skill、前端的 Skill、后端的 Skill——你按自己的领域筛选就行,不用大海捞针。还加了个 AI 搜索,用自然语言描述需求,帮你匹配。目前有 4700 个 Skills,还在持续更新中,也欢迎大家投稿自己的 Skills。
传统网站数据靠人填、分类靠人改、内容靠人审。把这种固定的环节交给 Agent 之后,你就可以把精力放在更重要的事上了。这个网站实际做了三天左右,都是晚上和手机上用 Claude 写的。
目前已经上线半个多月了,数据每天在自动更新。后续打算研究一下 SEO,让更多有需求的人能搜到。
智语观潮日报
ai.daily.yangsir.net
之前做的 AI 日报站一直在迭代,最近加了周报功能——AI 从一周的日报里精选最有价值的内容,抓原文,自动生成精读文章。目前连续更新了30多天,400➕日报内容,和 27 条 周报内容,目前周报生成的提示词还需要打磨。
除了这些之外手上还有几个个人项目在推进,但还不太成熟,等跑通了再跟大家分享。
意外收获:去当了 OpenClaw 讲师
因为写公众号和做开源项目,有很多读者通过文章找到了我,其中一位在筹备 OpenClaw 的课程项目,邀请我去当讲师。
前后讲了三节课:
|
讲课的过程中发现一个事:**需求比我想象的大很多。**来学的人里有做自媒体的、做私域运营的、做自动化的、有想用来盯股票的。很多人不是技术背景,就是想用 AI 解决自己工作里的实际问题。
还有不少人跟我当初一样——零基础,想往 AI 方向转,但不知道从哪下手。每次课后答疑,问得最多的就是"我想转行做 AI 相关的工作,应该从哪儿开始呢"。
这个问题我可以肯定的告诉大家:跟着我,相信自己。我带着大家一起了解更多的 AI 相关内容。不论是行业经验还是知识技巧。
🔗 往期推荐:
飞书社群开源知识库:my.feishu.cn/wiki/PFJswU…
今天的文章就到这里啦,如果觉得不错,可以点个赞、在看、转发,三连支持我~
扫描下方图片中我的微信二维码备注"进群",拉你进社群一起交流学习!