首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
架构和远方
潘锦
创建于2022-01-16
订阅专栏
除了眼前的苟且,还有架构和远方。 介绍创业路上的技术选型和架构、大型网站架构、高性能高可用可扩展架构实现,技术管理等相关话题,紧跟业界主流步伐。
等 122 人订阅
共147篇文章
创建于2022-01-16
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
AI Agent 的长期记忆:我在工程落地里踩过的坑、做过的取舍
长期记忆不是「把历史对话存起来」。在生产环境里,它更像一套数据管道和检索系统,目标很具体: 让 Agent 在跨天、跨周的任务里保持一致性(用户偏好、项目背景、关键决策不丢)。 让上下文成本可控(To
RAG 优化常用的 5 种策略
做 RAG 经常会效果不行,就算是把模型换了更大的,回答依然飘;把向量库换了更贵的,召回还是不稳;把 Prompt 改了很多版,效果依然起起落落。 RAG 的瓶颈大多不在「生成」,而在「检索」。检索做
AI 编程:程序员变成了程序指导员
去年 Vibe Coding 突飞猛进,AI 编程已经逐渐普及。 很多团队对于写代码这件事的定义开始有一些变化。变化在于产出代码的方式:越来越多的代码来自模型,程序员更多时间花在和模型聊天,把问题说清
AI Agent 进阶架构:渐进式披露和动态上下文管理
当 Agent 做到一定复杂度,问题往往不在模型能力本身,而在上下文怎么给、工具怎么给、流程怎么控。同一套模型,有的团队能把它用成「能稳定交付的执行系统」,有的团队只能得到「偶尔灵光一现的聊天机器人」
关于行业 AI Agent 评测的 9 个方面
做 AI Agent,跑起来很容易,简单点函数调用+几个最好的大模型,复杂一点,整合或「学习」一些开源的多 Agent 项目,也能跑起来。 但是如何真正要做到一个行业中去,把一个行业 Agent 做好
行业 Agent 实战总结:行业 Know How 如何在 AI Agent 中落地
2025 年算是 「 AI Agent 元年」。各种 AI Agent 层出不穷,我们能看到的做得比较好的还是编程用的 Agent。 做垂直行业 Agent 最常见的问题是「行业 Know How 没
如何构建行业 Agent 的 RAG
行业 Agent 和我们常用的「通用聊天 Agent」不是一类东西。 行业 Agent 是要能解决问题的,而查资料只是其中一步,后面还要做判断、走流程、调用系统、校验结果、留痕、可回放。
AI 编程时代,人与人的交流减少了是好事吗?
随着 AI 编程在团队越来越普及,猛然发现一个正在变得「习以为常」的变化:以前遇到问题,第一反应是问同事或 Google;现在第一反应是问 AI。
AI Agent 的 Skill 和行业 Workflow
挑一个你们团队最常做、步骤最清晰、但最浪费时间的任务,把它完整写成一个 Skill,再把现有系统封装成一个 Workflow。 这两个拼起来,基本就是你们自己的第一个「行业 Workflow + Ag
ComfyUI 的缓存架构和实现
围绕 ComfyUI,大家讨论最多的是节点、工作流、算力这些,真正去看缓存细节的人其实不多。但只要你开始在一台机器上堆多个模型、多个 LoRA、多个 workflow,缓存策略就会直接决定这几件事:
聊下 AI Agent 的上下文记忆和遗忘
最近 DeepSeek 的 OCR 论文里有个有趣的想法:用光学压缩来模拟人类的记忆遗忘机制。 这个思路很巧妙。他们注意到人类记忆和视觉感知都有个共同特点:距离越远,信息越模糊。一小时前的事记得清楚,
关于 AI Agent 的思考:大模型边界和工作流
做 AI Agent 产品这段时间,最大的感受是理想与现实的差距。我们都希望做出科幻电影里那样的 AI,但现实的技术约束让我们不得不妥协。 但这未必是坏事。工作流让 AI 变得可控、可靠、可用。
AI Agent不够聪明,但 SaaS 公司可能是解药
AI Agent 的发展还处于早期阶段,现在下结论还为时过早。但有一点是确定的:那些能够深入理解客户需求,扎实做好工程实施,持续优化产品体验的公司,最终会在这个市场上站稳脚跟。
AI 能替代程序员编写所有代码吗?
AI 改变的是编程的方式,不是编程的需求。就像高级语言没有消灭汇编程序员,框架没有消灭底层开发者,AI 也不会消灭程序员。它只是给了我们一个更强大的工具,让我们能够解决更复杂的问题,创造更大的价值。
从 LangChain 和 Manus 两巨头上下文工程实战中学到的 5 点经验
最近仔细看了 LangChain 的 Lance 和 Manus 的 Pete 的视频,主题是构建 AI 智能体中的上下文工程。这次分享没有那些空泛的理论,全是在生产环境中验证过的实战经验。 我结合自
AI Agent 架构常用的 4 种设计模式
AI Agent 持续火爆,不仅仅是产品上,在融资市场也同样火爆,各种产品都在往上靠。但对于 AI Agent 该如何架构,有人关注,但少有人刻意去了解和分析。一些常见的问题有:如单个 Agent 搞
AI Agent 核心策略:如何判断 Agent 应该停止
简单来讲,AI Agent 实现的的大逻辑就是一个大的循环 + 获取上下文 + 不停的 LLM 调用 + 工具的调用。 那么一个关键问题就出现了:这个循环什么时候应该停止?如果处理不当,Agent 可
聊聊选择,以及我的 2025 总结
老家。 酒后! 去年的所有文章有 90% 以上的内容和代码都是 AI 写的。这篇总结就不用 AI 了。 为什么用选择这个主题呢,原因很简单,因为刷视频的时候刷到了刘震云老师的一段话: 有点鸡汤
AI 编程的多层次编程辅助策略
如果把 2022 年 6 月微软和 OpenAI 正式推出 Copilot 作为起点,AI 编程已经 3 年多了。 随着大模型的不断迭代升级,从 Copilot 到 IDE 下的 Cursor 入局,
AI Agent 核心管理逻辑:工具的管理和调度
简单来说,AI Agent 就是一个能够自主感知环境、制定计划、采取行动来完成特定目标的系统。 从架构的角度来看,又可以分为感知模块(包括状态上下文和意图上下文,而意图上下文是一个更难一些的问题),推
下一页