AGI技巧

AGI技巧

AGI技巧

Prompt 工程、代码审查、AI 辅助重构等

等 36 人订阅共96篇文章创建于2025-12-08

微软双论文深度剖析：Agent Skill 的评测体系与自进化优化

从微软两篇最新研究论文出发，系统梳理 Agent Skill 的完整生命周期评测框架与 SkillOpt 文本空间优化方法，揭示"技巧好看不代表好用"的本质原因

19天前
245
1
评论

微软双论文深度剖析：Agent Skill 的评测体系与自进化优化

Agent系列（八）：上下文工程——让每个 Token 都用在刀刃上

深入讲解上下文工程（Context Engineering）的核心：上下文的五个来源及其 Token 成本剖析、预算约束下的动态上下文组装、以及上下文溢出时截断/摘要/检索三种策略的真实对比。附源码

21天前
147
1
评论

Agent系列（八）：上下文工程——让每个 Token 都用在刀刃上

Agent系列（七）：知识库集成——Agent 调用 RAG 的正确姿势

深入拆解 Agentic RAG 与 Pipeline RAG 的本质区别：Agent 如何自主决定是否检索、查哪个知识库、以及检索质量不足时如何自我修正。

22天前
149
1
评论

Agent系列（七）：知识库集成——Agent 调用 RAG 的正确姿势

Agent系列（六）：记忆管理——让 Agent 记住重要的事

深入讲解 Agent 的四种记忆类型（感觉/工作/情景/语义）与 LangGraph 实现的对应关系，三种上下文管理策略（截断/摘要/检索）的实测对比

23天前
159
1
评论

Agent系列（六）：记忆管理——让 Agent 记住重要的事

Agent系列（五）：意图识别与路由——让 Agent 听懂用户在说什么

深入拆解 Agent 意图识别层的必要性：关键词方案为何在生产中失效、LLM 分类器如何处理自然语言歧义、LangGraph 如何把不同意图路由到专项 Agent

24天前
273
1
评论

Agent系列（五）：意图识别与路由——让 Agent 听懂用户在说什么

Agent系列（四）：工具调用深度解析——Agent 的手和眼

深入拆解 Tool Calling 的核心机制：工具设计三要素（接口/验证/安全）、Pydantic 参数校验、并行调用的真实表现、三大安全威胁防护，以及错误分类如何影响 Agent 的重试行为。

25天前
141
1
评论

Agent系列（四）：工具调用深度解析——Agent 的手和眼

Agent系列（三）：Plan-and-Solve——先想清楚，再动手

深入解析 Plan-and-Solve 范式：当 ReAct 的贪心策略在复杂任务上撞墙，如何引入显式规划层突破瓶颈。附完整 LangGraph 实现代码

27天前
140
1
评论

Agent系列（三）：Plan-and-Solve——先想清楚，再动手

Agent系列（二）：ReAct——Agent 的"思考-行动"循环

深入解析 ReAct（Reasoning + Acting）范式：Thought → Action → Observation 三元组循环如何让 Agent 真正"思考"。附完整可运行示例代码

28天前
197
2
评论

Agent系列（二）：ReAct——Agent 的"思考-行动"循环

让 AI Agent 更可靠：Harness Engineering 与多 Agent 系统工程实践

从实际项目痛点出发，系统介绍 Harness Engineering 框架、5 种多 Agent 协作模式、Claude Code 长期记忆方案和持续学习机制，帮助你构建稳定、高效的 AI Agent

28天前
164
点赞
评论

让 AI Agent 更可靠：Harness Engineering 与多 Agent 系统工程实践

Agent 系列（一）：Agent 是什么——不只是「会调工具的 LLM」

Agent 系列第一篇。厘清 LLM、Chatbot、Agent 三者的本质区别，理解 Agent 的四要素，以及流程驱动 vs AI Native 两种范型

29天前
187
4
评论

Agent 系列（一）：Agent 是什么——不只是「会调工具的 LLM」

RAG 系列（二十四）：代码 RAG——让 AI 理解你的代码库

代码不是文档，它有结构（函数/类）、语义（docstring）和调用关系（call graph）——普通文本分块会把这些全部丢掉。本文带你实践如何做代码RAG

29天前
129
点赞
评论

RAG 系列（二十四）：代码 RAG——让 AI 理解你的代码库

RAG 系列（二十三）：多模态 RAG——图片、表格也能检索

真实文档里 30%–50% 的信息藏在图片和表格里，文本 RAG 完全看不到。三条处理路线：OCR/解析提取后文本化（最成熟）、CLIP 多模态 Embedding（图文同一向量空间）

1月前
201
1
评论

RAG 系列（二十三）：多模态 RAG——图片、表格也能检索

RAG 系列（二十二）：长上下文 vs RAG——要不要 RAG

Gemini 1.5 Pro 和 Claude 的百万 token 上下文窗口，让一部分人觉得 RAG 要过时了。这篇文章拆解两条路的实际代价

1月前
190
点赞
评论

RAG 系列（二十二）：长上下文 vs RAG——要不要 RAG

RAG 系列（二十一）：性能优化——又快又省钱

一次 RAG 请求涉及两种 API 调用：Embedding 和 LLM，都是按量计费且有延迟。四种优化：LLM 响应缓存（相同问题 0ms 返回，5057ms→0.8ms）、Embedding 缓存

1月前
101
点赞
评论

RAG 系列（二十一）：性能优化——又快又省钱

RAG 系列（二十）：企业级 RAG 架构设计

Demo 级 RAG 对所有用户共享同一个向量库，任何人都能检索到任何内容。企业场景需要三件事：多租户隔离（、权限控制（工程师看不到 HR 文档，HR 看不到财务数据）和服务化

1月前
172
1
评论

RAG 系列（二十）：企业级 RAG 架构设计

RAG 系列（十九）：增量更新——知识库如何保持新鲜

知识库每天都在变：文档更新、新增、下线。Naive RAG 的做法是全量重建索引，把所有文档重新 embed 一遍。如何能够实现动态更新呢？本篇带你来了解动态更新RAG方案，附可运行源码

1月前
158
1
评论

RAG 系列（十九）：增量更新——知识库如何保持新鲜

RAG 系列（十八）：Conversational RAG——多轮对话中的代词陷阱

单轮 RAG 每次都把原始问题直接送检索，但"它有哪四个指标""其中哪个最难提升"这类追问在没有上下文时检索会完全失效。本篇给出解决方案

1月前
99
点赞
评论

RAG 系列（十八）：Conversational RAG——多轮对话中的代词陷阱

RAG 系列（十七）：Agentic RAG——让 Agent 主导检索过程

Pipeline RAG 把检索结果原封不动传给 LLM，好坏都将就。Agentic RAG 把检索变成工具：先分类问题选策略，检索后打质量分，不合格就换策略重试。

1月前
164
1
评论

RAG 系列（十七）：Agentic RAG——让 Agent 主导检索过程

RAG 系列（十六）：Graph RAG——用知识图谱解决多跳关系问题

向量检索找的是"相似文档"，对实体间的关系网络是盲的。Graph RAG 把文档构建成知识图谱，用图遍历代替相似度搜索。

1月前
118
点赞
评论

RAG 系列（十六）：Graph RAG——用知识图谱解决多跳关系问题

RAG 系列（十五）：CRAG——检索结果不好时自动纠偏

传统 RAG 盲目信任检索结果，知识库覆盖不到时照样生成。CRAG 的思路：先给检索结果打分，不合格就触发网络搜索兜底。用 LangGraph 实现完整流程，附可执行源码

1月前
105
点赞
评论

RAG 系列（十五）：CRAG——检索结果不好时自动纠偏