首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
AGI技巧
冬奇Lab
创建于2025-12-08
订阅专栏
Prompt 工程、代码审查、AI 辅助重构等
等 36 人订阅
共96篇文章
创建于2025-12-08
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
微软双论文深度剖析:Agent Skill 的评测体系与自进化优化
从微软两篇最新研究论文出发,系统梳理 Agent Skill 的完整生命周期评测框架与 SkillOpt 文本空间优化方法,揭示"技巧好看不代表好用"的本质原因
Agent系列(八):上下文工程——让每个 Token 都用在刀刃上
深入讲解上下文工程(Context Engineering)的核心:上下文的五个来源及其 Token 成本剖析、预算约束下的动态上下文组装、以及上下文溢出时截断/摘要/检索三种策略的真实对比。附源码
Agent系列(七):知识库集成——Agent 调用 RAG 的正确姿势
深入拆解 Agentic RAG 与 Pipeline RAG 的本质区别:Agent 如何自主决定是否检索、查哪个知识库、以及检索质量不足时如何自我修正。
Agent系列(六):记忆管理——让 Agent 记住重要的事
深入讲解 Agent 的四种记忆类型(感觉/工作/情景/语义)与 LangGraph 实现的对应关系,三种上下文管理策略(截断/摘要/检索)的实测对比
Agent系列(五):意图识别与路由——让 Agent 听懂用户在说什么
深入拆解 Agent 意图识别层的必要性:关键词方案为何在生产中失效、LLM 分类器如何处理自然语言歧义、LangGraph 如何把不同意图路由到专项 Agent
Agent系列(四):工具调用深度解析——Agent 的手和眼
深入拆解 Tool Calling 的核心机制:工具设计三要素(接口/验证/安全)、Pydantic 参数校验、并行调用的真实表现、三大安全威胁防护,以及错误分类如何影响 Agent 的重试行为。
Agent系列(三):Plan-and-Solve——先想清楚,再动手
深入解析 Plan-and-Solve 范式:当 ReAct 的贪心策略在复杂任务上撞墙,如何引入显式规划层突破瓶颈。附完整 LangGraph 实现代码
Agent系列(二):ReAct——Agent 的"思考-行动"循环
深入解析 ReAct(Reasoning + Acting)范式:Thought → Action → Observation 三元组循环如何让 Agent 真正"思考"。附完整可运行示例代码
让 AI Agent 更可靠:Harness Engineering 与多 Agent 系统工程实践
从实际项目痛点出发,系统介绍 Harness Engineering 框架、5 种多 Agent 协作模式、Claude Code 长期记忆方案和持续学习机制,帮助你构建稳定、高效的 AI Agent
Agent 系列(一):Agent 是什么——不只是「会调工具的 LLM」
Agent 系列第一篇。厘清 LLM、Chatbot、Agent 三者的本质区别,理解 Agent 的四要素,以及流程驱动 vs AI Native 两种范型
RAG 系列(二十四):代码 RAG——让 AI 理解你的代码库
代码不是文档,它有结构(函数/类)、语义(docstring)和调用关系(call graph)——普通文本分块会把这些全部丢掉。本文带你实践如何做代码RAG
RAG 系列(二十三):多模态 RAG——图片、表格也能检索
真实文档里 30%–50% 的信息藏在图片和表格里,文本 RAG 完全看不到。三条处理路线:OCR/解析提取后文本化(最成熟)、CLIP 多模态 Embedding(图文同一向量空间)
RAG 系列(二十二):长上下文 vs RAG——要不要 RAG
Gemini 1.5 Pro 和 Claude 的百万 token 上下文窗口,让一部分人觉得 RAG 要过时了。这篇文章拆解两条路的实际代价
RAG 系列(二十一):性能优化——又快又省钱
一次 RAG 请求涉及两种 API 调用:Embedding 和 LLM,都是按量计费且有延迟。四种优化:LLM 响应缓存(相同问题 0ms 返回,5057ms→0.8ms)、Embedding 缓存
RAG 系列(二十):企业级 RAG 架构设计
Demo 级 RAG 对所有用户共享同一个向量库,任何人都能检索到任何内容。企业场景需要三件事:多租户隔离(、权限控制(工程师看不到 HR 文档,HR 看不到财务数据)和服务化
RAG 系列(十九):增量更新——知识库如何保持新鲜
知识库每天都在变:文档更新、新增、下线。Naive RAG 的做法是全量重建索引,把所有文档重新 embed 一遍。如何能够实现动态更新呢?本篇带你来了解动态更新RAG方案,附可运行源码
RAG 系列(十八):Conversational RAG——多轮对话中的代词陷阱
单轮 RAG 每次都把原始问题直接送检索,但"它有哪四个指标""其中哪个最难提升"这类追问在没有上下文时检索会完全失效。本篇给出解决方案
RAG 系列(十七):Agentic RAG——让 Agent 主导检索过程
Pipeline RAG 把检索结果原封不动传给 LLM,好坏都将就。Agentic RAG 把检索变成工具:先分类问题选策略,检索后打质量分,不合格就换策略重试。
RAG 系列(十六):Graph RAG——用知识图谱解决多跳关系问题
向量检索找的是"相似文档",对实体间的关系网络是盲的。Graph RAG 把文档构建成知识图谱,用图遍历代替相似度搜索。
RAG 系列(十五):CRAG——检索结果不好时自动纠偏
传统 RAG 盲目信任检索结果,知识库覆盖不到时照样生成。CRAG 的思路:先给检索结果打分,不合格就触发网络搜索兜底。用 LangGraph 实现完整流程,附可执行源码
下一页