首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
Anthropic 工程导读
贵慜_Derek
创建于2026-03-22
订阅专栏
Anthropic 工程导读
暂无订阅
共17篇文章
创建于2026-03-22
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
Managed Agents 里,Harness 到底升级了什么?
Anthropic 最新一篇文章《Scaling Managed Agents: Decoupling the brain from the hands》,讲的是将“大脑(Claude+Harness
「有人正常有人崩」不一定是模型抽风:三次基础设施复盘在读什么
2025 年 8~9 月,路由、TPU 输出、近似 top-k 三类问题曾经叠在一起,表现成「同一款产品,有人觉得一切正常、有人觉得明显不对」——排障像抓幽灵。原文写得很直白:从来没有因为需求、时段或
多Agent调研逻辑闭环:我以为在「多开聊天」,其实在买并行token容量
很多人的盲区是把多 Agent 理解成多开几个会话。 Anthropic 这篇工程文拆的是另一件事:Research 类任务是开放题——步骤事先定死会翻车,路径会边做边改;一条线性 one-shot
Claude「think」工具逻辑闭环:链中途那张「草稿纸」,和 Extended thinking 谁先谁后?
很多人把 Extended thinking 和「think 工具」当成「换皮」——这是我读材料时最常看到的盲区。 前者更像是 开口输出前,给模型一块长考空间;后者是 已经在走工具链了,中间要等一铲
Agent Skills:工具会连了,还差一本「上岗手册」
通用 Agent 已经能操作完整计算环境(例如 Claude Code 的本地执行与文件系统),但要稳定干真实工作,缺的不只是「能调什么」,而是程序性知识和组织上下文——报销怎么填、发布 checkl
RAG 检索老翻车?很多时候是切块把话说「半截」
做知识库检索的人几乎都踩过这种坑:切片里只剩一句「收入增长 3%」,却说不清哪家公司、哪一季——传统切块很容易把文档级语境弄丢,后面无论是向量召回还是 BM25,都在「半句话」上打转。Contextu
长程 Agent 卡住,多半不是模型不行,是下一棒接不住
上下文再长,也绕不开一个老问题:交接。上一轮干了啥、做到哪、坑踩到哪了,下一轮往往并不知道。Anthropic 这篇写得比较直:把“长程执行”从“靠模型记”改成“靠工程交接”——用 git + fea
Agent 评测最容易做错的一步,不是算分,而是没先把“对错”定义清楚
为什么这篇在现在特别有用 Agent 一旦开始“真干活”,评测就不能只盯一句回答。它会调工具、改状态、走分支;你要同时看两件事:最后做没做成,以及过程能不能接受。这篇真正有用的地方,不是再发明新词,而
Claude Code 沙箱这次最值得看的,不是“更会弹窗”,而是“先把边界画好”
为什么这件事现在更关键 这两年代码 Agent 变得越来越“能动手”:以前更像提建议,现在更像直接下场干活。问题也随之变了——弹窗多了,人会麻;弹窗少了,又怕兜不住风险。Anthropic 这篇真正想
工具太多、上下文先爆?Anthropic「高级工具使用」三件套在解决什么
Agent 侧的未来很可能是成百上千个工具同时在线:IDE 一串、运维又一串 MCP。麻烦在于:若把工具定义全塞进首轮上下文,用户话还没读完,token 先烧光,选错工具、乱填参数的概率也跟着上去。[
MCP 规模化之后,Agent 为什么开始「写代码调工具」?
这篇最值得看的,不是一句「能省 98.7% token」,而是一个工程转向: 过去我们让模型一轮轮直连 tool call;现在越来越多团队在做另一件事——让模型先写一段程序,在执行环境里把 MCP
用 Claude Agent SDK「给模型一台电脑」:从闭环到落地实践
支撑 Claude Code 的那套 agent harness 被泛化成 Claude Agent SDK:同一套「能写文件、跑终端、迭代验证」的底座,不只服务写代码,也能搭 金融助理、客服、深研
从「提示工程」到「上下文工程」:Anthropic 一文把 Agent 的注意力账算清楚
堆进窗口的 token 越多,context rot 越真实——不是某一家模型不行,而是长上下文里「大海捞针」普遍变难。Anthropic 把 context engineering 说成 promp
Agent 强不强,一半看工具:Anthropic 这篇把「怎么写工具」讲透了
MCP 一接,工具数量很容易冲到三位数。但堆接口不等于变强——原文那句 Agents are only as effective as the tools we give them 说得刻薄也实在:工
Claude Code 最佳实践导读:上下文是第一资源
Claude Code 把「读文件、跑命令、改代码」塞进同一条对话里——窗口越满,越容易忘指令。文档的底线就一句话:让模型能自证(测试、截图、期望输出),别让你当唯一反馈环。Plan Mode、短 C
一文读懂:如何为 Claude 写好「技能包」(Skills)——官方构建指南解读
一、为什么需要 Skill?两条路线先选边 1.1 人话版:从「每次重新教」到「装了一个常用动作包」 想象一下:你每个新项目都要跟同事重头讲一遍「我们代码风格怎样、周报格式怎样、提测前要检查哪几条」—
怎么造「真正好用的 AI Agent」?Anthropic 这篇工程长文,把套路说透了
「Agent」在业内的叫法很杂:有人指长跑全自动系统,有人指按剧本走的流水线。Anthropic 先把帽子统一成 agentic systems,再切开 Workflows(代码写死路线)与 Agen