Anthropic 工程导读

Anthropic 工程导读

Anthropic 工程导读

Anthropic 工程导读

暂无订阅共17篇文章创建于2026-03-22

Managed Agents 里，Harness 到底升级了什么？

Anthropic 最新一篇文章《Scaling Managed Agents: Decoupling the brain from the hands》，讲的是将“大脑（Claude+Harness

18天前
110
点赞
评论

「有人正常有人崩」不一定是模型抽风：三次基础设施复盘在读什么

2025 年 8～9 月，路由、TPU 输出、近似 top-k 三类问题曾经叠在一起，表现成「同一款产品，有人觉得一切正常、有人觉得明显不对」——排障像抓幽灵。原文写得很直白：从来没有因为需求、时段或

24天前
34
点赞
评论

多Agent调研逻辑闭环：我以为在「多开聊天」，其实在买并行token容量

很多人的盲区是把多 Agent 理解成多开几个会话。 Anthropic 这篇工程文拆的是另一件事：Research 类任务是开放题——步骤事先定死会翻车，路径会边做边改；一条线性 one-shot

26天前
63
点赞
评论

Claude「think」工具逻辑闭环：链中途那张「草稿纸」，和 Extended thinking 谁先谁后？

很多人把 Extended thinking 和「think 工具」当成「换皮」——这是我读材料时最常看到的盲区。前者更像是开口输出前，给模型一块长考空间；后者是已经在走工具链了，中间要等一铲

27天前
34
点赞
评论

Agent Skills：工具会连了，还差一本「上岗手册」

通用 Agent 已经能操作完整计算环境（例如 Claude Code 的本地执行与文件系统），但要稳定干真实工作，缺的不只是「能调什么」，而是程序性知识和组织上下文——报销怎么填、发布 checkl

28天前
29
点赞
评论

RAG 检索老翻车？很多时候是切块把话说「半截」

做知识库检索的人几乎都踩过这种坑：切片里只剩一句「收入增长 3%」，却说不清哪家公司、哪一季——传统切块很容易把文档级语境弄丢，后面无论是向量召回还是 BM25，都在「半句话」上打转。Contextu

29天前
67
1
评论

长程 Agent 卡住，多半不是模型不行，是下一棒接不住

上下文再长，也绕不开一个老问题：交接。上一轮干了啥、做到哪、坑踩到哪了，下一轮往往并不知道。Anthropic 这篇写得比较直：把“长程执行”从“靠模型记”改成“靠工程交接”——用 git + fea

29天前
50
点赞
1

Agent 评测最容易做错的一步，不是算分，而是没先把“对错”定义清楚

为什么这篇在现在特别有用 Agent 一旦开始“真干活”，评测就不能只盯一句回答。它会调工具、改状态、走分支；你要同时看两件事：最后做没做成，以及过程能不能接受。这篇真正有用的地方，不是再发明新词，而

1月前
49
1
1

Claude Code 沙箱这次最值得看的，不是“更会弹窗”，而是“先把边界画好”

为什么这件事现在更关键这两年代码 Agent 变得越来越“能动手”：以前更像提建议，现在更像直接下场干活。问题也随之变了——弹窗多了，人会麻；弹窗少了，又怕兜不住风险。Anthropic 这篇真正想

1月前
78
点赞
评论

工具太多、上下文先爆？Anthropic「高级工具使用」三件套在解决什么

Agent 侧的未来很可能是成百上千个工具同时在线：IDE 一串、运维又一串 MCP。麻烦在于：若把工具定义全塞进首轮上下文，用户话还没读完，token 先烧光，选错工具、乱填参数的概率也跟着上去。[

1月前
35
点赞
评论

MCP 规模化之后，Agent 为什么开始「写代码调工具」？

这篇最值得看的，不是一句「能省 98.7% token」，而是一个工程转向：过去我们让模型一轮轮直连 tool call；现在越来越多团队在做另一件事——让模型先写一段程序，在执行环境里把 MCP

1月前
26
点赞
评论

用 Claude Agent SDK「给模型一台电脑」：从闭环到落地实践

支撑 Claude Code 的那套 agent harness 被泛化成 Claude Agent SDK：同一套「能写文件、跑终端、迭代验证」的底座，不只服务写代码，也能搭金融助理、客服、深研

1月前
70
点赞
评论

从「提示工程」到「上下文工程」：Anthropic 一文把 Agent 的注意力账算清楚

堆进窗口的 token 越多，context rot 越真实——不是某一家模型不行，而是长上下文里「大海捞针」普遍变难。Anthropic 把 context engineering 说成 promp

1月前
58
点赞
评论

Agent 强不强，一半看工具：Anthropic 这篇把「怎么写工具」讲透了

MCP 一接，工具数量很容易冲到三位数。但堆接口不等于变强——原文那句 Agents are only as effective as the tools we give them 说得刻薄也实在：工

1月前
33
点赞
评论

Claude Code 最佳实践导读：上下文是第一资源

Claude Code 把「读文件、跑命令、改代码」塞进同一条对话里——窗口越满，越容易忘指令。文档的底线就一句话：让模型能自证（测试、截图、期望输出），别让你当唯一反馈环。Plan Mode、短 C

1月前
95
点赞
评论

一文读懂：如何为 Claude 写好「技能包」（Skills）——官方构建指南解读

一、为什么需要 Skill？两条路线先选边 1.1 人话版：从「每次重新教」到「装了一个常用动作包」想象一下：你每个新项目都要跟同事重头讲一遍「我们代码风格怎样、周报格式怎样、提测前要检查哪几条」—

1月前
389
点赞
评论

怎么造「真正好用的 AI Agent」？Anthropic 这篇工程长文，把套路说透了

「Agent」在业内的叫法很杂：有人指长跑全自动系统，有人指按剧本走的流水线。Anthropic 先把帽子统一成 agentic systems，再切开 Workflows（代码写死路线）与 Agen

1月前
101
点赞
评论