首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
twl
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
877
文章 877
沸点 0
赞
877
返回
|
搜索文章
最新
热门
评估驱动开发 EDD 介绍
“评估驱动开发(Evaluation-Driven Development, EDD)”调的是:先把评估体系(指标、数据、测试集、评估流程)设计好,再去做功能/模型/Prompt/策略开发。
Skills 生态介绍
本文介绍了Shills 市场,同时深入分析 Vercel Labs 开源的 Skills CLI 工具,这是一个为 AI 编程助手构建的开放式技能包管理器,支持 30+ 种主流 AI 编程工具。
中心化 Agent 和 非中心化 Agent 的实现区别
今天开会有一个问题引起我的思考:有同事说可以在Cursor执行自定义的Agent。梳理了下问题让ChatGPT回答。
json-render:构建安全可控的 AI 生成 UI 框架
随着大语言模型(LLM)在应用开发中的广泛应用,如何让 AI 安全、可控地生成用户界面成为一个技术挑战。本文深入解析 Vercel 开源的 json-render 框架,探讨其"护栏机制"设计思路。
agent-browser 深度技术解析:面向 AI Agent 的下一代浏览器自动化工具
本文深入剖析 Vercel Labs 开源的 agent-browser 项目,从架构设计、核心技术实现到最佳实践,全面解读这款专为 AI Agent 设计的无头浏览器自动化 CLI 工具。
Claude中SubAgents和Skills的区别
用子代理:需要独立推理、上下文隔离、并行处理的场景 用技能:需要特定领域知识、固定操作流程、可复用的专业功能
Hooks、Middleware、Plugins的区别及应用场景
最近在看 Claude Agent SDK, 里面特别提到了 Hooks,有各种各样的 Hooks,思考为什么这样设计,于是总结了下 Hooks、Plugins、Middleware的差异。
什么是 SWE-bench?
SWE-bench 是第一个大规模、可自动评测的“真实软件工程任务”基准. Claude Opus 4.5 和 GPT-5.2-Codex 是当前 SWE-bench 最高水平的模型.
两张图讲清楚Skills是如何节约Context Window的?
不把事情真的交给工具,模型只能在 context 里“脑补”,既费 token 又不准。 Skills 把能力变成“可按需加载的外部模块”,context 只承担“索引和当前任务”的角色。
为什么通用Agent也需要Bash环境
对比“不用 Bash” vs “用 Bash”时,大模型解决同一个问题的方式差异,核心想说明的是让模型把“思考 + 执行”交给真实工具(如 Bash),可以避免胡编、提高准确性和可复现性。
下一页
个人成就
文章被点赞
7
文章被阅读
3,214
掘力值
374
关注了
38
关注者
3
收藏集
0
关注标签
116
加入于
2017-03-22