新闻、观点、有趣
OpenAI 谷歌联手推出 AGENTS.md,能否成为编程 Agent 的「官方说明书」?
AGENTS.md 的诞生,是 AI 软件开发生态系统走向成熟和标准化的一个信号。
它试图解决一个普遍存在的痛点,通过一个简单、开放的方案,凝聚了行业主要参与者的共识。虽然它并不完美,也还没有得到所有关键厂商(尤其是 Anthropic)的全面支持。
但无论其最终形态如何演变,这场围绕 AGENTS.md 的讨论本身,已经极具价值。它促使我们深入思考:在一个人类工程师与 AI 智能体并肩作战的时代,我们应该如何构建新的沟通协议和协作规范?
当人类开始迎合机器的理解方式,这是无奈的妥协,还是进化的必然?
目前看来,AGENTS.md 是朝着一个更有序、更高效、更标准化的未来,迈出的坚实一步。
就像从口头语言到书面文字,再到今天的结构化数据,人类一直在发明新的工具和规范来更精确地传递信息。AGENTS.md 或许只是这条漫长道路上的一份「人机协作章程」。
它的未来,依赖于整个社区的共同建设。
你怎么看 AGENTS.md?你认为它是未来的方向,还是一个暂时的补丁?欢迎在评论区留下你的看法。
教程、技巧
一文搞定 AI Agent 核心设计模式,从0到1搭建智能体系统
当大语言模型突破了“理解与生成”的瓶颈,Agent 迅速成为 AI 落地的主流形态。从智能客服到自动化办公,几乎所有场景都需要 Agent 来承接 LLM 能力、执行具体任务。但技术演进中痛点也随之凸显,有的团队因不懂如何衔接 LLM 与业务系统,导致 Agent 只能 “空谈”;有的因状态管理缺失,让 Agent 执行任务时频频 “失忆”,复杂的交互流程也进一步增加了开发难度。
Midscene.js 实战与源码剖析:如何重塑 UI 自动化
Midscene.js是基于AI的下一代UI自动化框架,旨在解决传统自动化工具的脆弱性、高维护成本和调试困难等痛点。该框架采用自然语言描述操作意图,通过多模态AI模型理解页面内容并执行自动化操作。核心工作流程包括五个阶段:页面上下文获取(截图+DOM结构提取)、第一次AI调用进行任务规划和预定位、四层元素验证机制(XPath→缓存→Plan→AI回退)、第二次AI调用进行元素验证、最终执行自动化操作。框架支持VL模型和LLM模型两种模式,前者专注视觉定位且成本更低,后者能处理完整页面信息但成本较高。在业务落地过程中,作者发现了背景图片信息丢失、内容截断、iframe限制等问题。对于大前端研发,可探索将Midscene.js应用于可视化测试用例生成、智能化新手引导系统、AI驱动的代码调试助手等场景,通过自然语言操作界面元素,提升前端开发和测试的智能化水平。
6个agent搞定复杂指令和工具膨胀
文章阐述联调造数场景从单Agent到多Agent架构的演进实践。智造1.0采用单Agent模式通过Prompt工程和工具治理实现基础造数,但面临"造不准"(复杂指令准确率低)和"造的慢"(工具数量增加导致响应延迟)两大瓶颈。智造2.0通过6个Agent/模块协同解决:意图识别Agent抽象8类意图并解析为IntentResult模型(谁/地点/条件/关联方/做什么/对象),工具引擎通过后台工具解析Agent生成ToolEssentialModel和实时过滤引擎将100+工具降至5个左右,推理执行Agent采用"逆向推理+正向执行"策略构建工具调用链。核心技术创新包括应对语义断层(文本相似度+同义词词表+embedding)、功能断层(主辅工具双轨过滤)、通过结构化模型让LLM做选择题而非开放题。对大前端研发的启示:借鉴意图模型思想将需求抽象为标准化输入、采用工具过滤引擎解决组件库膨胀问题、逆向推理思路可用于从UI目标反推依赖组件、"弱化Agent"原则提醒优先用确定性工程手段(如规则引擎、模板匹配)而非全部依赖AI、构建工具本质模型(功能类型/依赖实体/作用实体)指导组件库设计、应对"产品需求语言"与"组件能力描述"的语义断层需建立领域术语映射和同义词库。
浅谈上下文工程|从 Claude Code 、Manus 和 Kiro 看提示工程到上下文工程的转变
上下文工程正在成为AI开发的新范式,它从传统的单一提示词转向构建动态系统,为大语言模型提供完整的信息和工具。与提示工程相比,上下文工程包含七个核心组成部分:系统提示词、用户提示词、短期记忆、长期记忆、检索信息、可用工具和结构化输出,解决了长上下文中的Context-Rot问题。业界实践中,Claude Code通过三层记忆架构和实时Steering机制实现了编码Agent的能力标杆;Manus通过KV缓存优化、工具遮蔽等技术大幅降低成本;Kiro采用Spec-Driven开发模式替代传统Vibe Coding。未来将从上下文工程演进到环境工程,AI不再只是被动接受信息,而是主动感知和塑造环境。对于大前端研发,可以借鉴这些实践构建智能代码助手、自动化测试工具和组件生成系统,通过动态上下文管理提升开发效率和代码质量。
MCP 安全“体检” | 基于 AI 驱动的 MCP 安全扫描系统
Model Context Protocol(MCP)作为 AI 应用生态系统中的关键协议,为大语言模型与外部工具、数据源的集成提供了标准化接口。随着 MCP 在企业级应用中的快速普及,其安全风险也日益凸显。构建一套智能化的 MCP 安全扫描系统,不仅是技术发展的必然需求,更是保障 AI 生态安全的重要基础设施。
Claude 新发布的 Agent Skills 到底是啥?居然比 MCP 还厉害?
库、工具
Vue Bits 是一大堆动画 VueJS UI 组件,旨在为您的 Web 创作增添趣味
90+ 总组件(文本动画、动画、组件、背景),每周都在增长
所有组件的依赖性都极少,并且可以通过 props 进行高度定制
旨在与任何现代 Vue/Nuxt 项目无缝集成
全平台前端UI框架
TDesign 是TDesign 是腾讯开源的企业级设计系统(Enterprise Design System),包含设计规范、组件实现、设计资源、开发工具的完整解决方案。
TDesign 的优势: ? 更新勤快 - 周更新节奏,5000+ 代码审查 ? 全平台支持 - Vue/React/小程序/移动端全覆盖 ? 设计完善 - 不只是代码,还有完整的设计规范 ? 企业级 - 腾讯内部验证,生产可用 ? 易用性强 - 开箱即用,文档完善 ? 开源友好 - 活跃的社区,欢迎贡献
在线体验 • 桌面端:tdesign.tencent.com/ • 移动端:tdesign.tencent.com/mobile-vue/… • 小程序:tdesign.tencent.com/miniprogram…
markitdown
微软出的工具,把包括 office 文档在内的文件转换为 Markdown