AI学习-Agent Infra

2025-09-23 159 阅读3分钟

今天看了一些关于Agent Infra的文章，感觉比较全面的的是Envrionment,Context,Tools和Agent Security的划分

一些收获

以之前用mastra开发agent为例，而且包括使用过的很多agent,我们希望它具有网络搜索的能力，能够记住自己，自己聊过的一些东西，希望它有一些专业的技能，一些其他的能力，恰恰对应了文章里总结的那几个方面。
根据cloudflare的统计，互联网的流量有40%都是机器人，就是说agent很需要一款headless browser，能够直接让ai去理解网页，而不是作为人的角度，去与网页交互，一些更深层次的内容需要走一些流程才能获取。有个专有的名词叫AI-native.

AI-native

是一个描述系统、产品或流程的术语，指其从设计到实现都以人工智能为核心，深度整合 AI 技术，而非将 AI 作为附加功能或后期优化.

1. 定义与核心特点

AI-native 系统或产品在架构、功能和用户体验上都围绕 AI 构建，具有以下特点：

原生设计：从一开始就以 AI 驱动为核心，而非在传统系统上“嫁接” AI 功能。例如，AI-native 应用可能直接用大模型（LLM 或 VLM）处理用户输入，而不是依赖规则引擎再辅助 AI。
数据驱动：深度依赖数据流和实时学习，AI 模型通过持续的数据输入优化性能。
自动化与智能化：核心流程（如决策、推荐、内容生成）由 AI 自动完成，减少人工干预。
多模态能力：常整合文本、图像、语音等多模态输入，如视觉语言模型（VLM）能同时处理图片和文字。
用户体验优化：AI-native 产品通常提供高度个性化和上下文感知的交互，如智能助手能根据用户习惯预测需求。

2. 与传统 AI 应用的区别

传统 AI 应用通常是将机器学习模块嵌入现有系统，比如在电商平台加一个推荐算法。而 AI-native 系统的整个架构都围绕 AI 构建：

传统 AI 应用：规则驱动 + AI 辅助（如传统聊天机器人基于脚本，AI 只优化部分回复）。
AI-native 应用：AI 驱动 + 规则辅助（如基于 LLM 的对话系统，规则仅用于边缘情况）。
开发方式：AI-native 更依赖端到端的神经网络，减少对传统编程逻辑的依赖。

3. AI-native 的价值

效率提升：自动化复杂任务，减少人工开发和维护成本。
可扩展性：AI-native 系统能快速适应新场景，通过模型微调或数据扩充实现功能扩展。
用户体验：提供更自然、智能的交互，如语音助手能理解复杂指令。
竞争优势：在 2025 年的 AI 热潮中，AI-native 产品更能满足市场对智能化、个性化的需求。

4. 挑战与考虑

算力需求：AI-native 系统通常需要强大计算资源，成本较高。
数据依赖：需要高质量、多样化的数据来训练和优化模型。
伦理问题：如隐私、偏见或透明性，AI-native 系统需更严格的治理。
技术门槛：开发 AI-native 产品需要深厚的 AI 专业知识，可能限制中小企业的进入

参考与了解到的产品

Browserbase：利用llm将自然语言生成playwright代码操控headless browser
memobase: 基于用户档案的个性化长期记忆，开源的
agent infra