AI学习-Agent Infra

118 阅读3分钟

今天看了一些关于Agent Infra的文章,感觉比较全面的的是Envrionment,Context,Tools和Agent Security的划分

一些收获

  1. 以之前用mastra开发agent为例,而且包括使用过的很多agent,我们希望它具有网络搜索的能力,能够记住自己,自己聊过的一些东西,希望它有一些专业的技能,一些其他的能力,恰恰对应了文章里总结的那几个方面。
  2. 根据cloudflare的统计,互联网的流量有40%都是机器人,就是说agent很需要一款headless browser,能够直接让ai去理解网页,而不是作为人的角度,去与网页交互,一些更深层次的内容需要走一些流程才能获取。有个专有的名词叫AI-native.

AI-native

是一个描述系统、产品或流程的术语,指其从设计到实现都以人工智能为核心,深度整合 AI 技术,而非将 AI 作为附加功能或后期优化.

1. 定义与核心特点

AI-native 系统或产品在架构、功能和用户体验上都围绕 AI 构建,具有以下特点:

  • 原生设计:从一开始就以 AI 驱动为核心,而非在传统系统上“嫁接” AI 功能。例如,AI-native 应用可能直接用大模型(LLM 或 VLM)处理用户输入,而不是依赖规则引擎再辅助 AI。
  • 数据驱动:深度依赖数据流和实时学习,AI 模型通过持续的数据输入优化性能。
  • 自动化与智能化:核心流程(如决策、推荐、内容生成)由 AI 自动完成,减少人工干预。
  • 多模态能力:常整合文本、图像、语音等多模态输入,如视觉语言模型(VLM)能同时处理图片和文字。
  • 用户体验优化:AI-native 产品通常提供高度个性化和上下文感知的交互,如智能助手能根据用户习惯预测需求。

2. 与传统 AI 应用的区别

传统 AI 应用通常是将机器学习模块嵌入现有系统,比如在电商平台加一个推荐算法。而 AI-native 系统的整个架构都围绕 AI 构建:

  • 传统 AI 应用:规则驱动 + AI 辅助(如传统聊天机器人基于脚本,AI 只优化部分回复)。
  • AI-native 应用:AI 驱动 + 规则辅助(如基于 LLM 的对话系统,规则仅用于边缘情况)。
  • 开发方式:AI-native 更依赖端到端的神经网络,减少对传统编程逻辑的依赖。

3. AI-native 的价值

  • 效率提升:自动化复杂任务,减少人工开发和维护成本。
  • 可扩展性:AI-native 系统能快速适应新场景,通过模型微调或数据扩充实现功能扩展。
  • 用户体验:提供更自然、智能的交互,如语音助手能理解复杂指令。
  • 竞争优势:在 2025 年的 AI 热潮中,AI-native 产品更能满足市场对智能化、个性化的需求。

4. 挑战与考虑

  • 算力需求:AI-native 系统通常需要强大计算资源,成本较高。
  • 数据依赖:需要高质量、多样化的数据来训练和优化模型。
  • 伦理问题:如隐私、偏见或透明性,AI-native 系统需更严格的治理。
  • 技术门槛:开发 AI-native 产品需要深厚的 AI 专业知识,可能限制中小企业的进入

参考与了解到的产品

  1. Browserbase:利用llm将自然语言生成playwright代码操控headless browser
  2. memobase: 基于用户档案的个性化长期记忆,开源的
  3. agent infra