国内agents平台概览

1,064 阅读6分钟

国内agents平台概览

agents 简介

AI Agent是一种基于大模型的人工智能代理,能够感知环境、进行决策和执行动作。它的核心功能包括感知、规划和行动,旨在通过大模型技术让人们能够以自然语言交互方式高效地执行和处理复杂的工作任务,极大地释放人员的精力。AI Agent的技术原理主要基于机器学习和优化算法,通过机器学习从数据中学习模式,并通过优化算法找到最优的决策。

AI Agent不同于传统的人工智能系统,它能够通过独立思考和调用工具逐步完成给定目标,而不是仅仅根据指令执行任务。这种能力使得AI Agent在处理特定任务时更加灵活和高效。此外,AI Agent也被认为是一种学习型智能体,具有从过去的经验中学习的能力,并根据学习能力采取行动或做出决定。

随着大语言模型(LLM)的快速发展,AI Agent在感知、具身和社会属性方面的发展也越来越受到关注。这些能力的提升使得AI Agent能够更好地理解现实世界,处理复杂问题。AI Agent的发展不仅改变了人类与AI的交互模式,还为企业提供了高效应用LLM的未来趋势。

agent模块

主要包含:规划模块,工具调用模块和记忆模块

https://lilianweng.github.io/posts/2023-06-23-agent/agent-overview.png

lilianweng.github.io/posts/2023-…

国内agents平台

glms

官网地址:chatglm.cn

主要流程

flowchart LR
    prompt --> chatglm4
    chatglm4 --> tools
    tools --> chatglm4
    tools <--> search
    tools <--> browser
    tools <--> cogview
    tools <--> code

功能&特点

与gpts类似,可以0代码构建agent。支持自有知识库。

可用工具

search: 支持搜索与网页浏览。

cogview: zhipu自己的图片生成模型。

code: 可以生成python代码并执行。这里的code很强,可以解决很多数学问题和数据处理问题。

dify

dify: dify.ai

Dify 是一个 LLM 应用开发平台,已经有超过 10 万个应用基于 Dify.AI 构建。它融合了 Backend as Service 和 LLMOps 的理念,涵盖了构建生成式 AI 原生应用所需的核心技术栈,包括一个内置 RAG 引擎。使用 Dify,你可以基于任何模型自部署类似 Assistants API 和 GPTs 的能力。

社区版完全开源。提供gpts, 知识库,工具插件

对比

功能Dify.AIAssistants APILangChain
编程方式面向 API面向 API面向 Python 代码
生态策略开源封闭且商用开源
RAG 引擎支持支持不支持
Prompt IDE包含包含没有
支持的 LLMs丰富仅 GPT丰富
本地部署支持不支持不适用

特点

1. LLM支持:与 OpenAI 的 GPT 系列模型集成,或者与开源的 Llama2 系列模型集成。事实上,Dify支持主流的商业模型和开源模型(本地部署或基于 MaaS)。

2. Prompt IDE:和团队一起在 Dify 协作,通过可视化的 Prompt 和应用编排工具开发 AI 应用。 支持无缝切换多种大型语言模型。

3. RAG引擎:包括各种基于全文索引或向量数据库嵌入的 RAG 能力,允许直接上传 PDF、TXT 等各种文本格式。

4. AI Agent:基于 Function Calling 和 ReAct 的 Agent 推理框架,允许用户自定义工具,所见即所得。Dify 提供了十多种内置工具调用能力,如谷歌搜索、DELL·E、Stable Diffusion、WolframAlpha 等。

5. 持续运营:监控和分析应用日志和性能,使用生产数据持续改进 Prompt、数据集或模型。

gpts功能

gpts提供2种应用类型:智能助手(多轮聊天场景)和文本生成应用(单轮文本生成)

智能助手:智能助手支持多轮agent,最大迭代次数为5轮,使用的是ReAct方式。下面是默认的prompt template

Respond to the human as helpfully and accurately as possible.

{{instruction}}

You have access to the following tools:

{{tools}}

Use a json blob to specify a tool by providing an {{TOOL_NAME_KEY}} key (tool name) and an {{ACTION_INPUT_KEY}} key (tool input). Valid "{{TOOL_NAME_KEY}}" values: "Final Answer" or {{tool_names}}

Provide only ONE action per $JSON_BLOB, as shown:

{ "{{TOOL_NAME_KEY}}": $TOOL_NAME, "{{ACTION_INPUT_KEY}}": $ACTION_INPUT }

Follow this format:

Question: input question to answer Thought: consider previous and subsequent steps Action:

$JSON_BLOB

Observation: action result ... (repeat Thought/Action/Observation N times) Thought: I know what to respond Action:

{ "{{TOOL_NAME_KEY}}": "Final Answer", "{{ACTION_INPUT_KEY}}": "Final response to human" }

Begin! Reminder to ALWAYS respond with a valid json blob of a single action. Use tools if necessary. Respond directly if appropriate. Format is Action:$JSON_BLOBthen Observation:.

文本生成应用: 单轮的文本处理,目前不支持工具。但可以加知识库。

功能

部署

WebApp方式: 支持公开URL访问。支持定制化和html/js潜入

API方式: 支持API访问,支持密钥

知识库:

来源: 本地文件,Notion内容,来自Web站点(待实现)

本地数据库支持:向量检索,全文检索,混合检索。其中全文检索需求有Rerank模型授权。

工具:

谷歌搜索(需授权)

维基百科

DALL-E 绘画(需授权): 包含DALL-E 3, DALL-E 2

网页抓取

WolframAlpha(需授权)

图表生成 : 包含 线性图表,柱状图,饼图

时间 : 获取当前时间

雅虎财经 : 包含新闻,分析,股票信息

Stable Diffusion WebUI(需授权,本地部署)

Vectorizer.AI(需授权)

YouTube(需授权)

coze

coze(扣子): 头条出品, www.coze.cn/, www.coze.com/

Coze(扣子)是一个AI Bot开发平台,旨在为开发者提供一个强大且易于使用的平台,以便快速构建和部署智能聊天机器人。

插件系统:平台提供了丰富的内置插件,涵盖文本分析、图像识别等多种功能,开发者可以根据需求选择和组合这些插件。 免费OpenAI API(国际版):Coze提供免费的OpenAI API,使得开发者能够利用先进的AI技术而无需自行开发。

coze的设计

flowchart LR
Agent --> Skills
    Skills --> Plugins
        Plugins --> Search(Search)
            Search --> Bing
            Search --> Google
        Plugins --> Browser
        Plugins --> Time
        Plugins --> Weather
        Plugins --> News(News)
            News --> Shares
            News --> Finance
        Plugins --> Chart
        Plugins --> Image
        Plugins --> Calculate(Calculate)
            Calculate --> Code
            Calculate --> WolfamAlpha
    Skills --> Workflows
        Workflows --> WebSearch
        Workflows --> Video
        Workflows --> Shopping
        Workflows --> Science
Agent --> Memory
    Memory --> Knowledge
    Memory --> Variable
    Memory --> Database
Agent --> Advanced
    Advanced --> Voice
            

体验特点

  • • coze的workflow可以很直白的构建流程,支持并发和条件选择。对于对流程控制度要求高的用户来说很实用。

  • • coze官方支持了非常丰富的插件。这给自己设计的agent提供了更强大的功能和更多的想象空间。

  • • 支持发布这豆包、飞书等头条系app中。

  • 补充一下我发布的智能体,为了参加coze初体验的活动

其他

百度千帆&文心一言

千帆官网:console.bce.baidu.com/qianfan/ove…

文心一言:chat.baidu.com/app/create

infomonkeys(猴子无限): ai.infmonkeys.com/

变现

目前对于agents开发者而言,直接通过agents变现还是不多的。毕竟大家都在获取流量的初始阶段。有了流量自然有很多变现的手段。

下面是了解到的一个专门针对gpts的广告平台: adintelli.ai/zh

总结

这篇文章只是简略的介绍了笔者最近了解的几家agents平台。做了一番体验与比较后,对agents平台与功能做一个简单的介绍。如果读者感兴趣可以访问上面的官网, 这些都是对国内支持比较好的几家平台。有什么问题和想法,也欢迎评论与留言。

参考

lilianweng.github.io/posts/2023-…

本文使用 文章同步助手 同步