通义千问官方Agent框架开源,这才是我要的“赛博打工人”!

7 阅读4分钟

朋友们,小编最近感觉头发日渐稀疏,主要原因还是因为大模型太“笨”了,让它写个代码还得小编我把手把手教,让它读个长文档它直接给我“失忆”,这届AI真的难带!🤯

不过,小编最近在 GitHub 热榜上发现了一个宝藏项目,简直是给大模型装上了“大脑”和“手脚”,这就是阿里通义千问团队开源的 Qwen-Agent

QwenLM/Qwen-Agent

这可不是什么第三方野路子框架,这是官方亲儿子,Star 数已经飙到了 14670+,而且是用咱们最亲切的 Python 写的,主打一个“听劝”和“好用”。

🤖 它是啥?能干啥?

简单来说,Qwen-Agent 就是一个用来开发 LLM(大语言模型)应用的框架,它基于 Qwen(通义千问)系列模型,把原本只会“聊天”的大模型,变成了能干活的“智能体”。

这就好比你雇了个助手,以前他只会动嘴皮子,现在他能帮你写代码、跑代码、读 PDF、上网搜资料,甚至还能帮你操作浏览器!🤝

根据 README 的介绍,它主要具备这几个核心能力:

  • 指令遵循:你说啥它干啥,不再跟你瞎扯淡。
  • 工具使用:会算数、会查资料,甚至能画图。
  • 规划能力:遇到复杂任务,自己会拆解步骤,一步步搞定。
  • 记忆能力:能记住之前的对话,甚至能处理超长文档。

最骚的是,它现在已经是 Qwen Chat 的后端引擎了,也就是说,你在用通义千问聊天时,背后可能就是这个框架在跑!🚀

💻 小白也能玩得转?

很多开源项目看着牛逼,但配置环境就能劝退 90% 的人。Qwen-Agent 这点做得挺人性化,安装非常简单,一条命令搞定:

pip install -U "qwen-agent[gui,rag,code_interpreter,mcp]"

这行命令不仅装了核心库,还顺带把 GUI 界面、RAG(检索增强生成)、代码解释器、MCP(模型上下文协议)都给你安排得明明白白。

而且,它支持阿里云 DashScope 的 API,也支持你本地部署的 vLLMOllama 服务。不管你是想白嫖云端算力,还是想本地显卡硬刚,它都给你路走。🛣️

🔥 几个让小编直呼“六六六”的功能

1. 真正的 Code Interpreter(代码解释器)

以前让大模型写 Python 代码,它只能给你一段文本,你还得自己复制粘贴去运行。Qwen-Agent 内置了一个基于 Docker 的代码解释器。

这意味着啥?意味着它写完代码,自己会在沙箱里跑一遍,然后把结果给你。画图、数据分析,直接出结果,再也不用担心代码跑不通了!🎨

2. 100万tokens 长文档问答

小编看到这个功能的时候,下巴都要掉地上了。它提供了一个 RAG 方案,能处理 100万 tokens 的上下文!

这是什么概念?你可以把整个公司的文档库扔给它,然后问它:“去年的财报里第三季度哪个部门花钱最多?”它真的能回答你,而且在“大海捞针”测试中表现完美。这哪里是 AI,这简直是社畜神器啊!📚

3. MCP 支持

最近 AI 圈很火的 MCP(Model Context Protocol),它也支持了!简单说,就是能让 AI 连接更多的外部数据源和工具,想怎么玩就怎么玩。🔌

🌟 谁适合用?

  • Python 开发者:想给自己的应用加个 AI 大脑,用它准没错。
  • AI 应用开发者:需要构建复杂的 Agent 工作流,这个框架提供了原子组件和高级 Agent 封装。
  • 数据分析师:想用自然语言分析数据,它的代码解释器能帮你省不少事。
  • 极客玩家:想体验最新的 Qwen3.5、QwQ-32B 的 Tool-call 能力,这里有现成的 Demo。

📝 怎么上手?

小编看了一眼代码示例,非常清晰。你可以定义一个 Assistant,给它塞几个工具(比如 code_interpreter),再给它一个 PDF 文件,它就能帮你干活了。

最爽的是,它自带 Gradio GUI,几行代码就能启动一个 Web 界面,直接在浏览器里跟你的 Agent 聊天,简直是演示神器!🖥️

from qwen_agent.gui import WebUI
WebUI(bot).run()

就这么简单,一个属于你自己的“贾维斯”就诞生了。

热榜截图

目前,这个项目已经登上了 GitHub 热榜,热度非常高!如果你也想拥有一个听话、能干、不抱怨的“赛博打工人”,赶紧去 GitHub 搞起来吧!

项目地址https://github.com/QwenLM/Qwen-Agent