引言
近期,字节跳动在AI Agent领域频频发力,多个团队同时推进相关项目研发。
今天我们重点介绍其中最引人注目的一款——TARS。
项目的开源地址:
这是一个在功能和视觉体验上极为接近manus的开源多模态AI Agent。
TARS:全能型多模态AI Agent
TARS是字节团队的开源力作,作为一款多模态AI Agent,它具备自主浏览网页、集成命令行和文件系统的能力,能够灵活利用浏览器执行各类操作。
**
**
核心特性
根据项目README介绍,TARS框架具有以下几个方面的突出能力:
1. 智能任务处理
- 通过精心设计的Agent框架,能够规划和执行复杂任务
- 提供深度研究(Deep Research)和电脑操作(Operator)等核心功能
- 能够理解复杂指令并将其分解为可执行的子任务
2. 丰富工具集成
- 内置搜索、文件编辑、命令行等多种工具
- 支持MCP(模型上下文协议),高效处理复杂工作流程
- 工具间无缝协作,实现连贯的任务执行
3. 完善的桌面客户端
- 提供浏览器展示功能,可视化Agent的网页浏览过程
- 支持多模态元素处理,理解图像和文本信息
- 会话管理、模型配置、对话流程和状态跟踪等功能一应俱全
实际体验案例
当我要求规划一次从北京到青岛的五一假期旅行时,TARS表现非常专业:它首先确认了假期具体日期,然后推荐了高铁作为最佳交通方式。
接着分析了青岛各区域的特点,推荐了栈桥、八大关、崂山等热门景点。
最后生成了一份包含住宿建议、美食推荐和行程时间表的完整计划。
来看一个官方的演示:例如输入:
Get the current weather in SF using the web browser
使用Web浏览器获取SF的当前天气
**
输出的markdown格式清晰易读,可以直接作为旅行指南使用。是不是感觉和manus的体验还挺像的?小白真的可以部署一下练练手。
使用配置指南
想要体验TARS,只需几个简单步骤:
- 从GitHub下载桌面客户端:github.com/bytedance/U…
2.下载并安装客户端后,点击左下角的设置图标 输入你的API密钥(支持多种大语言模型)
3.根据需要调整参数设置
4.完成后即可开始对话
值得一提的是,TARS支持你临时变卦!
如果你想调整Agent的执行计划,只需在特殊输入框中输入新的想法,TARS就会实时调整策略。任务执行完成后,还可以通过分享功能将结果分享给他人。
实际反馈
TARS在视觉界面和交互体验上非常接近manus,是目前开源社区中比较相似的替代方案。
值得注意的是,TARS目前仅发布了macOS系统的客户端版本,尚未推出Windows版。这对于使用Windows系统的潜在用户来说是一个临时障碍,希望开发团队能在后续更新中加入跨平台支持。
值得一提的是,TARS只是字节跳动在AI智能体领域的众多布局之一。目前已知的还有:
-
langmanus智能助手
-
Dev Agent开发助手 核心优势:深度整合字节内部知识库和专用工具集,还在内测中。
TARS作为字节跳动在AI智能体方向的重要作品,充分展示了国内技术团队在这一前沿领域的创新能力和技术水平。
我们将持续关注TARS及其他AI智能体的发展动态,也欢迎各位读者在评论区分享使用心得和建议~
往期文章:
p.s.
部分图片来自网络,仅供学习分享,版权归原作者所有,如有侵权,可联系我们删除。