AI Agent试用记录

103 阅读4分钟

最近AI智能体很火,但是完全搞不懂有什么用,领导需要整这个,于是在搜索了几个比较火的和AI智能体沾边的,做下尝试

一、Manus(Manus

一个国外的项目,参考文章提出的经典案例给它提要求,第一个要求是生成思维导图,非常的丑;第二个要求是制定一份旅行计划,纯粹瞎编,第三个是要求它去查豆瓣电影TOP250中上映于2017年的所有电影,然后就可以在右边的框里面看到AI访问了豆瓣然后各种点击,最后的结果是正确的。

以上的这些需求,普通的AI对话也能实现,看不出AI智能体的高级之处,AI智能体理论上来说,相当于一个可以自主决策的员工,你只需要给他任务目标,剩下的它自己会思考。从扣子空间的一些案例中获得了灵感,发现AI智能体应该用来直接生成结果(比如一个PPT,一个公众号文章),而不是生成方案或者思路。

第四个要求,让它生成一个宣传环保的网站,效果挺丑的,图片素材都是AI图,油得不行,点击导航栏也没有动画效果,优点是做了一个碳足迹计算的小功能,挺实用,但是这个扣子也做了,而且一开始它没有部署到环境中,直接打开html网页,连css文件都没加载出来。综合评价:很一般

二、扣子(扣子空间 | AI办公助手 - 复杂任务高效处理

同样的测试,第一个要求是获取豆瓣TOP250中2017年上映的电影,它先去直接以豆瓣TOP250和2017年这个关键字进行搜索,马上就搜到了自媒体出的总结性文章《五年以来,只有这19部电影杀进了豆瓣电影Top250》看到这个结果的时候我就觉得稳了,它速度肯定会比Manus要快。通过TOP250和2017年上映进行交叉搜索,是一种更聪明的策略,但是很容易受到不精准的信源影响。

第二个要求是生成网站,页面内容充实度更高,主动去搜了写很细节的内容,审美稍好一点点,但是也不咋地

第三个要求,让它针对“八九十年代港台文化”提出公众号选题,并挑选一个选题生成一篇公众号文章,选题那步完成的不错,但是生成公众号文章不行,生成了md文件之后让我选择导出的文件格式,之后变成了网页,网页的样式很不适合当公众号文章,生成的文本内容不是很令人感兴趣。

综合来说还行,唯一的美中不足是扣子这个项目本身的UI不够好看,Manus会先生成计划,然后有个勾选时间轴的UI设计,更美观一点。之前还看到一个AI项目非常有意思,是拆分目标的,将一个大目标拆分成几个可以立马执行的步骤,然后用户完成了就勾选,用于目标管理。感觉AI现在可以当心理咨询师,却当不了牛马。

三、Flowise(Flowise - Build AI Agents, Visually

github上搜到的开源项目,发现了就用一用,UI很好看,但是非常非常难用,不看文档压根用不明白。以Agentflows为例,需要先点击右上角的保存,然后在对话框里面输入hello world运行这个对话流,结果就直接输出在对话框里,关键是我也不知道对话的这个模型是不是我提供了API的模型,因为它自己也有个模型。

工作流的样式非常花哨,但是有前两个项目珠玉在前,感觉这种还需要手动去决定流程的智能体就落了下乘。给一个目标,给必要的需求,剩下的调用什么工具、执行什么步骤都用AI决定看上去才是大势所趋。