Coze Agent搭建入门教程之我用AI搞装修
一、什么是 AI Agent?【AI大模型教程】
AI Agent也就是咱们常说的智能体,它和ChatGPT、豆包这类大模型工具的区别在于它有提前设定好的特定的人设,处理同类任务时不用重新写提示词调教,并且Agent可以主动调用别的Agent或工具组合在一起去自动处理一些更复杂的任务。本篇教程主要带大家熟悉开发一个定制化Agent的基本流程。
二、开发一个Agent需要具备哪些能力
1、准确描述自己需求,撰写提示词的能力
提示词是一切的根本
2、基本的数据结构知识
在Agent 自定义的工作流开发中,可能会涉及到部分节点需要进行流程控制或者通过代码处理输入输出,所以开发者需要知道什么是JSON格式,循环和IF条件要怎么写,基本的数据类型和数据结构有哪些。
在学习后实践,在实践中学习,具备以上两点知识储备就可以直接上手实践了!
三、Hello Agent
标题里的Coze(www.coze.cn/home)是字节跳动旗… Agent开发平台 也是现在比较普及的一个开发平台,通过这个平台我们可以直接使用各种各样成型的Agent产品,也可以快速的开发一个专属于自己的Agent去帮自己干些牛马工作,有多快速?
快到你只用像这样告诉它你要创建的Agent的功能它就会帮你创建好!好了本教程到处结束。
开个玩笑,咱们继续,上述方式虽然可以快速的创建一个Agent,但是这个Agent只能做一些基础的问答任务,如果你的需求比较复杂,它肯定是满足不了的,这个时候就需要你去对Agent的提示词和参数做一些调整,或者自己去搭建这个Agent的工作流。Agent创建完后可以在工作台中进行调整,调整页面如下:
最左边是这个Agent的提示词,是系统根据之前的描述自动生成的,可以在这里对提示词进行补充和调整;中间是Agent能力的配置项(重要重要重要);右边是当前配置下Agent的一个调试页面,可以在这里测试调整后的效果。
对于开发者来说如果要进一步定制自己的Agent比较关键的内容是中间这个配置页。配置项很多,大部分大家点一点就能明白了,这里只说比较重要的几个。在【模型】中可以根据自己Agent需要的能力选择合适的模型,比如说我需要这个Agent可以根据我给出的不同的效果图去对比分析哪个更好,那我需要它具有图片理解的能力,那就需要选择具有这个能力的模型:
在【插件】中系统会根据你对Agent的描述自动为你添加默认的功能插件,也可以手动去插件商店里搜索自己想要的功能插件;
【工作流】这个是最关键的也是今天的重头戏,如果你想要完全定制化Agent处理问题的全流程,那么可以在这里去按照自己想要的流程开发工作流然后进行配置。【文件盒子】开启这个后Agent将会自动将用户上传的文件保存到专属的空间内,以便于重复访问和数据分析。【知识库】一般是使用的通用知识库(虽然范围很广但对特定领域的精度和准确度不足),也可以自己上传资料建立自己的知识库(比如上传很多自己的文档资料),然后模型回答问题时会优先以私有知识库中的数据为回答基础。
四、开发和调试工作流
比如说现在我想让Agent可以根据我给出的不同装修效果图来进行分析并给出建议。我们来创建一条专门的工作流。
首先我们加一个选择器对输入内容进行识别,只有在输入效果图图片的时候才需要往下执行,否则只需要进行正常的问答就好了。
在满足输入效果图的条件时,新增一个大模型节点,在节点中配置提示词让大模型对输入图片进行分析:
图中的输入内容需要配置为用户最开始的输入变量,在提示词中可以通过{{}}来引用设置的输入变量,在系统提示词中告诉需要模型做的事情,然后可以通过提示词优化来进一步优化提示词的格式:
这里我们先自动优化一下,如果优化后的调试结果最后还是不符合预期,我们再根据调试结果进行优化;
同样,我们对正常回答问题时的大模型节点也进行配置,这个节点的配置我们就直接采用最开始创建Agent时的提示词就好了:
一条简单的工作流就搭建完了,然后我们试运行一下:
如果出现报错,那么根据提示信息进行调整,直至运行正确,这里从错误信息来看IF少了一个分支处理,以及因为有多个流程分支,但是只能有一个结束节点所以还需要对几个不同分支的结果进行合并处理。修改后我们上传图片重新试运行,运行结束后可以在右上角查看每个节点的输入输出日志:
然后发现上传的图片被系统自动处理成了一个图片临时文件的url,模型无法直接去读取url,所以你需要告诉模型如何去处理这个url。
有两种方式,一种是手动或者告诉模型自动调用插件将图片url转成图片的base64信息后再进行分析,但因为模型输入的token长度有限制所以这种方式只适用于图片较少且大小较小的情况;第二种方式,切换模型为视觉理解模型节点,实测发现有的模型虽然有图片理解的标签但实际上只是文本模型,并无法读取图片url进行识别,选择名称中就带有视觉理解的模型,然后设置视觉理解输入便可以直接读取url了。
我们来看一下最后的运行结果:
五、Agent发布
以上一个简单的工作流就搭建完成了,在试运行通过后,点击右上角的发布工作流就可以将工作流配置到自己的Agent中,然后在Agent配置页点击右上角发布就可以发布到Coze的官方平台,甚至微信公众号中!