创造你的朋友圈社牛利器:智能体的诞生之旅!

719 阅读6分钟

引言

今天我们来使用coze(地址:https://www.coze.cn/home)开发一款名为“朋友圈社牛利器”的智能体。这款智能体通过结合先进的自然语言处理(NLP)技术和计算机视觉技术,为用户提供个性化的文案生成和图片编辑服务,接下来我将详细介绍这款智能体的设计思路、架构以及各个部分的具体实现。

话不多说,先看结果:

image.png

了解一下coze与Agent

14.jpg

Coze: 低代码Agent开发平台

Coze作为基于大型语言模型(如豆包等)构建的低代码开发平台,旨在简化AI应用的创建过程。它提供了一个直观的用户界面,让开发者能够通过拖拽组件的方式快速搭建工作流程,而无需编写大量的代码。Coze的核心优势在于其强大的集成能力、易用性和灵活性,这使得即使是技术背景较弱的用户也能够参与到AI应用的开发中来。

什么是Agent ?

在人工智能和计算机科学领域,Agent智能体 是指能够自主行动以达成特定目标的软件或硬件实体。这些智能体可以感知其环境,并通过执行一系列动作来影响该环境。智能体的概念广泛应用于多个领域,包括但不限于机器人技术、自动化系统、游戏设计、客户服务以及复杂的决策支持系统。

Agent智能“体”的演进

AIGC -> Agent -> AGI:随着时间的发展,AI开始承担起更加复杂的角色,不仅仅是生成内容,而是能够执行特定任务的智能代理。最终目标是实现AGI,即能够像人类一样思考并解决多种问题的人工智能。

智能体的整体架构

今天我们要介绍的朋友圈社牛利器的智能体的整体架构可以分为以下几个主要部分:

  • 输入模块:用户通过该模块提交请求,例如发送一条消息或者上传一张照片。
  • 大模型处理单元:使用预训练的语言模型对文本进行深度解析,并根据上下文生成相应的回复或建议。
  • ImageToolPro工具箱:处理图像相关的任务,如识别人脸表情、提取关键特征等。
  • 输出模块:整理并展示最终结果给用户。

接下来,我将介绍每一个组成部分的功能及其实现原理。

引入模块

可以通过屏幕左侧的选择节点来选择你想要使用的模块来完成你想实现的功能。

image.png

输入模块

用户可以通过多种渠道接入系统,比如微信公众号、小程序或是独立APP。无论哪种方式,都需要先将用户的意图转化为标准化格式的数据流。为此,我们设计了一个灵活的API框架,允许开发者自定义参数配置,以满足不同应用场景的需求。例如,用户可能需要上传一张图片,并附带一些描述性文字作为输入。

image.png

大模型处理单元

在这一阶段,我们利用了预训练的大规模语言模型来处理文本信息。具体来说,系统会接收用户的输入,并通过一个强大的语言模型(这里我用的是豆包·Function call 模型)来理解用户的心情状态。

image.png

在这里,我们还可以通过设置系统提示词来规范智能体输出的内容,让大模型生成符合要求的文案。

image.png

注意,这里的{{input}}是一个占位符,代表用户输入的情感状态。当系统运行时,这个占位符会被实际的用户输入替代。其中input是设置的参数名,其中包含内容当然是由用户输入的。所以切记在连接后,要在大模型的输入选项中引用开始中的内容,这样才可以成功调用用户的输入内容。

image.png

至于:

  • 用户提示词:用户可以根据需要提供额外的信息,用于定制化生成文案
  • 输出:返回JSON格式的结果,其中包含生成的文案文本。

这里暂时不使用,感兴趣的小伙伴们可以自己动手,试着了解一下。

ImageToolPro工具箱

对于涉及图像识别和处理的需求,我们会调用专门针对图像操作的服务接口。此模块可以帮助我们完成诸如识别人脸表情、提取关键特征等工作。通过集成第三方提供的SDK或者是自己编写代码实现相关功能,都能够有效地扩展系统的适用范围。

image.png

稍微介绍一下ImageToolPro里的内容:

  • 输入:

    • image_url: 图片的URL地址,可以不填。
    • model_type: 使用的模型类型编号:image.png
    • prompt: 具体的提示内容,这里我引用了前面的大模型所输出的text内容。
  • 输出:

    • code: 返回的状态码。
    • data: 包含生成的图片URL地址、日志ID以及返回的消息。

输出模块

最后一步是将所有计算出来的结果整合起来,并以适当的方式展现出来。这里涉及到的问题比较多样,既有简单的字符串拼接也有复杂的动态渲染逻辑。通常情况下,我们会尽量保持界面简洁明快的同时又不失细节上的考量。

在这里,系统会引用大模型生成的text文案和ImageToolPro data/image_url展示给用户。

image.png

但由于data/image_url会返回图片的URL 地址,而不是标准的图像格式,所以我们可以引用回答模式,将图片设置为 !([image]{{picture}})后进行输出,而![[image]{{picture}}) 的意思是显示一张图片,其源地址就是 {{picture}} 所指向的 URL 地址。

到了这里,调试完成后你就可以使用发布你的智能体啦!

结语

image.png

以上就是这次分享的全部内容了,中间的两个输出是为了让顾客知道智能体在干些什么,从而优化客户的体验。通过合理规划各个模块之间的关系以及充分利用现有资源,我们就能够打造出一款既强大又好用的朋友圈社牛利器啦!希望这篇文章对你有所帮助哦!