使用扣子实现一个文章收集智能体(简易版)

906 阅读4分钟

场景介绍

本次分享主要通过使用扣子的插件、工作流等能力实现文章内容的自动获取。

  • 任务目标: 实现获取某个链接内的文章标题、正文,并写入到Excel中。

  • 任务要求:

  1. 建议尽量使用插件、工作流等功能。

  2. 至少获取文章标题、正文2个字段,可自行扩展字段。

  3. 目标网站(可尝试多个链接):www.tongwuai.com/html/web/zh…

为什么本文标题带了个“简易版”?

  1. 文章直接获取,没有增加更多的逻辑处理;
  2. 文章的存储其实直接使用飞书电子表格或者多维表格效果更佳,本文为了突出插件、工作流的使用,弱化了这块。

后续会通过另一篇文章进行分享。

后一篇:使用扣子实现一个文章收集智能体(升级版) - 掘金

分析问题

简单拆分一下问题:

  1. 用户给定链接,智能体需要能够访问链接;(非文字分析,访问外部,比较适合使用“插件”实现)
  2. 分析链接内容,提取出标题、正文;(文字分析,“大模型”比较擅长)
  3. 将标题、正文写入Excel。(非文字分析,使用“插件”实现)

根据以上分析的要求,我们可以去扣子的商城寻找合适的插件。

image.png

意外收获,这个插件可以直接完成我们第1、2步,那接下来只需要找到一个可以写Excel文件的插件即可。

image.png

扣子上读取Excel的插件很多,写Excel的不太多,还好有一个可以使用的,这个插件会直接生成写入内容的Excel在线地址,还挺好用的。

操作步骤

前置条件:注册并登录扣子平台。

1. 建立智能体

扣子的操作界面还是非常清晰的,不仅可以通过“标准创建”(表单录入的方式)方式创建智能体,还可以通过“AI创建”(自然语言创建)的方式创建,这里我选择了“标准创建”。

  • 在录入名称、功能介绍后,通过AI直接生成图标,还是比较好用的。

image.png

2. 配置智能体

image.png

主要包括两点:

  1. 选择模式

模式分为三类:

  • 单Agent(LLM模式):通过提示词定义智能体技能,智能体根据定义技能进行回复或者调用插件、工作流。
  • 单Agent(工作流模式):用户输入直接作为工作流输入,且仅有一个变量,针对简单且唯一的需求比较好用,不需要设计提示词匹配正确的资源。
  • 多Agents:需要通过多Agent协同或者组合处理复杂逻辑时选择,暂时尚未在实际需要中使用。

image.png

  1. 添加工作流

image.png

需要注意的是,工作流名称不支持中文。

3. 绘制工作流

image.png

其中“大模型”节点是为了将前一个插件获取的文字转换为后一个插件所需格式,如果会编程,这里其实可以通过“代码”节点性能更佳,也更准确。

大模型节点提示词如下:

## 任务
将输入中的文本通过拼接后返回。

## 要求
- 不要改变输入的文本内容。
- 仅返回拼接后的字符串,不要返回任何其它的内容。

## 步骤
1. 将{{input.title}}、{{input.content}}中所有的英文逗号替换为中文逗号,以免后续拼接歧义。
2. 剔除正文中所有的换行符`\n`2. 返回```中的文本,```{{input.title}},{{input.content}}```。

工作流整体都是拖拽方式,比较简单:

  • 左侧是各类节点,包括插件、大模型、文本处理等。
  • 右侧是编辑区。
  • 右上角试运行通过后,就可以发布,发布完成的工作流会提示加入到刚才创建的智能体。

编辑区域下方的工具栏中有个“优化布局”按钮,可自动排版工作流节点,非常有用。

image.png

效果展示

智能体地址:

www.coze.cn/store/agent…

文章网址:

www.tongwuai.com/html/web/zh…

效果如下:

image.png

image.png

扩展

后续计划在该智能体基础上进行升级:

  1. 加入个人偏好,让智能体可以帮忙筛选当前文章是否符合预期,或者直接给出打分。
  2. 对接飞书多维表格,可以把文章积累在一起。
  3. 支持多个链接地址。

以上特性实现后,会及时给大家再次分享。