干货分享|AI智能体工作流搭建教学:实现自动搜索+阅读网页内容

90 阅读4分钟

前言

如何让 AI 既能搜索最新信息,又能深度阅读网页内容?这个问题在AI 应用开发中-直是个挑战。

传统的方案要么只能搜索不能阅读,要么只能阅读不能搜索。而今天分享的这个Agent 应用,通过智能工具调用机制,完美解决了这个问题。

核心思路

这个应用采用了 Agent 架构,让 AI 能够

1.智能判断:根据用户问题决定是否需要搜索

2.精准搜索:生成合适的搜索关键词

3内容阅读自动阅读搜索结果中的相关内容

综合分析:基于多源信息提供准确回答

技术架构

Agent 策略

策略类型:Function Calling

最大迭代次数:5 次

模型选择:DeepSeek-V3

核心工具

1.网页搜索工具(dataeyes search)

功能:搜索互联网并返回相关网页摘要

参数:

-q: 搜索关键词

-num: 返回结果数量(默认10)

2.网页阅读工具(dataeyes reader)

功能:读取网页内容并返回大模型友好的Markdown格式

参数:

-ur: 要读取的网页链接

timeout: 页面加载超时时间(1-60秒)

TODO

前置工作1-添加Agent:

1.添加Agent节点

2.在Agent策略杭选择dify 官方的agent

前置工作2-添加数眼智能MCP

1.在工具-MCP页面点击添加「添加MCP服务」

2.配置服务端点URL、服务器标识服服务端点URL:mcp.shuyanai.com/SK-xxx

服务器标识服:dataeyes-mcp-server

工作流程

第一步:问题分析

Agent 会分析用户问题的类型

实时信息类:需要最新信息(如天气、新闻)

知识查询类:需要查找特定信息(如教程、评测)

需要验证信息事实核实类:

一般对话类:不需要联网的日常对话

第二步:智能决策

如果是实时信息类、知识查询类或事实核实类,则进行搜索如果是一般对话类,直接回答

第三步:搜索执行

当需要搜索时:

1.生成精准的搜索关键词

调用网页搜索工具获取结果

从搜索结果中选择最相关的前3个链接3.

4.调用网页阅读工具读取这3个链接的内容

第四步:内容整合

基于读取的内容

提取关键信息1.

2.验证信息准确性

整合多个来源的信息3.

生成结构化的回答4.

关键特性

1.智能工具调用

Agent 能够根据上下文智能选择使用哪个工具,无需人工干预。

2.限制阅读数量

明确限制只阅读前 3个最相关的链接,避免信息过载

3.结构化输出

提供标准化的回答格式,包含核心要点、详细信息、信息来源等。

4.错误处理

能够处理搜索结果不足、内容读取失败等异常情况。

实际应用效果

场景 1:实时信息查询

用户:哪吒2 票房怎么样?Agent 处理:

1.判断为实时信息类问题

2.搜索“哪吒 2 票房 最新”

3.读取前 3个相关链接

4.整合信息并回答

输出

基于最新搜索结果,为您提供以下信息:

核心要点:

《哪吒2》上映首日票房突破2.5亿,创下暑期档动画电影新纪录。

详细信息:

根据猫眼专业版数据,《哪吒2》上映首日排片占比达到35%,上座率超过60%。观众评价普遍较高特效制作和剧情创新获得好评。相比前作,续集在故事深度和视觉呈现上都有明显提升。

信息来源:

猫眼专业版票房数据-[链接1]

-电影行业分析报告-[链接2]

观众评价汇总-[链接31

补充说明:

暑期档竞争激烈,后续票房表现还需观察口碑发酵情况。


本文基于 Dify 平台实际配置经验编写,所有代码和配置均经过测试验证。如有疑问,欢迎交流讨论

(可以私信我获取pdf图文详细版~~)