前言
如何让 AI 既能搜索最新信息,又能深度阅读网页内容?这个问题在AI 应用开发中-直是个挑战。
传统的方案要么只能搜索不能阅读,要么只能阅读不能搜索。而今天分享的这个Agent 应用,通过智能工具调用机制,完美解决了这个问题。
核心思路
这个应用采用了 Agent 架构,让 AI 能够
1.智能判断:根据用户问题决定是否需要搜索
2.精准搜索:生成合适的搜索关键词
3内容阅读自动阅读搜索结果中的相关内容
综合分析:基于多源信息提供准确回答
技术架构
Agent 策略
策略类型:Function Calling
最大迭代次数:5 次
模型选择:DeepSeek-V3
核心工具
1.网页搜索工具(dataeyes search)
功能:搜索互联网并返回相关网页摘要
参数:
-q: 搜索关键词
-num: 返回结果数量(默认10)
2.网页阅读工具(dataeyes reader)
功能:读取网页内容并返回大模型友好的Markdown格式
参数:
-ur: 要读取的网页链接
timeout: 页面加载超时时间(1-60秒)
TODO
前置工作1-添加Agent:
1.添加Agent节点
2.在Agent策略杭选择dify 官方的agent
前置工作2-添加数眼智能MCP
1.在工具-MCP页面点击添加「添加MCP服务」
2.配置服务端点URL、服务器标识服服务端点URL:mcp.shuyanai.com/SK-xxx
服务器标识服:dataeyes-mcp-server
工作流程
第一步:问题分析
Agent 会分析用户问题的类型
实时信息类:需要最新信息(如天气、新闻)
知识查询类:需要查找特定信息(如教程、评测)
需要验证信息事实核实类:
一般对话类:不需要联网的日常对话
第二步:智能决策
如果是实时信息类、知识查询类或事实核实类,则进行搜索如果是一般对话类,直接回答
第三步:搜索执行
当需要搜索时:
1.生成精准的搜索关键词
调用网页搜索工具获取结果
从搜索结果中选择最相关的前3个链接3.
4.调用网页阅读工具读取这3个链接的内容
第四步:内容整合
基于读取的内容
提取关键信息1.
2.验证信息准确性
整合多个来源的信息3.
生成结构化的回答4.
关键特性
1.智能工具调用
Agent 能够根据上下文智能选择使用哪个工具,无需人工干预。
2.限制阅读数量
明确限制只阅读前 3个最相关的链接,避免信息过载
3.结构化输出
提供标准化的回答格式,包含核心要点、详细信息、信息来源等。
4.错误处理
能够处理搜索结果不足、内容读取失败等异常情况。
实际应用效果
场景 1:实时信息查询
用户:哪吒2 票房怎么样?Agent 处理:
1.判断为实时信息类问题
2.搜索“哪吒 2 票房 最新”
3.读取前 3个相关链接
4.整合信息并回答
输出
基于最新搜索结果,为您提供以下信息:
核心要点:
《哪吒2》上映首日票房突破2.5亿,创下暑期档动画电影新纪录。
详细信息:
根据猫眼专业版数据,《哪吒2》上映首日排片占比达到35%,上座率超过60%。观众评价普遍较高特效制作和剧情创新获得好评。相比前作,续集在故事深度和视觉呈现上都有明显提升。
信息来源:
猫眼专业版票房数据-[链接1]
-电影行业分析报告-[链接2]
观众评价汇总-[链接31
补充说明:
暑期档竞争激烈,后续票房表现还需观察口碑发酵情况。
本文基于 Dify 平台实际配置经验编写,所有代码和配置均经过测试验证。如有疑问,欢迎交流讨论
(可以私信我获取pdf图文详细版~~)