DeepSeek-V3.2是性能跃迁的一代。其核心优势在于,以极致的成本效益,提供了顶级的推理能力。它在权威测试中超越了GPT-4o,但API价格仅为其百分之一,真正做到了 “好用不贵” 。同时支持长达128K的上下文以及更强大agent能力,在联网搜索场景下,可以分析和选择出最准确的数据源,作为回答引用。
在AI快速发展的今天,大语言模型虽然拥有海量知识,但面对实时信息、最新事件或特定网页内容时,往往显得力不从心。
(上图为DeepSeek V3.2联网搜索得出的信息并非实时更新资讯)
作为一款大模型,在解决一些比较实时的问题时,DeepSeek本身无法获取最新的数据和阅读网页,要发挥DeepSeek V3.2的最大能力,就必须给他解锁联网搜索和阅读网页的能力,让大模型自己查资料!
那么,如何系统性地为AI助手赋予联网搜索能力,获取最新、最准确的信息?
这正是我们解决方案的核心。本文将详细介绍如何基于Dify平台,并整合数眼智能提供的实时联网搜索与网页阅读功能,高效地搭建一个功能完整的联网搜索助手。此方案能充分发挥DeepSeek V3.2“思考与工具调用融合”的先进能力,系统性解决AI助手的实时信息获取难题。
什么是Dify联网搜索?
Dify 是一个强大的 LLM 应用开发平台,通过可视化工作流设计,我们可以轻松构建具备联网搜索能力的 AI 助手。与传统的本地部署方案不同,Dify 提供了更加便捷和稳定的解决方案。
核心架构设计
URL提取模块
def main(response):
results = response[0].get("webPages", [])
urls = []
for item in results[:5]:
urls.append(item.get("url"))
return {"results": urls}
内容格式化模块
[webpage {{ i+1 }} begin]
{{ text }}
[webpage {{ i+1 }} end]
将提取的网页内容格式化为 AI 友好的格式,便于后续处理。
我们实验了Dify平台上的许多搜索及网页内容读取插件,数眼智能与其他插件最大的不同是基于AI视觉识别来实现的搜索,并排除了许多无用的网页干扰元素,搜索结果上更加准确实时。
详细配置步骤
步骤 1:创建 Dify 应用
- 登录 Dify 平台
- 创建新的应用,选择"chatflow"模式
- 配置应用基本信息(名称、图标等)
步骤 2:配置工作流节点
2.1 添加时间获取节点
- 节点类型:工具
- 工具选择:获取当前时间
- 配置格式:%Y-%m-%d %H:%M:%S
- 时区设置:UTC
2.2 添加搜索节点
- 节点类型:工具
- 工具选择:网页搜索
- 参数配置:搜索关键词绑定到用户输入
- 返回条数:默认10条
2.3 添加代码处理节点
def main(response):
results = response[0].get("webPages", [])
urls = []
for item in results[:5]:
urls.append(item.get("url"))
return {"results": urls}
2.4 配置迭代器
- 迭代类型:数组迭代
- 输入:URL数组
- 并行处理:启用(提高效率)
- 并行数量:10
2.5 添加网页读取节点
2.6 配置内容格式化
节点类型:模板转换
模板格式:[webpage {{ i+1 }} begin]{{ text }}[webpage {{ i+1 }} end]
变量绑定:文本内容和索引
步骤 3:配置 LLM 模型
3.1 选择模型
- 模型:DeepSeek Chat
- 提供商:langgenius/deepseek
- 温度:0.7(平衡创造性和准确性)
3.2 提示词模板 #以下内容是基于用户发送的消息的搜索结果
{{context}}
在我给你的搜索结果中,每个结果都是[webpage X begin]...[webpage X end]格式的,X 代表每篇文章的数字索引。请在适当的情况下在句子末尾引用上下文。请按照引用编号<a href="网页链接">X的格式在答案中对应部分引用上下文。
在回答时,请注意以下几点:
-今天是 {{today}}。
-并非搜索结果的所有内容都与用户的问题密切相关,你需要结合问题,对搜索结果进行甄别、筛选。
-对于列举类的问题,尽量将答案控制在 10 个要点以内。
-对于创作类的问题,请务必在正文的段落中引用对应的参考编号。
-如果回答很长,请尽量结构化、分段落总结。
-你需要根据用户要求和回答内容选择合适、美观的回答格式,确保可读性强。
-你的回答应该综合多个相关网页来回答,不能重复引用一个网页。
-除非用户要求,否则你回答的语言需要和用户提问的语言保持一致。
# 用户消息为:
{{#sys.query#}}
步骤 4:连接节点
核心特性分析
使用效果展示
示例 1:实时信息查询
用户问题:今天北京的天气怎么样?
系统处理:
- 获取当前时间
- 搜索"今天北京天气"
- 提取相关网页URL
- 读取天气网站内容
- AI 整合信息并回答
示例 2:技术问题解答
用户问题:最新的Python 3.12有什么新特性?
系统处理:
- 搜索“Python 3.12”新特性
- 获取官方文档和技术博客
- 提取核心信息
- AI总结并结构化回答
后续可扩展优化
技术要点总结
- 模块化设计:每个功能模块独立,便于维护和扩展
- 错误处理:完善的错误处理机制,确保系统稳定性
- 可配置性:关键参数可配置,适应不同使用场景
- 扩展性:支持添加更多搜索源和内容处理方式
结语
通过 Dify 平台搭建联网搜索助手,数眼智能不仅实现了 AI 的实时信息获取能力,更重要的是建立了一个可扩展、可维护的智能问答系统。这种方案相比传统的本地部署更加稳定可靠,同时提供了丰富的配置选项和优化空间。
随着 AI 技术的不断发展,联网搜索能力已成为智能助手的基础功能。通过本文的介绍,您已经掌握了构建这类系统的核心思路和实现方法。期待这些方案能激发更多的创新应用!