解锁DeepSeek V3.2新玩法!接入联网搜索和网页阅读能力!

110 阅读5分钟

DeepSeek-V3.2是性能跃迁的一代。其核心优势在于,以极致的成本效益,提供了顶级的推理能力。它在权威测试中超越了GPT-4o,但API价格仅为其百分之一,真正做到了 “好用不贵” 。同时支持长达128K的上下文以及更强大agent能力,在联网搜索场景下,可以分析选择最准确的数据源,作为回答引用

在AI快速发展的今天,大语言模型虽然拥有海量知识,但面对实时信息最新事件特定网页内容时,往往显得力不从心。

微信图片_20251212113855_78_473.png

(上图为DeepSeek V3.2联网搜索得出的信息并非实时更新资讯)

作为一款大模型,在解决一些比较实时的问题时,DeepSeek本身无法获取最新的数据阅读网页,要发挥DeepSeek V3.2的最大能力,就必须给他解锁联网搜索阅读网页的能力,让大模型自己查资料

那么,如何系统性地为AI助手赋予联网搜索能力,获取最新最准确的信息?

这正是我们解决方案的核心。本文将详细介绍如何基于Dify平台,并整合数眼智能提供的实时联网搜索与网页阅读功能,高效地搭建一个功能完整的联网搜索助手。此方案能充分发挥DeepSeek V3.2“思考与工具调用融合”的先进能力,系统性解决AI助手的实时信息获取难题。

什么是Dify联网搜索?

Dify 是一个强大的 LLM 应用开发平台,通过可视化工作流设计,我们可以轻松构建具备联网搜索能力的 AI 助手。与传统的本地部署方案不同,Dify 提供了更加便捷和稳定的解决方案。

核心架构设计

流程5项PPT内容页.jpg

流程5项PPT内容页 (1).jpg

URL提取模块

def main(response):

   results = response[0].get("webPages", [])

   urls = []

   for item in results[:5]:

       urls.append(item.get("url"))

   return {"results": urls}

内容格式化模块

[webpage {{ i+1 }} begin]

{{ text }}

[webpage {{ i+1 }} end]

将提取的网页内容格式化为 AI 友好的格式,便于后续处理。

我们实验了Dify平台上的许多搜索及网页内容读取插件,数眼智能与其他插件最大的不同是基于AI视觉识别来实现的搜索,并排除了许多无用的网页干扰元素,搜索结果上更加准确实时。

详细配置步骤

步骤 1:创建 Dify 应用

  1. 登录 Dify 平台
  2. 创建新的应用,选择"chatflow"模式
  3. 配置应用基本信息(名称、图标等)

微信图片_20251208181546_51_5.png

步骤 2:配置工作流节点

2.1 添加时间获取节点

  1. 节点类型:工具
  2. 工具选择:获取当前时间
  3. 配置格式:%Y-%m-%d %H:%M:%S
  4. 时区设置:UTC

微信图片_20251208181546_52_5.png

2.2 添加搜索节点

  1. 节点类型:工具
  2. 工具选择:网页搜索
  3. 参数配置:搜索关键词绑定到用户输入
  4. 返回条数:默认10条

微信图片_20251208181546_53_5.png

2.3 添加代码处理节点

def main(response):
   results = response[0].get("webPages", [])
   urls = []
   for item in results[:5]:
       urls.append(item.get("url"))
   return {"results": urls}

微信图片_20251208181546_54_5.png

2.4 配置迭代器

  1. 迭代类型:数组迭代
  2. 输入:URL数组
  3. 并行处理:启用(提高效率)
  4. 并行数量:10

微信图片_20251208181547_55_5.png

2.5 添加网页读取节点

微信图片_20251208181547_56_5.png

2.6 配置内容格式化

节点类型:模板转换

模板格式:[webpage {{ i+1 }} begin]{{ text }}[webpage {{ i+1 }} end]

变量绑定:文本内容和索引

步骤 3:配置 LLM 模型

3.1 选择模型

  1. 模型:DeepSeek Chat
  2. 提供商:langgenius/deepseek
  3. 温度:0.7(平衡创造性和准确性)

3.2 提示词模板 #以下内容是基于用户发送的消息的搜索结果

{{context}}

在我给你的搜索结果中,每个结果都是[webpage X begin]...[webpage X end]格式的,X 代表每篇文章的数字索引。请在适当的情况下在句子末尾引用上下文。请按照引用编号<a href="网页链接">X的格式在答案中对应部分引用上下文。

在回答时,请注意以下几点:

-今天是 {{today}}。

-并非搜索结果的所有内容都与用户的问题密切相关,你需要结合问题,对搜索结果进行甄别、筛选。

-对于列举类的问题,尽量将答案控制在 10 个要点以内。

-对于创作类的问题,请务必在正文的段落中引用对应的参考编号。

-如果回答很长,请尽量结构化、分段落总结。

-你需要根据用户要求和回答内容选择合适、美观的回答格式,确保可读性强。

-你的回答应该综合多个相关网页来回答,不能重复引用一个网页。

-除非用户要求,否则你回答的语言需要和用户提问的语言保持一致。

# 用户消息为:

{{#sys.query#}}

微信图片_20251208181547_58_5.png

步骤 4:连接节点

流程5项PPT内容页 (2).jpg

微信图片_20251208181547_59_5.png

核心特性分析

流程5项PPT内容页 (4).jpg

使用效果展示

示例 1:实时信息查询

用户问题:今天北京的天气怎么样?

系统处理:

  • 获取当前时间
  • 搜索"今天北京天气"
  • 提取相关网页URL
  • 读取天气网站内容
  • AI 整合信息并回答

微信图片_20251208181548_60_5.png

示例 2:技术问题解答

用户问题:最新的Python 3.12有什么新特性?

系统处理:

  • 搜索“Python 3.12”新特性
  • 获取官方文档和技术博客
  • 提取核心信息
  • AI总结并结构化回答

微信图片_20251208181548_61_5.png

后续可扩展优化

流程5项PPT内容页 (5).jpg

技术要点总结

  1. 模块化设计:每个功能模块独立,便于维护和扩展
  2. 错误处理:完善的错误处理机制,确保系统稳定性
  3. 可配置性:关键参数可配置,适应不同使用场景
  4. 扩展性:支持添加更多搜索源和内容处理方式

结语

通过 Dify 平台搭建联网搜索助手,数眼智能不仅实现了 AI 的实时信息获取能力,更重要的是建立了一个可扩展可维护的智能问答系统。这种方案相比传统的本地部署更加稳定可靠,同时提供了丰富的配置选项和优化空间。

随着 AI 技术的不断发展,联网搜索能力已成为智能助手的基础功能。通过本文的介绍,您已经掌握了构建这类系统的核心思路和实现方法。期待这些方案能激发更多的创新应用!