一、背景
高考结束,暑假即将到来,高中生旅行规划面临三大痛点:预算有限(2000元内)、安全保障需求高、行程需兼顾舒适与趣味性。传统手工制作旅游计划耗时耗力,而大模型生成HTML界面可快速输出可视化方案。刚好AiPy(0.2.1)的官方大模型广场——Trustoken接入了豆包大模型,所以本次评测使用AiPy调用三大主流模型API,围绕代码质量、内容适配性、视觉设计三大维度展开横向对比。
评测对象:
📌 deepseek/deepseek-r1-0528(深度求索开源模型)
📌 qwen3-235b-a22b(阿里云通义千问)
📌 doubao-seed-1.6-250615(字节跳动旗下AI产品)
大模型配给网站:www.trustoken.cn/
二、综合评分
提示词:你是一位专业的旅游规划师,擅长为预算有限的年轻人制定经济实用的旅游方案。 你的任务是为一名刚结束高考、预算仅 2000 元、住在成都的学生制定详细的旅游攻略,并以美观的 HTML 界面展示。
| 一次成功率 | 准确度 | 美观度 | 文本概括 | 总分 | |
|---|---|---|---|---|---|
| Deepseek | 100% | 90 | 80 | 80 | 87.5 |
| 豆包 | 100% | 70 | 60 | 60 | 72.5 |
| 千问 | 100% | 60 | 40 | 50 | 62.5 |
三、模型输出横向测评
1、DeepSeek-R1表现
DeepSeek以500为目标,直接安排了三个地方
每到一个地方都安排了三天的行程,并有详细的介绍,包括推荐理由、行程安排、省钱小贴士、总预算以及安全注意事项。
对于安全注意事项和必备清单的设置也很合理。
输出总结:
✅ 预算控制:1519元(精确列出学生证优惠)
✅ 安全提示:包含10余项具体建议,以及地方旅游服务电话
✅ 界面设计:商务简约的界面设计,可以直观的看到关键信息****
2、豆包表现
豆包首先给了对于预算的总体安排。
可以看到豆包给出的是一个2+2的行程,先对两个旅游目的地进行了简介再是对其详细行程的安排,时间精确到小时,非常精确。
最后补充的建议并不局限于前面规划的目的地,对于四川境内的其他景点情况也做了说明。
输出总结:
⚠ 预算控制:985元(豆包还是太节约了,但把钱用完也是一种技术活),极致性价比导致旅游体验不是很好,预期上下浮动不超过10%
✅ 详细时间:每一天的行程都精确到小时
✅ 物品清单:设置为可交互的选择页面,收拾起来更方便
⚠ 缺陷:布局有点混乱,主要信息不突出,同一目的地的信息没放在一起
3、千问表现
千问模型生成的内容,无论是信息密度、准确度包括最后的页面展示都远远比不上前面两者。
输出总结:
❌ 严重缺陷:完全没有排版
✅ 特色之处:设定多个旅游方案对比
❌ 清单确实:仅3条必备物品
四、总结
从信息检索效能维度审视,DeepSeek 与豆包均展现出卓越的搜索实力。其中,DeepSeek 在内容呈现时更注重逻辑链条的完整性,通过严谨的层次架构构建知识脉络;豆包则以高密度的信息聚合为特色,在有限篇幅内集成多元视角与详实数据,二者形成鲜明互补。
| 需求类型 | 推荐模型**** | 原因**** |
|---|---|---|
| 教学/标准化开发 | ✅ DeepSeek | 代码规范/架构清晰 |
| 本地实时信息整合 | ✅ 豆包 | 数据检索覆盖更广 |
| 创意原型设计 | ⚠ 千问 | 可视化效果实现不稳 |