跟着自己开发智能体,环球世界

41 阅读8分钟

序幕:行前焦虑与灵感迸发

一直有个计划,就是来一次日本自由行。近在眼时,一个现实问题摆在面前:日本的轨道交通系统复杂程度堪称世界之最——仅东京就有超过50条地铁和铁路线路,由不同公司运营,票务系统各异。小红书上攻略如潮,却矛盾重重:有人说Suica卡万能,有人强调必须买JR Pass;有人推荐换乘案内APP,有人却说Google地图更准。

image.png 混乱的信息中,一个念头闪过:既然我是AI开发者,为何不自己打造一个专属的日本旅行智能体?

第一章:智能体诞生记——从零搭建的过程

1.1 基础框架选择

我选择了开源智谱AI作为基础,结合GLM-4.6的推理能力,构建了一个专门针对日本旅行的问答系统。这个决定基于几个考虑:

  • 智谱AI模块化设计便于集成实时数据
  • 能够构建长期记忆,记住我的偏好和行程
  • 可扩展性强,后期可以添加各种插件

1.2 核心配置

image.png

image.png

1.3 测试阶段(附测试截图)

我模拟了各种场景进行测试:

  • “从成田机场到新宿酒店最省钱的方式是什么?”
  • “我想购买JR Pass,7天全国版适合我的行程吗?”
  • “在京都,如何安排一天参观金阁寺、伏见稻荷和岚山?”

智能体不仅给出了路线建议,还标注了注意事项:“从成田到新宿的N'EX列车包含在JR Pass中,但如果您住在新宿西口,建议在东京站换乘中央线,因为新宿站容易迷路。”

image.png

image.png

第二章:实战日本——智能体伴我闯关东关西

2.1 初到东京:新宿站的考验

10月5日下午3点,我拖着行李箱站在新宿站南口。这个号称“世界最复杂车站”的地方有超过200个出口。打开智能体,输入:“我在新宿站南口,要去东京都厅展望台,怎么走最快?”

30秒后,回复来了:

image.png

我按照指引,竟然一次性找到了正确路线——对于第一次到新宿站的人来说,这简直是个奇迹。

2.2 京都的惊喜:智能体vs当地人推荐

在京都的第一天,智能体推荐了“哲学之道”作为晨间散步路线。我半信半疑地前往,发现果然清静雅致。但更惊喜的是,智能体在路线描述中嵌入了一个小提示:“途经法然院,游客稀少,庭院精致,特别是苔藓园在晨光中格外美。”

我临时起意前往,确实只有寥寥数人。在那里遇到了一位正在扫落叶的僧人,他见我对着苔藓拍照,主动用简单英语解释不同苔藓的种类和养护方法——这样的体验是任何旅行团都无法提供的。

image.png

2.3 实时困境解救:错过末班车后

最惊险的一次是在奈良。参观东大寺至傍晚,准备返回京都时发现,原计划的近铁特急已经停运。此时已晚上9点,许多咨询处都已关闭。

紧急询问智能体:“我在近铁奈良站,如何返回京都站的酒店?所有特急都已停运。”

智能体的回复速度比我想象的快:

image.png

我选择了方案2,虽然多花了些钱,但在疲惫的夜晚,简单的换乘路线确实更省心。更贴心的是,智能体还提醒了大阪站的哪个出口离换乘通道最近。

第三章:智能体的短板与现场补丁

3.1 营业时间之痛

在大阪,智能体推荐了一家“浪花オムレツ”蛋包饭店,评价极高。我专程前往,却发现门口贴着“本日临时休业”的纸条——这是智能体无法预料的。

当晚我更新了知识库:

新增模块:营业时间可靠性分类
A类:大型连锁店/商场(营业时间准确率>95%)
B类:独立热门店铺(准确率约80%,可能临时休业)
C类:家庭式小馆(准确率约70%,建议行前电话确认)
标记:所有推荐店铺加入分类标签

image.png

3.2 站内导航的局限性

智能体能准确告诉我“从银座线换乘丸之内线”,但在涩谷这样的巨型车站,它无法提供精确的站内路线。我多次在不同楼层之间绕圈后,决定添加用户贡献内容。

我在涩谷站成功找到捷径后,立即通过语音输入:

用户反馈:涩谷站,从JR山手线(上行方向)到副都心线
捷径:下车后不要上楼梯,直接向前走约50米,看到“B6”出口标志后左转,有直通副都心线的地下通道,比常规路线节省8分钟
验证时间:2025年10月6日 14:30

3.3 文化活动的信息滞后

我想参观一个京都的传统工艺展,智能体根据网络信息表示“无需预约”,到场却发现需要提前网上预约。这促使我集成了Peatix(日本主流活动预约平台)的API,让智能体能检查活动的实时预约状态。

第四章:知识库进化——从个人经验到集体智慧

回国后,我开始系统化整理这次旅行的收获。智能体的知识库从最初的4个模块扩展到12个:

  1. 交通核心库(完善版)

    • 各主要车站的换乘秘诀(用户贡献+官方数据)
    • 不同交通卡的最优使用场景
    • 夜间交通替代方案数据库
  2. 实时信息验证系统

    • 店铺营业状态众包确认机制
    • 活动预约需求自动检测
    • 季节性调整提醒(如红叶季特别交通安排)
  3. 文化情境理解模块

    • 神社/寺庙礼仪分级指南(基本/深度/专业)
    • 日语实用对话情境库(交通相关优先)
    • 日本社交禁忌注意事项
  4. 用户画像适配引擎

    • 根据历史行为自动调整推荐风格
    • 学习用户对“计划偏差”的容忍度
    • 记忆用户的特殊需求(如无障碍设施需求)

image.png

第五章:总结与反思——为什么这个智能体“非常好用”

5.1 相对于传统工具的突破

对比导航APP

  • Google地图/换乘案内:提供A到B的最优路线
  • 我的智能体:提供“基于我的偏好和实时状态”的路线建议 例:当检测到我携带大件行李时,会自动避开需要大量楼梯的换乘方案

对比攻略平台

  • 小红书/旅游博客:静态经验分享
  • 我的智能体:动态整合+个性化过滤+实时调整 能够判断“这个网红打卡点现在人多不多,值不值得去”

5.2 真正的价值:从信息检索到旅行伙伴的转变

这个智能体最成功的不是技术先进性,而是交互设计的哲学

  1. 理解旅行者的心理状态

    • 刚到日本时:提供详细、保守的方案
    • 旅行中期:开始推荐一些冒险选项
    • 疲惫时:自动简化回复,减少信息量
  2. 平衡规划与灵活性

    • 默认提供完整方案,但总会在最后问:“如果您想探索周边,B区域有三个有趣的小店”
    • 学习我的决策模式后,会自动调整建议的详细程度
  3. 承认自己的局限性

    • 当信息不确定时会明确标注:“这是三个月前的数据,建议您…”
    • 经常鼓励我“向车站工作人员确认一下,他们最了解实时情况”

5.3 可复制的架构启示

这次实验证明,即使是个人开发者,也能构建实用的垂直领域智能体。关键洞察包括:

  • 小数据也能有大智慧:我的知识库最初只有几百条数据,但通过精心设计的数据结构,覆盖了80%的常见场景
  • 实时数据比庞大历史数据更重要:接入2-3个高质量的实时API,价值超过百万条陈旧数据
  • 用户反馈闭环是进化的核心:每次我纠正或补充信息,智能体都能立即学习并应用到后续对话中

尾声:智能体不只是工具

日本旅行的复杂交通系统曾让我望而却步,但亲手打造的智能体不仅帮我解决了实际问题,更让我理解了一个更深层的道理:技术最好的样子,不是替代人类的体验,而是放大我们探索世界的能力和勇气

那些在新宿站迷路的焦虑、在奈良错过末班车的慌张、在哲学之道发现隐秘寺庙的惊喜——所有这些体验都因为有了智能体的陪伴而变得更加丰富而非简化。它处理了琐碎的信息劳动,让我更专注于旅行本身:观察、感受、沉浸。

而最重要的或许是,通过构建这个智能体,我不仅完成了一次日本旅行,更完成了一次关于人机协作可能性的探索之旅。这趟旅程的终点不是回到国内的那班飞机,而是那个还在不断学习、不断进化的数字伙伴——它准备好了,等待下一次冒险的开始。