FilmGPT：你的私人电影问答 AI，技术深度解析FilmGPT 是什么？ FilmGPT 是一个结合大模型（LL

想快速查电影信息？想根据心情挑片？想问“《盗梦空间》的主演是谁”，或者“我最近心情不好，看什么电影”？
FilmGPT 可以一站搞定！今天，我们不啰嗦一行行代码，而是深度拆解它的实现原理和技术亮点，让你看懂它是怎么聪明起来的——甚至比你那堆影评软件更懂电影。

一、FilmGPT 是什么？

FilmGPT 是一个 结合大模型（LLM）+ 向量数据库（Vector DB）+ RAG（知识增强生成） 的智能电影问答助手。

小白理解：FilmGPT 就像你的私人电影顾问，不管你想查电影信息，还是心情低落想看片，它都能秒懂你。

前端使用 React + Tailwind + Zustand，主要特点：

自定义 Hook 是啥？
- 想象一下，你有个贴身小秘书，帮你记住聊天记录、输入框内容、以及什么时候按“发送”
- useChat 就是这个秘书，把状态和逻辑全包起来，前端组件只负责显示和交互
流式显示为什么重要？
- 大模型回答可能需要几秒钟，如果一次性显示完整回答，你可能会心里默念：“它还活着吗？”
- 边生成边显示，用户体验直逼真人聊天

总结一句：前端是“聊天窗口”，useChat 是小秘书，ChatInput 是你说话的嘴，ChatOutput 是你看到答案的眼睛。

FilmGPT 的核心秘密在后端，依赖 RAG（Retrieval-Augmented Generation） ：

用户问题向量化
- 用户问：“我最近心情不好，看什么电影？”
- 模型先把这句话转换成向量（数字魔法），方便在知识库里找最相关的电影信息
向量数据库检索
- Supabase 向量数据库存储电影知识块（chunks）
- 每块知识包括：
  - content：电影介绍、剧情摘要
  - url：来源链接，方便溯源
  - movie_title：电影名
  - genre / release_year / date_updated
- 检索函数会返回最相关的几个 chunks，提供给大模型参考
Prompt 设计
- 中文 + Markdown 输出
- 如果用户问心情相关问题 → 推荐 2~3 部电影
- 非电影问题 → 礼貌提醒：“抱歉，我只会聊电影哦！”

小白理解：用户问问题 → 转数字向量 → 数据库找相似知识 → LLM 结合知识回答 → 前端边显示边渲染，整个过程像魔法一样流畅。

FilmGPT 要聪明，必须有丰富的电影知识库。

网页爬取
- Puppeteer 爬取 IMDb、Wikipedia 等网站
- 获取电影页面 HTML → 清洗成纯文本
文本切块
- RecursiveCharacterTextSplitter 将文本切成 512 字左右的小块，重叠 100 字
- 避免一条信息被切断，保证检索到完整语义
向量化 & 入库
- 每块文本生成 embedding（数字向量）
- 入库字段包含：内容、向量、电影信息、来源和更新时间

换句话说：我们给 AI 准备了“电影知识小卡片”，AI 每次只抽最相关的几张来回答你，准确率大大提升。

Prompt 就像给 AI 的剧本，告诉它“你该怎么回答、输出什么格式”。

小白理解：Prompt 就是给 AI 的“剧本”，告诉它剧情、格式、和回答风格，让回答更专业、更贴心。

总结一句话：FilmGPT = “私人电影顾问 + 心情电影推荐小助手”，从此问电影不用翻 IMDb、豆瓣，也不用烦恼看什么电影。

最后总结一句：FilmGPT，不只是一个聊天机器人，它是你的私人影评馆、心情疗愈师和电影百科全书三合一，让你从此看电影不再迷路。