大家好,我是 via007。
这个周末有点意外,我随手写的一个开源小工具 Bilibili-RAG,竟然入选了**《阮一峰科技爱好者周刊》**,GitHub Star 数也在短短 48 小时内突破了 200+ 。
既然大家对**“个人知识库”**这么感兴趣,今天不贴代码,单纯聊聊我为什么做这个东西,以及它能帮你解决什么问题。
😫 痛点:收藏夹 = 坟墓
相信大家跟我一样,B 站收藏夹里躺着几百个技术视频:《并发编程》、《源码解析》、《AI 教程》...
收藏的时候想着“回家一定看”,现实是**“再也没打开过”**。
更痛苦的是:
- 检索难:想找某个知识点,必须凭记忆去翻视频,进度条拖到手酸。
- 没字幕:很多优质的生肉(搬运视频)或老教程根本没有字幕,想搜都没法搜。
💡 解决方案:Bilibili-RAG
所以我做了一个基于 RAG (检索增强生成) 的 AI 助手。
简单来说,它不仅是一个“下载器”,更是一个**“视频阅读器”**。
它能帮你做三件事:
-
全自动“啃”视频:
你只需要扔一个 B 站链接(或者收藏夹 ID),它自动把视频里的语音转成文字。
- 亮点:即使视频本身没有字幕,我也接入了阿里 ASR 进行语音转写,强行生成字幕。
-
构建本地知识库:
它会把成千上万字的视频内容,切片存入本地的向量数据库(ChromaDB)。这一切都在你本地完成,隐私安全。
-
AI 对话式检索:
你可以直接问它:“这个视频里关于 Transformer 架构讲了哪几点?”
它会基于视频内容回答你,拒绝瞎编。
🛠️ 技术实现(极简版)
虽然不贴代码,但技术栈还是要提一下,给想折腾的朋友参考:
- 后端:FastAPI + LangChain
- 前端:Next.js
- 核心能力:RAG(向量检索)+ ASR(语音转写)
- 部署:Docker 一键启动
🚀 为什么它是“周末神器”?
- 省时间:以前看视频要 30 分钟,现在问 AI 只要 30 秒。
- 不仅是 B 站:它其实提供了一套通用的“音视频转知识库”的思路。
🔗 写在最后
目前项目还在快速迭代中(刚刚修了几个 Bug)。如果你也是 B 站重度用户,或者想把收藏夹真正利用起来,欢迎来 GitHub 玩玩。
开源地址(欢迎 Star ⭐️):
如果有任何部署问题,或者新的功能建议,欢迎在评论区告诉我!周末愉快!👋