项目介绍
利用OpenAI的能力,实现了文档内容概要生成和基于文档内容进行问答的功能。文件支持pdf和epub两种文件格式,支持概要和对话的本地持久化。网站免费使用,无需注册或登录。进入网站>> 代码仓库地址>>
技术栈
- 前端
- Reactjs v18、dexie v4、Typescript v5
- 服务端
- python v3.12、gunicorn、fastapi、langchain
网站部分截图
文件上传页
文件详情页
工作流程
每一次的总结或对话流程最长可能需要等待几分钟,这主要是由上传文件的大小和OpenAI的处理效率决定的。 我们有必要了解下整个过程发生了什么。 以下是工作过程图:
- 在我们开始之前,您需要准备一个
.pdf或.epub格式的文件 如果您没有文件,您可以点击下载一个示例pdf文件。上传完成后,服务端会帮您处理剩下的事,您只需要耐心等待。 如果您不是开发人员,可以跳过剩下的步骤。 - 服务端会从上传的文件中提取所有的文本内容,然后调用合适的
Text Splitter将文本内容分割成许多独立的document对象。 - 生成
Embeddings对象,通过利用OpenAI embedding。 - 通过
Embedding或Pinecone来生成vectors。 - 服务器会根据用户操作来生成答案或总结。