使用OpenAI生成文档内容概要、基于文档内容对话(React + Python fastapi)

171 阅读1分钟

项目介绍

利用OpenAI的能力,实现了文档内容概要生成和基于文档内容进行问答的功能。文件支持pdfepub两种文件格式,支持概要和对话的本地持久化。网站免费使用,无需注册或登录。进入网站>> 代码仓库地址>>

技术栈

  • 前端
    • Reactjs v18、dexie v4、Typescript v5
  • 服务端
    • python v3.12、gunicorn、fastapi、langchain

网站部分截图

文件上传页

文件详情页

工作流程

每一次的总结或对话流程最长可能需要等待几分钟,这主要是由上传文件的大小和OpenAI的处理效率决定的。 我们有必要了解下整个过程发生了什么。 以下是工作过程图:

  1. 在我们开始之前,您需要准备一个.pdf.epub格式的文件 如果您没有文件,您可以点击下载一个示例pdf文件。上传完成后,服务端会帮您处理剩下的事,您只需要耐心等待。 如果您不是开发人员,可以跳过剩下的步骤。
  2. 服务端会从上传的文件中提取所有的文本内容,然后调用合适的Text Splitter将文本内容分割成许多独立的document对象。
  3. 生成Embeddings对象,通过利用OpenAI embedding
  4. 通过EmbeddingPinecone来生成vectors
  5. 服务器会根据用户操作来生成答案或总结。

license

LICENSE