扣子(coze.cn)初体验-史料RAG 复现

1,139 阅读1分钟

复现 史料RAG

  1. wxywb/history_rag (github.com)
  2. 当我开发出史料检索RAG应用,正史怪又该如何应对?_哔哩哔哩_bilibili

知识库介绍

参考 Coze - 文档中心

image.png

image.png 说明:

  1. 因为单个文件(也就是一个单元)限制20M,所以上传电子书PDF就不可能了,需要把PDF转换为纯文本,这也需要OCR识别准确。
  2. 因为是纯文本,所以也不需要纠结2G/10G的限制了,因为一个纯文本的二十四史才50M,所以对于个人数据库来说肯定是够用了,虽然训练大模型可能要1000G的数据。

使用知识库

Coze - 文档中心

创建数据库

一个数据库是由多张表(类比一个单元)组成的。 image.png

新增单元

image.png image.png

处理失败

同时处理单元太多导致的,一般同时处理十个应该是的。 image.png

image.png

管理分段

在Bot内使用知识库

创建 史料RAG Bot

image.png

编排 史料RAG Bot 添加指定的history_rag知识库

image.png

image.png

调试 史料RAG Bot

(可选)在预览与调试区域调试 Bot 能力时,扩展运行完毕的内容可以查看知识库命中并召回的分片内容。 可见回答不是符合预期 image.png

编排 史料RAG Bot 人设与回复逻辑

编写提示

image.png

提示词输出非常不稳定

image.png

发布

doubao.com/bot/rur0BUO…

bot id : 7333124381247275034