探索Psychic API的使用：从加载文档到生成嵌入3. 转换文档为嵌入将加载的文档转换为嵌入，方便在向量数据库中存

# 探索Psychic API的使用：从加载文档到生成嵌入

## 引言

在现代应用中，能够高效地加载和处理文档数据至关重要。本文将介绍如何使用Psychic API加载文档，并将其转换为嵌入，用于进一步的数据处理或分析。我们将提供实用的代码示例，并讨论可能遇到的挑战和解决方案。

## 主要内容

### 1. 前提条件

在开始之前，请确保您已完成以下步骤：

- 根据[Psychic文档](https://psychic.example.com)中的快速入门指导进行准备。
- 登录Psychic仪表板获取您的密钥。
- 配置前端React库以允许用户进行连接认证。

### 2. 加载文档

通过`PsychicLoader`类可以轻松从连接中加载文档。每个连接都有一个对应的连接器ID和连接ID。

```python
# 安装必要的库
!poetry run pip -q install psychicapi langchain-chroma

from langchain_community.document_loaders import PsychicLoader
from psychicapi import ConnectorId

# 创建Google Drive文档加载器
# 使用API代理服务提高访问稳定性
google_drive_loader = PsychicLoader(
    api_key="您的API密钥",
    connector_id=ConnectorId.gdrive.value,
    connection_id="google-test",
)

documents = google_drive_loader.load()

3. 转换文档为嵌入

将加载的文档转换为嵌入，方便在向量数据库中存储和检索。

from langchain.chains import RetrievalQAWithSourcesChain
from langchain_chroma import Chroma
from langchain_openai import OpenAI, OpenAIEmbeddings
from langchain_text_splitters import CharacterTextSplitter

# 拆分文档
text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
texts = text_splitter.split_documents(documents)

# 生成嵌入
embeddings = OpenAIEmbeddings()
docsearch = Chroma.from_documents(texts, embeddings)

# 创建问答链
chain = RetrievalQAWithSourcesChain.from_chain_type(
    OpenAI(temperature=0), chain_type="stuff", retriever=docsearch.as_retriever()
)

# 进行一次简单的查询
result = chain({"question": "what is psychic?"}, return_only_outputs=True)
print(result)

常见问题和解决方案

网络访问困难：由于某些地区的网络限制，您可能需要使用API代理服务来提高访问的稳定性。
文档加载失败：确保提供的连接ID和连接器ID是正确的，并且您的API密钥具有相应的权限。

总结和进一步学习资源

通过本文，我们了解了如何使用Psychic API加载文档，并将其转换为可以用于分析的嵌入。对于更深入的学习，可以参考以下资源：

参考资料

如果这篇文章对你有帮助，欢迎点赞并关注我的博客。您的支持是我持续创作的动力！

---END---