如何创建自定义LLM类：与LangChain无缝集成测试自定义LLM类这个LLM实现了LangChain的标准Runn

# 如何创建自定义LLM类：与LangChain无缝集成

在现今的AI和编程领域中，自定义化和可扩展性变得越来越重要。本文将带您了解如何创建一个自定义语言模型（LLM）类，以便与LangChain无缝集成。这使您能够利用现有LangChain功能，同时使用您自定义的LLM或不同的包装器。

## 引言

在许多情况下，您可能想使用您自己的语言模型，或与LangChain目前支持的模型不同的包装器。在这种情况下，创建一个自定义LLM类并实现LangChain的标准LLM接口，将使您能够在现有LangChain程序中使用自定义模型，且仅需进行最小的代码修改。

## 主要内容

### 自定义LLM实现基础

要实现一个自定义LLM类，需要实现以下两个核心方法：

- `_call`：接收一个字符串和一些可选的停止词，返回一个处理后的字符串。
- `_llm_type`：返回一个字符串，仅用于日志记录。

除此之外，您还可以选择实现以下方法：

- `_identifying_params`：帮助识别模型并打印LLM，返回一个字典。
- `_acall`：提供异步版本的`_call`。
- `_stream` 和 `_astream`：支持流式输出。

### 实现一个简单的LLM示例

以下是如何实现一个简单的自定义LLM，该模型返回输入的前n个字符：

```python
from typing import Any, Dict, Iterator, List, Optional

from langchain_core.callbacks.manager import CallbackManagerForLLMRun
from langchain_core.language_models.llms import LLM
from langchain_core.outputs import GenerationChunk

class CustomLLM(LLM):
    """A custom chat model that echoes the first `n` characters of the input."""

    n: int

    def _call(self, prompt: str, stop: Optional[List[str]] = None, run_manager: Optional[CallbackManagerForLLMRun] = None, **kwargs: Any) -> str:
        if stop is not None:
            raise ValueError("stop kwargs are not permitted.")
        return prompt[: self.n]

    def _stream(self, prompt: str, stop: Optional[List[str]] = None, run_manager: Optional[CallbackManagerForLLMRun] = None, **kwargs: Any) -> Iterator[GenerationChunk]:
        for char in prompt[: self.n]:
            chunk = GenerationChunk(text=char)
            if run_manager:
                run_manager.on_llm_new_token(chunk.text, chunk=chunk)
            yield chunk

    @property
    def _identifying_params(self) -> Dict[str, Any]:
        return {
            "model_name": "CustomChatModel",
        }

    @property
    def _llm_type(self) -> str:
        return "custom"

测试自定义LLM类

这个LLM实现了LangChain的标准Runnable接口，因此支持LangChain的许多抽象方法。

llm = CustomLLM(n=5)
print(llm)

# Invoke example
llm.invoke("This is a foobar thing") # 输出: 'This '

# Async invoke example
await llm.ainvoke("world") # 输出: 'world'

# Batch processing
llm.batch(["woof woof woof", "meow meow meow"]) # 输出: ['woof ', 'meow ']

# Streaming output
async for token in llm.astream("hello"):
    print(token, end="|", flush=True) # 输出: 'h|e|l|l|o|'

常见问题和解决方案

停止词的使用

在自定义LLM实现中，如何正确处理停止词是一个常见的问题。在本示例中，如果提供停止词，会引发ValueError。要更好地支持停止词，需要根据停止词的出现位置截断输出。

异步支持

实现异步支持（如_acall和_astream）可以显著提高性能，特别是在需要处理大量请求或长时间运行任务时。

总结和进一步学习资源

实现自定义LLM类并与LangChain集成，可以帮助开发者利用更丰富的语言模型功能。要进一步了解LangChain和LLM，您可以参考以下资源：

参考资料

LangChain API Reference: CallbackManagerForLLMRun, LLM, GenerationChunk
Python Typing: docs.python.org/3/library/t…

如果这篇文章对你有帮助，欢迎点赞并关注我的博客。您的支持是我持续创作的动力！

---END---