大模型I/O的实现过程及原理(3)输出解析青训营X豆包MarsCode 技术训练营AI| 豆包MarsCode AI 刷题

107 阅读4分钟

langchain 输出解析器的作用

语言模型通常输出文本供人类阅读,但在很多实际应用场景中,我们需要的是程序能够处理的结构化信息。这时,langchain 的输出解析器就发挥了关键作用。

输出解析器是专门用于处理和构建语言模型响应的类。通过实现诸如get_format_instructionsparseparse_with_prompt等方法,输出解析器可以指导语言模型如何输出格式化的内容,并将其解析为特定的数据结构或格式,确保模型的输出符合我们的预期,便于后续的处理和分析。

例如,在鲜花文案生成程序中,我们使用 pydantic(json)解析器来确保模型输出符合特定的数据格式,方便进行数据分析、处理和存储。在处理可能出现错误的输出时,自动修复解析器和重试解析器可以发挥重要作用。自动修复解析器可以自动纠正某些常见的模型输出错误,如语法或拼写错误、格式不正确的 json 字符串等。重试解析器则可以在模型的初次输出不符合预期时,尝试修复或重新生成新的输出,特别是当输出不完整或有缺失内容时,它可以利用大模型的推理能力根据原始提示找回相关信息。

总之,langchain 的输出解析器在将语言模型的输出转化为结构化信息方面起着至关重要的作用,极大地提高了语言模型在实际应用中的可用性和效率。

输出解析器名称用法特点
列表解析器(List Parser)用于处理模型生成的输出为列表的情况,如询问模型 “列出所有鲜花的库存”,模型的回答应为一个列表。处理输出为列表的场景,确保输出符合列表格式。
日期时间解析器(Datetime Parser)处理日期和时间相关的输出,确保模型输出是正确的日期或时间格式。专注于日期和时间格式的输出处理。
枚举解析器(Enum Parser)当模型的输出应该是预定义的一组值之一时使用。限制模型输出在预定义的值范围内。
结构化输出解析器(Structured Output Parser)处理复杂的、结构化的输出,如生成报告、文章等。处理复杂结构化的输出,需要根据具体结构进行解析。
Pydantic(JSON)解析器通过定义 Pydantic 数据格式,创建输出解析器,确保模型输出符合特定的 JSON 格式,用于数据验证和格式处理。如在鲜花文案生成程序中,定义数据格式,获取输出格式指示,创建提示模板,将模型输出解析为指定格式并存储。利用 Pydantic 库进行数据验证和格式处理,确保输出符合预期的 JSON 格式,方便进行数据分析和存储。
自动修复解析器(OutputFixingParser)当模型输出格式不正确时,自动修复某些常见的输出错误。如在处理格式错误的 JSON 字符串时,将格式错误的输出以及格式化的指令传递给大模型进行修复。自动修复常见的输出错误,尤其是格式错误,通过调用大模型进行修复。
重试解析器(RetryWithErrorOutputParser)在模型初次输出不符合预期,特别是输出不完整或有缺失内容时,利用大模型的推理能力根据原始提示找回相关信息。如在处理错误格式的字符串时,尝试再次提问以得到正确的输出。根据原始提示重试生成输出,解决输出不完整或有问题的情况。

image.png 到这里为止,学完了模型的I/O模块,体会到了模型的基本底层工作原理,不仅是这不仅增强了我们的ai理解力,也为我们更好使用ai工具提供了借鉴。