第六届字节跳动青训营第六课（ai_代理）｜豆包MarsCode AI 刷题LangChain从入门到放弃~ Lang

代理可以有效地解决大模型“事实幻觉”，即大模型对你扯淡。

代理相关三元素：

大模型：提供逻辑的引擎，负责生成预测和处理输入。
与之交互的外部工具：可能包括数据清洗工具、搜索引擎、应用程序等。
控制交互的代理：调用适当的外部工具，并管理整个交互过程的流程。

ReAct框架

ReAct 框架的灵感正是来自“行动”（Act）和“推理”（Reasoning）之间的协同作用，这种协同作用使得咱们人类能够学习新任务并做出决策或推理。

大语言模型可以通过生成推理痕迹和任务特定行动来实现更大的协同作用。

具体来说，就是引导模型生成一个任务解决轨迹：观察环境-进行思考-采取行动，也就是观察-思考-行动。那么，再进一步进行简化，就变成了推理-行动，也就是Reasoning-Acting框架。

其中，Reasoning包括了对当前环境和状态的观察，并生成推理轨迹。这使模型能够诱导、跟踪和更新操作计划，甚至处理异常情况。Acting在于指导大模型采取下一步的行动，比如与外部源（如知识库或环境）进行交互并且收集信息，或者给出最终答案。

ReAct的每一个推理过程都会被详细记录在案，这也改善大模型解决问题时的可解释性和可信度，而且这个框架在各种语言和决策任务中都得到了很好的效果。

仅仅使用思维链（CoT）提示，LLMs能够执行推理轨迹，以完成算术和常识推理等问题，但这样的模型因为缺乏和外部世界的接触或无法更新自己的知识，会导致幻觉的出现。

而将 ReAct框架和思维链（CoT）结合使用，则能够让大模型在推理过程同时使用内部知识和获取到的外部信息，从而给出更可靠和实际的回应，也提高了 LLMs 的可解释性和可信度。

LangChain正是通过Agent类，将ReAct框架进行了完美封装和实现，这一下子就赋予了大模型极大的自主性（Autonomy），大模型现在从一个仅仅可以通过自己内部知识进行对话聊天的Bot，飞升为了一个有手有脚能使用工具的智能代理。

链和代理的区别

在链中，一系列操作被硬编码（在代码中）。在代理中，语言模型被用作推理引擎来确定要采取哪些操作以及按什么顺序执行这些操作（代理具有自主性）。操作的序列并非硬编码在代码中，而是使用语言模型（如GPT-3或GPT-4）来选择执行的操作序列

代理的关键组件

代理（Agent）：这个类决定下一步执行什么操作。它由一个语言模型和一个提示（prompt）驱动。提示可能包含代理的性格（也就是给它分配角色，让它以特定方式进行响应）、任务的背景（用于给它提供更多任务类型的上下文）以及用于激发更好推理能力的提示策略（例如ReAct）。LangChain中包含很多种不同类型的代理。
工具（Tools）：工具是代理调用的函数。这里有两个重要的考虑因素：一是让代理能访问到正确的工具，二是以最有帮助的方式描述这些工具。如果你没有给代理提供正确的工具，它将无法完成任务。如果你没有正确地描述工具，代理将不知道如何使用它们。LangChain提供了一系列的工具，同时你也可以定义自己的工具。
工具包（Toolkits）：工具包是一组用于完成特定目标的彼此相关的工具，每个工具包中包含多个工具。比如LangChain的Office365工具包中就包含连接Outlook、读取邮件列表、发送邮件等一系列工具。当然LangChain中还有很多其他工具包供你使用。
代理执行器（AgentExecutor）：代理执行器是代理的运行环境，它调用代理并执行代理选择的操作。执行器也负责处理多种复杂情况，包括处理代理选择了不存在的工具的情况、处理工具出错的情况、处理代理产生的无法解析成工具调用的输出的情况，以及在代理决策和工具调用进行观察和日志记录。

代理就是一种用语言模型做出决策、调用工具来执行具体操作的系统。通过设定代理的性格、背景以及工具的描述，你可以定制代理的行为，使其能够根据输入的文本做出理解和推理，从而实现自动化的任务处理。而代理执行器（AgentExecutor）就是上述机制得以实现的引擎。

代理类型

AgentType.ZERO_SHOT_REACT_DESCRIPTION 是一种代理类型，它允许代理在没有任何特定任务训练的情况下，根据用户的输入和工具的描述来执行任务。这种类型的代理通常用于通用的问题解决。

SELF_ASK_WITH_SEARCH利用一种叫做 “Follow-up Question（追问）”加“Intermediate Answer（中间答案）”的技巧，来辅助大模型寻找事实性问题的过渡性答案，从而引出最终答案。在问题和最终答案之间，存在中间过程。

PlanAndExecute，计划和解决可以用一个或多个模型，通过首先计划要做什么，然后执行子任务来实现目标。

第六届字节跳动青训营第六课（ai_代理） ｜ 豆包MarsCode AI 刷题

ReAct框架

代理的关键组件

代理类型

第六届字节跳动青训营第六课（ai_代理）｜豆包MarsCode AI 刷题