AI 伴学笔记7 代理一般来说，LLM 模型无法主动更新自己的知识，其知识范围包括训练时的知识和提示上下文提供的附加信息

一般来说，LLM 模型无法主动更新自己的知识，其知识范围包括训练时的知识和提示上下文提供的附加信息。

事实幻觉：大模型以错误虚构的提示上下文胡编乱造

解决方法可以让 LLM 在本地知识库、外部搜索等检索，确认真实再进行输出。本地知识库和外部搜索引擎称为外部工具

LangChain 通过代理调用外部工具。代理可以认为是对外部工具的接口和调用的封装

与链相比，代理可以不硬编码操作序列，而是由大模型自主选择与外部工具的交互

Pasted image 20241113195326.png

ReAct

ReAct 即推理（Reasoning）+行动（Acting），LLM 通过生成推理痕迹和特定行动实现更大的协同作用

ReAct 会记录每一步的推理过程以提高可信度。LangChain 通过代理 Proxy 使用 ReAct。

加载外部工具依赖（如搜索工具 SerpAPI，数学工具 llm-math）
使用 load_tools(['serpapi', 'llm-math'], llm=llm) 加载工具
使用工具链初始化代理：initialize_agent(<tools>, <llm>, <agent>, <verbose>)
- tools：前面 load_tools 创建的对象
- agent：代理类型，如 AgentType.ZERO_SHOT_REACT_DESCRIPTION，STRUCTURED_CHAT_ZERO_SHOT_REACT_DESCRIPTION 等

SerpAPI 需要注册申请 Key，并设置 os.environ["SERPAPI_API_KEY"] 环境变量

LangChain 代理主要由以下几种组件组成：

通过调试查看 AgentExecutor 运行过程，思考 - 观察 - 行动提示词如下：

每次 Q-A-T 过程，LLM 都会推进任务进度，直到任务完成，LLM 直到结果（AgentFinish）为止

结构化工具对话代理：允许更复杂、多方面的交互，通过结构化工具箱调用多个工具

开源自动化框架，模拟用户操作网页自动化网页交互和测试，支持 Chrome、Firefox、Safari 多种浏览器

Pasted image 20241113202703.png

结构化工具对话代理的 AgentType 为 STRUCTURED_CHAT_ZERO_SHOT_REACT_DESCRIPTION，PlayWrightBrowserToolkit 工具集提供 PlayWright 支持

利用追问+中间答案辅助大模型寻找事实性问题的过渡性答案，引出最终答案，其 AgentType 为 SELF_ASK_WITH_SEARCH

多跳问题：Multi-hop question，为了得到最终答案，需要进行多步推理或多次查询。这种问题不能直接通过单一的查询或信息源得到答案，而是需要跨越多个信息点，或者从多个数据来源进行组合和整合。

Self-Ask with Search 代理主要用于解决多跳问题。

Plan and execute 通过首先计划要做什么，然后执行子任务来实现目标。

首先，制定一个计划，并将整个任务划分为更小的子任务；然后按照该计划执行子任务。