自Langchain:
blog.langchain.dev/what-is-a-c…
认知架构
A cognitive architecture refers to both a theory about
the structure of the human mind and to a computational instantiation of such a theory used in the fields of artificial intelligence (AI) and
computational cognitive science.
hypothesis about the fixed structures that provide a mind, whether in natural or artificial systems,
and how they work together
— in conjunction with knowledge and skills embodied within the architecture
— to yield intelligent behavior in a diversity of complex environments.
认知架构指的是一种人类心灵结构的理论,也可以指这种心灵结构理论在人工智能(AI)及计算认知科学领域中的计算实现。一个产生思维的固定结构假设(无论是在自然系统还是人工系统中),该假设也说明了这些固定结构是如何与架构中所包含的知识和技能协同工作,从而在复杂环境的多样性中,产生智能行为。
这套理论说明非常费解, Langchain 研究员:
认知架构是指你的系统如何思考—— 换句话说,就是接受用户输入并执行操作或生成响应的代码/提示/LLM 调用的流程。
-
“认知”:因为代理系统依赖于使用 LLM 来推理要做什么。
-
“架构”:因为这些代理系统仍然涉及大量与传统系统架构类似的工程。
AI Agent 是一个用 LLM 来做程序的控制流决策的系统。An AI agent is a system that uses an LLM to decide the control flow of an application.
下面这张图展示了不同层次 Cognitive architecture 的例子:
从上往下不同 level, 从左→右不同阶段
• 标准化的软件代码(code) :一切都是 Hard Code ,输出或输入的相关参数都直接固定在源代码中,这不构成一个认知架构,因为没有 cognitive 的部分;
• LLM Call ,除了一些数据预处理外,单个 LLM 的调用构成了应用程序的大部分,简单的 Chatbot 属于这一类;
• Chain:一系列 LLM 调用,Chain 尝试将问题的解决分成若干步,调用不同的 LLM 解决问题。复杂的 RAG 属于这一种:调用第一个 LLM 用来搜索、查询,调用第二个 LLM 用于生成答案;
• Router:在前面的三种系统中,用户可以提前知道程序会采取的所有步骤,但在 Router 中,LLM 自行决定调用哪些 LLM ,采取怎样的步骤,这增加了更多的随机性和不可预测性;
• State Machine ,将 LLM 与 Router 结合使用,这将更加不可预测,因为这样结合放入循环中,系统可以(理论上)做无限次的 LLM 调用;
• Agentic 的系统:大家也会称为“ Autonomous Agent ”,使用 State Machine 时,对于可以采取哪些操作以及在执行该操作后执行哪些流程仍然存在限制;但当使用 Autonomous Agent 时,这些限制将被删除。LLM 来决定采取哪些步骤、怎样去编排不同的 LLM ,这可以通过使用不同的 Prompt 、工具或代码来完成。
简单来说,一个系统越是“ Agentic ”,LLM 就越大程度地决定系统的行为方式。
Credit from: Agent 最全 Playbook:场景、记忆和交互创新
混个 google agent whitebook 图:
小广告:
ApiSmart
ApiSmart 是ApiHug 插件内置 AI 支持功能; ApiSmart 作为一个入门AI智能编码,和本地AI 学习调试工具, 做到 练学习操 一体;
一边练习,一边增加你对AI 体验, 一边提升你的工作效率, 一箭三雕。
- 精准携上下文, 代码片段位置
- 识别语言, 当然IDEA内非常简单
- 精炼的prompt, 当然你也可以覆盖他
ApiHug 的 ApiSmart 利用 Langchain4j 与大型语言模型(LLM)供应商进行通信;因此基本上任何 Langchain4j 支持的供应商都可以被 ApiSmart 支持;