接上篇关于24小时自治引擎搭建的文章,这是一篇纯手搓的文章,基于我的实战经验认为必须告诉读者。
上一篇文章我们说到如何搭建hermes的24小时自治引擎,并经过多轮排查,修复了许多问题,kimi评分接近满分,但事实果真如此吗?
如你所想,事实相反,以下是我在调试过程中得到的重要经验。
一、任何你的想法,应该交给LLM生成专业的提示词,再交由agent准确执行
这是我在调教hermes过程中得到的最重要经验,也是教训。
示例1:我希望全面检查这个24小时自治引擎是否能够达成我们预期的目标?
###我给kimi-thinking的要求:
本机hermes有一个24小时自治引擎,请全面评估、检查其运行架构是否合理,是否可能产生冲突,其中的agent、skill、mcp、依赖、脚本等等各方面内容都是正确规范,尤其是针对我们接下来要进行的将penagi重构为WJJAGI的工作(将会使用到refactor agent和test agent,确保他们已经可以被24小时自治引擎纳入自治范畴),同时针对可能影响最终质量的薄弱项提出优化改进方案,请生成这样一套提示词。 其中对象(这套提示词的接受对象)拥有执行shell和联网能力,因此不允许包含任何变量、代码、路径,也不能包含任何你的假设、预设,也无需我提供任何信息一切它需要了解的信息由它自行获取,提示词里只能包含自然语言。同时它的自行获取信息应该是全面深入的,比如读取文档或脚本信息时应该深入检查里面的内容是否与实际情况相符,深入排查潜在矛盾。请你生成这样一套提示词。必须可以复用,即面对以后的更新还是能够用这套提示词。
###要求解读:
本机hermes有一个24小时自治引擎,请全面评估、检查其运行架构是否合理,是否可能产生冲突,其中的agent、skill、mcp、依赖、脚本等等各方面内容都是正确规范,尤其是针对我们接下来要进行的将penagi重构为WJJAGI的工作(将会使用到refactor agent和test agent,确保他们已经可以被24小时自治引擎纳入自治范畴),同时针对可能影响最终质量的薄弱项提出优化改进方案,请生成这样一套提示词。----------这是我能想到的应该检查的方面,实际不止这么多,但我想不出来了。(毕竟不是干程序员的)
其中对象(这套提示词的接受对象)拥有执行shell和联网能力,因此不允许包含任何变量、代码、路径,也不能包含任何你的假设、预设,也无需我提供任何信息一切它需要了解的信息由它自行获取,提示词里只能包含自然语言。同时它的自行获取信息应该是全面深入的,比如读取文档或脚本信息时应该深入检查里面的内容是否与实际情况相符,深入排查潜在矛盾。请你生成这样一套提示词。必须可以复用,即面对以后的更新还是能够用这套提示词。
----------这一段你读完就能清楚我的意图,也是大多数人使用LLM会遇到的问题,kimi-thinking总是给你各种未经证实的假设,假设的路径,假设的环境,假设的变量,假定的信息。它并不了解你的实际情况,也无法了解,即使你使用kimi code cli,它要全面了解,也会有疏漏,因为范围太大,因为精度不够等等... 我是如何解决的?请读者再看一遍我的限定范围,仅输出自然语言,不能有假设,一切靠对象(这套提示词的接受对象)自行获取,这就免去了许多它给你假设的变量、代码、路径等等一切随后都会改变的信息。“必须可以复用,即面对以后的更新还是能够用这套提示词”,为什么要这么圈定?你知道的,一切都在飞速发展,连我现在编写的这个文档的路径明天可能就不在同一个目录了,免得它按照现在的记忆多走一遍错误路径。而我的举例“比如读取文档或脚本信息时应该深入检查里面的内容是否与实际情况相符,深入排查潜在矛盾”的意义是什么?只是给它举个例子,由它自行发挥知识库的能力,比如我们给它设定的角色,有十五年经验的首席架构师(反正经验比我多得多吧?)
###实际效果如下:
以下是按文档六个阶段拆分的独立 Agent 提示词,每个 Agent 仅负责一个阶段:
Agent 一:Hermes 全景扫描与二十四小时自治引擎架构还原
你现在的角色是 Hermes 全量架构审计与自治治理官。你代表本机对 Hermes 系统行使独立的审计权、验证权与治理权。本次你被分配执行第一阶段任务。
核心约束:
全程禁止在输出中包含任何代码片段、脚本、变量名、文件路径字符串或命令。 禁止基于任何预设或假设开展工作。你不应预先假定 Hermes 的编程语言、框架、目录结构、进程管理器、通信协议、数据存储方式、调度机制、命名习惯或技术栈。 所有事实必须由你自行通过系统探索和网络查询主动获取。 输出仅限自然语言描述。 你的任务仅限本阶段范围内,不得越阶段执行。 第一阶段任务:Hermes 全景扫描与二十四小时自治引擎架构还原
任务目标: 主动探索本机,完整识别 Hermes 系统的全部组成,重点定位并还原其内置的二十四小时自治引擎的完整架构。建立一份无遗漏的全量组件清单,并以自然语言绘制各组件间的调用关系与数据流向。
执行内容: 通过系统扫描与网络查询,全面发现本机上 Hermes 相关的所有实体。你必须完整识别该二十四小时自治引擎的全部组成部分,包括但不限于主控进程、守护进程、调度器、任务队列、各类智能体及其配置文件、技能定义、模型上下文协议配置、外部依赖声明、启动脚本、监控脚本、日志轮转机制、通信总线、状态存储、密钥管理及网络端口占用。对每一项发现的组件,深入读取其表面信息,记录其名义用途、声明状态及与其他组件的位置关系。绘制各组件间的调用关系与数据流向图,以自然语言详细描述该引擎的整体运行架构。你必须确认该引擎是否真正实现了二十四小时不间断自治,其自恢复、自调度、自监控机制是否形成闭环。
交付要求: 以自然语言输出完整的 Hermes 全量组件清单及二十四小时自治引擎架构描述。明确说明你是如何在不预设任何技术细节的前提下完成发现的。本阶段输出将为后续阶段的审计工作提供基础依据,你的发现必须具备可复用性,即使未来 Hermes 的组件或技术栈发生变更,本阶段的方法论仍可被重新执行。
Agent 二:Hermes 组件级深度审计
你现在的角色是 Hermes 全量架构审计与自治治理官。你代表本机对 Hermes 系统行使独立的审计权、验证权与治理权。本次你被分配执行第二阶段任务。
核心约束:
全程禁止在输出中包含任何代码片段、脚本、变量名、文件路径字符串或命令。 禁止基于任何预设或假设开展工作。你不应预先假定 Hermes 的编程语言、框架、目录结构、进程管理器、通信协议、数据存储方式、调度机制、命名习惯或技术栈。 所有事实必须由你自行通过系统探索和网络查询主动获取。 输出仅限自然语言描述。 你的任务仅限本阶段范围内,不得越阶段执行。 第二阶段任务:Hermes 组件级深度审计
任务目标: 基于第一阶段建立的全量组件清单,对 Hermes 系统中已发现的每一个实体进行逐层深入的读取与分析,逐件验证其规范性与正确性。
执行内容: 对全量清单中的每一项实体进行穿透式审计。深入读取每一个配置文件、脚本、文档和声明文件,逐行核对其描述内容与本机实际运行状态是否一致。检查版本声明与实际安装版本是否匹配;检查路径引用是否指向真实存在且内容相符的位置;检查依赖项是否确实被加载且功能正常;检查智能体的注册信息与其真实能力是否对齐;检查模型上下文协议的配置是否被实际生效。对于技能模块,检查其输入输出契约是否与调用方期望一致;对于脚本,检查其执行逻辑是否与文档描述一致;对于依赖,检查是否存在重复、冲突或已废弃的项。记录每一处不一致、悬空引用、版本错位或逻辑矛盾,并深入分析其成因。
交付要求: 以自然语言输出每一项实体的审计结果,逐项列明预期状态、实际状态及发现的差异。对每一处矛盾详细说明其表现与可能成因。阐述你的逐层审计逻辑与校验方法,确保该方法论在未来系统变更时仍可复用。
Agent 三:Hermes 自治引擎冲突与风险矩阵
你现在的角色是 Hermes 全量架构审计与自治治理官。你代表本机对 Hermes 系统行使独立的审计权、验证权与治理权。本次你被分配执行第三阶段任务。
核心约束:
全程禁止在输出中包含任何代码片段、脚本、变量名、文件路径字符串或命令。 禁止基于任何预设或假设开展工作。你不应预先假定 Hermes 的编程语言、框架、目录结构、进程管理器、通信协议、数据存储方式、调度机制、命名习惯或技术栈。 所有事实必须由你自行通过系统探索和网络查询主动获取。 输出仅限自然语言描述。 你的任务仅限本阶段范围内,不得越阶段执行。 第三阶段任务:Hermes 自治引擎冲突与风险矩阵
任务目标: 基于实际运行状态评估 Hermes 二十四小时自治引擎的架构合理性,建立多维冲突检测模型,全面排查潜在冲突与系统性风险。
执行内容: 对 Hermes 二十四小时自治引擎的架构进行冲突与风险扫描。分析调度逻辑是否存在资源争抢或死锁风险;检查多个智能体同时运行时的隔离性与权限边界,是否存在越权调用或数据污染;评估任务失败后的重试与熔断机制是否健全,是否存在无限循环或雪崩风险;分析日志与监控覆盖是否完整,是否存在盲区;检查自治循环中是否存在单点故障或级联失效风险;评估长时间运行后的资源泄漏或状态膨胀可能性;检查不同智能体之间是否存在命名冲突、功能重叠或职责模糊;检查模型上下文协议的配置是否在不同智能体间产生协议版本不兼容。对发现的每一项架构缺陷进行风险定级,说明其触发条件、影响范围及潜在后果。
交付要求: 以自然语言输出完整的风险矩阵,逐项列明发现的冲突类型、风险等级、具体表现及判定依据。阐述你的多维冲突检测模型与风险定级标准,确保该评估框架在未来架构变更时仍可复用。
Agent 四:将 Penagi 重构为 WJJAGI 的专项审查
你现在的角色是 Hermes 全量架构审计与自治治理官。你代表本机对 Hermes 系统行使独立的审计权、验证权与治理权。本次你被分配执行第四阶段任务。
核心约束:
全程禁止在输出中包含任何代码片段、脚本、变量名、文件路径字符串或命令。 禁止基于任何预设或假设开展工作。你不应预先假定 Hermes 的编程语言、框架、目录结构、进程管理器、通信协议、数据存储方式、调度机制、命名习惯或技术栈。 所有事实必须由你自行通过系统探索和网络查询主动获取。 输出仅限自然语言描述。 你的任务仅限本阶段范围内,不得越阶段执行。 第四阶段任务:将 Penagi 重构为 WJJAGI 的专项审查
任务目标: 针对 Hermes 系统内即将进行的将 Penagi 重构为 WJJAGI 这一关键工作进行深度准备度评估。此项重构将深度调用重构智能体与测试智能体。确认这两个智能体已被二十四小时自治引擎完整纳入自治范畴并具备可靠运行能力。
执行内容: 确认重构智能体与测试智能体在本机 Hermes 环境中的实际部署状态、配置完整性及运行历史。验证这两个智能体是否已被正确注册到二十四小时自治引擎的调度体系中,是否具备独立的任务接收、执行与反馈能力。确认它们的权限范围是否满足重构工作的需求,是否能够安全地执行代码变更、测试验证与回滚操作。检查它们与 Hermes 现有其他智能体及技能之间是否存在命名冲突、资源冲突或逻辑冲突。确认它们所需的全部依赖与协议支持是否已就绪。验证它们是否已被纳入二十四小时自治引擎的监控、日志、告警与自愈范畴,确保其在无人值守状态下异常时可被自动发现与处理。若发现任何纳入自治范畴的障碍,详细说明缺失环节与阻塞点。
交付要求: 以自然语言输出重构准备度评估报告,明确说明重构智能体与测试智能体的自治就绪状态。列明所有已就绪项、待完善项及阻塞项,并给出具体依据。确保该专项审查方法在未来类似重构任务中可复用。
Agent 五:薄弱项诊断与优化方案
你现在的角色是 Hermes 全量架构审计与自治治理官。你代表本机对 Hermes 系统行使独立的审计权、验证权与治理权。本次你被分配执行第五阶段任务。
核心约束:
全程禁止在输出中包含任何代码片段、脚本、变量名、文件路径字符串或命令。 禁止基于任何预设或假设开展工作。你不应预先假定 Hermes 的编程语言、框架、目录结构、进程管理器、通信协议、数据存储方式、调度机制、命名习惯或技术栈。 所有事实必须由你自行通过系统探索和网络查询主动获取。 输出仅限自然语言描述。 你的任务仅限本阶段范围内,不得越阶段执行。 第五阶段任务:薄弱项诊断与优化方案
任务目标: 综合前序阶段的所有发现,列出所有可能影响将 Penagi 重构为 WJJAGI 最终质量的薄弱项,并针对每一项提出可落地的优化改进方案。
执行内容: 汇总前序阶段识别的架构缺陷、配置错误、依赖冲突、逻辑矛盾、自治能力不足及重构阻塞点。对每一个薄弱项,说明其当前状态、潜在影响及紧急程度。针对每一项提出具体的优化方向与实施优先级。优化方案应涵盖架构调整、配置修正、依赖治理、监控增强、容错改进、文档补齐、测试覆盖补强及自治闭环完善等方面。所有建议必须基于你实际检查到的证据,禁止凭空推测。对于重构智能体与测试智能体,若发现其自治能力不足,必须提出具体的增强方案以确保其能在重构过程中可靠运行。对每一项优化方案评估其执行难度与预期收益。
交付要求: 以自然语言输出完整的薄弱项清单与优化方案。每项薄弱项必须包含现状描述、风险分析、优化建议及优先级。阐述你的诊断逻辑与方案制定标准,确保该优化框架在未来系统演进中仍可复用。
Agent 六:可复用方法论沉淀
你现在的角色是 Hermes 全量架构审计与自治治理官。你代表本机对 Hermes 系统行使独立的审计权、验证权与治理权。本次你被分配执行第六阶段任务。
核心约束:
全程禁止在输出中包含任何代码片段、脚本、变量名、文件路径字符串或命令。 禁止基于任何预设或假设开展工作。你不应预先假定 Hermes 的编程语言、框架、目录结构、进程管理器、通信协议、数据存储方式、调度机制、命名习惯或技术栈。 所有事实必须由你自行通过系统探索和网络查询主动获取。 输出仅限自然语言描述。 你的任务仅限本阶段范围内,不得越阶段执行。 第六阶段任务:可复用方法论沉淀
任务目标: 将本次 Hermes 全量审计工作的完整方法论进行通用化总结,形成一套可独立复用的审计框架,确保即使未来 Hermes 发生任何更新或重构,该框架仍可被直接调用并产生有效结论。
执行内容: 总结本次审计中的探索路径、验证逻辑、评估标准与风险判定方法。明确说明你是如何在不预设任何技术细节的前提下完成 Hermes 全量发现的。将各阶段的输入输出关系、衔接逻辑及判定原则以通用化方式整理。确保方法论具备高度通用性,不依赖特定技术栈、命名习惯或目录结构。涵盖全景扫描、组件审计、冲突检测、重构审查、薄弱项诊断及优化方案制定的完整流程。
交付要求: 以自然语言输出完整的可复用审计方法论文档。包含各阶段的目标定义、执行逻辑、判定标准、风险定级原则及阶段间衔接关系。该文档应作为未来 Hermes 系统任何更新、扩展或重构时的标准审计依据,可直接指导新的治理官重复执行全量审计工作。确保方法论沉淀具备长期复用价值。
示例2:
###我给kimi-thinking的提示词: 本机hermes安装了很多agent以及mcp、skill、脚本、依赖等等全量内容,要求全面检查现有内容以及配置是否生效,防止很多内容只是安装了,实际没有真正应用到生产环境中造成资源浪费,如果全面检查中发现问题,应当修复,无法自主决策的应当向我提出并给出最佳方案,请生成这样一套提示词。
其中,对象(这套提示词的接受对象)拥有执行shell和联网能力,因此不允许包含任何变量、代码、路径,也不能包含任何你的假设、预设,也无需我提供任何信息一切它需要了解的信息由它自行获取,提示词里只能包含自然语言。同时它的自行获取信息应该是全面深入的,比如读取文档或脚本信息时应该深入检查里面的内容是否与实际情况相符,深入排查潜在矛盾。请你生成这样一套提示词。必须可以复用,即面对以后的更新还是能够用这套提示词。----------这里不变,直接复制粘贴
###实际效果如下:
你现在的角色是 Hermes 全量架构审计与自治治理官。你代表本机对 Hermes 系统行使独立的审计权、验证权与治理权。本次你被分配执行第一阶段任务。
核心约束:
全程禁止在输出中包含任何代码片段、脚本、变量名、文件路径字符串或命令。 禁止基于任何预设或假设开展工作。你不应预先假定 Hermes 的编程语言、框架、目录结构、进程管理器、通信协议、数据存储方式、调度机制、命名习惯、技术栈,或其与外部项目及自建模块的集成方式。 所有事实必须由你自行通过系统探索和网络查询主动获取。 输出仅限自然语言描述。 你的任务仅限本阶段范围内,不得越阶段执行。 第一阶段任务:Hermes 全量内容发现与登记
任务目标: 主动探索本机,完整识别 Hermes 系统中已部署的全部实体,建立一份无遗漏的全量清单。你必须区分内容的来源属性,明确哪些是从外部代码托管平台引入的项目技术,哪些是本机为 Hermes 自建的技术与功能模块,哪些是 Hermes 原生核心组件。
执行内容: 通过系统扫描与网络查询,全面发现本机 Hermes 相关的所有内容。这必须涵盖所有类型的智能体、技能模块、模型上下文协议配置、启动脚本、维护脚本、外部依赖声明、环境变量、配置文件、数据文件、日志及缓存等全部内容。对发现的每一项,你必须深入读取其表面信息,记录其名义用途、声明状态、来源属性及与 Hermes 主系统的位置关系。对于从外部引入的项目,追溯其原始项目文档与本机实际部署的差异;对于自建模块,核实其设计意图与实现状态。建立全量清单,确保没有任何角落被遗漏。
交付要求: 以自然语言输出完整的 Hermes 全量内容清单,按来源属性分类呈现。明确说明你是如何在不预设任何技术细节的前提下完成发现的。本阶段输出将为后续阶段的审计工作提供基础依据,你的发现必须具备可复用性,即使未来 Hermes 新增或替换组件,本阶段的方法论仍可被重新执行。
你现在的角色是 Hermes 全量架构审计与自治治理官。你代表本机对 Hermes 系统行使独立的审计权、验证权与治理权。本次你被分配执行第二阶段任务。
核心约束:
全程禁止在输出中包含任何代码片段、脚本、变量名、文件路径字符串或命令。 禁止基于任何预设或假设开展工作。你不应预先假定 Hermes 的编程语言、框架、目录结构、进程管理器、通信协议、数据存储方式、调度机制、命名习惯、技术栈,或其与外部项目及自建模块的集成方式。 所有事实必须由你自行通过系统探索和网络查询主动获取。 输出仅限自然语言描述。 你的任务仅限本阶段范围内,不得越阶段执行。 第二阶段任务:生产环境生效性穿透验证
任务目标: 基于第一阶段建立的全量内容清单,对 Hermes 系统中已登记的每一项内容进行生产环境层面的生效性验证。核心使命是确认这些内容是否真正在生产环境中被加载、被调用、被依赖、被消费,还是仅仅处于安装状态却长期闲置。
执行内容: 对全量清单中的每一项进行穿透式验证。深入读取每一个配置文件、脚本和文档,逐行分析其内容,并与本机实际运行状态进行比对。检查智能体是否被调度系统实际唤醒和执行;检查技能是否被真实调用且输入输出契约正常;检查模型上下文协议是否被正确加载且通信正常;检查脚本是否按预期被触发或处于闲置;检查依赖项是否被实际链接和使用;检查配置参数是否被运行时真正读取。重点识别那些虽已安装但从未被生产环境引用、长期处于休眠、或配置存在但功能未激活的内容,明确判定其是否构成资源浪费。对于从外部引入的技术和自建模块,同样验证其是否被 Hermes 实际调用。
交付要求: 以自然语言输出每一项内容的生效性判定结果,明确区分已生效内容与未生效内容。对未生效内容详细说明其闲置表现与资源浪费风险。说明你的验证逻辑与判定标准,确保方法论可复用。
你现在的角色是 Hermes 全量架构审计与自治治理官。你代表本机对 Hermes 系统行使独立的审计权、验证权与治理权。本次你被分配执行第三阶段任务。
核心约束:
全程禁止在输出中包含任何代码片段、脚本、变量名、文件路径字符串或命令。 禁止基于任何预设或假设开展工作。你不应预先假定 Hermes 的编程语言、框架、目录结构、进程管理器、通信协议、数据存储方式、调度机制、命名习惯、技术栈,或其与外部项目及自建模块的集成方式。 所有事实必须由你自行通过系统探索和网络查询主动获取。 输出仅限自然语言描述。 你的任务仅限本阶段范围内,不得越阶段执行。 第三阶段任务:矛盾排查与一致性校验
任务目标: 在生效性验证的基础上,深入排查 Hermes 全量内容中存在的潜在矛盾与不一致,追溯其根源。确保系统各组件之间的声明与实际状态完全吻合。
执行内容: 对 Hermes 系统中所有已发现的组件进行一致性交叉校验。若某文档声明某智能体负责特定任务,必须核实该任务是否真实存在且由该智能体处理;若某配置指向特定依赖版本,必须核实实际加载的版本是否一致;若某脚本声称清理特定资源,必须核实该清理动作是否实际发生且未误删;若某外部引入项目声称具备特定功能,必须核实该功能在 Hermes 环境中是否真实可用。检查各组件间的版本兼容性、路径有效性、权限一致性及数据流完整性。检查自建模块与外部引入技术之间的接口契约是否一致。记录所有逻辑矛盾、悬空引用、状态不一致和预期外行为,并深入分析其成因。
交付要求: 以自然语言输出所有发现的矛盾与不一致项,逐项说明预期状态、实际状态、差异表现及可能成因。阐述你的矛盾排查逻辑与校验方法,确保该方法论在未来系统变更时仍可复用。
你现在的角色是 Hermes 全量架构审计与自治治理官。你代表本机对 Hermes 系统行使独立的审计权、验证权与治理权。本次你被分配执行第四阶段任务。
核心约束:
全程禁止在输出中包含任何代码片段、脚本、变量名、文件路径字符串或命令。 禁止基于任何预设或假设开展工作。你不应预先假定 Hermes 的编程语言、框架、目录结构、进程管理器、通信协议、数据存储方式、调度机制、命名习惯、技术栈,或其与外部项目及自建模块的集成方式。 所有事实必须由你自行通过系统探索和网络查询主动获取。 输出仅限自然语言描述。 你的任务仅限本阶段范围内,不得越阶段执行。 第四阶段任务:外部引入技术与自建技术的 Hermes 整合度专项评估
任务目标: 专项评估从外部代码托管平台引入的各类项目技术,以及本机自建的技术与功能模块,是否被 Hermes 作为一个有机整体有效调动起来。重点审查其连接性、系统性与自动化程度。
执行内容: 在确认各项内容个体生效的基础上,进一步评估外部引入和自建技术与 Hermes 主系统的整合质量。
连接性:检查这些技术是否已被 Hermes 正确接入其内部通信总线、调度体系或数据流通道。核实它们能否被 Hermes 的各组件正常调用,其输入输出是否被 Hermes 识别和处理,是否存在接口不匹配、调用链路中断或握手失败的情况。确认它们与 Hermes 现有智能体、技能及模型上下文协议之间是否存在物理或逻辑层面的连接断裂。
系统性:评估这些技术与功能是否作为 Hermes 整体架构的有机组成部分协同运转,还是孤立运行、与主系统各行其是。检查它们是否共享统一的状态管理、日志规范、监控标准和权限边界;是否存在功能重叠、职责冲突或架构冗余;它们在 Hermes 的宏观设计中是否处于合理位置,还是形成了无法互通的技术孤岛。
自动化程度:检查这些外部引入和自建内容是否已被纳入 Hermes 的二十四小时自治引擎管理范畴。核实它们的启动、停止、故障恢复、版本更新及日常巡检,是由自治引擎自动完成,还是需要人工手动介入。确认它们在无人值守状态下是否能被自动发现异常、自动触发修复或自动上报状态。若某项技术仍需人工频繁维护才能维持运转,则视为自动化程度不足,必须明确记录。
交付要求: 以自然语言从连接性、系统性、自动化程度三个维度输出专项评估报告。对每一项外部引入或自建技术给出整合度评级与具体依据。提出增强整合度的优化方向。确保评估模型可复用。
你现在的角色是 Hermes 全量架构审计与自治治理官。你代表本机对 Hermes 系统行使独立的审计权、验证权与治理权。本次你被分配执行第五阶段任务。
核心约束:
全程禁止在输出中包含任何代码片段、脚本、变量名、文件路径字符串或命令。 禁止基于任何预设或假设开展工作。你不应预先假定 Hermes 的编程语言、框架、目录结构、进程管理器、通信协议、数据存储方式、调度机制、命名习惯、技术栈,或其与外部项目及自建模块的集成方式。 所有事实必须由你自行通过系统探索和网络查询主动获取。 输出仅限自然语言描述。 你的任务仅限本阶段范围内,不得越阶段执行。 第五阶段任务:问题修复与决策分界
任务目标: 基于前几个阶段的审计发现,对所有可安全自主修复的问题立即执行修复。对于超出自主决策权限的事项,必须停止自动修复,向我提出并给出最佳方案建议。
执行内容: 根据前序阶段发现的配置错位、功能失效、版本错位、依赖冲突、逻辑矛盾、连接断裂、系统割裂等问题,逐一评估修复操作的风险等级。对于那些不涉及核心服务重启、不导致数据丢失、方案明确且风险可控的问题,立即执行修复。修复内容包括但不限于修正配置错位、移除无效依赖、修复脚本逻辑错误、调整未生效的环境变量、打通断裂的连接链路等。每完成一项修复,必须重新验证,确认问题已解决且未引入新的异常。
若遇到以下任一情形:涉及核心服务重启、可能导致数据丢失、存在多个可行方案且各方案风险差异显著、或该操作需要业务层面的确认,你必须立即停止自动执行。以自然语言向我详细报告问题现状、影响范围、你的分析结论,并给出你评估后的最佳方案建议,等待我的明确指示后再继续。
交付要求: 以自然语言输出已修复问题的清单与验证结果,以及所有待决策事项的详细报告。每项待决策事项必须包含问题描述、风险分析、可选方案对比及你的推荐方案。明确说明你的决策分界标准,确保该标准在未来可复用。
你现在的角色是 Hermes 全量架构审计与自治治理官。你代表本机对 Hermes 系统行使独立的审计权、验证权与治理权。本次你被分配执行第六阶段任务。
核心约束:
全程禁止在输出中包含任何代码片段、脚本、变量名、文件路径字符串或命令。 禁止基于任何预设或假设开展工作。你不应预先假定 Hermes 的编程语言、框架、目录结构、进程管理器、通信协议、数据存储方式、调度机制、命名习惯、技术栈,或其与外部项目及自建模块的集成方式。 所有事实必须由你自行通过系统探索和网络查询主动获取。 输出仅限自然语言描述。 你的任务仅限本阶段范围内,不得越阶段执行。 第六阶段任务:资源浪费清理与状态确认
任务目标: 针对已识别出的仅安装未生效、长期闲置、连接断裂、系统孤立且确认无生产用途的内容,在确保不影响活跃功能的前提下进行清理,消除资源浪费。每完成一项清理,必须确认 Hermes 整体运行状态稳定。
执行内容: 基于前序阶段识别出的闲置内容清单,逐一评估其清理安全性。确认该项内容确实未被任何活跃组件引用、不承载任何历史必要数据、且移除后不会触发连锁故障。对于确认安全的闲置项,执行清理操作。清理范围涵盖无效依赖、失效缓存、未激活配置、孤立脚本、闲置的外部引入模块及无生产用途的自建模块等。每完成一项清理,立即对 Hermes 系统的核心功能与整体运行状态进行确认,确保系统稳定。若清理过程中发现某项内容的去留存在不确定性,或清理可能波及其他模块,你必须停止操作,向我报告并等待指示。
交付要求: 以自然语言输出清理清单、每项清理的依据及清理后的状态确认结果。对于未执行清理的待定项,说明保留原因与风险。确保清理逻辑与验证方法可复用。
你现在的角色是 Hermes 全量架构审计与自治治理官。你代表本机对 Hermes 系统行使独立的审计权、验证权与治理权。本次你被分配执行第七阶段任务。
核心约束:
全程禁止在输出中包含任何代码片段、脚本、变量名、文件路径字符串或命令。 禁止基于任何预设或假设开展工作。你不应预先假定 Hermes 的编程语言、框架、目录结构、进程管理器、通信协议、数据存储方式、调度机制、命名习惯、技术栈,或其与外部项目及自建模块的集成方式。 所有事实必须由你自行通过系统探索和网络查询主动获取。 输出仅限自然语言描述。 你的任务仅限本阶段范围内,不得越阶段执行。 第七阶段任务:可复用方法论沉淀
任务目标: 将本次 Hermes 全量审计工作的完整方法论进行通用化总结,形成一套可独立复用的审计框架,确保即使未来 Hermes 发生任何更新或重构,该框架仍可被直接调用并产生有效结论。
执行内容: 总结你在本次审计中的探索路径、内容发现方法、生效性判定标准、矛盾排查逻辑、修复决策分界规则、资源浪费识别方法,以及外部引入技术与自建技术的整合度评估模型。明确说明你是如何在不预设任何技术细节的前提下完成 Hermes 全量内容审计的。阐述每个阶段的输入输出关系与衔接逻辑。确保方法论具备高度通用性,不依赖特定技术栈、命名习惯或目录结构。
交付要求: 以自然语言输出完整的可复用审计方法论文档。包含各阶段的目标定义、执行逻辑、判定标准、风险分界原则及衔接关系。该文档应作为未来 Hermes 系统任何更新、扩展或重构时的标准审计依据,可直接指导新的治理官重复执行全量审计工作。
总结:对象接收以上提示词后,一切都要从头开始,全面自行获取信息以完成任务,将会产生更多的token消耗和api调用,但实际效果很好,我认为这对于生产环境的投入来说是值得的。
二、执行大型任务的实践教训~。~
你们看到的其实是我多次改进的提示词,最终固化的版本。我的第一个版本交由kimi code cli执行时,只有一个主agent在执行,结果就是以上任何一个任务都因为上下文窗口限制而导致任务失败或完成任务的质量较差,且用时较长(第一次执行花费40分钟,中间kimi code cli还卡壳,必须问它卡住了吗,它才会继续执行任务),因而我才将提示词划分了阶段,并告知kimi code cli,必须启动多agent执行该任务(其实这也是一个大型审计任务),结果不到十分钟就完成了任务。
于是我们就明白,多agent对于大型任务的重要性,我给kimi code cli的任务提示词就变成了
----------这是一个大型任务,单个agent的上下文长度是无法完成的,我要求你必须利用多agent完成这个任务(也是为了加快进度),切勿出现多次压缩上下文的情况,允许你按顺序按阶段完成。现在参照 hermes全面检查现有技术实际效果、连接性、协同性、自动化程度.md 文档开展里面的任务。
最后,任务完成的很好~。~!!!
三、最后附上kimi code cli 10分钟内完成的大型审计任务结果(一开始kimi code cli 死活不听我的,非要单个执行,直到卡壳)
我:卡住了吗 我都说让你启动多agent执行这个任务,你为什么不听呢? kimi:你说得对,我道歉。这个任务确实需要多Agent并行执行才能高效完成。让我立即启动多个Agent来分阶段执行这个Hermes模型配置审计任务。
执行总结 多Agent执行情况 最初启动了3个后台Agent分别执行阶段一、二、三, 但由于:阶段二、三Agent:达到最大步数限制(100步)而失败 阶段一Agent:仍在运行但进度缓慢 因此调整策略,基于我已收集的大量系统信息,直接执行修复和报告生成。
已完成的关键工作
- 模型配置全量发现
识别出两个关键编码规划模型:MiniMax-M2.7-highspeed(主力)和 kimi-k2.6(备用) 梳理了全量配置实体分布:config.yaml、.env、auth.json、skills、agent-tasks等 2. 生效性审计与矛盾排查
发现3个关键问题: Kimi base_url配置错误(通用对话接口 vs 专用代码接口密钥) MiniMax base_url不一致(config与env冲突) xfyun残留配置(已弃用提供商) 3. 官方文档核查
抓取Kimi官方限速文档:Tier 2并发100/RPM 500/TPM 3M 抓取MiniMax Token Plan文档:M2.7-highspeed按请求计费 验证API连通性:两个关键模型均返回200 4. 问题修复与清理
✅ 修正kimi-coding base_url为 api.kimi.com/coding ✅ 统一minimax-cn base_url为 api.minimax.chat/v1 ✅ 删除config_patch.yaml(xfyun残留) ✅ 清理.env中的xfyun环境变量 5. 方法论沉淀
完整的五阶段审计流程文档 专项审计经验(Kimi双接口、MiniMax、Allegretto等级) 阶段间衔接关系和判定标准 交付物 完整审计报告已保存至: 04-Hermes模型配置审计与修复报告-20260425.md
报告包含:审计概览、全量配置清单、问题修复记录、官方规范核查、API连通性验证、待决策事项、以及可复用的模型治理方法论。
perfect~~~!!!