低代码平台接入 Agent 后,我们踩到的组件、上下文和追问坑

0 阅读14分钟

本文复盘一次内部低代码平台智能助手的阶段性验证。

目标很直接:用户在聊天入口里发送设计图、切图链接,或者一段文字描述,Agent 理解需求后调用低代码平台能力,生成页面或配置页链接。

早期简单场景可以跑通:

  • 一张图的规则页可以生成页面结果;
  • 单组件需求可以匹配组件并生成可编辑配置;
  • 熟悉平台的人可以通过补充组件描述,让 Agent 生成页面骨架。

但真实需求一复杂,问题也很快暴露出来:

  • 组件一多,生成结果开始不稳定;
  • 对话轮次一多,Agent 可能丢掉前面已经修改过的组件;
  • 遇到需要追问的场景时,系统可能把“追问内容”当成最终结果保存,反而丢掉前面已经生成出的有效结果;
  • 每次改 Prompt、组件描述或工具调用逻辑之后,缺少稳定的回归验证方式。

这次实践给我们的结论是:

低代码页面生成不是一次性的文本生成任务,而是一个带状态、带工具调用、带平台约束的工程流程。

所以它真正难的不是“让模型生成一次页面”,而是让生成结果能被平台理解、能继续编辑、能多轮修改、能追问补齐信息,并且每次调整后都能验证是否真的变好了。

1. 生成链路:它不是让 AI 自由画页面

低代码平台的核心资产不是一张空白画布,而是一批已经沉淀好的组件、参数、规则和配置能力。

所以这个 Agent 的定位不是“让 AI 随便画一个看起来差不多的页面”,而是给低代码平台增加一个自然语言入口。

整体链路可以简化成这样:

ig_08bea2cc5ff5fd15016a0d85e8ff7481919dabb65234f73f26.png

这个定位决定了后面所有工程取舍。

如果只是做 Demo,生成一个视觉上接近的页面就够了。但进入低代码平台之后,生成结果必须满足几个条件:

  • 只能使用平台真实存在的组件;
  • 组件参数要符合平台约束;
  • 生成出的页面配置要能被编辑器继续打开和修改;
  • 复杂场景里缺少信息时,要能正确追问;
  • 多轮修改时,不能把上一轮已经确认的组件改丢;
  • 后续要有测试样例验证生成质量。

换句话说,AI 的价值不是绕过低代码平台,而是更低成本地调用平台已有能力。

ig_092fc40abe7b5fc3016a0d6d81c0ec8191b0a82777166823f2.png

2. 第一阶段能跑通什么,边界在哪里

第一阶段验证里,比较稳定的场景集中在三类。

2.1 一张图的规则页

用户给出图片和描述后,Agent 根据输入生成对应页面。

这类页面结构相对固定,组件数量少,平台侧可选组件也比较明确,所以更容易生成可预览结果。

2.2 单组件页面

比如只需要一个弹窗组件、头图组件或者某个业务组件时,Agent 根据用户补充的少量参数,可以匹配组件并生成初始配置。

这个场景的关键是:任务边界足够窄。

它不需要同时判断很多组件之间的顺序、参数依赖和页面结构,所以更适合作为早期验证场景。

ig_092fc40abe7b5fc3016a0d6e9976188191a61522051481a09f.png

2.3 熟悉平台的人辅助生成骨架

如果使用者本身熟悉低代码平台,能明确告诉 Agent 页面里有哪些组件、每个组件承担什么功能,它就更容易先生成页面骨架,再由人工继续核改。

这个场景很适合内部提效,但它也提醒我们:当前能力还不是“无门槛自动生成复杂页面”,而是“在边界清楚的前提下,帮助人更快生成初版”。

可以把当前适用边界先收敛成一张表:

场景当前适配度原因
单图规则页较高结构固定,组件少
单组件页面较高任务边界清晰,参数较少
熟悉平台的人生成骨架中等偏高人能补充组件和参数上下文
多组件复杂页面不稳定组件选择、顺序、参数约束同时变复杂
长对话持续修改不稳定容易丢失已确认组件或误判任务边界

这一步判断很重要。很多 AI 项目早期最容易犯的错误,就是把 Demo 场景里的顺畅,误判成真实场景里的稳定。

3. 复杂需求上来后,问题从“生成”变成“状态管理”

真正的问题出现在复杂页面里。

真实页面通常不是单组件。一个活动页可能同时包含头图、规则、按钮、跳转、状态展示、弹窗、列表、业务卡片和各种配置参数。

组件一多,Agent 需要处理的就不只是“选一个组件填几个参数”,而是:

  • 哪些组件可以满足需求;
  • 多个组件之间是什么顺序;
  • 哪些参数必填,哪些可以默认;
  • 缺少信息时应该追问什么;
  • 用户补充信息后,应该更新哪个组件;
  • 新一轮输入是在改当前页面,还是开始一个新页面。

这时问题就从“能不能生成”变成了“状态能不能管住”。

3.1 坑一:追问时丢掉了已有中间结果

一次复杂需求里,用户希望生成一个包含头图、轮播视频图,以及两行两个主播的页面。

Agent 能理解大致方向,但落到实际配置时,还需要继续追问视频链接、封面图、主播数据、跳转信息等内容。

追问本身是合理的。

真正的问题在于,早期追问流程没有处理好:系统会把追问内容直接保存,反而没有保留前面已经搜索或生成出的有效结果,导致页面里的组件不正确。

从聊天视角看,这只是“问用户补充一个信息”。但从工程视角看,追问背后对应的是一个未完成任务、一部分页面结构,以及已经拿到的中间结果。

如果系统没有把这些状态保存住,追问就会变成覆盖。

后续修复后,追问时可以继续保留上下文,至少不会因为一次补充信息就把前面的有效结果丢掉。

ig_092fc40abe7b5fc3016a0d6f58e9a88191bbeab2834f0ff76c.png

3.2 坑二:多轮修改时丢弃已确认组件

页面生成不是一次性对话。

用户很可能会连续说:

  • 把头图换成另一张;
  • 第二个组件参数调一下;
  • 增加一个按钮;
  • 按钮跳转到另一个页面;
  • 再补一个弹窗。

如果前一轮刚确认的组件,下一轮因为一句新指令被覆盖掉,用户很快就会失去信任。

这个问题不能简单归因于“模型没理解”。更准确地说,是系统没有把当前页面结构、已确认组件、待补参数和本轮修改目标建模清楚。

3.3 坑三:任务结束判断不稳定

还有一个容易被低估的问题:一个页面需求什么时候算结束?

用户下一句话到底是在补充同一个页面,还是开始了一个新页面?

如果完全交给模型自动判断,实际效果会不稳定。当前更稳妥的方式,是通过手动结束会话来显式标记任务边界,避免系统误把不同页面认成同一个任务,或者把同一个任务拆成多个页面。

这类设计看起来不够“智能”,但在工程早期更可靠。

4. 四个必须收紧的工程边界

踩坑之后,我们发现问题不只是模型能力。

模型当然会影响理解和生成效果,但内部 Agent 要进入业务工具,必须先把工程边界收紧。

4.1 组件边界:不能让模型想象不存在的组件

低代码平台不是自由画布。

Agent 不能为了满足用户描述,想象一个平台里不存在的组件,也不能随意创造平台不支持的参数。

所以组件描述不能只写“这个组件是做什么的”,还需要补充:

  • 适用场景;
  • 不适用场景;
  • 必填参数;
  • 参数约束;
  • 示例输入;
  • 示例输出;
  • 缺信息时的追问方式;
  • 不支持时的返回策略。

组件说明对 Agent 来说不是普通文档,而是它选择工具、生成配置和处理异常时的重要依据。

4.2 上下文边界:页面生成需要任务状态

普通聊天可以模糊一点,但页面配置不行。

一个页面生成任务里,至少要记录:

  • 当前页面包含哪些组件;
  • 每个组件是否已确认;
  • 哪些参数还缺失;
  • 本轮用户输入作用于哪个组件;
  • 当前任务是否已经结束;
  • 下一轮是继续编辑还是新建页面。

如果没有任务状态,Agent 很容易在多轮对话里“看起来很努力”,但实际上把页面越改越乱。

4.3 工具调用边界:中间结果、追问和最终保存要分开

Agent 调用平台能力时,工具返回结果、用户追问、异常信息和最终保存结果应该有清晰流转。

尤其是追问场景,系统需要保留已经拿到的有效结果,而不是因为缺少某个参数,就把追问内容覆盖成最终结果。

一个更稳的流程应该接近这样:

识别需求
  -> 匹配组件
  -> 生成部分配置
  -> 判断缺失参数
  -> 保存中间状态
  -> 向用户追问
  -> 合并补充信息
  -> 再次生成 / 更新配置
  -> 最终保存

这里的关键不是流程图多漂亮,而是“中间状态”和“最终结果”不能混在一起。

4.4 验证边界:不能靠感觉判断这次变好了

页面生成不能只靠肉眼看一眼,也不能每次出问题都靠人工读日志、贴上下文、让代码 Agent 猜哪里错。

一旦日志变长、上下文变复杂,这种排查方式会非常低效。

更需要补上的是可回归验证机制。至少要覆盖几类样例:

  • 简单单图生成;
  • 单组件参数生成;
  • 多组件页面骨架生成;
  • 多轮修改不丢组件;
  • 追问后继续保留原有效结果;
  • 手动结束会话后不再误关联上一页;
  • 不支持组件时能正确拒绝或继续追问。

这样每次调整组件描述、工具调用逻辑或模型策略时,团队才知道它到底变好了,还是只是这一次碰巧跑通。

5. 一套更适合落地的迭代路径

这次验证之后,我们没有继续盲目扩大需求范围,而是先把问题收窄。

5.1 先做高频组件,不追求全组件覆盖

低代码平台里的组件很多,但真实高频使用的往往只是其中一部分。

早期与其追求全量覆盖,不如先把高频组件的描述、参数、示例和限制条件写清楚。

这一步的目标不是“看起来支持很多”,而是让最常见的场景先稳定下来。

5.2 把组件经验翻译成 Agent 能执行的规则

很多平台经验原本存在于研发、运营或熟练使用者脑子里。

比如:

  • 哪个组件适合规则页;
  • 哪个组件适合活动入口;
  • 哪些参数不能同时出现;
  • 缺少跳转信息时应该先问什么;
  • 哪些复杂需求只能先生成骨架,不能承诺全自动完成。

这些经验如果不显式写出来,Agent 只能靠模型推理去猜。

真正要做的是把这些经验翻译成结构化的组件能力说明和测试样例。

5.3 业务侧和平台侧分工要清楚

业务 Agent 接入平台时,业务侧和平台侧的边界要先分清。

低代码平台侧更应该关注:

  • 高频组件;
  • 组件能力说明;
  • 页面生成样例;
  • 失败样例;
  • 人工核改边界。

通用 Agent 平台更适合承接:

  • 会话状态;
  • 工具注册;
  • 日志分析;
  • 执行环境;
  • 权限审计;
  • 失败恢复;
  • 回归验证。

这样业务侧不用每次都从零搭一套 Agent 服务,而是把精力放回自己的业务能力描述、组件边界和验证样例上。

6. 可复用 Checklist

如果你也在做“Agent + 内部业务工具”或“AI + 低代码平台”,可以先用这份检查清单过一遍。

6.1 组件和能力描述

  • 组件是否有明确适用场景?
  • 是否写清了不适用场景?
  • 必填参数和可选参数是否区分清楚?
  • 参数之间是否有约束说明?
  • 是否提供了标准示例和反例?
  • 不支持的需求应该拒绝,还是继续追问?

6.2 多轮对话和状态管理

  • 当前任务是否有唯一上下文?
  • 页面里已确认的组件是否被保存?
  • 本轮修改作用在哪个组件上?
  • 缺失参数是否有单独状态?
  • 用户什么时候结束当前页面任务?
  • 新任务和旧任务如何隔离?

6.3 工具调用和结果保存

  • 工具返回结果是否和用户追问分开?
  • 中间结果是否会被追问内容覆盖?
  • 异常信息是否可追踪?
  • 最终保存前是否有必要校验?
  • 失败后是否能恢复到上一个有效状态?

6.4 质量验证

  • 是否有固定测试样例?
  • 是否能对比生成配置差异?
  • 是否记录失败原因分类?
  • 是否能复现多轮修改问题?
  • 是否能验证一次改动对多个场景的影响?

7. 总结:从能跑到可用,差的是工程闭环

如果只看第一次生成页面,AI 低代码页面生成很容易让人兴奋:图片丢进去,页面出来;一句话过去,配置页链接回来。

但工程团队真正要关心的是:

  • 复杂一点还能不能生成;
  • 多轮修改会不会破坏已有结果;
  • 缺信息时能不能正确追问;
  • 工具调用异常能不能恢复;
  • 生成结果能不能回到平台继续编辑;
  • 每次调整后有没有回归验证。

所以这次探索给我们的结论不是“AI 已经可以完全替代页面搭建”,而是更接近工程落地的一句话:

内部 Agent 想要真正可用,不能只追求模型更强,还要让业务规则、状态管理、工具调用和验证闭环一起成熟。

低代码平台里,组件和配置本身就是工程资产。AI 的价值不是绕开这些资产,而是更低成本地理解、调用,并把结果重新放回平台流程里。

先从高频组件开始,把简单页面做稳;再用测试和日志把问题收集回来,逐步扩大能力边界。这条路没有一次 Demo 那么漂亮,但它更接近真实工程落地。


花椒技术交流群

还在孤军研究 AI 工程化、AI 编程、Agent 落地,没人同行交流、没人拆解实战?

这里汇聚一线技术从业者,专注代码评审、企业内部 AI 助手真实实战落地。

想紧跟 AI 前沿动态、交流工程落地经验、少走踩坑弯路,欢迎直接加入「花椒技术交流群」。

群内专属福利拉满:每日精选研发向 AI 行业日报、文章独家延伸资料、文中未展开的技术细节,全部同步共享。

WechatIMG742.jpeg 如果群过期关注公众号 花椒技术,私信回复「交流群」获取最新入群二维码。