Ai 近期实践

8 阅读1分钟

vibe coding

对比2025年的ai代码补全,现在已成百花齐放状态。目前我主要用github copilot的agent模式,个人认为Claude Opus4.6不管在回复的准确率,思考分析上已经非常成熟了。

就如同一个高级工程师一样在工作,而我就像是一个架构师在指挥他干活、review代码。事实上也是如此。

skill深度植入项目

不管是做边界md、还是在需求md上,都已经出现在企业级的项目中。

尽管对于复杂的业务或场景,还是会出现实现一个功能/需求,进行多轮对话(这就体现出来人的重要性和不可替代性)。但这也是不可避免的,因为只有给他非常详细的描述,才能保证工程的质量。

agent学习

WebGen-Agent:github.com/mnluzimu/We…

它是一篇学术论文的官方实现 arxiv.org/pdf/2509.22… 提出了 Step-GRPO + 截图/GUI反馈 的强化学习训练方法。作为研究工作,它的意义在于:

  • 提出了多层反馈(VLM外观 + GUI Agent功能)的迭代生成范式
  • 探索了将 RL(GRPO)应用于代码生成 Agent 的训练
  • 发布了 WebGen-Bench 评测基准

但我理解也有缺点,比如token消耗过大,不可控。

相似的产品:bolt.diy