vibe coding
对比2025年的ai代码补全,现在已成百花齐放状态。目前我主要用github copilot的agent模式,个人认为Claude Opus4.6不管在回复的准确率,思考分析上已经非常成熟了。
就如同一个高级工程师一样在工作,而我就像是一个架构师在指挥他干活、review代码。事实上也是如此。
skill深度植入项目
不管是做边界md、还是在需求md上,都已经出现在企业级的项目中。
尽管对于复杂的业务或场景,还是会出现实现一个功能/需求,进行多轮对话(这就体现出来人的重要性和不可替代性)。但这也是不可避免的,因为只有给他非常详细的描述,才能保证工程的质量。
agent学习
WebGen-Agent:github.com/mnluzimu/We…
它是一篇学术论文的官方实现 arxiv.org/pdf/2509.22… 提出了 Step-GRPO + 截图/GUI反馈 的强化学习训练方法。作为研究工作,它的意义在于:
- 提出了多层反馈(VLM外观 + GUI Agent功能)的迭代生成范式
- 探索了将 RL(GRPO)应用于代码生成 Agent 的训练
- 发布了 WebGen-Bench 评测基准
但我理解也有缺点,比如token消耗过大,不可控。
相似的产品:bolt.diy