2025 AI 实践总结

111 阅读11分钟

前言

2025年初,我使用AI编程还处于半吊子水平,只能解决一些局部问题。到年底,已经能够独立完成大部分开发任务。这一年,我在业务和个人项目中深度使用了业界主流的AI模型、CLI工具和IDE,本文将从模型对比、成本分析、实践场景和思考几个维度,总结这一年的AI编程经验。

一、模型和工具对比

工具评测表

工具

简介

整体评价

Antigravity

Google出品,前身是Windsurf

Gemini 3在UI处理和复杂设计上表现突出,Opus模型处理逻辑问题表现突出。且token个人用基本上是用不完的。且暂时免费。

唯一的问题是VPN卡的很紧,需要tune模式使用,略有不便。

Cursor

Cursor在大部分场景下表现都很好,功能也完善,就是token太少。高频使用很快就用完了

Zed

基于Rust实现的开源IDE,性能好,但是生态一般。Atom的开发者做的,IDE中唯一没有fork VSCode的

NPC

性能极好,顺畅。问题是agent bug太多。可以体验,但没法做主力。

Qocder

阿里出品

NPC

使用了两个月左右,能解决一部分问题,后面收费了就不用了。

Trae海外版

字节跳动出品

人上人

功能全面,模型多。但是不能用Opus模型之后就没再使用了。Trae在相同的模型下,解决问题的效果没有Cursor好。

Kiro

亚马逊出品

试用了一下,解决两个问题都没解决掉,直接放弃。

codebudy

腾讯出品

拉完了

IDE缺陷多,模型也差。只能做一些小功能。

codex

OpenAI出品

夯爆了

今年最惊艳的模型是5.1,用来重构复杂问题基本也能一遍过。

但是CLI不支持图片功能,场景有点受限

Kimi Code

Kimi出品

Benchmark表现很好,但是基本没法解决问题。买了一个月会员,放弃了。

claudecode+GLM 4.7

国内无法使用,内接的GLM模型。表现也很好。

iflow

阿里出品

NPC

免费用minix和glm,能接Zed和Cursor,但是agent能力一般

Qwencode

阿里出品

效果很差,解决不了什么问题。

opencode

开源

人上人

免费试用minix和glm,agent能力不错

我的工具组合

综合对比下来,我形成了如下的工具使用策略:

1. IDE选择

  • 新功能开发:首选Antigravity,token充足,使用流畅

  • 小功能迭代:使用Cursor

2. 模型选择

  • UI实现:Gemini 3 Pro

  • 逻辑开发和Bug修复:GLM 4.7或Opus 4.5(复杂问题优先Opus 4.5)

  • 代码重构:Codex

3. 成本控制

  • Codex:$20/月

  • GLM:¥40/月

  • Cursor:$20/月(已退订,改用自接入的GLM 4.7)

  • Token不足时:配合opencode使用免费额度

二、实践场景

1. 从RAG到LLM.txt

上半年遇到一个需求:将Vue项目代码转换为React。由于源项目使用了古早的组件库,目标项目需要使用公司内部组件库,而通用模型不具备这两种组件库的知识。

初始方案:基于RAG的实现

我搭建了一个基于RAG的客户端,流程如下:

  1. 用户选择源码文件

  2. 通过AST分析依赖图

  3. 对依赖图中的关联代码进行AI转换

知识库处理流程:

  • 使用脚本提取和拼接组件库的md文档

  • 对文件进行分割和向量化

  • 在AI转换前进行知识召回

这个典型的RAG链路最终效果不理想,主要问题在于:

  • 模型能力是基座,使用的Qwen模型能力确实不足

  • 向量化和召回的第三方库都比较轻量(为了本地运行),效果不佳

优化方案:llm.txt + 本地索引

受社区启发,以及Sonnet 3.5的发布,我改变了思路:

  • 在Cursor中使用llm.txt建立本地索引

  • 将转换前后的代码写入llm.txt

  • 将所有组件文档喂给Sonnet,生成精简版llm.txt

在消耗大量token后,典型页面的转换成功率达到了90%的可用度。

2. 从Agent到提示词

在个人项目中,我实践了Agent的能力,主要涉及:

  • 模型的智能切换

  • 多Agent的编排

  • 上下文压缩处理

在langgraph的加持下,开发难度并不大。当然,这也得益于项目本身不算太复杂。

目前业界对Agent的实践还没有形成统一的范式。观察Code Agent领域,gemini cli、codex cli、kimi cli的实现方式都各不相同。

Agent的演化趋势

Agent目前主要作用是弥补AI基座能力的不足。但随着模型能力的提升,一些原本需要Agent完成的任务,正在逐步被AI直接接管,比如任务编排。

这让我想起《沸腾新十年》中的观察:Android早期,当系统能力较弱时,垃圾清理、电池管理等增强类工具市场很大。但随着系统能力完善,这些APP不可避免地被系统开发商取代。

AI的能力演化似乎也遵循类似的规律。如今,dify和coze这类平台搭建的Agent,已经可以直接用一句提示词让AI独立完成。从agent,到mcp,再到skill,AI的能力增强其实是越来越简化的。

3. 全链路赋能实践

帮忙写代码只是单点问题。从整个开发链路和前端工程角度,还需要补充更多实践来实现全链路赋能。

(1)从UI到代码

这是AI尝试最多的方向。Figma官方也推出了MCP服务,用于将设计稿生成代码。但实际体验并不理想,特别是需要转换为公司自有组件时,通用AI往往力不从心。

我实践下来,最有效的方式是:直接截图交给Gemini 3,并清晰描述各个元素使用什么组件。

(2)私有组件知识库

沿用之前的实践,将组件库文档生成llm.txt,交给本地索引。实际上,Cursor和claudecode在生成代码时会参考现有代码,所以只要样本代码足够,这一环节的作用没有之前那么显著。

(3)从单一问题到Spec Coding

前端架构在整体产品中相对较薄,即使在复杂业务生态下,上下文和状态管理也是有限的。这带来一个好处:大部分场景下,我们可以用文字准确描述背景和计划。

关键在于如何给AI编写指导手册。通用原则如SOLID是公认的,但文件结构、组件颗粒度、状态拆分和耦合等设计,依赖于开发者自己的设计理念。如果完全交给AI,效果往往不佳。

对于复杂需求,我目前的实践流程是:

  1. 描述背景

  2. 添加关键代码路径

  3. 提供接口数据结构

  4. 描述自己的解决方案

  5. 让AI优化和补充文档

  6. 让AI按文档拆分任务

  7. 进行渐进式实现开发

配合通用的skill和subagent,目前日常需求能够完成80%,疑难问题90%都可以帮我解决或提供解决思路。

(4)活文档

程序员最讨厌两件事:别人不写注释,以及自己要写注释。

几年前,我读了《活文档》一书,这本书探讨如何制度化地将文档流程融入业务开发。但因为国内实际情况,这个制度很难落地。

有了AI就不同了。在项目中维护一个文档库,利用Claude skill对提交的代码进行总结,并实时补充到文档中。这样,无论是做回溯还是后续迭代都有裨益,既方便程序员开发,也方便AI理解背景和上下文。

三、独立开发者的AI创业观察

过去两年,许多程序员转为独立开发者,做AI相关业务。根据我的观察,主要分为以下类别:

1. 套壳应用

典型如GPT套壳产品。前期确实有不少人赚到钱,但随着豆包、千问等产品的诞生,这些套壳应用逐渐消失。之前火出圈的VSCode插件ChatMoss,一度做到数万用户,现在已经一年不更新了。

2. 图片生成

这个赛道很难。做视频没有那个财力和能力,做图片相对简单,但也因此没有门槛。可以吃一波新鲜饭,但很快因为大家都涌入而难以做出差异化。年初关注一个美团程序员,离职做图片应用,当时数据很好,但后来竞争激烈,不知道现在怎么样了。

3. 提效工具

如数据处理、文案生成等。市面上有ChatExcel、AIPPT等成熟产品,一般是小公司做的,目前没看到比较好的个人开发产品。

4. 知识库和笔记类

笔记类本身场景小,还有Notion、飞书这类成熟产品。玉伯做的youmind据说已经有千万级别的ARR,我试用过youmind,但还是没理解它的卖点。

5. 资讯和AI博主

这个成功的比较多。也有一部分人趁机拉圈子,卖知识星球和课程,目前看这部分人成功的较多。

6. 垂类工具或插件

细分领域和市场,如AI播客、AI翻译、建站模板等。目前了解到比较成功的应该是沉浸式翻译。

四、思考

元旦前与前司老板吃饭,他提出一个问题:AI时代下,社会如何重新分配?

在非AI时代,学历和知识是社会分层和分配的主要依据。但AI造成了知识平权,那如何重新分配社会财富?

老板的思维高屋建瓴。

当时我说:相信社会的演化,在不同时代下自然会演化出不同的分配方式。

回来后我想起出差路上看的《周期》一书。作者是投资大鳄,他说自己有很多投资技能建立在实践之上,这部分东西无法描述,即使描述出来也无法通过阅读学会。

一个简单的例子:AI可以告诉你游泳的所有技巧,但并不等于你就能学会游泳。

最近遇到一个案例:有同学要在某图层上的两个图标之间画贝塞尔曲线连接,但绘制出现了偏移,连不上两个图。不同的缩放比例下,偏移量也不同。他使用AI来解决这个问题,很久没有解决。我建议换个思路,直接挪一下图标位置。按照这个思路,很快解决了问题。

也就是说:知识和能力之间存在鸿沟,而社会的分配大概率上仍是以能力为导向的

我把社会上的知识,分为三类:通识,专业知识,精英知识。

通识是AI最擅长的,比如这个鸟什么种类,这个单词是什么意思。

专业知识就是我这种程序员或者会计,他有一定的难度,需要一定的经验,但是没有难到需要比拼天赋。

精英知识就是一些不是依靠人力就能突破的知识点,比如我在AI的指导下去学习其他编程语言,是可以XX天从入门到精通,但是你现在给我一本《控制论》,我还是学不会。

从这个划分上讲,AI的冲击是对我们这种所谓专业知识人员冲击较大。但是这到底是一个好的冲击还是坏的冲击,现在难以论述的。如果简单的用出租车和马车的历史来做例子,我认为是有点粗暴的。我对AI的能力表示惊叹,但也不认为它能解决一切问题,一个段子说:如果全用AI了,谁来背锅呢?

在《人类简史》中,作者说智人之所以打败更强壮的尼安德特人,是因为智人拥有更强的协作能力。

人类社会的发展,也是在不同的时代,气候,生产力的背景下,人与人协作关系的变化中发展的。AI是新的生产力,我相信也会最终演化出新的生产关系来的。所以未来是什么样,我觉得更多的还是以演化的态度去看,不用规划的态度去看。