AI开发实战:从希望到现实的工具探索与反思

86 阅读8分钟

image.png

背景

自从去年11月份开始探索AI开发以来,使用了多个AI插件以及AI编辑器。既有惊喜又有折磨,最近手里的纯AI开发项目刚完结,梳理一下这一路经历。

AI智能助手

通义灵码

去年11月份,听闻兄弟部门开始主推通义千问的AI辅助编程,效果很好,领导便迫不及待的让调研、尝试。常用编辑器是vscode,便集成了通义灵码插件,大概使用了一天。

总体来说可以提高一定效率,但是插件的交互、应用效果比较差,对现有项目的分析思考不足,写出的代码对于我个人而言应用率不高。其中最大的问题是不能从零开始写代码,需要过多的人为参与才能拉起项目。

ROO CLINE(现改名ROO CODE)

deepseek在去年11月份时还未大火,当时对接了deepseek-v3。从一个空目录开始开发项目,无论是插件的交互还是大模型的分析编码能力都给我很大的震撼。

当时只是做了一个纯前端项目,没有人为写一行代码,硬是靠不停的对话完成了整个项目构建和业务实现。当时的deepseek也完全不卡顿,完全给自己打开了AI开发的新世界。然而过完年后,deepseek在插件中的调用基本瘫痪,于是尝试寻找替代方案。

  • 硅基流动
  • 腾讯元宝
  • 火山方舟

找了三个大模型平台,最后充了10元申请了硅基流动的,虽然也相对卡一些,最后磕磕绊绊完成了项目的问题修改和收尾。如今也不时使用Roo Code对接deepseek-R1模型进行开发,但是还是觉得蠢了一些,完全没有年前对接初版deepseek v3时的开发顺畅。

Copilot

年后换了新电脑,装了vscode后发现自带了AI插件Copilot,在看对接的大模型

  • Claude 3.5 Sonnet
  • Gemini 2.0
  • GPT-4.1
  • GPT-4o
  • o3-mini

直到现在也不时在使用,在业务开发上表现还是差了一些,在编写代码遇见大文件时还会出现卡死问题,现在用的最多的功能是代码中的单点异常修复(Copilot 修复)

Marscode(现改名Trae AI)

这里介绍的是vscode的插件,不是AI编辑器(Trae CN)。引入这个插件的主要原因是在deepseek最火时,Roo Code基本没法用,即使能用效率也很差,一个任务跑20分钟都是常态。初衷是为了提高甚至替代人为开发的,现状却使开发效率降低,不得已继续寻找替代方案。恰好Marscode进入视野,一看对接的也是deepseek R1模型,这不妥妥平替么,最主要的是响应速度还快。在项目稳定阶段使用Chat局部修改还是不错的。

当时Builder(Alpha)没开放,不具备自主编码能力,只能以审核应用的方式开发。直到现在这种开发方式也用的最多,Builder方式执行太慢,效果其实也不算好,改小问题小需求还行。

Trae CN

掘金一直在推,决定试一下这很火的AI代码编辑器。持续使用了一天,发现基本是vscode + Marscode的平替,并没有太多惊艳的东西,况且平时使用是多个AI插件协同开发的。当然AI插件、编辑器厂家都在疯狂抢市场,更新频率甚至达到了日更,暂时先观望。Cursor编辑器一直听闻很强,不过收费也很高,计算了一下120¥/月,即使开通使用也无法长久付费就未尝试。

文心快码

这个插件于我观察来看,热度很低,公测期间充了一个月(60¥/月),为什么要充值这个代码助手。因为它能识别图片、文档,直白点就是它能够设计文档转代码、设计图片转代码。这样可以大大减少人为和助手的对话,让AI快速理解项目、构建项目,不用我再孜孜不倦的一点一点告诉AI。

项目开发

需求

一个演示视频

拆解

使用剪映分帧导出各个业务场景的图,视频中未讲到的页面根据导航名称自行脑补

image.png

开发

贴图,补充约束的方式智能生成代码,能快速构建出整个系统。剩下的就是补充纠正细节,从客户端->服务端->数据库拉通业务。从手动创建一个目录到项目测试通过一共发起了82次任务,每次任务平均发起5次对话,一共发起至少450次对话。

image.png

遇到问题

  1. 发起对话后,AI告诉我执行已经完成,看分析及执行过程也没问题,但是代码一行也没发生变化,不得已告诉AI代码未实现重新执行(发生概率2%
  2. 生成完代码,格式异常代码报红(发生概率5%),即使让文心快码继续修复耗时久也有可能不能修复成功,使用Copilot介入修复,或者回退掉重新让生成
  3. AI根据一系列图构建出的复杂系统,大概率梳理的模型关系会出现问题(100%),需要人为梳理清楚一步一步纠正过来关系。如果有完整设计文档,基本一步能到位
  4. 开发效率完全取决于AI服务端的速度,有时忍不住想人为参与。流量大的时候,执行一次任务得10 min +
  5. 开发逻辑很容易业务前移,直白点说,用自然语言告诉AI要前后端拉通某一个业务,AI很容易将业务移到前端去组装业务,实际正确的是在后端接口内部去组装业务,时常得特别说明来避免这类问题
  6. 没有编程基础的人也很难开发成功,在对话过程中需要不时监视AI助手的执行思路,发现有偏差立即得停止修正,否则一个小问题都可能绕很久走不出来。

智能助手问题

短短一个月提交了5张工单,提供服务的不稳定、部分功能随意下架、频繁卡死问题等等,开发过程还是挺折磨人的。最重要的是收费模式的变化,充钱也分快速、慢速请求了,快速请求还得继续加钱,有点像vip -> svip了。

image.png

开发效果及耗时

贴一个相对复杂的页面,对话至少10次,主要是拉通接口调用、调整图片生成代码后的一些细节偏差。整个系统开发 + 部署耗时至少三周时间,当然开发自测完成距离真正上线还有一定差距,并没有AI助手厂商吹嘘的能够一蹴而就。

  • 需求梳理,视频转图片,梳理模型关系(2天
  • 贴图业务开发(14天),因为期间遭遇AI服务卡死、图片识别功能下架等外在因素,如果能有相对稳定的AI服务,相信耗时能减少不少
  • 部署 + 线上问题处理(3天),生成部署脚本很快,但是制作镜像、解决测试环境下的一些异常问题(windows、Linux环境差异导致的一些问题)就相对很耗时。制作镜像依赖外网去下载很多依赖包,制作完镜像下载到本地也是非常耗时。 image.png

总结

短短几个月,AI智能助手市场百家争鸣,发布会都看了好几场,实际应用来说,现阶段还是轻人工智能时代。既要紧跟时代潮流尽量不要让自己落伍,也要保持清醒的大脑不要在自己的行业中过度吹嘘AI,让领导层产生错觉,觉得AI可以替代人。实际上现阶段是减轻开发压力,只是减多少的问题,远远没达到替代的程度。

结合自身情况,什么时候需要付费、什么场景使用哪个AI助手,得视场景而定。现在各个厂商都把收费标准改为快速、慢速模式,限制次数,需要节省付费work的成本。

再说一下使用过的几款插件和AI编辑器,付费的 > 免费的,不只从大模型的角度分析,还要结合应用工具来总结,有时大模型能力再强,应用工具不行也发挥不出效果。排名如下,

  • 文心快码zulu
  • ROO CODE + deepseek R1
  • Trae CN(AI编辑器
  • Trae AI + deepseek R1
  • Copilot + (Claude3.5 Sonnet等)
  • 通义灵码

还有一点,在AI思考分析中人要实时参与,并不能完全放空自己。能掌控执行过程、项目细节才能更好的维护和解决问题。