
获得徽章 0
赞了这篇文章
赞了这篇文章
赞了这篇沸点
给沸点提个优化建议:当帖子评论多的时候,能不能不要新开一个网页打开全部评论,不能做到局部加载吗,新开一个网页,我都不知道我刚才看到哪个评论了,又得从头开始找,很麻烦的!!!
15
10
赞了这篇沸点
赞了这篇沸点
上周五提离职,周六就办手续走了,周六下午问我弟弟去不去西安,同时买周一的高铁票,订酒店,开始了四天三夜的西安旅行,吃了当地的陕西菜,羊肉泡馍,牛肉汤,第一天晚上就去爬了华山(累啊),还买了大包子,凉皮,肉夹馍,去了不夜城,钟楼,鼓楼,大雁塔,拍了好看的妆造,今天回啦![[不失礼貌的微笑]](//lf-web-assets.juejin.cn/obj/juejin-web/xitu_juejin_web/img/jj_emoji_16.9d17f6d.png)
接下来就慢慢在成都找工作了
![[不失礼貌的微笑]](http://lf-web-assets.juejin.cn/obj/juejin-web/xitu_juejin_web/img/jj_emoji_16.9d17f6d.png)
![[不失礼貌的微笑]](http://lf-web-assets.juejin.cn/obj/juejin-web/xitu_juejin_web/img/jj_emoji_16.9d17f6d.png)
64
57
赞了这篇文章
赞了这篇文章
赞了这篇沸点
多款AI IDE编程测试,好用的工具真的不多
Hello大家好,这里是独立开发者频道,这篇笔记想和大家聊聊AI编程工具的话题,最近在这个事上没少花时间和心思,付费版也买了几款。
♻ 这段时间AI IDE各种上蹿下跳,cursor在国内停服,argument平替使用,最后再切回cursor,换来换去的肯定有点麻烦,为啥对cursor念念不忘?肯定是在系统开发中好用且高效。
正好又赶上国内AI工具各种迭代更新,于是也顺带体验了一把,这里就不多介绍了,感兴趣的话可以自行尝试。
♻ 主要想分享一下,几款大模型的编程实践,涉及到豆包(辅助角色)、DeepSeek、Kimi-K2,注意这里的场景限定是编程。
先直接说结论:目前国内的主流模型中,Kimi-K2的编程能力,应该是领先的,不过它是近期刚发布。
在编程任务中,单次输出代码低于500行的模型先选择忽略,以现在的AI编程工具来看,至少写千行代码不抛出错误,才能放到一张桌子上比划比划。
♻ 主要测试两种场景:① 简单描述需求,让模型可劲的发挥;② 提供原型图,做提示词工程,让模型最大限度的还原页面。
为什么对标上面两个场景?因为在cursor里面自己一直就是这么用的。
1️⃣ 场景一的测试
这里主要考验模型纯粹的编程能力,DeepSeek和Kimi-K2都能输出符合预期的页面效果,不过K2的视觉质感更好更丰富,但是代码输出的效率略低。
2️⃣ 场景二的测试
在cursor中直接导入原型稿,都能输出大差不差的页面效果图,所以必须要测这个场景,尝试国内的AI IDE都做不到,只能放在大模型里执行。
直接在DeepSeek和Kimi-K2传原型稿,要求它们直接用web页面还原,这两款模型能做但是效果都不好,Kimi-K2的还原效果稍微领先。
那就换个思路,用豆包生成原型稿的提示词,问题来了为啥用豆包?还是那个朴实的道理,在使用中对比其它效果较好。
豆包生成的提示词丢给DeepSeek和Kimi-K2还原,这时候两款模型还原出的页面,已经能达到原型稿70%的效果了,仍然是Kimi-K2稍微领先。
🔚 国内外多款模型和工具体验下来,感觉差距和差异都比较明显,虽然小模块编程能力上的差距不大,但是于开发来说,系统工程性的编程能力才更有价值,这大概是很多开发者愿意为cursor买单的原因。
Hello大家好,这里是独立开发者频道,这篇笔记想和大家聊聊AI编程工具的话题,最近在这个事上没少花时间和心思,付费版也买了几款。
♻ 这段时间AI IDE各种上蹿下跳,cursor在国内停服,argument平替使用,最后再切回cursor,换来换去的肯定有点麻烦,为啥对cursor念念不忘?肯定是在系统开发中好用且高效。
正好又赶上国内AI工具各种迭代更新,于是也顺带体验了一把,这里就不多介绍了,感兴趣的话可以自行尝试。
♻ 主要想分享一下,几款大模型的编程实践,涉及到豆包(辅助角色)、DeepSeek、Kimi-K2,注意这里的场景限定是编程。
先直接说结论:目前国内的主流模型中,Kimi-K2的编程能力,应该是领先的,不过它是近期刚发布。
在编程任务中,单次输出代码低于500行的模型先选择忽略,以现在的AI编程工具来看,至少写千行代码不抛出错误,才能放到一张桌子上比划比划。
♻ 主要测试两种场景:① 简单描述需求,让模型可劲的发挥;② 提供原型图,做提示词工程,让模型最大限度的还原页面。
为什么对标上面两个场景?因为在cursor里面自己一直就是这么用的。
1️⃣ 场景一的测试
这里主要考验模型纯粹的编程能力,DeepSeek和Kimi-K2都能输出符合预期的页面效果,不过K2的视觉质感更好更丰富,但是代码输出的效率略低。
2️⃣ 场景二的测试
在cursor中直接导入原型稿,都能输出大差不差的页面效果图,所以必须要测这个场景,尝试国内的AI IDE都做不到,只能放在大模型里执行。
直接在DeepSeek和Kimi-K2传原型稿,要求它们直接用web页面还原,这两款模型能做但是效果都不好,Kimi-K2的还原效果稍微领先。
那就换个思路,用豆包生成原型稿的提示词,问题来了为啥用豆包?还是那个朴实的道理,在使用中对比其它效果较好。
豆包生成的提示词丢给DeepSeek和Kimi-K2还原,这时候两款模型还原出的页面,已经能达到原型稿70%的效果了,仍然是Kimi-K2稍微领先。
🔚 国内外多款模型和工具体验下来,感觉差距和差异都比较明显,虽然小模块编程能力上的差距不大,但是于开发来说,系统工程性的编程能力才更有价值,这大概是很多开发者愿意为cursor买单的原因。
展开
评论
3