【打造开发领域的AI超级个体】初探成果分享

421 阅读6分钟

大家好,我是LV,聚焦AI产品研发领域。

本篇内容是笔者在社区“AI圆桌派”的“打造开发领域的AI超级个体”直播内容文字版。

“超级个体”这个词,在AI时代火了起来,本篇章我们就来聊一聊这个话题。

本文大纲如下,内容很干很充实,建议点赞收藏防失联。

本篇内容适用于对互联网产品开发 & AI技术有所了解的读者。

不多说,正式开始。

开发领域的AI超级个体

什么是超级个体?

超级个体,它其实并不是AI这个时代才有的一个专属名词。

通俗来说,它指的是一个人可以做很多事情,一个人可以担任一个领域里面的多个角色,甚至是跨领域的多个角色。

比如说,一个普通的产品经理,他能够做产品设计,甚至还能做UI设计,还能顺便把前端甚至是后端的开发任务搞定了。

当然了这种情况很少,毕竟个人的精力有限,什么都想抓,可能导致什么都抓不住。

什么是AI超级个体呢?

加上AI这两个字,我的理解是,AI能够更快的催生出这种超级个体来。

因为,AI时代,铸就了一批便捷的AI产品,有了这些AI产品,解放了生产效能,同时降低了各大领域的学习门槛。

这是用传统的软件你可能是做不到的,传统的软件它是有一定的使用门槛的。比如说做UI设计。

UI设计它需要掌握的工具就很多,比如说 sketch figma 等这一系列的设计工具,还包括如何使用这些工具做响应式设计、组件库设计、移动端、WEB端等等。

这些工具要求用户必须要能够花大量的时间投入进去,才能够掌握的了这个工具来生产内容。

但是通过AI融入到这些工具之后,能够较大降低用户使用工具生产内容的门槛。

比如用户需要做一个真人动漫形象、抠图、海报生成。

通过使用AI工具,用户只需要通过提示词,以及一些简单的微调,就可以做到这一步。

什么是开发领域的超级个体?

首先我们看一下整个产品的简化版开发工作流:

1、市场业务需求分析,市场调研竞品分析,成本分析,可行性分析等。

2、将确定的需求给到产品经理 & 技术人员,对整体的需求进行产品化设计 & 技术可行性分析,从不同的维度提出问题,跟业务方反复Battle。

3、将确定好的产品化方案(原型设计 & 业务规则等)进行UI、UX设计。

4、前后端开发,撸代码。

5、测试,Debug、部署上线运维。

整个过程需要大量的角色来支撑,运营人员 & 产品经理 & 项目经理 & UI设计师 & 前端开发 & 后端开发 & DevOps & QA等。

一个人将整个产品开发流程搞定,谓之“开发领域的超级个体”。

一个人搞定整个产品,很有难度,每一个角色都需要大量的经验,个人精力有限,担任多角色,难度极大。

不过现在其实有很多产品开发领域的自由职业者,他们一个人要干多个人的事情。

掌握一些不错的AI工具,或许可以让你在产品开发领域的效率翻倍。

笔者目前也在持续探索产品开发领域的AI化,十分欢迎沟通交流经验。

下面介绍一些工具,希望让你在产品研发的产品设计、UI设计、前端开发环节增效。

一个人搞定产品需求、UI设计、前端开发

下面分享一些在“产品需求、UI设计、前端开发”不错的AI产品。

Vercel V0

是什么?

通过可视化的自然语言迭代生成页面 & 代码。

项目地址:v0.dev/

优点

  • 有版本管理,可基于任意生成的页面版本进行二次迭代

缺点

  • 用户只能够通过自然语言来描述需求

  • 不开源,无法二次定制、价格稍贵

  • 生成的前端代码跟业务技术栈规范不相关,可维护性相对较差

  • 无法做代码二次微调,所有代码强依赖于AI,可控性较低

Open V0

是什么?

Vercel V0 的开源版本,通过可视化的自然语言迭代生成页面 & 代码。

项目地址:github.com/raidendotai…

优点

  • 继承Vercel V0 的优点,开源,可二次定制开发

缺点

  • 用户只能够通过自然语言来描述需求

  • 生成的前端代码跟业务技术栈规范不相关,可维护性相对较差

  • 无法做代码二次微调,所有代码强依赖于AI,可控性较低

Screenshoot to code

是什么?

  • 将屏幕截图转换为代码(HTML/Tailwind CSS,或React或Vue或Bootstrap)

  • 使用了GPT-4 Vision来生成代码,同时使用DALL-E 3来生成类似的图像

  • 支持输入网址来克隆一个实时网站

项目地址:github.com/abi/screens…

优点

  • 接入了识图功能,用户通过截图即可快速还原页面

缺点

  • 无版本管理

  • 强依赖于图形识别图片

  • 生成的前端代码跟业务技术栈规范不相关,可维护性相对较差

  • 无法做代码二次微调,所有代码强依赖于AI,可控性较低

Draw a ui

是什么?

  • 利用tldraw和gpt-4-vision API根据你绘制的线框生成基于HTML的应用界面。

项目地址:github.com/SawyerHood/…

优点

  • 接入了识图功能,用户通过截图 & 手绘原型图即可快速还原页面

缺点

  • 无版本管理

  • 强依赖于图形识别图片

  • 生成的前端代码跟业务技术栈规范不相关,可维护性相对较差

  • 无法做代码二次微调,所有代码强依赖于AI,可控性较低

三、AI如何落地前端开发

上面分享了一些工具,但是实际工作真正使用这些工具来生产内容还是存在一些缺点。

于是,笔者融合前面工具的优点和缺陷,开发出来的一款产品,解决6个需求点。

1、包含自然语言需求描述转页面

2、手绘原型图转页面

3、网页截图转页面

4、支持版本管理 & 基于任意版本的二次迭代

5、支持生成符合不同业务技术栈规范的前端代码,提高可维护性

6、支持基于AI生成的代码进行二次微调,提高可控性

下面是产品的简单截图,笔者希望可以做成一个开源项目,借助开源社区的力量,跟志同道合的伙伴们一起来共创,一起来打造开发领域的超级个体,欢迎有想法的伙伴留言交流。

再深入思考一下,我们后续还需要处理的问题?

1、如何清晰地描述页面的功能交互,截图或者是原型图生成的页面只有静态的展示,而无交互。

2、老代码(祖传代码)的需求迭代如何借助AI落地开发

3、前后端的对接联调能够借助AI完成

最后,笔者部署了一个 screenshot to code 应用,自费token给大家玩一玩。

地址:http://101.43.230.98:5007/