上周在库拉KULAAI(t.kulaai.cn)上整理收藏夹的时候数了一下,我过去一年测试过的AI工具已经超过60个。不是刻意收集,是真的被推着用——每个月都有新东西冒出来,不用怕落后,用了又怕浪费时间。
这篇文章聊聊我观察到的几个核心变化。不是测评,更像是一份"生态观察笔记"。
一、聚合平台崛起:工具太多本身就是问题
AI工具的爆发带来一个反直觉的问题:选择成本太高了。
光是文本生成就有ChatGPT、Claude、Gemini、文心一言、通义千问十几个选项。生图有Midjourney、Flux、Stable Diffusion、即梦。视频有Runway、Pika、可灵。每个都要注册、要学习、要付费。
这不是效率问题,是认知负担。
所以今年我明显看到一个趋势:聚合类平台开始起来了。它们的逻辑不是"我做一个更好的AI",而是"我把已有的AI整理清楚,让你少花时间选"。
这个思路对用户最友好。普通创作者不需要知道GPT-4o和Claude 3.5的参数差异,他们只需要知道"写文案用哪个、生图用哪个、做视频用哪个"。谁能把这个答案给得最直接,谁就有价值。
二、多模态创作:从"各干各的"到"一条流水线"
去年多模态还是个概念,今年已经落地了。
举个实际场景。我现在做一期短视频内容的流程是这样的:先用Claude写脚本初稿,用GPT-4o调整语气让它更口语化,然后用ElevenLabs生成配音,用可灵把关键画面生成出来,最后在剪映里组装。
三年前这套流程需要一个团队干两天。现在我一个人,半天搞定。
但问题也很明显:工具之间是割裂的。每一步都要手动复制粘贴,格式要转换,风格要统一。多模态的能力有了,但多模态的"管道"还没打通。
谁能把这个管道修通,谁就掌握了下一阶段的主动权。目前我看到Runway和字节的豆包在往这个方向走,但都还在早期。
三、开源模型的逆袭:不只是省钱那么简单
今年开源模型的变化比闭源更值得关注。
Flux在生图领域已经能和Midjourney正面对话。Llama 3在文本生成上缩小了和GPT-4的差距。Qwen 2.5在中文场景甚至有优势。
但开源的真正价值不是"免费替代品",而是可控性。
我接触过几个做电商内容的团队,他们的核心顾虑是数据安全。产品图、用户画像、营销文案这些东西放到第三方API里,心里不踏实。本地部署开源模型,数据不出内网,这个问题解决了。
还有一个常被忽略的点:开源模型可以微调。一个做法律文书的团队用Qwen做了LoRA微调,合同审查的准确率从通用模型的70%提升到92%。这种垂直场景的深度优化,闭源模型很难做到。
所以现在的格局是:通用需求用闭源,垂直需求用开源。两条路线并行,短期内不会收敛。
四、视频和3D:最后的壁垒正在松动
AI生图已经很成熟了,但AI生视频和AI生3D还在爬坡。
视频方面,Runway Gen-3和可灵的表现确实比一年前好太多了。5秒以内的短片段已经可以商用,但一旦拉长到15秒以上,人物一致性、物理逻辑就开始出问题。一个明显的bug是人物转身时脸部变形,目前所有模型都没彻底解决。
3D方面更早期。Meshy和Tripo能生成基础3D模型,但离"游戏级资产"还有距离。不过方向是对的,尤其是NeRF和3D Gaussian Splatting技术的结合,让我对明年的发展比较乐观。
判断:视频AI明年会有质变,3D还需要两年。
五、内容生产的规则真的在变
回到标题的问题:谁在改写内容生产规则?
我的答案不是某个具体工具,而是一种生产关系的重构。
以前的内容生产是"人做创意,人执行"。现在变成"人定方向,AI执行初稿,人做精修"。角色变了——人从执行者变成审核者和决策者。
这意味着两件事:
第一,个人创作者的能力被大幅放大了。以前需要团队协作才能产出的内容量,现在一个人可以覆盖。小团队甚至个人品牌会越来越多。
第二,专业门槛在降低,但审美门槛在提高。当每个人都能用AI生成"还不错"的内容时,"好"的标准会水涨船高。最终拉开差距的不是工具,是品味和判断力。
六、给普通用户的建议
如果让我给一个刚开始接触AI工具的人三条建议:
第一,别贪多。 选两三个工具深度用,比浅尝二十个有用得多。
第二,关注工作流,而不是单个功能。 一个能嵌入你日常流程的AI,比一个功能炫酷但需要额外打开的AI值钱十倍。
第三,保持更新但别焦虑。 这个领域变化快是事实,但核心逻辑没变——AI是工具,用工具的人决定产出的质量。
2026年的AI工具生态,已经从"有没有"过渡到了"好不好用"。接下来的竞争,会越来越集中在体验、整合和垂直场景这三个维度。
泡沫会有,淘汰会有,但趋势不可逆。现在入局,不晚。