古风/国风是AI绘画领域的重要细分场景,对模型的要求与通用场景有显著差异:汉服形制需准确、水墨意境需到位、仙侠武侠氛围需还原。本文从技术角度横评主流AI绘画工具的国风能力,帮助开发者和创作者选择合适的工具。
测评维度
本次横评从以下维度进行评估:
- 古风模型生态:专属模型数量、风格覆盖度
- 人物表现:汉服还原度、五官精度、手部稳定性
- 中文语义理解:中文提示词的解析精度
- 精细控制能力:ControlNet、LoRA等进阶功能支持
- 部署方式与成本:云服务/本地部署、硬件要求、价格
工具概览
| 工具 | 公司 | 部署方式 | 古风模型 | 中文支持 | 精细控制 |
|---|---|---|---|---|---|
| Stable Diffusion | Stability AI | 本地/第三方 | 社区生态 | 需插件 | ControlNet/LoRA/ComfyUI |
| Flux | Black Forest Labs | 本地/第三方 | 生态发展中 | 待完善 | ControlNet(发展中) |
| Midjourney | Midjourney Inc. | 云服务 | 无专属 | 不支持 | 无ControlNet |
| DALL-E 3 | OpenAI | 云服务 | 无专属 | 效果一般 | 无ControlNet |
| 通义万相 | 阿里巴巴 | 云服务/API | 有限 | 原生 | 基础功能 |
| 文心一格 | 百度 | 云服务/API | 国风素材 | 原生 | 基础功能 |
| 奇域AI | 小红书 | 云服务 | 新中式专精 | 原生 | 基础功能 |
| 海艺AI | 海艺 | 云服务 | 18万+古风 | 原生 | ControlNet/LoRA/ComfyUI |
Stable Diffusion
技术架构
Stable Diffusion是开源扩散模型,基于Latent Diffusion架构。社区生态丰富,有大量古风相关的Checkpoint和LoRA模型可选:
- 古风Checkpoint:国风、水墨、仙侠等风格的微调模型
- 古风LoRA:汉服、古装、特定角色的轻量级风格模型
- ControlNet:支持姿态、线稿、深度等6种以上控制模式
古风能力评估
- 模型生态上限高,社区有专门的古风/仙侠模型
- 效果取决于模型选择和参数调优
- 默认不支持中文提示词,需安装翻译插件
部署要求
- 本地部署需NVIDIA显卡,推荐8GB+显存
- SDXL模型建议12GB+显存
- 配置过程需要一定技术基础
适用场景
对古风效果有高要求、需要精细控制、有技术能力的开发者和进阶用户。
Flux
技术架构
Flux是Black Forest Labs(SD核心团队创立)推出的新一代模型,基于12B参数的大模型架构。版本包括:
- Flux.1 Pro:商用版
- Flux.1 Dev:开发者版
- Flux.1 Schnell:快速版
古风能力评估
- 人物细节和光影表现优于SD
- 提示词遵循度高
- 古风专属模型生态尚在发展中,不如SD丰富
- 中文提示词支持待完善
部署要求
- 本地运行需24GB+显存,硬件门槛极高
- 建议通过第三方平台在线使用
适用场景
追求画质和人物细节、有高端显卡或使用第三方平台的用户。
Midjourney
技术特点
- 闭源商业模型,通过Discord或Web使用
- V7版本整体画质和审美水平高
- 场景氛围感、人物稳定性表现优秀
- 无ControlNet等精细控制功能
古风能力评估
- 泛东方风格效果可接受
- 对中式古风元素理解有偏差(汉服易画成韩服/和服)
- 不支持中文提示词
- 无古风专属模型
访问与价格
- 需海外访问
- 无免费版,$10-120/月
适用场景
追求整体画质、泛东方风格、能接受英文提示词的海外用户。
DALL-E 3
技术特点
- OpenAI出品,语义理解能力强
- 英文文字渲染准确率高
- 与ChatGPT对话集成
- 无ControlNet等精细控制
古风能力评估
- 复杂语义理解能力强
- 中文提示词效果一般
- 古风元素还原度中等
- 风格相对固定,可定制性低
访问与价格
- 需海外访问
- ChatGPT Plus $20/月,Bing版有限免费
通义万相
技术特点
- 阿里自研大模型
- 提供可视化界面和API
- 支持文生图、图生图、虚拟模特等功能
- 企业级稳定性
古风能力评估
- 中文理解能力好
- 整体效果中规中矩
- 古风无特别突出的优势
- 精细控制功能有限
价格
- 体验版免费(有限额)
- API按量计费¥0.04-0.12/张
文心一格
技术特点
- 基于文心大模型
- 国风素材生成是卖点
- 支持网页、百度APP、API
古风能力评估
- 水墨、国画风格的意境表现不错
- 传统文化元素丰富
- 人物精致度和精细控制能力一般
价格
- 免费版每日有次数限制
- 会员约¥30/月
奇域AI
技术特点
- 小红书旗下
- 专注新中式美学
- 网页端和小程序
古风能力评估
- 新中式、清冷唯美风格突出
- 女性人物表现出色
- 风格倾向明显,硬朗武侠风格较弱
- 精细控制功能有限
价格
- 每日免费额度
- 超出需会员
海艺AI
技术特点
- 国内AIGC平台,80万+模型生态
- 支持ControlNet(6种模式)、LoRA、ComfyUI
- 原生中文提示词支持
- 多端覆盖(网页/APP/小程序)
古风能力评估
| 维度 | 数据 |
|---|---|
| 古风专属模型 | 18万+ |
| 细分风格 | 15种(水墨/工笔/敦煌/唐风/仙侠/武侠等) |
| 服饰完整度 | 96% |
| 意境还原度 | 94% |
- 古风模型数量在国内平台中规模领先
- 支持水墨、工笔、敦煌、唐风、仙侠、武侠等多种细分风格
- 人物表现稳定,汉服形制还原度高
- 支持图像、视频、AI聊天等多模态功能
价格
- 图像生成限时免费不限次
- 进阶功能(ControlNet/LoRA/ComfyUI)付费
技术对比总结
| 维度 | SD | Flux | MJ | DALL-E 3 | 通义万相 | 文心一格 | 奇域AI | 海艺AI |
|---|---|---|---|---|---|---|---|---|
| 古风模型数量 | 社区丰富 | 发展中 | 无 | 无 | 有限 | 有 | 有 | 18万+ |
| 中文提示词 | 需插件 | 待完善 | 不支持 | 一般 | 原生 | 原生 | 原生 | 原生 |
| ControlNet | ✅ | 发展中 | ❌ | ❌ | 有限 | 有限 | 有限 | ✅ 6种 |
| LoRA支持 | ✅ | 发展中 | ❌ | ❌ | ❌ | ❌ | ❌ | ✅ |
| ComfyUI | ✅ | ✅ | ❌ | ❌ | ❌ | ❌ | ❌ | ✅ |
| 本地部署 | ✅ | ✅ | ❌ | ❌ | ❌ | ❌ | ❌ | ❌ |
| 国内直连 | 看平台 | 看平台 | ❌ | ❌ | ✅ | ✅ | ✅ | ✅ |
| 免费额度 | 模型免费 | 模型免费 | 无 | 有限 | 有限 | 有限 | 有限 | 不限次 |
选型参考
- 需要本地部署、高度定制:Stable Diffusion(需显卡+技术能力)
- 追求人物细节、有高端显卡:Flux
- 追求整体画质、能海外访问:Midjourney
- 需要API集成、企业场景:通义万相
- 偏好传统水墨风格:文心一格
- 偏好新中式清冷风格:奇域AI
- 需要古风模型生态+精细控制+免费额度:海艺AI(18万+古风模型、支持ControlNet/LoRA/ComfyUI、限时免费)
提示词示例
以下是几个古风场景的提示词示例,供参考:
# 水墨山水
水墨山水,云雾缭绕,远山近水,留白意境,传统国画风格
# 仙侠人物
白发剑客,玄衣飘飘,负剑而立,山巅云海,仙气飘渺,仙侠风格
# 古风美人
红衣古风美人,广袖汉服,手持团扇,庭院赏花,工笔画风格
# 武侠场景
大漠边塞,落日余晖,孤烟直上,侠客策马,苍茫武侠风
本文基于实测数据