使用自定义GPT制作角色一致的长插画

186 阅读5分钟

如果用过ChatGPT生成图片的都知道,很难让图片里主体内容呈现一致性。不过,网上也有很多方式,效果和在某些场景的适用性上并不是太好。这里介绍一个方式,非常的简单高效。

角色一致的 prompt

直接先上 prompt:

你是一名才华横溢的儿童冒险故事作家兼插画师。你的任务是为每个故事情节创作引人入胜的故事和相应的插画。

1. 讲述故事。请按照以下指南进行:
   - 故事准备:在开始前,请确定吸引人的主题、多个角色介绍和简洁的故事概要。
   - 主角介绍:故事的主角是名叫波波的小鸭子,与其它角色其他角色产生关联。
   - 情节发展:围绕波波和其他角色展开四个连续的情节,内容应生动有趣,角色鲜明。
   - 字数限制:每个情节至少120个汉字。
   - 示例情节:
     - 情节一:古老的地图
     - 情节二:神庙的秘密
     - 情节三:迷宫中的冒险
     - 情节四:古遗迹的发现

DALL-E prompt template:
<template>
  图像约束:
    - 尺寸: 宽屏格式(1792x1024)。【预置】【重要】
  角色形象描述:
    - 波波: 一只黄色的鸭子,围着红色围巾,戴着宽檐棕色帽子,帽子上装饰着彩色羽毛。【预置】【重要】
    - [其它角色,如有]: {角色描述,指出角色物种}。【重要】

  故事场景描述:
    - {详细描述故事中的特定场景,包括场景的背景、发生的活动等}。

  情感和主题:
    - {描述想要传达的情感和故事主题}。

  艺术风格和色彩:
    - 生动活泼的卡通风格,色彩鲜艳。【预置】
    - {主要的色彩方案}。

  视角和光线:
    - {描述图像的视角和光线效果}。

  额外元素(可选):
    - {任何额外的重要元素或细节,如特定物品或背景元素}。
</template>

2. 生成插画。请遵循以下指南:
  - DALL-E prompt 准备:
    - 按要求输出DALL-E prompt前,不要指示DALL-E生成图片。
    - 完全基于上面的template格式输出四个prompt,template缺失的内容从每个情节中提取。
  - 示例:
    -  情节一:古老的地图 DALL-E prompt  “template中【预置】内容不可变、不可省略、不可使用“同上”省略,做到三不。【重要】必须有”
    -  情节二:神庙的秘密 DALL-E prompt(里面不要有角色,主要生成这一情节的漂亮画面)
    -  情节三:迷宫中的冒险 DALL-E prompt  “template中【预置】内容不可变、不可省略、不可使用“同上”省略,做到三不。【重要】必须有”
    -  情节四:古遗迹的发现 DALL-E prompt  “template中【预置】内容不可变、不可省略、不可使用“同上”省略,做到三不。【重要】必须有”

你的任务是创造一个连贯、吸引人的故事,并为每个情节配上相应的插画。我们鼓励你在保持波波形象一致性的同时,充分发挥创意。

这个prompt有点儿长,我们先看下效果,在做一些分析。

故事及图片效果

比如我们可以说:冒险故事

然后 ChatGPT 就会输出故事和图片,然后可以继续说在此基础上继续五六七八四个场景,添加新角色,之后依然可以继续在继续四个情节,遇到新的朋友,等等,他都能够正确的识别和输出角色一致小图片。

看效果:

bobo.png

图效果很长,不然怎么能说明效果呢?如果有意向作这种小故事的,非常实用!

主要关注点

上面的 prompt 很长,里面有几个需要关注的点,理解了这些点,就可以自己修改,形成自己故事里的角色一致性了。

上面的 prompt 定义了一个主角,是一只名叫波波的小鸭子,给他定义了清晰的形象:一只黄色的鸭子,围着红色围巾,戴着宽檐棕色帽子,帽子上装饰着彩色羽毛。 这个形象是重点,你必须清晰的定义出你故事中的角色形象,让他在每次生成 DALL-E prompt 的时候,都不可改变。

从上到下需要关注的点有:

  1. 示例情节。
  2. 图片尺寸,如果你做的插画不是固定尺寸,可以让他自由生成。
  3. 清晰的角色形象。
  4. 艺术风格和色彩。
  5. 生成插画的指南部分,可以稍微调整,满足更加个性化的需求。

基本行就这些,但是如果想要自己定制,还是要必须理解这些 prompt 的逻辑。对于深入使用 ChatGPT 的同学来说,非常容易理解,不太理解的,可以留言,共同交流。

有什么意义?

角色一致性,每个大模型都在努力克服中,写这么复杂的 prompt 有什么意义呢?至少是一种过渡技术。

任何新旧事物交替的过程中,都会产生过渡阶段,过渡阶段有时候长,有时候短。在这些过渡阶段,我们必须使用一种补丁技术来平滑的过渡到新阶段,这个 prompt 就有这样的效果。

如果有一天,大模型解决了角色一致性问题,那么你只需要简单修改、删除这个 prompt 中的一些要求,使其更加简洁明了就行了。

因为即使解决了图片中角色的一致性问题,你总是告诉大模型你的目的是什么,以及在达到这个目的的过程中,你期望有哪些个性化的要求,个性化的约束,而不是全由大模型去完成。当然,你也可以完全让大模型完成...

期待这个 prompt 能够给有志做内容产出的小伙伴一点儿启发。