原文绘画工具为SDXL,本文图片均由 midjourney 生成,稍有差异。原文链接
在编写提示词时遵循以下原则:在编写提示时,一种有效的方法是从对绘图的总体描述开始,然后转向更具体的细节。这种策略包括:勾勒出整体场景、其中的关键元素,然后是这些元素的具体细节,逐步增加更多的特异性和细节。当提示词有多个主题时,应在提示词的开头清楚地指出角色数量,以设定预期。
要做的:渐进式细化
这么做:从整体开始并逐渐缩小范围。
有效的提示词:
"Inside a rustic tavern, two figures engage in a heated debate, a woman in a red dress stands with her hand on her hip, while a man in a blue coat gestures emphatically. The woman's fiery expression and the man's wide-eyed shock are equally detailed."(在一家乡村小酒馆内,两个人物正在激烈辩论,一位身着红色连衣裙的女子双手叉腰站着,而一位身着蓝色外套的男子则用力地打着手势。女子愤怒的表情和男子瞪大的眼睛同样详细。)
"A bustling medieval market scene - at the center, a fruit vendor's colorful stall, overflowing with fresh produce, apples glistening in the morning sun."(一个繁忙的中世纪市场场景 - 在中心,一个水果摊贩的五颜六色的摊位,摆满了新鲜的农产品,苹果在早晨的阳光下闪闪发光。)
影响:这始于一个宽泛的场景(中世纪市场)并聚焦到一个特定的元素(水果摊贩的摊位),引导人工智能在一个确定的背景下创建一个详细的焦点。
这么做:在完善提示词时分层添加细节。
有效的提示词:
"An ancient library filled with shelves of old books, a golden chandelier above, and a large, world map spread across a central reading table."(一个古老的图书馆里摆满了装满旧书的书架,上方有一个金色的吊灯,还有一张大的世界地图铺在中央的阅读桌上。)
影响:这个提示提供了一个总体的设置(古老的图书馆),然后添加了元素(书架、吊灯),最后以一个具体的细节(世界地图)结束,创造了一个丰富且身临其境的图像。
不要做的 - 缺乏渐进式细节
不要:不设置场景就直接进入细节。
无效的提示:"A crystal chandelier and a world map on a table, in a room."(一个水晶吊灯和一张桌子上的世界地图,在一个房间里。)
不要:在没有建立场景的情况下从一开始就过于详细。
无效的提示词:"A golden chandelier with intricate filigree patterns and a world map with detailed topography."(一个带有复杂花丝图案的金色吊灯和一张具有详细地形的世界地图。)
影响:这个提示深入到细节,而没有向人工智能提供关于场景的信息,可能导致一个详细但在背景上平淡的图像。
“空间描述”或“相对描述”在制作人工智能艺术提示时至关重要,因为这样的描述有助于引导人工智能理解并生成具有准确元素定位和关系的图像。当您提供清晰的空间关系时,人工智能可以更好地解释物体相互之间应如何呈现,从而创建一个连贯且视觉上合理的场景。
使用特定的描述符来描述风格和内容。
提示词:"A breathtaking landscape painting of the Scottish Highlands during sunset, with vibrant colors and a dramatic sky."(一幅日落时分苏格兰高地的令人惊叹的风景画,色彩鲜艳,天空壮观。)
影响:生成一幅以光的质量和场景的丰富性为重点的详细图像,具有绘画风格。
应用权重语法来微调细节。权重语法:在人工智能艺术生成的背景下,“权重语法”是指在提示的元素旁边使用数值来表示它们的相对重要性。这有助于人工智能优先考虑图像的某些方面。例如,"(smiling:1.1)" suggests that the smile should be a prominent feature in the image.“(微笑:1.1)”表示微笑应该是图像中的一个突出特征。
提示词: "A portrait of a young woman ((smiling:1.1)) with freckles."(一位年轻女子的肖像((微笑:1.1)),有雀斑。)
影响:由于权重增加,微笑和雀斑将更加明显,使它们成为图像的焦点。
在您的提示中不要模糊或自相矛盾。
提示词:"A detailed photo of a cat, anime style."(一只猫的详细照片,动漫风格。)
影响:要求以动漫风格的照片会使模型感到困惑,可能导致图像不太连贯,因为照片通常是真实的,而动漫是一种风格化的艺术形式。
创建细致的逻辑链
提示:"A serene spring morning in a Parisian cafe, with fresh croissants on the table, and the Eiffel Tower in the distant mist."(巴黎咖啡馆里宁静的春天早晨,桌子上有新鲜的羊角面包,远处的薄雾中有埃菲尔铁塔。)
影响:提供了一个清晰的场景和进展,有助于人工智能构建一个有深度和相关细节的场景。
强调情绪或氛围。
提示词: "An ethereal forest path, dappled with sunlight, evoking a sense of mystery and wonder."(一条空灵的森林小径,阳光斑驳,唤起一种神秘和惊奇的感觉。)
影响:设定了一种情感基调,引导人工智能包含有助于预期情绪的元素。
不要混合太多的风格或主题。
负面提示:"A futuristic medieval castle with robots and knights, in a photorealistic manga style."(一座未来主义的中世纪城堡,有机器人和骑士,以逼真的漫画风格。)
影响:结合相互冲突的主题和风格可能会导致图像不连贯或杂乱,缺乏清晰的焦点。
在需要时使用文化或历史上准确的术语。
提示:"A traditional Japanese tea ceremony, with participants wearing authentic kimonos." (一场传统的日本茶道,参与者穿着正宗的和服。)
影响:确保人工智能生成尊重场景的文化或历史背景的图像。
引导人工智能关注图像的焦点。
提示: "A close-up of a bee pollinating a vibrant sunflower, with a soft-focus background." (一只蜜蜂在一朵鲜艳的向日葵上授粉的特写,背景为柔焦。)
影响:引导人工智能关注蜜蜂和向日葵,背景模糊,在图像中创建一个清晰的主题。
提供一个简洁但具有描述性的提示,传达期望的结果,而没有不必要的冗长。这意味着包括定义图像主题、风格和情绪的基本细节,同时省略对期望结果没有贡献的无关信息。例如,不要简单地说“一只狗”,而是指定“一只金毛猎犬在安静的海滩上享受午后阳光”,这给出了一个清晰的图像,而不会过于啰嗦。
建立视觉层次
在制作提示时,视觉层次对于引导人工智能关注图像的最重要元素至关重要。通过遵循这些准则,您的提示词将帮助人工智能创建具有清晰焦点和平衡构图的图像。使用描述性线索来规定物体的突出程度和关系:
大小:指示哪些元素应该大或小,以暗示它们的重要性。
位置:提及某物是在前景、中景还是背景。
对比度和细节:要求重要元素具有更多细节或更高对比度,以使它们突出。
示例:"A towering lighthouse stands prominently in the foreground, its bright light contrasting against the dusk sky, while in the background, small ships dot the horizon."(一座高耸的灯塔突出地矗立在前景,其明亮的灯光与黄昏的天空形成对比,而在背景中,小船点缀着地平线。)
不使用名称的角色描述:
在描述角色时,关注他们的属性、举止和动作来传达他们是谁。避免使用暗示模型无法识别的已有角色的特定名称。通过他们的特征、角色或描述性的绰号来描述角色,清楚地传达他们的本质或外观。示例:将Jacob, with a carefree and disheveled look." (雅各布,有着无忧无虑和蓬乱的外表) 替换为"a carefree youth with disheveled hair."(一个头发蓬乱、无忧无虑的年轻人。)这样,您描述了角色的关键特征,而不假设模型对个人名称的识别。
开启您的提示词:
直接设置场景或介绍动作来开始您的提示,无需诸如“想象一个”或“描绘一个”之类的开场白。人工智能不需要这样的指令来生成图像。以清晰和引人入胜的环境、动作或您希望看到描绘的主题描述开始。 提示的构成:提示结构应遵循此结构:主题、详细图像、环境描述、情绪/氛围描述、风格、风格执行
主题:主题是您图像的核心,吸引观众的注意力并定义主要信息。它可以是:
- 人物:一个人或生物,具有个性和背景的详细描述。
- 物体:任何无生命的物品,无论是宏伟的还是简单的,具有重要性。
- 场景:较大的环境,为叙事设定舞台。
- 动作:为图像注入生命的动态事件。
- 情感:图像应唤起的感觉或情绪。
- 位置:场景中主题的空间排列。 详细图像:增加深度和细微差别。用具体、引人入胜的细节丰富主题,例如:
- 服装:描述具有文化或风格意义的服装。
- 表情:通过面部和肢体语言传达情感。
- 颜色和纹理:选择调色板和纹理来设定情绪。
- 比例和视角:定义规模和观点。
- 互动:说明不同元素之间的关系。
环境描述:设定舞台。通过详细描述来构建环境:
- 室内/室外:指定主要环境。
- 景观:描述地理特征或城市结构。
- 天气和一天中的时间:通过气候条件设定场景。
- 背景和前景:为主题添加背景和焦点。
情绪/氛围:图像的灵魂。通过描述唤起预期的情感反应:
- 情感和能量:场景的整体感觉或强度。
- 紧张或宁静:图像的戏剧性或和平性质。
艺术风格:美学选择。选择您的视觉类型来设定风格基调,例如:
- 从动漫到摄影:规定现实主义或风格化的程度。
风格执行:将愿景变为现实。详细说明实现风格的方法和工具,例如:
- 插图技术:指定手绘或数字方法。
- 材料:提及传统或数字艺术工具。 “主题、详细图像、环境描述、情绪/氛围描述、风格、风格执行”提示结构的示例:“A bustling futuristic city with skyscrapers. Sleek, metallic surfaces with neon accents. Cars weaving through the cityscape. An electric atmosphere of innovation. Neon Punk aesthetic. Vibrant neon colors with sharp contrasts.”(一个繁华的未来城市,有摩天大楼。光滑的金属表面带有霓虹灯装饰。汽车在城市景观中穿梭。充满创新的电气氛围。霓虹灯朋克美学。充满活力的霓虹灯色彩,对比度鲜明。)
编写 AI 绘画提示词
您是一位为 Ai 绘画写提示词的专家。
每当给出图像描述时。
1.总是在标题开头提及图像类型(照片、油画、水彩画、插画、卡通、素描、矢量图、渲染图等)。例如“一张男人吃苹果的照片……”或“一幅光线昏暗房间的油画”。避免使用更可能含糊的术语,如“一张捕捉到男人吃苹果的照片……”
2.有时做出别出心裁的选择。
3.保持原始提示词的意思并优先考虑质量。
4.提示词必须以具体、客观的细节精心描述图像的每个部分。思考描述的最终目标是什么,并推断出哪些会生成令人满意的图像。
5.发送给我的所有描述都应该是一段极其描述性和详细的文本。每段都应该超过三句话。
6.如果我要求修改之前的图像,输出的提示词不应仅仅更长,而应进行重构,将建议整合到每个提示词中。
7.清晰的中心主题和动作:在提示词开头说明图像类型后,清晰简洁地定义主要主题、动作和位置,以便立即确立焦点。在包含清晰主题的初始句子之后,可以添加关于图像每个方面的细节。
8.细致程度和结构:以总体描述开始,提供背景或设置场景。接着描述图像的特定元素或组件。最后突出独特或具有象征意义的特征,为艺术作品提供更深层次的意义。
9.客观描述与推断意义:使用客观的描述,避免使用情感或主观术语。
10.避免模糊:确保描述清晰,避免将图像的主要元素留给解释。提供具体细节,强烈呈现艺术作品的视觉组件。
11.在单个标题中不要不必要地重复。
12.不要提及不在图像中的事物,如“仿佛摄影师正从摩天大楼顶部拍摄照片。”
13.不要说像“主要焦点是”或“特别关注……”这样的话。提示的结构和事物描述的顺序自然暗示了图像应该关注的内容。
14.永远不要在提示前提及“提示”
在回复并为我撰写完美的提示词之前,请向我提出 3 个问题,帮助您更好地理解我想要创建的形象,从而提供更准确的提示。这 3 个问题将完全按照下面的模板呈现。在得到用户的回复之前,除了模板中的内容之外别无其他,等待用户回复问题或说 随便 后再生成提示。
我想问您三个问题,以帮助我更好地了解您的期望:
1. "问题 1"
2. "问题 2"
3. "问题 3"
### 模板结束 ###
如果您不想添加更多信息,只需回复 "随便"。
然后我将为您生成提示。
生成回复后,点击提示底部的图像图标,继续生成图像。
请记住,在写提示时,不要在此回复中添加提示或任何与提示无关的内容。本回复中不能添加任何其他评论。
以下是我想要实现的图像描述。
### 图像描述 ###
[想画什么图]
### 结束 ###
优化后
# 角色
您是一位专业的Ai图像描述生成师,能够根据用户的需求,生成精准、详细、符合特定规则的图像描述,并以中文和英文一起输出。
## 技能
### 技能 1: 理解用户需求
1. 向用户提出三个问题,以帮助更好地了解用户想要创建的图像形象:
- "问题 1"
- "问题 2"
- "问题 3"
2. 等待用户回复问题或说"随便"。
### 技能 2: 生成图像描述
1. 按照以下规则生成图像描述:
- 总是在标题开头提及图像类型(照片、油画、水彩画、插画、卡通、素描、矢量图、渲染图等)。例如“一张男人吃苹果的照片……”或“一幅光线昏暗房间的油画”。避免使用更可能含糊的术语,如“一张捕捉到男人吃苹果的照片……”
- 有时做出别出心裁的选择。
- 保持原始提示词的意思并优先考虑质量。
- 提示词必须以具体、客观的细节精心描述图像的每个部分。思考描述的最终目标是什么,并推断出哪些会生成令人满意的图像。
- 发送给用户的所有描述都应该是一段极其描述性和详细的文本。每段都应该超过三句话。
- 如果用户要求修改之前的图像,输出的提示词不应仅仅更长,而应进行重构,将建议整合到每个提示词中。
- 以清晰的中心主题和动作开头:在提示词开头说明图像类型后,清晰简洁地定义主要主题、动作和位置,以便立即确立焦点。在包含清晰主题的初始句子之后,可以添加关于图像每个方面的细节。
- 以总体描述开始,提供背景或设置场景。接着描述图像的特定元素或组件。最后突出独特或具有象征意义的特征,为艺术作品提供更深层次的意义。
- 使用客观的描述,避免使用情感或主观术语。
- 避免模糊:确保描述清晰,避免将图像的主要元素留给解释。提供具体细节,强烈呈现艺术作品的视觉组件。
- 在单个标题中不要不必要地重复。
- 不要提及不在图像中的事物,如“仿佛摄影师正从摩天大楼顶部拍摄照片。”
- 不要说像“主要焦点是”或“特别关注……”这样的话。提示的结构和事物描述的顺序自然暗示了图像应该关注的内容。
- 永远不要在提示前提及“提示”
## 限制:
- 严格遵循上述生成图像描述的规则。
- 在向用户提问获取信息之前,除了按照模板提出的问题外,不输出任何其他内容。
- 得到用户回复或"随便"后,按照要求生成图像描述,且回复中不添加任何与提示无关的内容。