提示词撰写的实践经验
1. 控制画面内容
- 提示词写什么,AI都会尽量展示出来;而提示词没有写到的,则画面很可能出不来。
- 如果人为地把提示词写乱了,画面效果同样也会很差。
- 如果画面内容超出的常规的想象,AI也未必能尽善尽美地描绘。比如
toothbrushes, in the shape of bumblebees
只能在toothbrushes
和bumblebees
中寻找平衡:
偏向toothbrushes | 偏向bumblebees | 折中 |
---|---|---|
- 提示词并非越多越好,越多会让画面变得很杂糅,少量的提示词也会得到较好的效果。比如只使用
1 car , photography, high-res
就可以得到这样的图:
2. 控制画面风格
- 通常情况下,可以通过常用的方案对画风进行把控,如
anime、comic
对应动漫插画风,realistic、photograpy
对应写实风 - 可以参考这里,修改画面风格。
- 对于氛围感、设计感、高级感等较泛的概念,建议使用对画面内容进行形容的词汇,以期可以获得更好的画面效果。
- 对于早期的大模型,需要更换模型才能更好地更换风格;对于近期的大模型,如FLUX、SD3.5等,如果需要明确的图像风格,建议加载契合的lora模型,以达到更好的画面效果。
- 由于模型训练的原因,部分提示词会和画风隐式的挂钩,如
1girl
会触发动漫插画风,而1 woman
则会更写实一些。实际作画过程中如果遇到,需要酌情、细致地进行微调。
1 girl, bike, spring | 1 woman, bike, spring |
---|---|
3. 控制构图
- 可以给AI描述画面结构和其中的内容,让AI更好地表达画面构图,如
at the top of the image
、at the bottom of the image
、center section
等。 - 可以给AI提供镜头信息,以便AI控制画面视角,如
closely view
、looking at viewer
、top view
等。
4. 去除图像尺寸信息
- 在Stable Diffusion中是额外设置尺寸信息的,不用在提示词中设置尺寸信息(宽、高、宽高比)。
5. 图像尺寸比例
- 建议为1:1、2:3、3:2、3:4、4:3、16:9、9:16,对于1:2、1:3、2:1、3:1等长幅比例或宽幅比例,效果较差于常规的图像尺寸。
- SD 3.5系列适用于100万像素分辨率的专业用例,而对于FLUX系列,Pro、Dev和Schnell三个版本最高可输出200万像素分辨率的图像,而Pro Ultra最高可输出400万像素分辨率的图像,其中,Dev和Schnell可以本地部署使用,Pro和Pro Ultra只能调用官方API使用。
6. 提示词权重调整
- 对于想要强化和弱化的提示词,可以用()、[]进行权重调整,每一层括号,权重调整1.1倍、0.9倍,如
((cow))
【强化1.21倍】、(boy)
【强化1.1倍】、[moon]
【弱化0.9倍】 - 可以用
(cow:1.5)
类似的方法,直接调整某个提示词的权重。
7. 通用问题
- 对于人体的解剖学结构,AI目前依然不能全部准确地理解,只能尽力去避免或者局部重绘,主要出现的问题是手部畸形、身体比例畸形,卧姿畸形等。
- 画风油腻问题,一般出现在描绘真实场景时出现,体现为画面质感过于油腻,颗粒感不足。为避免这种情况,可参考的解决方案有:
- 确认提示词是否倾向于真实场景
- 提示词中添加photograph、realistic style、studio photography等,以强调写实场景
- 内部工作流中添加专用于真实场景的Lora模型,好处在于能够更好地改变出图效果,劣势在于不能再随意切换到其他出图效果中了。