跳转至

提示词撰写的实践经验

1. 控制画面内容

  • 提示词写什么,AI都会尽量展示出来;而提示词没有写到的,则画面很可能出不来
  • 如果人为地把提示词写乱了,画面效果同样也会很差
  • 如果画面内容超出的常规的想象,AI也未必能尽善尽美地描绘。比如toothbrushes, in the shape of bumblebees只能在toothbrushesbumblebees中寻找平衡:
偏向toothbrushes 偏向bumblebees 折中
alt text alt text alt text
  • 提示词并非越多越好,越多会让画面变得很杂糅,少量的提示词也会得到较好的效果。比如只使用1 car , photography, high-res就可以得到这样的图:

alt text

2. 控制画面风格

  • 通常情况下,可以通过常用的方案对画风进行把控,如anime、comic对应动漫插画风realistic、photograpy对应写实风
  • 可以参考这里,修改画面风格。
  • 对于氛围感设计感高级感等较泛的概念,建议使用对画面内容进行形容的词汇,以期可以获得更好的画面效果。
  • 对于早期的大模型,需要更换模型才能更好地更换风格;对于近期的大模型,如FLUXSD3.5等,如果需要明确的图像风格,建议加载契合的lora模型,以达到更好的画面效果。
  • 由于模型训练的原因,部分提示词会和画风隐式的挂钩,如1girl会触发动漫插画风,而1 woman则会更写实一些。实际作画过程中如果遇到,需要酌情、细致地进行微调。
1 girl, bike, spring 1 woman, bike, spring
alt text alt text

3. 控制构图

  • 可以给AI描述画面结构其中的内容,让AI更好地表达画面构图,如at the top of the imageat the bottom of the imagecenter section等。
  • 可以给AI提供镜头信息,以便AI控制画面视角,如closely viewlooking at viewertop view等。

4. 去除图像尺寸信息

  • 在Stable Diffusion中是额外设置尺寸信息的,不用在提示词中设置尺寸信息(宽、高、宽高比)。

5. 图像尺寸比例

  • 建议为1:1、2:3、3:2、3:4、4:3、16:9、9:16,对于1:2、1:3、2:1、3:1等长幅比例宽幅比例,效果较差于常规的图像尺寸。
  • SD 3.5系列适用于100万像素分辨率的专业用例,而对于FLUX系列Pro、Dev和Schnell三个版本最高可输出200万像素分辨率的图像,而Pro Ultra最高可输出400万像素分辨率的图像,其中,Dev和Schnell可以本地部署使用,Pro和Pro Ultra只能调用官方API使用。

6. 提示词权重调整

  • 对于想要强化弱化的提示词,可以用()[]进行权重调整,每一层括号,权重调整1.1倍0.9倍,如((cow))【强化1.21倍】、(boy)【强化1.1倍】、[moon]【弱化0.9倍】
  • 可以用(cow:1.5)类似的方法,直接调整某个提示词的权重

7. 通用问题

  • 对于人体的解剖学结构,AI目前依然不能全部准确地理解,只能尽力去避免或者局部重绘,主要出现的问题是手部畸形身体比例畸形卧姿畸形等。
  • 画风油腻问题,一般出现在描绘真实场景时出现,体现为画面质感过于油腻,颗粒感不足。为避免这种情况,可参考的解决方案有:
  • 确认提示词是否倾向于真实场景
  • 提示词中添加photographrealistic stylestudio photography等,以强调写实场景
  • 内部工作流中添加专用于真实场景的Lora模型好处在于能够更好地改变出图效果劣势在于不能再随意切换到其他出图效果中了