跳转至

文档中心

生图提示词技巧

提示词撰写的实践经验

1. 控制画面内容

提示词写什么，AI都会尽量展示出来；而提示词没有写到的，则画面很可能出不来。
如果人为地把提示词写乱了，画面效果同样也会很差。
如果画面内容超出的常规的想象，AI也未必能尽善尽美地描绘。比如toothbrushes, in the shape of bumblebees只能在toothbrushes和bumblebees中寻找平衡：

偏向toothbrushes	偏向bumblebees	折中

提示词并非越多越好，越多会让画面变得很杂糅，少量的提示词也会得到较好的效果。比如只使用1 car , photography, high-res就可以得到这样的图：

alt text

2. 控制画面风格

通常情况下，可以通过常用的方案对画风进行把控，如anime、comic对应动漫插画风，realistic、photograpy对应写实风
可以参考这里，修改画面风格。
对于氛围感、设计感、高级感等较泛的概念，建议使用对画面内容进行形容的词汇，以期可以获得更好的画面效果。
对于早期的大模型，需要更换模型才能更好地更换风格；对于近期的大模型，如FLUX、SD3.5等，如果需要明确的图像风格，建议加载契合的lora模型，以达到更好的画面效果。
由于模型训练的原因，部分提示词会和画风隐式的挂钩，如1girl会触发动漫插画风，而1 woman则会更写实一些。实际作画过程中如果遇到，需要酌情、细致地进行微调。

1 girl, bike, spring	1 woman, bike, spring

3. 控制构图

可以给AI描述画面结构和其中的内容，让AI更好地表达画面构图，如at the top of the image、at the bottom of the image、center section等。
可以给AI提供镜头信息，以便AI控制画面视角，如closely view、looking at viewer、top view等。

4. 去除图像尺寸信息

在Stable Diffusion中是额外设置尺寸信息的，不用在提示词中设置尺寸信息（宽、高、宽高比）。

5. 图像尺寸比例

建议为1:1、2:3、3:2、3:4、4:3、16:9、9:16，对于1:2、1:3、2:1、3:1等长幅比例或宽幅比例，效果较差于常规的图像尺寸。
SD 3.5系列适用于100万像素分辨率的专业用例，而对于FLUX系列，Pro、Dev和Schnell三个版本最高可输出200万像素分辨率的图像，而Pro Ultra最高可输出400万像素分辨率的图像，其中，Dev和Schnell可以本地部署使用，Pro和Pro Ultra只能调用官方API使用。

6. 提示词权重调整

对于想要强化和弱化的提示词，可以用()、[]进行权重调整，每一层括号，权重调整1.1倍、0.9倍，如((cow))【强化1.21倍】、(boy)【强化1.1倍】、[moon]【弱化0.9倍】
可以用(cow:1.5)类似的方法，直接调整某个提示词的权重。

7. 通用问题

对于人体的解剖学结构，AI目前依然不能全部准确地理解，只能尽力去避免或者局部重绘，主要出现的问题是手部畸形、身体比例畸形，卧姿畸形等。
画风油腻问题，一般出现在描绘真实场景时出现，体现为画面质感过于油腻，颗粒感不足。为避免这种情况，可参考的解决方案有：
确认提示词是否倾向于真实场景
提示词中添加photograph、realistic style、studio photography等，以强调写实场景
内部工作流中添加专用于真实场景的Lora模型，好处在于能够更好地改变出图效果，劣势在于不能再随意切换到其他出图效果中了。