Prompt Engineering:AIGC 设计师的核心竞争力
上周,一位学员拿着两张图来找我:“老师,我用同样的提示词,在 Midjourney 和 DALL·E 3 里生成的结果完全不同,一个像概念艺术,一个像产品渲染图。到底哪个是对的?”
这个问题很典型。很多设计师以为“写提示词”就是堆砌形容词,但真正拉开差距的,是 对 Prompt 结构的理解,以及 针对不同工具的适配能力。在 AIGC 时代,不会写 Prompt 的设计师,就像拿着单反却只懂按快门——你能出图,但永远出不了好图。
今天,我们就从“能出图”到“能控图”,拆解 Prompt Engineering 的核心方法。
—
一、Prompt 的“三层架构”:从乱写到精准控制
1.1 为什么你的提示词总失效?
大多数人写 Prompt 是这样的:
> “一只可爱的猫,坐在沙发上,高清,写实风格,电影感”
这种写法有两个致命问题:
- 信息堆砌:AI 无法区分主次,容易忽略关键元素
正确的做法是 按“主体-环境-风格-参数”分层构建。以 Midjourney 6.1 为例,一个专业级 Prompt 的骨架是:
[主体描述] + [环境/背景] + [风格/媒介] + [光照/色彩] + [构图/视角] + [技术参数]
1.2 实操案例:从“翻车”到“出片”
案例目标:生成一张“赛博朋克风格的中国茶馆,雨夜,霓虹灯反射在湿漉漉的石板路上”
错误版本(学员原始 Prompt):
Cyberpunk Chinese tea house, rain, neon lights, wet street, realistic
结果:画面混乱,霓虹灯和茶馆元素混合,像是日式动漫场景。
正确版本(经过三层架构优化):
主体:A traditional Chinese tea house with curved eaves and wooden lattice windows
环境:Rainy night, wet cobblestone street reflecting neon signs, steam rising from tea cups
风格:Cyberpunk aesthetic, blade runner vibes, volumetric lighting, cinematic
参数:--ar 16:9 --v 6.1 --s 250 --style raw
关键参数说明:
效果对比:优化后的 Prompt 生成结果,茶馆结构清晰,霓虹灯反射在石板路上形成倒影,蒸汽和雨丝有层次,整体更像电影截图而非插画。
—
二、工具适配:同一段 Prompt,不同 AI 的反应
2.1 核心原则:理解 AI 的“语言偏好”
AIGC 工具本质上是 语言模型 + 扩散模型的组合。不同工具的训练数据、权重分配不同,导致对同一段 Prompt 的解读差异巨大。
| 工具 | 擅长领域 | 对 Prompt 的敏感点 |
|——|———|——————|
| Midjourney | 艺术性、氛围感 | 风格关键词、艺术家引用 |
| DALL·E 3 | 写实度、文字生成 | 精确的物体名称、空间关系 |
| Stable Diffusion | 可控性、局部修改 | 负面提示词、权重标记 |
2.2 实操案例:为 DALL·E 3 重构 Prompt
同样是“赛博朋克茶馆”,DALL·E 3 对“传统建筑”的理解更偏向 几何结构,而对“氛围感”的依赖较低。因此需要调整表达方式:
针对 DALL·E 3 的优化版本:
A hyper-realistic photograph of a traditional Chinese tea house in a futuristic city. The building has curved eaves and red lanterns. Rain is falling on a cobblestone street, creating reflections of blue and pink neon signs. Steam rises from a ceramic teapot on an outdoor table. The scene is shot with a 35mm lens, shallow depth of field, cinematic lighting.
关键差异:
结果:DALL·E 3 生成的茶馆带有明显的光学镜头效果(如焦外虚化),石板路的纹理更接近真实照片,而 Midjourney 版本则更接近概念艺术。
2.3 进阶技巧:利用负面提示词(Negative Prompt)
在 Stable Diffusion 中,负面提示词是控制质量的利器。例如,在生成“赛博朋克茶馆”时,添加:
Negative prompt: cartoon, anime, illustration, watercolor, blurry, low quality, deformed buildings, incorrect perspective
能让 SD 避免输出二次元风格,保持写实感。这在 Midjourney 中可以通过 `–no` 参数实现类似效果:`–no cartoon, anime, illustration`。
—
三、参数调优:让 AI 听你的话
3.1 Midjourney 的“隐藏参数”组合
除了基础参数,Midjourney 6.1 还支持一些高级控制:
实战组合:生成“超现实茶馆”
A tea house floating in the sky, upside down, with waterfalls flowing upward --v 6.1 --chaos 80 --weird 1000 --ar 16:9
3.2 迭代法:用“反推提示词”优化
当你对某张图满意但想微调时,使用 Describe 功能(Midjourney 的 `/describe` 命令)反推提示词。例如,上传一张满意的图,AI 会生成 4 个可能的 Prompt,你可以:
1. 选择最接近你想法的那个
2. 修改关键元素(如“把红色灯笼换成蓝色”)
3. 调整参数(降低 `–s` 值增加写实度)
注意:反推的 Prompt 通常包含冗余信息(如“8k resolution”),需要手动精简。
—
总结与进阶建议
核心结论
1. Prompt 是结构化编程:不是写作文,而是给 AI 设定参数范围
2. 工具适配是必修课:同一段 Prompt 在不同工具中效果天差地别
3. 参数是控制权:学会使用 `–v`、`–s`、`–chaos` 等参数,才能从“抽卡”变成“设计”
学习路径建议
推荐工具
—
常见问题 FAQ
Q1:为什么我用了同样的 Prompt,在 Midjourney 和 Stable Diffusion 里结果完全不一样?
A:因为训练数据和模型架构不同。Midjourney 更强调艺术风格,SD 更依赖数学计算。建议为每个工具建立独立的 Prompt 库,不要直接复用。
Q2:Prompt 越长越好吗?
A:不是。超过 200 个字符的 Prompt 容易导致 AI 注意力���散��忽略核心元素。建议控制在 100-150 字符,用精确的动词和名词代替长句。
Q3:如何让 AI 生成特定角色的连续形象?
A:使用 种子值(Seed)。在 Midjourney 中,每张图生成时都有种子号,固定种子值(`–seed 12345`)可以保持角色面部特征一致。Stable Diffusion 同理。
Q4:负面提示词(Negative Prompt)在 Midjourney 里怎么用?
A:Midjourney 不支持直接写负面提示词,但可以用 `–no` 参数:`–no cartoon, blurry`。注意 `–no` 只能排除大类别,无法像 SD 那样精确到“排除特定颜色”。
Q5:为什么我加了“photorealistic”但结果还是像插画?
A:因为 AI 对“photorealistic”的理解依赖训练数据。建议替换为更具体的摄影术语,如“shot with Canon EOS R5, 85mm lens, f/1.4, ISO 200, natural light”,触发更真实的渲染逻辑。

评论(0)