Prompt Engineering:AIGC 设计师的核心竞争力
上周三的直播答疑课上,一位学员发来两张图:一张是 Midjourney 生成的“赛博朋克风咖啡馆”,画面里霓虹灯管歪歪扭扭,人物手指像被压路机碾过;另一张是他在小红书看到的“神仙作品”——同样的主题,光影通透、细节炸裂,连咖啡杯上的蒸汽都带着情绪。他问我:“老师,我用的也是 V6 模型,关键词也抄了,为什么我的像车祸现场?”
我让他把 Prompt 发过来,一看就笑了:`cyberpunk cafe, neon lights, barista, coffee`——五个词,零修饰。而那张神仙作品的 Prompt 足足 327 个字符,里面嵌入了相机型号、光圈值、光线角度、材质描述,甚至还有“volumetric steam”这种物理关键词。
这就是 AIGC 设计师的分水岭:会用工具的人很多,但能精准控制工具的人,才是稀缺资源。 Prompt Engineering 不是玄学,而是可以拆解、复制、优化的工程技术。今天,我们就用两个实操案例,把它讲透。
一、Prompt 的结构化拆解:从“关键词堆砌”到“指令工程”
1.1 为什么你的 Prompt 像“碎碎念”?
很多设计师把写 Prompt 当成“掷骰子”:想到什么词就往上扔,最后画面靠运气。但专业 Prompt 是有固定框架的。我把它总结为 4C 法则:
- Context(语境):主体、场景、时间
拿开头那个“赛博朋克咖啡馆”举例。改写后的 Prompt 是这样的:
/Imagine prompt:
A futuristic coffee shop interior, cyberpunk aesthetic,
neon blue and magenta lighting,
rain-slicked window reflecting street signs,
barista pouring latte art with precise hands,
shot on Leica M6, 35mm f/1.4, shallow depth of field,
volumetric haze, realistic skin texture,
octane render style, 8K, --ar 16:9 --v 6
看到区别了吗?这不是“关键词”,而是“视觉命令”。每个短语都在约束画面的一部分。
1.2 工具实操:用 Midjourney 的“/describe”反向工程
如果你看到一张好图,但不知道 Prompt 怎么写的,别猜。Midjourney 自带的 `/describe` 命令能帮你逆向解析。
操作步骤:
1. 在 Discord 输入 `/describe`,上传目标图片
2. 系统返回 4 个 Prompt 建议
3. 选择最接近的版本,手动调整参数
上周我解析一张“哥特风教堂室内”图时,系统给出的 Prompt 里有个词 `“gobelin tapestry texture”`(戈布兰挂毯纹理)。我查了资料才知道,这个词直接让 AI 生成了一种特定编织纹理。这就是设计师的知识壁垒:你不仅要会写词,还要知道哪些词能触发特定效果。
二、进阶控制:参数级 Prompt Engineering
2.1 Stable Diffusion 的“负向 Prompt”与权重控制
如果说 Midjourney 是“画图”,那 Stable Diffusion 就是“炼丹”。它最大的优势是 精准控制。但很多新手只写正向 Prompt,忽略负向 Prompt,导致画面出现“六指琴魔”或“建筑扭曲”。
具体操作(WebUI 1.7.0 版本):
场景: 生成一张“中世纪药剂师的工作台”,要求细节丰富,但不能有现代元素。
正向 Prompt:
(masterpiece, best quality:1.2), medieval apothecary table,
glass vials with colored liquids, dried herbs hanging from ceiling,
candlelight illumination, brass scales, worn wooden surface,
dust motes in light beam, hyperdetailed, photorealistic
负向 Prompt:
plastic, modern, smartphone, electricity, metal chair,
digital watch, neon sign, cartoon, (worst quality, low quality:1.4),
extra fingers, deformed hands, twisted body
这里的关键是 `(word:weight)` 语法。`(masterpiece:1.2)` 表示这个词的权重增加 20%,`(worst quality:1.4)` 表示负向权重增加 40%。权重不是越高越好,1.2-1.5 是安全区间,超过 2.0 会导致画面过饱和。
参数设置:
2.2 ControlNet 的“结构约束”:让 AI 按你的构图走
很多设计师抱怨:“AI 生成的构图总是歪的,主体不在我想要的焦点上。” 这时候要用 ControlNet(版本 1.1.441)。
操作案例: 生成一张“宇航员在火星上种花”,但要求构图是“人物在右侧,面朝左,花在左下角”。
步骤:
1. 在 Photoshop 里画一个极简草图(火柴人+方块花盆)
2. 导入 ControlNet,选择 Canny(边缘检测) 模型
3. 设置参数:`Control Weight: 0.8`,`Starting Control Step: 0.1`,`Ending Control Step: 0.9`
4. 写 Prompt:`astronaut planting flowers on Mars, red soil, glass helmet reflecting sunset, delicate hands, hyperrealistic`
参数解释:
2.3 进阶技巧:用“种子值”锁定风格
你有没有遇到过:同一段 Prompt 跑两次,结果完全不一样?这是因为每次生成都是随机种子。要复现结果,必须锁定种子值。
操作:
1. 生成一张满意的图后,在图片信息里找到 `Seed: 123456789`
2. 下次生成时,在参数栏输入 `–seed 123456789`(Midjourney)或 `Seed: 123456789`(SD)
3. 微调 Prompt 中的关键词,观察变化
实战技巧: 先跑 10 张图,选出构图最好的那张,锁定它的种子,然后修改 Prompt 中的颜色/材质描述。这样你就能在保持构图的前提下,快速迭代风格。
三、Prompt Engineering 的“心法”:设计师的不可替代性
3.1 为什么 AI 无法取代你?
有人说:“以后设计师就失业了,AI 自己就能生成。” 这是对 Prompt Engineering 最大的误解。AI 生成的内容是“概率产物”,而设计师的价值在于“意图定义”。
举个例子:你让 AI 生成“悲伤的蓝色调”,它可能会给你一张阴天的海景。但真正的设计师知道,“悲伤的蓝色”在色彩心理学里是 `#2C3E50` 的深蓝灰,在摄影里是“低饱和度+高对比度”,在材质上要搭配“磨砂玻璃”而不是“抛光金属”。这些知识库,是 Prompt 写不出来的,但 Prompt 可以调用它们。
3.2 建立你的“Prompt 知识库”
我建议每个设计师都建一个 Prompt 模板库,按场景分类:
| 场景 | 核心词 | 参数模板 |
|——|——–|———-|
| 产品摄影 | product shot, studio lighting, white background | –ar 4:3 –v 6 –style raw |
| 概念设计 | concept art, matte painting, cinematic lighting | –ar 16:9 –v 6 –stylize 250 |
| 角色设计 | character design, turnarounds, clean lineart | –ar 3:4 –niji 6 |
每次生成时,从模板出发,只修改 2-3 个变量。这样你就能快速积累“什么词产生什么效果”的经验。
3.3 未来趋势:多模态 Prompt 和 LORA 微调
2024 年,Midjourney 发布了 `–style reference` 参数,Stable Diffusion 的 LORA 模型已经能��刻特定画风。这意味着 Prompt 正在从“文字指令”变成“多模态指令”。
学习建议:
四、总结与进阶建议
Prompt Engineering 不是“魔法咒语”,而是一套 可复用的设计控制工程。它需要你同时具备三样东西:
1. 视觉知识:懂构图、色彩、光影
2. 工具认知:知道每个参数的边界
3. 迭代思维:不追求一次完美,而是用种子值+微调逼近目标
进阶路径:
最后送你一句话:AI 是画笔,Prompt 是握笔的手。手不稳,再好的笔也画不出好画。
—
常见问题 FAQ
Q1:为什么我复制了网上的 Prompt,生成的效果不一样?
A:因为版本不同。Midjourney V6 和 V5 对 Prompt 的解析方式差异很大。V6 更注重自然语言理解,不需要堆砌关键词。建议先确认版本,再用 `/info` 查看当前设置。
Q2:负向 Prompt 写多少词合适?
A:一般 5-10 个核心负面词即可,太多会干扰模型。重点放“手部畸形”“低质量”“不想要的风格”三类。注意不要和正向 Prompt 冲突,比如正向写了“realistic”,负向就别写“photorealistic”。
Q3:为什么我用了 ControlNet,画面还是偏离草图?
A:检查两个参数:`Control Weight` 是否低于 0.6?`Ending Control Step` 是否太早?如果权重低于 0.6,模型会忽略约束;如果结束步数小于 0.7,模型会在后期自由发挥,导致偏离。
Q4:Stable Diffusion 的 CFG Scale 设多少最合适?
A:没有标准答案。7-9 是通用区间。如果画面太乱(AI 自由发挥过多),提高 CFG 到 10-12;如果画面太死板(完全照搬 Prompt),降低到 5-6。建议用 X/Y 图功能批量测试。
Q5:我想生成特定品牌风格(比如苹果产品图),怎么训练 LORA?
A:准备 20-30 张高清产品图,用 Kohya_ss 训练。关键参数:`Repeat: 10`(每张图重复 10 次),`Epoch: 20`(训练轮次),`Learning Rate: 1e-4`。训练完生成时,权重设 0.6-0.8 即可,太高会过拟合。

评论(0)