Prompt Engineering:AIGC 设计师的核心竞争力
上周,一位学员带着他的 Midjourney 作品来找我,画面是一只“赛博朋克风格的狐狸”,但出来的效果却像卡通贴纸,完全没有“赛博朋克”应有的金属质感、霓虹光影和机械细节。他抱怨说:“AI 根本不懂我。” 我让他把提示词写给我看,他写的是:`cyberpunk style fox, 8k, detailed`。问题出在哪?风格词 `cyberpunk` 太宽泛,缺少对光影、材质、构图的精准控制。这就是典型的“提示词贫血症”。
作为一名 AIGC 设计师,你的核心竞争力不是会点几个按钮,而是能否通过 Prompt Engineering(提示词工程)把模糊的想法转化为可控、可复现、高质量的视觉输出。今天,我们就来拆解这套核心技能。
一、结构化提示词:从“玄学”到“工程”
很多设计师把写提示词当成“许愿”,堆砌一堆形容词。真正的 Prompt Engineering 是结构化信息输入。一个专业的提示词应该包含以下四个核心模块:
1. 主体与动作:清晰描述核心对象及其状态。
2. 环境与氛围:背景、��线、天气、时间。
3. 风格与媒介:艺术流派、渲染引擎、摄影术语、镜头类型。
4. 参数与后缀:长宽比、风格化程度、版本号、负面提示词。
实操案例 1:用 Midjourney 生成一张“末日废土风”场景
错误示范:
`post-apocalyptic city, ruins, dark, realistic`
结果: 画面灰暗,主体模糊,缺乏细节。
正确结构化提示词(Midjourney v6.1):
A collapsed highway overpass in a flooded city, rusted cars half-submerged in murky water, overgrown vines covering concrete pillars, golden hour light filtering through toxic smog, cinematic lighting, volumetric fog, photorealistic, shot on 35mm lens, f/2.8, shallow depth of field --ar 16:9 --s 250 --v 6.1 --no people, cartoon, bright colors
拆解分析:
| 模块 | 内容 | 作用 |
|——|——|——|
| 主体与动作 | `collapsed highway overpass, rusted cars` | 明确视觉焦点 |
| 环境与氛围 | `flooded city, murky water, golden hour, toxic smog` | 建立沉浸感 |
| 风格与媒介 | `cinematic lighting, volumetric fog, photorealistic, 35mm lens, f/2.8` | 锁定电影级真实感 |
| 参数 | `–ar 16:9 –s 250 –v 6.1 –no people, cartoon` | 控制比例、风格强度、排除干扰 |
关键参数说明:
- `–s 250`:风格化参数(Stylize),范围0-1000。数值越低,越忠于提示词;数值越高,Midjourney 会加入更多自己的“艺术创意”。对于写实场景,建议 100-300。
—
二、从“写词”到“调参”:用 Stable Diffusion 做精准控制
如果说 Midjourney 是“魔法盒子”,那么 Stable Diffusion(以 SD WebUI Forge 为例)就是你的“实验室”。在这里,你可以通过 ControlNet 和 LoRA 实现像素级的控制。
实操案例 2:用一张线稿图生成精准的“机甲设计”
很多设计师想用 AI 做概念设计,但苦于 AI 生成的造型太随机。解决方案是:先用线稿锁定轮廓,再用提示词填充细节。
步骤 1:准备控制图
手绘或使用 Sketch/Rhino 画一张简单的机甲轮廓线稿(白底黑线),保存为 PNG。
步骤 2:加载 ControlNet
在 SD WebUI Forge 的 ControlNet 单元中,上传线稿图,并设置:
步骤 3:编写提示词与参数
Positive prompt:
mecha robot, heavy armor, white and orange color scheme, glowing blue reactor core on chest, intricate panel lines, hydraulic joints, battle damage, photorealistic, 8k, sharp focus, rim lighting, grey background, product shotNegative prompt:
deformed, blurry, low quality, extra limbs, bad anatomy, text, watermark
Sampling method: DPM++ 2M Karras
Steps: 30
CFG Scale: 7
Size: 768x1024
Denoising strength: 0.7 (如果基于已有图像做 img2img 时使用)
步骤 4:生成与迭代
点击生成,你会看到 AI 严格沿着你的线稿生长出机械装甲、管线细节。如果某个区域不满意(比如手臂太粗),可以在 Photoshop 中局部修改线稿,然后使用 `inpaint` 功能重新生成。
为什么这样做?
—
三、进阶:提示词的“微调”与“组合”
当你掌握了基础结构,下一步是通过迭代微调来逼近目标。这里分享三个实战技巧:
技巧 1:权重语法——让 AI 听懂主次
在提示词中,用 `(word:1.5)` 或 `(word:0.8)` 来调整某个元素的重要性。
技巧 2:混合媒介——打破风格单一
不要只写一种风格。尝试混搭:
技巧 3:反向工程——拆解优秀作品
当你看到一张惊艳的 AI 图时,不要只感叹。使用 CLIP Interrogator(在 Replicate 或 SD 插件中)反推提示词,然后分析它的结构:
—
总结与进阶建议
Prompt Engineering 不是背诵“魔法咒语”,而是建立一套从意图到参数的翻译系统。你的核心竞争力在于:
1. 结构化思维:把视觉元素拆解为可控制的模块。
2. 参数理解:知道 `–s` 控制什么,`CFG Scale` 影响什么。
3. 迭代能力:不满足于“第一张”,而是通过调整权重、ControlNet 参数、负面词来逼近目标。
给进阶学习者的三条建议:
—
常见问题 FAQ
Q1:为什么我的提示词写得很详细,但 Midjourney 还是生成出奇怪的东西?
A:检查两个地方:一是 `–s` 值是否过高(超过 600 会让 AI 过度发挥),二是是否遗漏了 `–no` 负面词。另外,Midjourney v6 对自然语言理解更好,建议用完整句子代替关键词堆砌,例如用 `A mecha robot standing in a rain-soaked street` 代替 `mecha robot, street, rain`。
Q2:Stable Diffusion 的负面提示词到底要写哪些?
A:基础必加:`deformed, blurry, low quality, worst quality, bad anatomy, extra limbs, text, watermark`。针对特定场景加:生成人脸时加 `asymmetric eyes`,生成建筑时加 `crooked lines`。建议在负面提示词中放 10-15 个词,但不要重复。
Q3:ControlNet 权重设多少合适?
A:取决于你的需求。如果线稿非常精确(比如工程图纸),设 `1.0`;如果只是参考构图,设 `0.5-0.7`。记住,权重越高,AI 的自由度越低,但结构越稳定。建议从 `0.8` 开始,逐步降低直到找到平衡点。
Q4:同一组提示词,为什么每次生成都不一样?
A:因为 AI 生成有随机性。在 Midjourney 中,使用 `–seed 12345`(任意数字)可以固定随机种子,从而复现同一构图。在 SD 中,勾选 `Fixed seed` 并输入数值。这是商业项目中确保可复现性的关键操作。
Q5:我该学 Midjourney 还是 Stable Diffusion?
A:两者不冲突。Midjourney 适合快速出图、探索美学方向,尤其适合插画和概念设计。Stable Diffusion 适合需要精准控制、批量生成、或与 3D 工作流结合的场景(如用 Blender 渲染底图再 AI 细化)。建议先精通一个,再学另一个。




评论(0)