Prompt Engineering:AIGC 设计师的核心竞争力
上周三,学员小李拿着他刚用 Midjourney 生成的一组“赛博朋克城市”来找我。画面确实很炫——霓虹灯、雨夜、飞行汽车,乍一看像模像样。但仔细看,楼宇之间缺乏空间层次,人物动作僵硬,光影逻辑混乱。小李委屈地说:“老师,我明明用了‘cyberpunk city, highly detailed, 8k’这些词,为什么还是像劣质游戏截图?”
这个问题太典型了。绝大多数 AIGC 设计新手都卡在这一步:以为堆砌形容词就能得到好结果。实际上,Prompt 不是“许愿”,而是“编程”——你输入的每一段文字,都在为 AI 定义视觉逻辑、空间关系、材质属性和光影规则。
今天,我们就从工程化角度,拆解 Prompt 的核心设计方法。你会看到,为什么同样调用同一个模型,有人只能产出“墙纸级”图片,有人却能输出“可商用级”设计。
一、结构化 Prompt:从“堆词”到“搭积木”
1.1 问题的根源:AI 如何理解你的文字?
先看一个底层事实:当前主流 AIGC 工具(Midjourney V6、Stable Diffusion XL、DALL·E 3)都基于扩散模型,它们将你的 Prompt 转化为高维语义向量。这意味着,文字的顺序、结构、甚至标点符号都会影响注意力权重分布。
举个例子,以下两个 Prompt 在 Midjourney V6(版本号:6.0)中生成的结果完全不同:
- Bad Prompt:`a beautiful girl in a cyberpunk city, neon lights, rain, detailed`
区别在哪?Good Prompt 做了三件事:
1. 指定主体和动作:不是“girl”,而是“portrait of a young woman with freckles, standing under…”
2. 描述环境交互:雨滴在脸上的痕迹、水坑中的倒影
3. 定义技术参数:景深、灯光、胶片质感、画幅比
这是结构化 Prompt 的雏形。更严谨的框架,我建议你使用“五要素法”。
1.2 五要素 Prompt 框架(含操作步骤)
操作步骤:打开 Midjourney V6(确保已升级到最新版本),在 Discord 中输入以下结构:
[主体描述] + [环境/背景] + [光线/色调] + [材质/细节] + [技术参数]
案例:生成一张“中式赛博朋克茶楼”
Step 1: 主体描述
"a traditional Chinese tea house suspended in mid-air, glowing red lanterns, wooden beams with neon strips"Step 2: 环境/背景
"surrounded by holographic koi fish swimming through thick fog, distant skyscrapers with Chinese characters on their facades"
Step 3: 光线/色调
"ambient lighting from warm lanterns contrasting with cool cyan neon, volumetric fog, rim light on the edges of the building"
Step 4: 材质/细节
"detailed wood grain, translucent paper screens, polished brass fixtures, water droplets on leaves"
Step 5: 技术参数
"--ar 16:9 --s 250 --v 6 --style raw"
完整 Prompt:
a traditional Chinese tea house suspended in mid-air, glowing red lanterns, wooden beams with neon strips, surrounded by holographic koi fish swimming through thick fog, distant skyscrapers with Chinese characters on their facades, ambient lighting from warm lanterns contrasting with cool cyan neon, volumetric fog, rim light on the edges of the building, detailed wood grain, translucent paper screens, polished brass fixtures, water droplets on leaves --ar 16:9 --s 250 --v 6 --style raw
关键参数说明:
二、进阶技巧:用“负面 Prompt”和“权重控制”驯服 AI
2.1 负面 Prompt:告诉 AI 不要做什么
很多设计师只写“要什么”,却忘了写“不要什么”。在 Stable Diffusion XL 1.0 中,负面 Prompt(Negative Prompt)是阻止 AI 生成低质量内容的关键。
操作步骤(以 ComfyUI + SDXL 为例):
1. 安装 ComfyUI(推荐版本:v0.2.3+),加载 SDXL 基础模型(如 `sd_xl_base_1.0.safetensors`)
2. 在 CLIP Text Encode (Negative) 节点中输入:
ugly, deformed, blurry, low quality, watermark, text, signature, extra limbs, bad anatomy, disfigured, poorly drawn face, mutation, extra fingers, fused fingers, bad proportions, cropped head, out of frame, worst quality, low resolution, jpeg artifacts, monochrome, grainy, dark, overexposed, underexposed
3. 设置 CFG Scale(分类器自由引导尺度)为 7.5。这个值控制 Prompt 的遵循程度:太低(<5)AI 自由发挥,太高(>12)容易出现伪影。
实战案例:生成“未来主义办公椅”
使用负面 Prompt 后,AI 不再生成“四条腿不对称”“椅背刺穿坐垫”等结构错误。
2.2 权重控制:让 AI 听你的重点
在 Midjourney V6 中,你可以用 `::` 分隔符和数字权重来强调或弱化某个元素。
语法:
[元素1::权重] [元素2::权重] [元素3::权重]
案例:生成“穿红色斗篷的机器人,背景是沙漠”
robot in a red cloak::2 desert background::1 --ar 16:9 --v 6
这里 `robot in a red cloak` 的权重是 2,`desert background` 是 1。AI 会优先处理机器人和斗篷的细节,沙漠背景则作为辅助元素。
进阶用法:嵌套权重
(red cloak:1.5) robot::2 (desert dunes:0.8) --ar 16:9 --v 6
三、跨工具迁移:如何复用你的 Prompt 资产?
作为设计师,你不可能只用一款工具。不同工具(Midjourney、SD、DALL·E)对 Prompt 的解析逻辑不同,但底层结构可以复用。
3.1 从 Midjourney 迁移到 Stable Diffusion
核心差异:
迁移方案:
假设你在 Midjourney 中有一个好用的 Prompt:
a glass sculpture of a dragon, iridescent surface, studio lighting, white background, product photography --ar 1:1 --v 6
迁移到 SDXL 时,你需要:
1. 删除 `–ar 1:1`(SD 用宽高比节点控制)
2. 增加负面 Prompt(如前文)
3. 添加触发词:`(masterpiece, best quality:1.2)`
4. 如果使用特定模型(如 Realistic Vision),添加 `(realistic vision style:0.8)`
完整 SDXL Prompt:
(masterpiece, best quality:1.2) a glass sculpture of a dragon, iridescent surface, studio lighting, white background, product photography, (realistic vision style:0.8)
3.2 工具推荐:Prompt 管理神器
总结与进阶建议
Prompt Engineering 的本质,是把设计师的视觉经验转化为 AI 可执行的指令。它���要你懂构图、懂光影、懂材质,还要懂模型的“脾气”。
三个立刻能用的行动:
1. 建立自己的 Prompt 库:每次生成好图,把 Prompt 存入 Notion 或 Obsidian,标注参数和效果
2. 做“A/B 测试”:固定主体,只改一个参数(如 `–s` 值),观察变化
3. 逆向分析:看到好的 AI 作品,尝试反向推导它的 Prompt 结构
进阶学习路径:
常见问题 FAQ
Q1:为什么我用了很长的 Prompt,但生成结果反而更差?
A:常见原因是“稀释效应”——过多的修饰词分散了 AI 的注意力。建议控制 Prompt 长度在 50-80 个英文单词内,用权重语法突出重点。
Q2:Midjourney V6 和 V5 的 Prompt 写法有什么不同?
A:V6 对自然语言的理解更强,可以直接写“a photo of a cat sitting on a windowsill, afternoon sunlight”,而不需要像 V5 那样加很多“photorealistic”之类的词。同时 V6 的 `–style raw` 更适合精确控制。
Q3:Stable Diffusion 的 CFG Scale 应该设多少?
A:一般 7-9 是安全区间。低于 5 会导致主体不清晰,高于 12 容易产生“过度锐化”的伪影。建议从 7.5 开始,每次加减 0.5 测试。
Q4:负面 Prompt 写多少合适?
A:10-15 个关键词足够,不要超过 30 个。重点写“ugly”“deformed”“bad anatomy”这些结构相关词,颜色和风格类词不需要放进去。
Q5:不同工具之间,Prompt 可以完全复制吗?
A:不能。Midjourney 和 SD 的语义空间不同,直接复制通常效果很差。建议保留核心描述(主体、环境、光线),然后根据工具特性调整风格触发词和技术参数。



评论(0)