Prompt Engineering:AIGC 设计师的核心竞争力

上周三的直播答疑课上,一位学员发来两张图:一张是 Midjourney 生成的“赛博朋克风咖啡馆”,画面里霓虹灯管歪歪扭扭,人物手指像被压路机碾过;另一张是他在小红书看到的“神仙作品”——同样的主题,光影通透、细节炸裂,连咖啡杯上的蒸汽都带着情绪。他问我:“老师,我用的也是 V6 模型,关键词也抄了,为什么我的像车祸现场?”

我让他把 Prompt 发过来,一看就笑了:`cyberpunk cafe, neon lights, barista, coffee`——五个词,零修饰。而那张神仙作品的 Prompt 足足 327 个字符,里面嵌入了相机型号、光圈值、光线角度、材质描述,甚至还有“volumetric steam”这种物理关键词。

这就是 AIGC 设计师的分水岭:会用工具的人很多,但能精准控制工具的人,才是稀缺资源。 Prompt Engineering 不是玄学,而是可以拆解、复制、优化的工程技术。今天,我们就用两个实操案例,把它讲透。

一、Prompt 的结构化拆解:从“关键词堆砌”到“指令工程”

1.1 为什么你的 Prompt 像“碎碎念”?

很多设计师把写 Prompt 当成“掷骰子”:想到什么词就往上扔,最后画面靠运气。但专业 Prompt 是有固定框架的。我把它总结为 4C 法则

  • Context(语境):主体、场景、时间
  • Characteristic(特征):风格、材质、颜色、纹理
  • Composition(构图):景别、视角、镜头焦段
  • Condition(条件):光照、氛围、渲染引擎
  • 拿开头那个“赛博朋克咖啡馆”举例。改写后的 Prompt 是这样的:

    /Imagine prompt: 
    A futuristic coffee shop interior, cyberpunk aesthetic, 
    neon blue and magenta lighting, 
    rain-slicked window reflecting street signs, 
    barista pouring latte art with precise hands, 
    shot on Leica M6, 35mm f/1.4, shallow depth of field, 
    volumetric haze, realistic skin texture, 
    octane render style, 8K, --ar 16:9 --v 6
    

    看到区别了吗?这不是“关键词”,而是“视觉命令”。每个短语都在约束画面的一部分。

    1.2 工具实操:用 Midjourney 的“/describe”反向工程

    如果你看到一张好图,但不知道 Prompt 怎么写的,别猜。Midjourney 自带的 `/describe` 命令能帮你逆向解析。

    操作步骤:
    1. 在 Discord 输入 `/describe`,上传目标图片
    2. 系统返回 4 个 Prompt 建议
    3. 选择最接近的版本,手动调整参数

    上周我解析一张“哥特风教堂室内”图时,系统给出的 Prompt 里有个词 `“gobelin tapestry texture”`(戈布兰挂毯纹理)。我查了资料才知道,这个词直接让 AI 生成了一种特定编织纹理。这就是设计师的知识壁垒:你不仅要会写词,还要知道哪些词能触发特定效果。

    Midjourney /describe 解析示例

    二、进阶控制:参数级 Prompt Engineering

    2.1 Stable Diffusion 的“负向 Prompt”与权重控制

    如果说 Midjourney 是“画图”,那 Stable Diffusion 就是“炼丹”。它最大的优势是 精准控制。但很多新手只写正向 Prompt,忽略负向 Prompt,导致画面出现“六指琴魔”或“建筑扭曲”。

    具体操作(WebUI 1.7.0 版本):

    场景: 生成一张“中世纪药剂师的工作台”,要求细节丰富,但不能有现代元素。

    正向 Prompt:

    (masterpiece, best quality:1.2), medieval apothecary table, 
    glass vials with colored liquids, dried herbs hanging from ceiling, 
    candlelight illumination, brass scales, worn wooden surface, 
    dust motes in light beam, hyperdetailed, photorealistic
    

    负向 Prompt:

    plastic, modern, smartphone, electricity, metal chair, 
    digital watch, neon sign, cartoon, (worst quality, low quality:1.4), 
    extra fingers, deformed hands, twisted body
    

    这里的关键是 `(word:weight)` 语法。`(masterpiece:1.2)` 表示这个词的权重增加 20%,`(worst quality:1.4)` 表示负向权重增加 40%。权重不是越高越好,1.2-1.5 是安全区间,超过 2.0 会导致画面过饱和。

    参数设置:

  • 采样器: DPM++ 2M Karras(细节保留最好)
  • 步数: 30-40(太少会模糊,太多会过锐)
  • CFG Scale: 7-9(数值越高越服从 Prompt,但会损失创意)
  • 分辨率: 768×768 → 高清修复 2x(用 ESRGAN 模型)
  • 2.2 ControlNet 的“结构约束”:让 AI 按你的构图走

    很多设计师抱怨:“AI 生成的构图总是歪的,主体不在我想要的焦点上。” 这时候要用 ControlNet(版本 1.1.441)。

    操作案例: 生成一张“宇航员在火星上种花”,但要求构图是“人物在右侧,面朝左,花在左下角”。

    步骤:
    1. 在 Photoshop 里画一个极简草图(火柴人+方块花盆)
    2. 导入 ControlNet,选择 Canny(边缘检测) 模型
    3. 设置参数:`Control Weight: 0.8`,`Starting Control Step: 0.1`,`Ending Control Step: 0.9`
    4. 写 Prompt:`astronaut planting flowers on Mars, red soil, glass helmet reflecting sunset, delicate hands, hyperrealistic`

    参数解释:

  • `Control Weight`:约束强度,0.8 意味着构图 80% 遵循草图,20% 自由发挥
  • `Starting/Ending Step`:控制在哪个阶段施加约束。提前释放(0.1-0.9)能让细节部分更自然
  • ControlNet 结构约束示意图

    2.3 进阶技巧:用“种子值”锁定风格

    你有没有遇到过:同一段 Prompt 跑两次,结果完全不一样?这是因为每次生成都是随机种子。要复现结果,必须锁定种子值。

    操作:
    1. 生成一张满意的图后,在图片信息里找到 `Seed: 123456789`
    2. 下次生成时,在参数栏输入 `–seed 123456789`(Midjourney)或 `Seed: 123456789`(SD)
    3. 微调 Prompt 中的关键词,观察变化

    实战技巧: 先跑 10 张图,选出构图最好的那张,锁定它的种子,然后修改 Prompt 中的颜色/材质描述。这样你就能在保持构图的前提下,快速迭代风格。

    三、Prompt Engineering 的“心法”:设计师的不可替代性

    3.1 为什么 AI 无法取代你?

    有人说:“以后设计师就失业了,AI 自己就能生成。” 这是对 Prompt Engineering 最大的误解。AI 生成的内容是“概率产物”,而设计师的价值在于“意图定义”。

    举个例子:你让 AI 生成“悲伤的蓝色调”,它可能会给你一张阴天的海景。但真正的设计师知道,“悲伤的蓝色”在色彩心理学里是 `#2C3E50` 的深蓝灰,在摄影里是“低饱和度+高对比度”,在材质上要搭配“磨砂玻璃”而不是“抛光金属”。这些知识库,是 Prompt 写不出来的,但 Prompt 可以调用它们。

    3.2 建立你的“Prompt 知识库”

    我建议每个设计师都建一个 Prompt 模板库,按场景分类:

    | 场景 | 核心词 | 参数模板 |
    |——|——–|———-|
    | 产品摄影 | product shot, studio lighting, white background | –ar 4:3 –v 6 –style raw |
    | 概念设计 | concept art, matte painting, cinematic lighting | –ar 16:9 –v 6 –stylize 250 |
    | 角色设计 | character design, turnarounds, clean lineart | –ar 3:4 –niji 6 |

    每次生成时,从模板出发,只修改 2-3 个变量。这样你就能快速积累“什么词产生什么效果”的经验。

    3.3 未来趋势:多模态 Prompt 和 LORA 微调

    2024 年,Midjourney 发布了 `–style reference` 参数,Stable Diffusion 的 LORA 模型已经能��刻特定画风。这意味着 Prompt 正在从“文字指令”变成“多模态指令”

    学习建议:

  • 花一周时间,用 `/describe` 解析 50 张你喜欢的设计图
  • 建立自己的“关键词效果表”(比如“volumetric”= 体积光,“grainy”= 胶片噪点)
  • 学会用 LORA 训练自己的风格模型(推荐 Kohya_ss 工具)
  • 多模态 Prompt 参考示例

    四、总结与进阶建议

    Prompt Engineering 不是“魔法咒语”,而是一套 可复用的设计控制工程。它需要你同时具备三样东西:
    1. 视觉知识:懂构图、色彩、光影
    2. 工具认知:知道每个参数的边界
    3. 迭代思维:不追求一次完美,而是用种子值+微调逼近目标

    进阶路径:

  • 初级: 能写 100 字以上的结构化 Prompt,控制画面主体和风格
  • 中级: 能使用 ControlNet 和种子值,精确控制构图和复现
  • 高级: 能训练自己的 LORA 模型,用多模态 Prompt 生成品牌专属风格
  • 最后送你一句话:AI 是画笔,Prompt 是握笔的手。手不稳,再好的笔也画不出好画。

    常见问题 FAQ

    Q1:为什么我复制了网上的 Prompt,生成的效果不一样?
    A:因为版本不同。Midjourney V6 和 V5 对 Prompt 的解析方式差异很大。V6 更注重自然语言理解,不需要堆砌关键词。建议先确认版本,再用 `/info` 查看当前设置。

    Q2:负向 Prompt 写多少词合适?
    A:一般 5-10 个核心负面词即可,太多会干扰模型。重点放“手部畸形”“低质量”“不想要的风格”三类。注意不要和正向 Prompt 冲突,比如正向写了“realistic”,负向就别写“photorealistic”。

    Q3:为什么我用了 ControlNet,画面还是偏离草图?
    A:检查两个参数:`Control Weight` 是否低于 0.6?`Ending Control Step` 是否太早?如果权重低于 0.6,模型会忽略约束;如果结束步数小于 0.7,模型会在后期自由发挥,导致偏离。

    Q4:Stable Diffusion 的 CFG Scale 设多少最合适?
    A:没有标准答案。7-9 是通用区间。如果画面太乱(AI 自由发挥过多),提高 CFG 到 10-12;如果画面太死板(完全照搬 Prompt),降低到 5-6。建议用 X/Y 图功能批量测试。

    Q5:我想生成特定品牌风格(比如苹果产品图),怎么训练 LORA?
    A:准备 20-30 张高清产品图,用 Kohya_ss 训练。关键参数:`Repeat: 10`(每张图重复 10 次),`Epoch: 20`(训练轮次),`Learning Rate: 1e-4`。训练完生成时,权重设 0.6-0.8 即可,太高会过拟合。

    声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。