Prompt Engineering:AIGC 设计师的核心竞争力

上周在火星人教育的课堂上,一位学员小陈拿着他生成的“赛博朋克城市”作品给我看——画面诡异,霓虹灯牌上的文字像鬼画符,建筑比例完全失调。他苦恼地说:“老师,我已经用了‘赛博朋克、未来城市、霓虹灯’这些词,为什么出来的效果还是像十几年前的劣质游戏截图?”

这个问题我每天都在听到。很多设计师以为 AIGC 就是“输入几个关键词,等奇迹发生”,结果往往等来的是“车祸现场”。真正的 Prompt Engineering,不是简单的关键词堆砌,而是像写代码一样精确地控制 AI 的“思维路径”。 今天我们就用两个实操案例,拆解如何通过结构化提示工程,让 Midjourney 和 Stable Diffusion 真正成为你的设计利器。

一、从“玄学”到“科学”:提示词的底层逻辑

1.1 为什么你的提示词总“翻车”?

我们先看一个典型错误案例。学员小陈的原始 Prompt 是:

cyberpunk city, neon lights, future, busy street, rain, high quality

这个提示词犯了三个致命错误:

  • 模糊的形容词:“high quality”“future”对 AI 来说没有具体标准
  • 缺失空间关系:没有指定视角(俯视/平视/广角)、光照方向、主体位置
  • 忽略风格锚点:没有引用具体的艺术家或电影风格
  • AI 在处理这种提示词时,会像无头苍蝇一样在“赛博朋克”这个大类里随机采样,结果就是画面混乱、细节缺失。

    2.2 结构化提示词框架

    经过大量测试,我们总结了适合设计师的 T.A.R.G.E.T. 框架

  • Task(任务):画面主体是什么?人物/场景/产品?
  • Angle(视角):拍摄角度、镜头焦距、人物位置
  • Reference(参考):风格锚点(艺术家、电影、游戏)
  • Geometry(几何):空间布局、构图规则
  • Effect(效果):光照、色彩、纹理、后期
  • Technical(技术):分辨率、渲染引擎、画幅比
  • 二、实操案例1:用 Midjourney 生成电影级概念设计

    2.1 工具与环境配置

  • 工具:Midjourney V6(2024年8月版本)
  • 参数:`–ar 16:9`(宽幅电影比例) `–v 6`(指定版本) `–style raw`(关闭自动美化)
  • 种子值:`–seed 12345`(固定随机数,便于迭代)
  • 2.2 从垃圾到杰作:逐层优化

    初始版本(失败)

    a futuristic city with flying cars, sunset, mountains in background
    

    产出:画面平淡,飞车像漂浮的玩具,山体缺乏层次。

    优化后 Prompt

    Cinematic wide shot of a neon-lit megacity at golden hour, flying cars leaving light trails, background has snow-capped mountains with mist, foreground shows a rain-slicked street with reflections, volumetric lighting, lens flare, shot on 35mm film, grain texture, Denis Villeneuve style, cyberpunk aesthetic, hyperdetailed architecture, --ar 16:9 --v 6 --style raw --seed 12345
    

    关键优化点
    1. 视角明确:`Cinematic wide shot` 替代模糊的 `futuristic city`
    2. 光照控制:`golden hour` + `volumetric lighting` 形成戏剧性光影
    3. 风格锚点:`Denis Villeneuve style`(《银翼杀手2049》导演)锁定灰冷色调
    4. 物理细节:`light trails`(光轨)`reflections`(反射)`grain texture`(颗粒感)

    电影级城市概念设计

    2.3 迭代技巧:用“–iw”参数控制权重

    当你需要保留某次生成的构图,但调整风格时,可以使用 `–iw`(图像权重)参数。例如:

    /imagine prompt: original scene with different color palette --iw 0.5
    

    `–iw` 值范围 0-2,数值越高,越保留原图特征;数值越低,越听从文本提示。

    三、实操案例2:Stable Diffusion 的 ControlNet 精准控制

    3.1 工具与插件配置

  • 工具:Stable Diffusion WebUI(Automatic1111 1.8.0)
  • ControlNet 版本:1.1.450
  • 模型:DreamShaper XL(适合写实风格)
  • 采样器:DPM++ 2M Karras(平衡速度与质量)
  • 3.2 案例:为产品海报生成背景

    需求:为某款运动鞋生成一个“城市夜景运动感”的背景,要求建筑透视与产品角度匹配。

    步骤1:准备线稿控制
    1. 上传一张简单的建筑线稿(可用 Photoshop 快速绘制)
    2. 在 ControlNet 中选择 `Canny` 模式,权重 0.8
    3. 勾选 `Pixel Perfect`(自动匹配尺寸)

    步骤2:撰写结构提示词

    Prompt: dynamic sports scene, runner on a futuristic bridge, city skyline at night, neon lights reflecting on wet ground, motion blur on legs, photorealistic, 8K, shot on Canon EOS R5 with 24-70mm lens, low angle, dramatic lighting
    Negative Prompt: text, watermark, deformed hands, extra limbs, blurry face, low quality, jpeg artifacts
    

    步骤3:参数设置

  • 步数:30
  • CFG Scale:7(创意与约束的平衡点)
  • 分辨率:1024×768
  • 开启 `Hires.fix`(高清修复),放大倍数 2x
  • ControlNet线稿控制生成

    3.3 进阶:用 LoRA 锁定品牌风格

    如果你需要为同一品牌生成系列海报,可以训练一个 LoRA 模型。步骤如下:

    1. 收集素材:20-30 张品牌过往海报(分辨率 ≥ 1024)
    2. 打标:使用 `WD14 Tagger` 自动生成标签
    3. 训练:在 Kohya_ss 中设置 `Repeat=10`,`Epoch=20`
    4. 调用:在 Prompt 中加入 ``,权重 0.8 表示风格强度

    四、总结与进阶建议

    今天我们从“为什么提示词总翻车”出发,通过两个实操案例展示了结构化 Prompt Engineering 的核心方法。记住三点:

    1. 框架优于灵感:用 T.A.R.G.E.T. 框架替代直觉堆词
    2. 参数是画笔:`–iw`、`CFG Scale`、`ControlNet` 权重都是可调参数
    3. 迭代胜于完美:先固定种子值,再逐层优化细节

    进阶学习路径

  • 第1周:掌握 T.A.R.G.E.T. 框架,每天用 Midjourney 生成 5 张不同风格的概念图
  • 第2-3周:学习 Stable Diffusion 的 ControlNet 和 LoRA,完成一个完整的品牌视觉系统
  • 第4周:研究 AIGC 工作流(如 ComfyUI),实现从草图到成片的自动化管线
  • 最后,送大家一句话:Prompt Engineering 不是魔法,而是编程。 当你像写代码一样写提示词时,AI 就不再是玩具,而是真正的生产力工具。

    常见问题 FAQ

    Q1:为什么我用同样的提示词,生成的结果每次都不同?
    A:这是正常的。AI 模型有随机性,建议使用 `–seed`(Midjourney)或设置随机种子(Stable Diffusion)来固定结果。如果需要完全一致,可以同时固定 `seed` 和 `CFG Scale`。

    Q2:如何让 AI 生成特定分辨率?
    A:Midjourney 用 `–ar` 参数控制比例(如 `–ar 16:9`),实际分辨率由平台决定。Stable Diffusion 可直接设置宽高(建议 1024×1024 以内),超出需要开启 Hires.fix。

    Q3:Negative Prompt 真的有用吗?
    A:非常有用。它像“禁止列表”,能有效避免常见缺陷。建议针对不同任务准备不同的 Negative Prompt 模板,例如人物生成时加入 `deformed hands, extra fingers`。

    Q4:LoRA 训练需要多少张图?
    A:最少 15 张高质量图像,但 30-50 张效果最佳。注意图像要风格统一(如同系列产品图),且分辨率不低于 1024。

    Q5:如何判断 Prompt 是否“过拟合”?
    A:如果 AI 生成的画面出现重复纹理、不自然的对称、或过度依赖某个关键词(如每个物体都带有“发光”效果),说明提示词过于狭窄。此时应增加描述多样性,或降低相关权重。

    声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。