Prompt Engineering:AIGC 设计师的核心竞争力

上周三,学员小李拿着他刚用 Midjourney 生成的一组“赛博朋克城市”来找我。画面确实很炫——霓虹灯、雨夜、飞行汽车,乍一看像模像样。但仔细看,楼宇之间缺乏空间层次,人物动作僵硬,光影逻辑混乱。小李委屈地说:“老师,我明明用了‘cyberpunk city, highly detailed, 8k’这些词,为什么还是像劣质游戏截图?”

这个问题太典型了。绝大多数 AIGC 设计新手都卡在这一步:以为堆砌形容词就能得到好结果。实际上,Prompt 不是“许愿”,而是“编程”——你输入的每一段文字,都在为 AI 定义视觉逻辑、空间关系、材质属性和光影规则。

今天,我们就从工程化角度,拆解 Prompt 的核心设计方法。你会看到,为什么同样调用同一个模型,有人只能产出“墙纸级”图片,有人却能输出“可商用级”设计。

一、结构化 Prompt:从“堆词”到“搭积木”

1.1 问题的根源:AI 如何理解你的文字?

先看一个底层事实:当前主流 AIGC 工具(Midjourney V6、Stable Diffusion XL、DALL·E 3)都基于扩散模型,它们将你的 Prompt 转化为高维语义向量。这意味着,文字的顺序、结构、甚至标点符号都会影响注意力权重分布

举个例子,以下两个 Prompt 在 Midjourney V6(版本号:6.0)中生成的结果完全不同:

  • Bad Prompt:`a beautiful girl in a cyberpunk city, neon lights, rain, detailed`
  • Good Prompt:`portrait of a young woman with freckles, standing under a flickering neon sign, rain streaks on her face, reflections in puddles, deep focus, cinematic lighting, shot on 35mm film –ar 3:2 –v 6`
  • 区别在哪?Good Prompt 做了三件事:
    1. 指定主体和动作:不是“girl”,而是“portrait of a young woman with freckles, standing under…”
    2. 描述环境交互:雨滴在脸上的痕迹、水坑中的倒影
    3. 定义技术参数:景深、灯光、胶片质感、画幅比

    这是结构化 Prompt 的雏形。更严谨的框架,我建议你使用“五要素法”。

    1.2 五要素 Prompt 框架(含操作步骤)

    操作步骤:打开 Midjourney V6(确保已升级到最新版本),在 Discord 中输入以下结构:

    [主体描述] + [环境/背景] + [光线/色调] + [材质/细节] + [技术参数]
    

    案例:生成一张“中式赛博朋克茶楼”

    Step 1: 主体描述
    "a traditional Chinese tea house suspended in mid-air, glowing red lanterns, wooden beams with neon strips"

    Step 2: 环境/背景 "surrounded by holographic koi fish swimming through thick fog, distant skyscrapers with Chinese characters on their facades"

    Step 3: 光线/色调 "ambient lighting from warm lanterns contrasting with cool cyan neon, volumetric fog, rim light on the edges of the building"

    Step 4: 材质/细节 "detailed wood grain, translucent paper screens, polished brass fixtures, water droplets on leaves"

    Step 5: 技术参数 "--ar 16:9 --s 250 --v 6 --style raw"

    完整 Prompt:

    a traditional Chinese tea house suspended in mid-air, glowing red lanterns, wooden beams with neon strips, surrounded by holographic koi fish swimming through thick fog, distant skyscrapers with Chinese characters on their facades, ambient lighting from warm lanterns contrasting with cool cyan neon, volumetric fog, rim light on the edges of the building, detailed wood grain, translucent paper screens, polished brass fixtures, water droplets on leaves --ar 16:9 --s 250 --v 6 --style raw
    

    中式赛博朋克茶楼

    关键参数说明

  • `–s 250`:Stylize 值���控制 AI 的“创意自由度”。0-100 偏写实,250-500 偏艺术化。这里用 250 在写实与风格化之间平衡。
  • `–style raw`:减少 Midjourney 默认的美化滤镜,保留更多原始结构细节。对需要精确控制的设计尤其重要。
  • 二、进阶技巧:用“负面 Prompt”和“权重控制”驯服 AI

    2.1 负面 Prompt:告诉 AI 不要做什么

    很多设计师只写“要什么”,却忘了写“不要什么”。在 Stable Diffusion XL 1.0 中,负面 Prompt(Negative Prompt)是阻止 AI 生成低质量内容的关键。

    操作步骤(以 ComfyUI + SDXL 为例):

    1. 安装 ComfyUI(推荐版本:v0.2.3+),加载 SDXL 基础模型(如 `sd_xl_base_1.0.safetensors`)
    2. 在 CLIP Text Encode (Negative) 节点中输入:

    ugly, deformed, blurry, low quality, watermark, text, signature, extra limbs, bad anatomy, disfigured, poorly drawn face, mutation, extra fingers, fused fingers, bad proportions, cropped head, out of frame, worst quality, low resolution, jpeg artifacts, monochrome, grainy, dark, overexposed, underexposed
    

    3. 设置 CFG Scale(分类器自由引导尺度)为 7.5。这个值控制 Prompt 的遵循程度:太低(<5)AI 自由发挥,太高(>12)容易出现伪影。

    实战案例:生成“未来主义办公椅”

    使用负面 Prompt 后,AI 不再生成“四条腿不对称”“椅背刺穿坐垫”等结构错误。

    未来主义办公椅

    2.2 权重控制:让 AI 听你的重点

    在 Midjourney V6 中,你可以用 `::` 分隔符和数字权重来强调或弱化某个元素。

    语法

    [元素1::权重] [元素2::权重] [元素3::权重]
    

    案例:生成“穿红色斗篷的机器人,背景是沙漠”

    robot in a red cloak::2 desert background::1 --ar 16:9 --v 6
    

    这里 `robot in a red cloak` 的权重是 2,`desert background` 是 1。AI 会优先处理机器人和斗篷的细节,沙漠背景则作为辅助元素。

    进阶用法:嵌套权重

    (red cloak:1.5) robot::2 (desert dunes:0.8) --ar 16:9 --v 6
    
  • `(red cloak:1.5)`:单独提升“红色斗篷”的权重
  • `robot::2`:主体权重最高
  • `(desert dunes:0.8)`:弱化背景细节,避免喧宾夺主
  • 三、跨工具迁移:如何复用你的 Prompt 资产?

    作为设计师,你不可能只用一款工具。不同工具(Midjourney、SD、DALL·E)对 Prompt 的解析逻辑不同,但底层结构可以复用。

    3.1 从 Midjourney 迁移到 Stable Diffusion

    核心差异

  • Midjourney 天然理解“cinematic lighting”“photorealistic”这类风格词
  • SD 需要更明确的“艺术家风格”或“模型名”来触发
  • 迁移方案
    假设你在 Midjourney 中有一个好用的 Prompt:

    a glass sculpture of a dragon, iridescent surface, studio lighting, white background, product photography --ar 1:1 --v 6
    

    迁移到 SDXL 时,你需要:
    1. 删除 `–ar 1:1`(SD 用宽高比节点控制)
    2. 增加负面 Prompt(如前文)
    3. 添加触发词:`(masterpiece, best quality:1.2)`
    4. 如果使用特定模型(如 Realistic Vision),添加 `(realistic vision style:0.8)`

    完整 SDXL Prompt:

    (masterpiece, best quality:1.2) a glass sculpture of a dragon, iridescent surface, studio lighting, white background, product photography, (realistic vision style:0.8)
    

    3.2 工具推荐:Prompt 管理神器

  • PromptBase:付费 Prompt 市场,可以买别人的优质 Prompt 逆向学习
  • AIPRM for ChatGPT:浏览器插件,内置结构化 Prompt 模板库
  • Midjourney Prompt Helper(Web 应用):可视化构建 Prompt,自动生成权重和分隔符
  • Prompt 管理工具界面

    总结与进阶建议

    Prompt Engineering 的本质,是把设计师的视觉经验转化为 AI 可执行的指令。它���要你懂构图、懂光影、懂材质,还要懂模型的“脾气”。

    三个立刻能用的行动
    1. 建立自己的 Prompt 库:每次生成好图,把 Prompt 存入 Notion 或 Obsidian,标注参数和效果
    2. 做“A/B 测试”:固定主体,只改一个参数(如 `–s` 值),观察变化
    3. 逆向分析:看到好的 AI 作品,尝试反向推导它的 Prompt 结构

    进阶学习路径

  • 如果专注 Midjourney:精读官方文档的“参数”部分,特别是 `–stylize`、`–weird`、`–chaos` 的组合
  • 如果专注 Stable Diffusion:学习 LoRA 训练,用少量图片微调模型,彻底摆脱“撞 Prompt”的困境
  • 常见问题 FAQ

    Q1:为什么我用了很长的 Prompt,但生成结果反而更差?
    A:常见原因是“稀释效应”——过多的修饰词分散了 AI 的注意力。建议控制 Prompt 长度在 50-80 个英文单词内,用权重语法突出重点。

    Q2:Midjourney V6 和 V5 的 Prompt 写法有什么不同?
    A:V6 对自然语言的理解更强,可以直接写“a photo of a cat sitting on a windowsill, afternoon sunlight”,而不需要像 V5 那样加很多“photorealistic”之类的词。同时 V6 的 `–style raw` 更适合精确控制。

    Q3:Stable Diffusion 的 CFG Scale 应该设多少?
    A:一般 7-9 是安全区间。低于 5 会导致主体不清晰,高于 12 容易产生“过度锐化”的伪影。建议从 7.5 开始,每次加减 0.5 测试。

    Q4:负面 Prompt 写多少合适?
    A:10-15 个关键词足够,不要超过 30 个。重点写“ugly”“deformed”“bad anatomy”这些结构相关词,颜色和风格类词不需要放进去。

    Q5:不同工具之间,Prompt 可以完全复制吗?
    A:不能。Midjourney 和 SD 的语义空间不同,直接复制通常效果很差。建议保留核心描述(主体、环境、光线),然后根据工具特性调整风格触发词和技术参数。

    声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。