Prompt Engineering:AIGC 设计师的核心竞争力

上周,一位跟我学了三个月 Midjourney 的学员发来一个截图,满脸困惑:“老师,我明明用了同样的 prompt,为什么生成的效果跟你的差这么多?”

我点开一看:她用的是 `a beautiful girl, portrait, cinematic lighting, 8k`,而我在课程中演示的是 `fashion portrait of a young woman with freckles, soft window light falling across her face, film grain, shot on Portra 400, shallow depth of field, warm earth tones –ar 3:4 –style raw –s 250`。

这之间的差距,不是“运气”或“天赋”,而是Prompt Engineering(提示工程) 的功力差距。

在 AIGC 设计领域,Prompt 就是设计师的“画笔”。掌握提示工程,等于掌握了对 AI 的精准控制力。今天,我们就用两个完整的实操案例,拆解如何写出“高质量 Prompt”。

一、从“猜谜”到“精准控制”:Prompt 的结构拆解

很多设计师把写 Prompt 当成“许愿”——把一堆形容词堆上去,希望 AI 能猜中你的心思。但真正的高手,是把 Prompt 拆解成4个核心模块

| 模块 | 作用 | 示例 |
|——|——|——|
| 主体描述 | 明确核心对象 | `a female cyberpunk hacker` |
| 环境/背景 | 设定空间与氛围 | `sitting in a neon-lit alley, rain reflecting on the pavement` |
| 风格/媒介 | 控制视觉语言 | `digital painting, art by WLOP and Yoshitaka Amano` |
| 参数/技术 | 微调生成质量 | `–ar 16:9 –v 6.1 –stylize 300` |

记住这个结构,你的 prompt 就从“玄学”变成了“工程”。

工具版本说明

本文所有案例基于 Midjourney v6.1(2024年8月更新版本)和 ComfyUI + SDXL 1.0。不同版本对 prompt 的解析方式有差异,请确认你使用的版本。

二、实操案例 1:用 Midjourney 生成“电影级产品海报”

目标:为一款智能手表生成一张电商主图,要求:科技感、高级灰、有光影层次。

步骤 1:写出基础 prompt

a smartwatch on a stone surface, product photography, white background

输出结果:平庸、毫无质感。

步骤 2:加入“风格锚点”

a smartwatch on a dark slate stone surface, rim light from upper right, soft shadows, cinematic mood, shot on Hasselblad X1D, f/2.8, macro lens, product photography, minimal composition, dark grey and silver tones --ar 4:5 --v 6.1

这里的关键是:

  • Hasselblad X1D(相机品牌)→ 控制“质感”
  • f/2.8(光圈参数)→ 控制“景深”
  • rim light(轮廓光)→ 控制“光影”
  • 步骤 3:用参数做“微调”

    --style raw   (去掉MJ默认的美化滤镜)
    --s 100       (低风格化,保持物体真实感)
    --no text, logo, watermark
    

    最终输出:金属拉丝纹理清晰可见,表盘玻璃有反光层次,背景从纯白变成有纹理的深灰色石板。

    智能手表产品渲染图

    关键技巧:不要写 `high quality` 或 `8k`——这些词对 v6.1 几乎没有影响。用具体的设备名称摄影术语来替代抽象形容词。

    三、实操案例 2:用 ComfyUI + SDXL 生成“可控角色插画”

    当需要精确控制人物姿势、服装细节、多元素组合时,Midjourney 的随机性会让人抓狂。这时需要换到 Stable Diffusion + ControlNet

    工具准备

  • 工作流:ComfyUI(最新版,推荐 0.2.4+)
  • 模型:SDXL 1.0 + DreamShaper XL
  • 控制网络:OpenPose + Canny
  • 步骤 1:准备“姿势参考”

    从网上找一张人物站立姿态的线稿图(或直接使用 OpenPose 编辑器生成骨架图)。将这张图拖入 ComfyUI 的 Load Image 节点。

    步骤 2:构建 prompt 与负面 prompt

    Positive Prompt:
    fantasy warrior woman, silver armor with gold trim, holding a glowing blue sword, standing in a ruined cathedral, sunlight streaming through broken stained glass, dust particles in the air, epic cinematic shot, art by Craig Mullins and Ruan Jia, detailed armor texture, dynamic lighting, volumetric fog

    Negative Prompt: poorly drawn hands, extra fingers, bad anatomy, blurry, lowres, watermark, text, logo, deformed, mutated, ugly, disfigured

    步骤 3:配置 ControlNet 参数

  • OpenPose:权重 0.8,起始控制步数 0,结束步数 0.6
  • Canny:权重 0.3,低阈值 100,高阈值 200
  • 采样器:DPM++ 2M Karras,步数 30
  • CFG Scale:7.0
  • 步骤 4:生成并迭代

    第一次生成:姿势正确,但铠甲纹理偏模糊。
    修复方案:在 prompt 中增加 `extreme detail, highres, 8k` 无效——改为 `intricate filigree on the armor, brushed metal texture`。

    第二次生成:细节明显提升。

    战士角色插画生成对比

    关键技巧:SDXL 对 `8k` 等抽象词不敏感,但对材质描述词(如 `brushed metal`、`filigree`、`chiseled stone`)反应极佳。负面 prompt 中一定要包含 `poorly drawn hands`——这是 SDXL 的常见缺陷。

    四、进阶技巧:用“权重语法”实现精细控制

    无论你用 MJ 还是 SD,权重语法都是提升控制力的核心。

    在 Midjourney 中

    a castle::2 in a forest::1.5, fog::1.2, flowers::0.8
    
  • `::2` 表示这个元素权重加倍
  • `::0.8` 表示降低权重
  • 在 Stable Diffusion 中

    (castle:1.3), (forest:1.1), (fog:0.9), (flowers:0.7)
    
  • 括号内数字:大于1表示强调,小于1表示弱化
  • 实战案例:某学员想要“一只猫站在月球上”,但 MJ 总是生成“猫在月球旁边”。通过 `cat::3 standing on the surface of the moon::2`,成功让猫“站”在了月球表面。

    总结与进阶建议

    Prompt Engineering 不是“背模板”,而是理解 AI 模型的“语言习惯”。不同模型对词汇的敏感度不同——MJ v6.1 对摄影术语敏感,SDXL 对材质和艺术风格敏感。

    给设计师的3条学习路径

    1. 建立“词汇库”:每次生成满意作品后,记录 prompt 中的“有效词”和“无效词”。推荐用 NotionAirtable 建表。
    2. 掌握参数原理:不要只记参数值,要理解 `–stylize`、`CFG Scale`、`Denoising Strength` 到底控制什么。推荐阅读官方文档。
    3. 跨工具迁移能力:把 MJ 的 prompt 改写成 SD 格式,反之亦然。这能帮你理解不同模型的“思维差异”。

    最后,记住:AI 是工具,你才是设计师。Prompt Engineering 不是终点,而是让你更高效表达创意的起点。

    常见问题 FAQ

    Q1:为什么我写了很长的 prompt,效果反而变差?
    A:常见原因是“信息冲突”。比如同时写 `photorealistic` 和 `anime style`,模型会混乱。建议每个 prompt 只锁定一个风格方向,用权重语法控制主次。

    Q2:Midjourney v6.1 和 v5 的 prompt 写法有什么不同?
    A:v6.1 对自然语言的理解更强,不再需要 `–v 5` 时代的“关键词堆砌”。现在建议写完整的句子,比如 `a woman reading a book in a cozy library` 比 `woman, book, library` 效果好。

    Q3:Stable Diffusion 的负面 prompt 到底该写什么?
    A:核心是常见缺陷不需要的元素。推荐必加:`poorly drawn hands, extra fingers, bad anatomy, blurry, lowres, watermark, text`。如果生成人物,再加 `deformed face, ugly, disfigured`。

    Q4:如何让 AI 生成“完全相同的角色”在不同场景中?
    A:需要用 IP-Adapter(SD)或 Midjourney 的 –cref 参数(v6.1 起支持)。在 MJ 中:`–cref [图片链接] –cw 100` 可以复制角色特征。但注意:目前无法做到100%一致,需要多次微调。

    Q5:有没有推荐的 prompt 管理工具?
    A:个人用 PromptBase(查找别人分享的 prompt)和 Notion(自己整理)。团队协作推荐 AIPRM(浏览器插件,可保存 prompt 模板)。

    声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。