Prompt Engineering:AIGC 设计师的核心竞争力

上周,一位学员拿着两张图来找我:“老师,我用同样的提示词,在 Midjourney 和 DALL·E 3 里生成的结果完全不同,一个像概念艺术,一个像产品渲染图。到底哪个是对的?”

这个问题很典型。很多设计师以为“写提示词”就是堆砌形容词,但真正拉开差距的,是 对 Prompt 结构的理解,以及 针对不同工具的适配能力。在 AIGC 时代,不会写 Prompt 的设计师,就像拿着单反却只懂按快门——你能出图,但永远出不了好图。

今天,我们就从“能出图”到“能控图”,拆解 Prompt Engineering 的核心方法。

一、Prompt 的“三层架构”:从乱写到精准控制

1.1 为什么你的提示词总失效?

大多数人写 Prompt 是这样的:
> “一只可爱的猫,坐在沙发上,高清,写实风格,电影感”

这种写法有两个致命问题:

  • 信息堆砌:AI 无法区分主次,容易忽略关键元素
  • 缺乏控制参数:风格、光照、构图全靠 AI 自由发挥
  • 正确的做法是 按“主体-环境-风格-参数”分层构建。以 Midjourney 6.1 为例,一个专业级 Prompt 的骨架是:

    [主体描述] + [环境/背景] + [风格/媒介] + [光照/色彩] + [构图/视角] + [技术参数]
    

    1.2 实操案例:从“翻车”到“出片”

    案例目标:生成一张“赛博朋克风格的中国茶馆,雨夜,霓虹灯反射在湿漉漉的石板路上”

    错误版本(学员原始 Prompt):

    Cyberpunk Chinese tea house, rain, neon lights, wet street, realistic
    

    结果:画面混乱,霓虹灯和茶馆元素混合,像是日式动漫场景。

    正确版本(经过三层架构优化):

    主体:A traditional Chinese tea house with curved eaves and wooden lattice windows
    环境:Rainy night, wet cobblestone street reflecting neon signs, steam rising from tea cups
    风格:Cyberpunk aesthetic, blade runner vibes, volumetric lighting, cinematic
    参数:--ar 16:9 --v 6.1 --s 250 --style raw
    

    赛博朋克茶馆示例

    关键参数说明

  • `–v 6.1`:Midjourney 当前最新版本,对细节和光影理解最好
  • `–s 250`:风格化强度,0-1000,数值越高 AI 越“放飞”,建议 200-300 平衡创意与可控
  • `–style raw`:关闭 Midjourney 默认的美化滤镜,保留更真实的渲染质感
  • 效果对比:优化后的 Prompt 生成结果,茶馆结构清晰,霓虹灯反射在石板路上形成倒影,蒸汽和雨丝有层次,整体更像电影截图而非插画。

    二、工具适配:同一段 Prompt,不同 AI 的反应

    2.1 核心原则:理解 AI 的“语言偏好”

    AIGC 工具本质上是 语言模型 + 扩散模型的组合。不同工具的训练数据、权重分配不同,导致对同一段 Prompt 的解读差异巨大。

    | 工具 | 擅长领域 | 对 Prompt 的敏感点 |
    |——|———|——————|
    | Midjourney | 艺术性、氛围感 | 风格关键词、艺术家引用 |
    | DALL·E 3 | 写实度、文字生成 | 精确的物体名称、空间关系 |
    | Stable Diffusion | 可控性、局部修改 | 负面提示词、权重标记 |

    2.2 实操案例:为 DALL·E 3 重构 Prompt

    同样是“赛博朋克茶馆”,DALL·E 3 对“传统建筑”的理解更偏向 几何结构,而对“氛围感”的依赖较低。因此需要调整表达方式:

    针对 DALL·E 3 的优化版本

    A hyper-realistic photograph of a traditional Chinese tea house in a futuristic city. The building has curved eaves and red lanterns. Rain is falling on a cobblestone street, creating reflections of blue and pink neon signs. Steam rises from a ceramic teapot on an outdoor table. The scene is shot with a 35mm lens, shallow depth of field, cinematic lighting.
    

    关键差异

  • 加入“photograph”:DALL·E 3 对摄影术语敏感,能触发更真实的材质渲染
  • 具体化“steam”的来源:明确“ceramic teapot”,避免 AI 随机生成蒸汽位置
  • 指定镜头参数:35mm 焦距、浅景深,让构图更专业
  • DALL·E 3 赛博朋克茶馆

    结果:DALL·E 3 生成的茶馆带有明显的光学镜头效果(如焦外虚化),石板路的纹理更接近真实照片,而 Midjourney 版本则更接近概念艺术。

    2.3 进阶技巧:利用负面提示词(Negative Prompt)

    在 Stable Diffusion 中,负面提示词是控制质量的利器。例如,在生成“赛博朋克茶馆”时,添加:

    Negative prompt: cartoon, anime, illustration, watercolor, blurry, low quality, deformed buildings, incorrect perspective
    

    能让 SD 避免输出二次元风格,保持写实感。这在 Midjourney 中可以通过 `–no` 参数实现类似效果:`–no cartoon, anime, illustration`。

    三、参数调优:让 AI 听你的话

    3.1 Midjourney 的“隐藏参数”组合

    除了基础参数,Midjourney 6.1 还支持一些高级控制:

  • `–iw 2`:图像权重,数值越高越依赖参考图(需配合 `–image` 使用)
  • `–chaos 50`:混乱度,数值越高生成结果多样性越大,适合探索创意,但不易控制
  • `–weird 500`:怪异度,0-3000,适合生成超现实、抽象风格
  • 实战组合:生成“超现实茶馆”

    A tea house floating in the sky, upside down, with waterfalls flowing upward --v 6.1 --chaos 80 --weird 1000 --ar 16:9
    

    3.2 迭代法:用“反推提示词”优化

    当你对某张图满意但想微调时,使用 Describe 功能(Midjourney 的 `/describe` 命令)反推提示词。例如,上传一张满意的图,AI 会生成 4 个可能的 Prompt,你可以:

    1. 选择最接近你想法的那个
    2. 修改关键元素(如“把红色灯笼换成蓝色”)
    3. 调整参数(降低 `–s` 值增加写实度)

    反推提示词示例

    注意:反推的 Prompt 通常包含冗余信息(如“8k resolution”),需要手动精简。

    总结与进阶建议

    核心结论

    1. Prompt 是结构化编程:不是写作文,而是给 AI 设定参数范围
    2. 工具适配是必修课:同一段 Prompt 在不同工具中效果天差地别
    3. 参数是控制权:学会使用 `–v`、`–s`、`–chaos` 等参数,才能从“抽卡”变成“设计”

    学习路径建议

  • 第一周:掌握 Midjourney 的 5 个核心参数(v, s, ar, style, chaos),每天用不同参数组合生成 10 张图,记录差异
  • 第二周:学习 DALL·E 3 的 Prompt 语法,重点练习“摄影术语”和“材质描述”
  • 第三周:研究 Stable Diffusion 的负面提示词,尝试用 ControlNet 控制构图
  • 第四周:建立自己的 Prompt 模板库,按“写实/插画/概念艺术”分类存储
  • 推荐工具

  • Prompt 管理:AIPRM(Chrome 插件),支持保存和分类 Prompt
  • 参数可视化:Midjourney Prompt Helper(在线工具),实时查看参数效果
  • 反推工具:CLIP Interrogator(免费),分析图片中的语义关键词
  • 常见问题 FAQ

    Q1:为什么我用了同样的 Prompt,在 Midjourney 和 Stable Diffusion 里结果完全不一样?
    A:因为训练数据和模型架构不同。Midjourney 更强调艺术风格,SD 更依赖数学计算。建议为每个工具建立独立的 Prompt 库,不要直接复用。

    Q2:Prompt 越长越好吗?
    A:不是。超过 200 个字符的 Prompt 容易导致 AI 注意力���散��忽略核心元素。建议控制在 100-150 字符,用精确的动词和名词代替长句。

    Q3:如何让 AI 生成特定角色的连续形象?
    A:使用 种子值(Seed)。在 Midjourney 中,每张图生成时都有种子号,固定种子值(`–seed 12345`)可以保持角色面部特征一致。Stable Diffusion 同理。

    Q4:负面提示词(Negative Prompt)在 Midjourney 里怎么用?
    A:Midjourney 不支持直接写负面提示词,但可以用 `–no` 参数:`–no cartoon, blurry`。注意 `–no` 只能排除大类别,无法像 SD 那样精确到“排除特定颜色”。

    Q5:为什么我加了“photorealistic”但结果还是像插画?
    A:因为 AI 对“photorealistic”的理解依赖训练数据。建议替换为更具体的摄影术语,如“shot with Canon EOS R5, 85mm lens, f/1.4, ISO 200, natural light”,触发更真实的渲染逻辑。

    声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。