Prompt Engineering:AIGC 设计师的核心竞争力

上周三的晚课,一位学员拿着刚生成的图来找我:“老师,我用同样的关键词,为什么出的图总比您示范的差一大截?”她展示的是一张“赛博朋克城市夜景”,画面灰蒙蒙,细节模糊,完全没有我想象中霓虹与钢铁交织的张力。

我让她把 prompt 发到群里。她写的是:“Cyberpunk city, night, neon lights, rain, high quality, realistic”。

问题在哪?不是工具不行,不是模型不好,是 prompt 太“模糊”。这种描述,AI 只能猜你要什么,而猜的结果往往平庸。Prompt Engineering 不是写句子,是给 AI 画“设计蓝图”

今天,我们就来拆解这件事。作为 AIGC 设计师,你能不能稳定产出高质量作品,90% 取决于你写 prompt 的能力。这是真正的核心竞争力。

一、为什么 prompt 是你的“设计语言”?

很多人以为 AI 绘画是“自动生成”,这是最大的误解。Midjourney 6.1、Stable Diffusion 3.5、DALL·E 3——这些工具本质上是“图像渲染引擎”,而 prompt 是你和引擎之间的“编程语言”。

1.1 模糊 prompt 的代价

我们做个对比实验。

模糊 prompt:“A beautiful landscape, sunset, mountains, lake, photorealistic”

AI 会给你什么?大概率是一张糖水片:夕阳、倒影、远山,构图居中,光影平淡。放在小红书都引不来一个赞。

结构化 prompt:“Epic landscape photography, dramatic sunset over jagged mountain peaks, calm turquoise lake reflecting orange and purple sky, foreground rocky shore with moss, ultra-detailed, 8K, shot on Hasselblad X1D II 50C, f/8, hyperrealistic, cinematic lighting –ar 16:9 –v 6.1 –style raw”

结果完全不同:画面有层次、有叙事感、有摄影语言的质感。为什么?因为你告诉 AI 的不只是“要什么”,还有“怎么要”。

1.2 prompt 的核心三要素

我在火星人教育的 AIGC 设计课里,把 prompt 拆成三个必填模块:

1. 主体与场景:谁?在哪?做什么?
2. 风格与媒介:什么画风?什么设备?什么参数?
3. 品质与细节:光线、纹理、分辨率、构图。

缺任何一个,输出都会打折。下面我们通过两个实战案例,把这套方法落地。

结构化 prompt 与模糊 prompt 的对比

二、实操案例一:用“参数化 prompt”精准控制 Midjourney 输出

2.1 背景:学员的“科幻角色”需求

学员要做一个“未来战士”角色设计,用于游戏原画。她第一次写的 prompt 是:“Futuristic soldier, armor, gun, blue lighting, concept art, high detail”。

结果:人物姿势僵硬,盔甲像塑料,光影平铺直叙。

2.2 改造方案:给 prompt 加“参数表”

我让她按这个模板重写:

Step 1:定义主体与动作

  • “A muscular female soldier in full tactical exosuit, dynamic crouching pose, aiming a plasma rifle, side profile view”

Step 2:指定风格与媒介

  • “Concept art by Feng Zhu and Syd Mead, cyberpunk military aesthetic, hard surface design, mechanical joints with visible hydraulics”
  • Step 3:控制品质与参数

  • “Octane render, volumetric lighting, blue and orange complementary color scheme, rim light, dust particles in air, hyperdetailed, 8K, –ar 3:2 –v 6.1 –style raw –s 50”
  • 注意最后的参数:

  • `–v 6.1`:指定模型版本,6.1 在人物和材质上有显著提升
  • `–style raw`:减少 Midjourney 默认的美化滤镜,保留更多摄影/渲染质感
  • `–s 50`:风格化强度,0-1000,50 是低风格化,适合写实原画
  • `–ar 3:2`:画幅比例,适合角色���绘
  • Step 4:用“–no”做负向控制

  • 在 prompt 末尾加 `–no deformed hands, extra fingers, blurry face, low quality`
  • 2.3 结果与关键点

    生成的图:盔甲有金属磨损痕迹,光影从右上侧勾勒出肌肉线条,枪械的散热片细节清晰可见。学员当场惊呼:“这才是我想要的!”

    关键教训:prompt 不是写作文,是填参数。每个词都在告诉 AI“这个要保留”“那个要突出”“什么风格”“什么设备”。当你把 prompt 当作“设计规格书”来写,AI 就不再是猜谜,而是执行你的意图。

    Midjourney 参数化 prompt 生成的角色设计

    三、实操案例二:Stable Diffusion 中的“权重语法”与 ControlNet 联动

    3.1 场景:电商产品图,要“真实感”但不要“影棚感”

    一位做电商设计的学员需要一张“户外登山鞋”的产品图,要求:鞋子在真实的岩石地面上,有自然光,但鞋的材质要清晰到能看清缝线。

    她最初用 SD WebUI 生成,prompt 是:“Hiking boots on rocks, outdoor, natural light, product photography, high detail”。结果:背景像贴图,鞋子像塑料模型,完全没质感。

    3.2 改造方案:权重语法 + ControlNet 深度控制

    Step 1:用权重语法突出核心元素

    SD 的 prompt 支持 `( )` 和数字权重。我们把关键元素加权重:

    (masterpiece, best quality:1.2), (hiking boots:1.4), (leather texture, stitched seams:1.3), on granite rocks, morning sunlight, (volumetric lighting:1.2), (sharp focus:1.3), product photography, shot on Canon EOS R5, 85mm lens, f/2.8, (hyperrealistic:1.2)
    

    解释:

  • `(hiking boots:1.4)`:鞋子权重 1.4,确保它不被背景淹没
  • `(leather texture, stitched seams:1.3)`:强调材质细节
  • `(sharp focus:1.3)`:避免 AI 做模糊化处理
  • Step 2:用 ControlNet 锁定构图与深度

    在 SD WebUI 的 ControlNet 面板(版本 1.1.4+):

  • 上传一张参考构图:鞋子在画面左下1/3,背景是岩石纹理
  • 启用 Canny 边缘检测或 Depth 深度图
  • 权重设为 0.8,控制模式选“均衡”
  • Step 3:负向 prompt 过滤杂质

    low quality, blurry, plastic, fake, mannequin, watermark, text, logo, deformed, extra limbs, bad anatomy, ugly, duplicate, morbid, mutilated, out of frame, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck
    

    这串负向词不是随便写的,是从 SD 社区最常用的“bad hands”负面列表里提炼的。负向 prompt 的重要性不亚于正向,它告诉 AI“不要碰这些雷区”。

    3.3 结果:从“塑料鞋”到“可以摸到的鞋”

    生成的图:鞋面的皮革纹理清晰可见,缝线有立体感,鞋底的橡胶纹路与岩石的颗粒感形成对比,光线从左上角打过来,在鞋侧面形成柔和的渐变。

    学员说:“这张图直接能上详情页了。”

    关键教训:权重语法让你像调音台一样控制每个元素的“音量”。ControlNet 则让你从“文字描述”进阶到“视觉参考”,AI 不再是自由发挥,而是在你划定的框架内创作。

    Stable Diffusion 权重语法与 ControlNet 生成的产品图

    四、总结与进阶建议

    4.1 核心心法:从“写句子”到“写规格”

    回顾这两个案例,你会发现一个共同点:好的 prompt 不是描述,是规格

  • 写“futuristic soldier” → 改为“concept art by Feng Zhu, hard surface design, mechanical joints”
  • 写“hiking boots on rocks” → 改为“(leather texture:1.3), on granite rocks, morning sunlight”
  • 写“high quality” → 改为“8K, shot on Hasselblad X1D II 50C, f/8, hyperrealistic”
  • 每次写 prompt 前,问自己三个问题:
    1. 我到底要什么主体?它的材质、颜色、姿态是什么?
    2. 我想要什么风格?是电影感、摄影感、还是插画感?
    3. 我需要哪些视觉参数来控制光影、构图、分辨率?

    4.2 进阶学习路径

    如果你已经掌握了基础,可以往这几个方向深入:

  • 多模型融合:在 ComfyUI 中串联多个 LoRA 模型,比如一个控制材质、一个控制光影、一个控制人物特征
  • 动态 prompt:使用 `{red|blue|green}` 语法让 AI 随机组合,批量生成变体
  • 反向工程:看到一张喜欢的图,用 CLIP Interrogator 或 DeepDanbooru 反推 prompt,学习高手的用词习惯
  • 4.3 工具推荐

  • Midjourney 6.1:适合创意探索和高质量渲染,参数系统友好
  • Stable Diffusion WebUI 1.9.4:适合精细控制和批量生产,配合 ControlNet 1.1.4+
  • ComfyUI:适合工作流编排和复杂任务,学习曲线陡但上限高
  • PromptBase:学习别人怎么写 prompt,但不是照抄,要理解为什么
  • 常见问题 FAQ

    Q1:为什么我加了很长的 prompt,效果反而更差?

    A:因为“长”不等于“好”。prompt 越长,AI 越容易迷失重点。保持 30-50 个词,每个词都有明确指向。如果必须写长,用权重语法 `( )` 或 `[ ]` 区分主次。

    Q2:Midjourney 和 Stable Diffusion 的 prompt 写法一样吗?

    A:核心逻辑相同,但语法不同。MJ 用 `–` 参数,SD 用 `( )` 权重和 `+` 连接。MJ 更依赖自然语言,SD 更依赖关键词堆叠。建议两个都学,场景不同选不同工具。

    Q3:怎么判断我写的 prompt 好不好?

    A:看生成的图是否符合你的“设计意图”。如果图里出现了你没写的东西(比如多了个人、多了棵树),说明 prompt 不够精确。如果材质、光影、构图和你脑中画面一致,就是好 prompt。

    Q4:有没有快速提升 prompt 技巧的方法?

    A:有。每天做“对比实验”:同一主题,写两个版本——一个模糊版本、一个结构化版本。看差异在哪。坚持两周,你会形成肌肉记忆。

    Q5:负向 prompt 到底该写多长?

    A:不要超过正向 prompt 的 1/3。重点写常见问题:手部畸形、模糊、重复、水印。SD 的社区有现成的负面词列表,可以直接拿来用,再根据你的场景微调。

    最后,记住一句话:AI 不会替你做设计,它只是你手里的一支更快的笔。而 prompt,就是握笔的方式。 掌握它,你才能从“会用 AI”的人,变成“用 AI 做设计”的人。

    下一期,我们聊如何用 LoRA 模型训练自己的风格,保持品牌一致性。火星人教育的 AIGC 设计课见。

    声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。