Prompt Engineering:AIGC 设计师的核心竞争力

上周,一位在火星人教育学习AIGC设计课程的同学发来一张图,问我:“老师,我用了同样的关键词,为什么生成的人物总是‘翻车’?不是手指畸形,就是眼神空洞,完全不像我想象中的‘东方赛博朋克女侠’。”

我点开他的Prompt一看,写的是:“A cyberpunk female warrior, eastern style, futuristic city, neon lights”。这个Prompt看似完整,但问题在于——它太“模糊”了。AI不是读心术,它只能根据你给出的文字去“猜”你的意图。结果就是:AI猜对了“赛博朋克”,但没猜对“东方”;猜对了“女侠”,但没猜对“眼神凌厉”。

这恰恰是很多设计师在接触AIGC时的共同困境:工具很强大,但Prompt写不好,就像手握顶级相机却不会对焦。

今天,我们就来深入聊聊Prompt Engineering——这项正在成为AIGC设计师核心竞争力的技能。它不是简单的“写关键词”,而是一种结构化、工程化的沟通方法。掌握它,你才能真正驾驭AI,而不是被AI的随机输出“牵着鼻子走”。

一、Prompt的底层逻辑:从“关键词堆砌”到“结构化描述”

很多初学者以为Prompt就是“堆关键词”,把想到的形容词全塞进去。但专业设计师都知道,AI的注意力是有限的,关键词堆砌反而会稀释核心指令。

1.1 结构化Prompt的“四要素法则”

经过大量测试(以Midjourney V6和Stable Diffusion WebUI 1.7为例),我总结出一个高效的结构化Prompt公式:

`[主体描述] + [环境/场景] + [风格/材质] + [细节/氛围] + [参数控制]`

举个例子,我们来生成一张“赛博朋克女侠”:

  • 低效Prompt:`A cyberpunk female warrior, eastern style, futuristic city, neon lights`

(AI容易生成欧美脸+日式赛博朋克,比如《攻壳机动队》风格)

  • 高效Prompt
  • `A Chinese female warrior in a futuristic Shanghai street, wearing a bamboo-weave armor with LED circuits, holding a glowing katana, rain-soaked asphalt reflecting neon signs, cinematic lighting, dramatic shadows, shot on 35mm film, –ar 16:9 –v 6`
    (AI会生成一个“中国面孔+元素融合”的赛博朋克角色,因为“Chinese female warrior”和“bamboo-weave armor”锁定了文化属性,“LED circuits”和“neon signs”保留了赛博朋克感)

    关键点:AI的“理解”是基于词频和关联性的。你写“eastern style”,AI可能关联到“日本动漫”,但写“Chinese female warrior”就直接锁定中国元素。具体名词 > 抽象形容词

    1.2 实操案例:用Stable Diffusion生成一组“东方赛博朋克角色”

    我们以Stable Diffusion WebUI 1.7 + Anything V5模型为例,做一个完整的Prompt工程流程:

    步骤1:定义主体
    `1girl, solo, Chinese face, black long hair tied into a ponytail, fair skin, serious expression`

    步骤2:添加装备与环境
    `wearing a futuristic armor with traditional Chinese cloud patterns, glowing blue circuits on the armor, holding a tech-sword with a jade handle, standing on a rooftop in a neon-lit Shanghai street`

    步骤3:风格与光影
    `cyberpunk style, neon lights, rain, wet surfaces, cinematic lighting, volumetric light, ray tracing, ultra-detailed, high fidelity`

    步骤4:负面Prompt(关键!)
    `ugly, deformed hands, extra fingers, bad anatomy, blurry, low quality, watermark, text, logo`

    步骤5:参数设置

  • Sampling method: `Euler a`
  • Steps: `30`
  • CFG Scale: `7`
  • Denoising strength: `0.6`(如果用图生图)
  • Seed: `固定一个种子值`(比如`123456`,用于复现效果)
  • 东方赛博朋克女侠

    输出结果:AI生成的角色不再是“欧美脸+日本元素”,而是“中国面孔+赛博朋克装备”,且手指、眼神都正常。这就是结构化Prompt的力量——你给了AI清晰的边界,它就不会“跑偏”

    二、进阶技巧:用“角色扮演”和“思维链”控制AI行为

    如果你觉得“四要素法则”还不够精细,那接下来这个技巧——角色扮演Prompt——会让你的输出质量再上一个台阶。它特别适合在ChatGPT、Claude等语言模型中使用,但也能用于图像生成(通过描述“摄影师视角”)。

    2.1 什么是“角色扮演Prompt”?

    简单说,就是给AI一个“身份设定”,让它以特定角色的视角去思考。比如,你不是说“生成一张产品图”,而是说“你是一个顶级商业摄影师,正在为苹果公司拍摄一组极简风格的产品图”。

    原理:AI训练数据中包含了大量“专业角色”的语料。当你给它一个角色,它会自动调用该领域的“知识框架”,包括构图、光影、材质处理等细节。

    2.2 实操案例:用ChatGPT生成一组“香水产品文案”

    假设你要为一个小众香水品牌写广告文案,普通Prompt可能是:
    `Write a product description for a unisex perfume named “Midnight Mist”.`
    (结果:AI会写“这款香水融合了木质和花香…”这种千篇一律的文案)

    但用“角色扮演Prompt”:

    Prompt
    `你是一个为《Vogue》杂志工作10年的香水评论家,擅长用意象和情感来描述香气。现在,请为一款名为“午夜迷雾”的中性香水写一段300字的广告文案。这款香水的核心是“皮革+檀香+一点点烟熏味”,目标用户是25-35岁、住在城市、追求独立精神的年轻人。请用冷静、疏离的语气,避免“甜美”“温柔”等词汇。`

    输出
    `“午夜的城市,你独自走在空荡的街道。路灯把影子拉长,空气中飘来皮革与檀香的气息——那是‘午夜迷雾’的味道。它不讨好任何人,就像你一样。前调是冰冷的金属感,像地铁站台的风;中调是旧书和雪松,让人想起深夜的图书馆;尾调是烟熏的木质,像壁炉里最后一缕余烬。这不是香水,是一件穿在身上的情绪。”`

    差异:普通Prompt得到的是“说明书”,角色扮演Prompt得到的是“故事”。AI会调用“香水评论家”的词汇库(如“前调”“中调”“尾调”“意象”),并模仿杂志的写作风格。

    2.3 思维链(Chain-of-Thought)在Prompt中的应用

    思维链是一种分步推理的Prompt技巧,特别适合复杂任务(比如设计多个角色、多个场景的系列作品)。

    示例
    `你是一个概念设计师,正在为一部赛博朋克电影设计三个主要角色。请按以下步骤思考:
    1. 首先,确定三个角色的身份:一个黑客、一个警察、一个流浪者。
    2. 然后,为每个角色分配一个核心视觉元素:黑客用“全息纹身”,警察用“透明装甲”,流浪者用“废品改造装备”。
    3. 接着,描述每个角色的服装细节、色彩倾向和光影效果。
    4. 最后,将这些描述转化为Midjourney V6的Prompt,每个角色输出一个独立的Prompt。`

    输出:AI会生成三个结构清晰、风格统一的Prompt,而且每个角色之间会有视觉关联(比如都使用“冷色调+霓虹光”),形成系列感。

    三个赛博朋克角色

    关键点:思维链强迫AI“先思考再输出”,而不是直接生成随机结果。这对需要一致性的设计项目(如游戏角色设计、品牌视觉系统)尤其有用。

    三、Prompt的“调试”与“迭代”:像程序员一样工作

    很多设计师以为Prompt是一次性写好的,但实际工作中,Prompt是一个“调试-反馈-优化”的循环。就像写代码,你不可能一次就写出完美的函数。

    3.1 建立“Prompt版本管理”习惯

    我建议用Excel或Notion记录你的Prompt迭代过程,包括:

    | 版本 | Prompt内容 | 参数设置 | 输出结果 | 问题分析 | 改进方向 |
    |——|————|———-|———-|———-|———-|
    | V1 | “A cyberpunk female warrior” | 默认参数 | 手指畸形,欧美脸 | 主体描述不够具体,缺少负面Prompt | 加入“Chinese face”“extra fingers” |
    | V2 | “A Chinese female warrior…” | CFG 7 | 手指正常,但背景模糊 | 场景描述太笼统 | 加入“neon-lit Shanghai street”“rain” |
    | V3 | “A Chinese female warrior in Shanghai street, rain…” | CFG 8 | 背景清晰,但脸太成熟 | 年龄描述缺失 | 加入“young, 18 years old” |

    迭代原则:每次只改一个变量。比如这次只改“主体描述”,下次只改“CFG Scale”,这样你才能知道“哪个改动导致了效果变化”。

    3.2 用“权重”和“混合”控制细节

    在Midjourney V6中,你可以用`::`符号给关键词加权重:

    `Chinese female warrior::2 cyberpunk::1.5 rain::1`

    这表示“Chinese female warrior”的重要性是“rain”的两倍。AI会优先保证“中国女战士”特征,然后再考虑“雨”。

    在Stable Diffusion中,权重用`(keyword:1.2)`或`(keyword:0.8)`表示,1.0是基准值。

    实战技巧

  • 如果你想让“眼睛”更亮,可以用`(glowing eyes:1.4)`
  • 如果你想减少“机械感”,可以用`(less mechanical:0.6)`
  • 如果你想混合两种风格,可以用`[style A:style B:0.5]`(0.5表示在前50%步骤用风格A,后50%用风格B)
  • 3.3 常见“翻车”场景与解决方案

    | 问题 | 原因 | 解决方案 |
    |——|——|———-|
    | 手指畸形 | AI对“手”的理解有限 | 加入负面Prompt `extra fingers, bad hands`,或使用ControlNet的“OpenPose”手部模型 |
    | 脸崩 | 面部特征描述不足 | 加入`detailed face, symmetrical face, clear eyes, defined nose` |
    | 背景空洞 | 场景描述太抽象 | 用具体名词替代:不用`futuristic city`,用`neon-lit Tokyo street at night` |
    | 风格不统一 | 混合了冲突的风格词 | 避免同时出现`anime style`和`photorealistic`,选择一种为主 |

    Prompt调试对比图

    总结与进阶建议

    Prompt Engineering的本质,是一种精准的、结构化的沟通能力。它不是“魔法咒语”,而是一套可以学习、可以迭代的方法论。从“四要素法则”到“角色扮演Prompt”,再到“版本管理”,每一步都在帮你把模糊的创意转化为AI能理解的具体指令。

    三个进阶建议���

    1. 建立自己的Prompt库:每完成一个项目,就把高质量的Prompt整理成模板,标注参数和效果。下次遇到类似需求,直接复用。
    2. 学习控制网络(ControlNet):在Stable Diffusion中,ControlNet可以让你用“姿势骨架”“深度图”“线稿”等条件控制生成结果。Prompt + ControlNet = 从“文字控制”到“视觉控制”的飞跃。
    3. 关注AI模型的更新:Midjourney V6对自然语言的理解能力大幅提升,Stable Diffusion 3引入了“文本渲染”能力。工具在变,但Prompt工程的原则——具体、结构化、可迭代——不会变。

    最后,记住一句话:好的Prompt不是“写”出来的,是“改”出来的。 接受AI的“不完美”,把它当作一个需要反复沟通的合作伙伴,而不是一个“一键出图”的工具。

    常见问题 FAQ

    Q1:Prompt越长越好吗?
    A:不一定。太长会稀释核心指令,AI的注意力有限。建议控制在50-80个单词内,用具体名词替代抽象形容词。如果需要更多细节,可以用“分段式Prompt”(比如先写主体,再写背景,最后写光影)。

    Q2:负面Prompt(Negative Prompt)到底该怎么写?
    A:负面Prompt的作用是“排除不想要的元素”。常见的包括:`ugly, blurry, low quality, watermark, text, extra fingers, bad anatomy, deformed`。但不要写太多,5-8个词足够。注意:负面Prompt中的词可能被AI“反向强化”,所以不要写`no hands`(可能导致手消失),而是写`bad hands`。

    Q3:Midjourney和Stable Diffusion的Prompt写法一样吗?
    A:不完全一样。Midjourney V6更擅长理解自然语言,你可以写“A cat sitting on a beach at sunset, cinematic lighting”这种完整句子。Stable Diffusion则更依赖关键词权重,需要用`()`和`[]`控制优先级。建议两个工具都学,但先掌握一个。

    Q4:为什么我复制别人的Prompt,却生成不出同样的效果?
    A:三个原因:1)参数不同(Seed、CFG Scale、Steps等);2)模型不同(Midjourney版本、Stable Diffusion底模);3)随机性(AI每次生成都有微小变化)。解决方案:固定Seed值,使用相同的模型版本,并调整参数到一致。

    Q5:Prompt Engineering需要学编程吗?
    A:不需要。但了解一些基础概念(如权重、种子值、采样方法)会很有帮助。更关键的是“结构化思维”——把复杂问题拆解成“主体-场景-风格-细节”的能力。这种能力可以通过大量练习获得,与编程无关。

    声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。