Prompt Engineering：AIGC 设计师的核心竞争力

上周，一位在火星人教育学习AIGC设计课程的同学发来一张图，问我：“老师，我用了同样的关键词，为什么生成的人物总是‘翻车’？不是手指畸形，就是眼神空洞，完全不像我想象中的‘东方赛博朋克女侠’。”

我点开他的Prompt一看，写的是：“A cyberpunk female warrior, eastern style, futuristic city, neon lights”。这个Prompt看似完整，但问题在于——它太“模糊”了。AI不是读心术，它只能根据你给出的文字去“猜”你的意图。结果就是：AI猜对了“赛博朋克”，但没猜对“东方”；猜对了“女侠”，但没猜对“眼神凌厉”。

这恰恰是很多设计师在接触AIGC时的共同困境：工具很强大，但Prompt写不好，就像手握顶级相机却不会对焦。

今天，我们就来深入聊聊Prompt Engineering——这项正在成为AIGC设计师核心竞争力的技能。它不是简单的“写关键词”，而是一种结构化、工程化的沟通方法。掌握它，你才能真正驾驭AI，而不是被AI的随机输出“牵着鼻子走”。

—

一、Prompt的底层逻辑：从“关键词堆砌”到“结构化描述”

很多初学者以为Prompt就是“堆关键词”，把想到的形容词全塞进去。但专业设计师都知道，AI的注意力是有限的，关键词堆砌反而会稀释核心指令。

1.1 结构化Prompt的“四要素法则”

经过大量测试（以Midjourney V6和Stable Diffusion WebUI 1.7为例），我总结出一个高效的结构化Prompt公式：

`[主体描述] + [环境/场景] + [风格/材质] + [细节/氛围] + [参数控制]`

举个例子，我们来生成一张“赛博朋克女侠”：

低效Prompt：`A cyberpunk female warrior, eastern style, futuristic city, neon lights`

（AI容易生成欧美脸+日式赛博朋克，比如《攻壳机动队》风格）

高效Prompt：

`A Chinese female warrior in a futuristic Shanghai street, wearing a bamboo-weave armor with LED circuits, holding a glowing katana, rain-soaked asphalt reflecting neon signs, cinematic lighting, dramatic shadows, shot on 35mm film, –ar 16:9 –v 6`
（AI会生成一个“中国面孔+元素融合”的赛博朋克角色，因为“Chinese female warrior”和“bamboo-weave armor”锁定了文化属性，“LED circuits”和“neon signs”保留了赛博朋克感）

关键点：AI的“理解”是基于词频和关联性的。你写“eastern style”，AI可能关联到“日本动漫”，但写“Chinese female warrior”就直接锁定中国元素。具体名词 > 抽象形容词。

1.2 实操案例：用Stable Diffusion生成一组“东方赛博朋克角色”

我们以Stable Diffusion WebUI 1.7 + Anything V5模型为例，做一个完整的Prompt工程流程：

步骤1：定义主体
`1girl, solo, Chinese face, black long hair tied into a ponytail, fair skin, serious expression`

步骤2：添加装备与环境
`wearing a futuristic armor with traditional Chinese cloud patterns, glowing blue circuits on the armor, holding a tech-sword with a jade handle, standing on a rooftop in a neon-lit Shanghai street`

步骤3：风格与光影
`cyberpunk style, neon lights, rain, wet surfaces, cinematic lighting, volumetric light, ray tracing, ultra-detailed, high fidelity`

步骤4：负面Prompt（关键！）
`ugly, deformed hands, extra fingers, bad anatomy, blurry, low quality, watermark, text, logo`

步骤5：参数设置

Sampling method: `Euler a`

Steps: `30`

CFG Scale: `7`

Denoising strength: `0.6`（如果用图生图）

Seed: `固定一个种子值`（比如`123456`，用于复现效果）

东方赛博朋克女侠

输出结果：AI生成的角色不再是“欧美脸+日本元素”，而是“中国面孔+赛博朋克装备”，且手指、眼神都正常。这就是结构化Prompt的力量——你给了AI清晰的边界，它就不会“跑偏”。

—

二、进阶技巧：用“角色扮演”和“思维链”控制AI行为

如果你觉得“四要素法则”还不够精细，那接下来这个技巧——角色扮演Prompt——会让你的输出质量再上一个台阶。它特别适合在ChatGPT、Claude等语言模型中使用，但也能用于图像生成（通过描述“摄影师视角”）。

2.1 什么是“角色扮演Prompt”？

简单说，就是给AI一个“身份设定”，让它以特定角色的视角去思考。比如，你不是说“生成一张产品图”，而是说“你是一个顶级商业摄影师，正在为苹果公司拍摄一组极简风格的产品图”。

原理：AI训练数据中包含了大量“专业角色”的语料。当你给它一个角色，它会自动调用该领域的“知识框架”，包括构图、光影、材质处理等细节。

2.2 实操案例：用ChatGPT生成一组“香水产品文案”

假设你要为一个小众香水品牌写广告文案，普通Prompt可能是：
`Write a product description for a unisex perfume named “Midnight Mist”.`
（结果：AI会写“这款香水融合了木质和花香…”这种千篇一律的文案）

但用“角色扮演Prompt”：

Prompt：
`你是一个为《Vogue》杂志工作10年的香水评论家，擅长用意象和情感来描述香气。现在，请为一款名为“午夜迷雾”的中性香水写一段300字的广告文案。这款香水的核心是“皮革+檀香+一点点烟熏味”，目标用户是25-35岁、住在城市、追求独立精神的年轻人。请用冷静、疏离的语气，避免“甜美”“温柔”等词汇。`

输出：
`“午夜的城市，你独自走在空荡的街道。路灯把影子拉长，空气中飘来皮革与檀香的气息——那是‘午夜迷雾’的味道。它不讨好任何人，就像你一样。前调是冰冷的金属感，像地铁站台的风；中调是旧书和雪松，让人想起深夜的图书馆；尾调是烟熏的木质，像壁炉里最后一缕余烬。这不是香水，是一件穿在身上的情绪。”`

差异：普通Prompt得到的是“说明书”，角色扮演Prompt得到的是“故事”。AI会调用“香水评论家”的词汇库（如“前调”“中调”“尾调”“意象”），并模仿杂志的写作风格。

2.3 思维链（Chain-of-Thought）在Prompt中的应用

思维链是一种分步推理的Prompt技巧，特别适合复杂任务（比如设计多个角色、多个场景的系列作品）。

示例：
`你是一个概念设计师，正在为一部赛博朋克电影设计三个主要角色。请按以下步骤思考：
1. 首先，确定三个角色的身份：一个黑客、一个警察、一个流浪者。
2. 然后，为每个角色分配一个核心视觉元素：黑客用“全息纹身”，警察用“透明装甲”，流浪者用“废品改造装备”。
3. 接着，描述每个角色的服装细节、色彩倾向和光影效果。
4. 最后，将这些描述转化为Midjourney V6的Prompt，每个角色输出一个独立的Prompt。`

输出：AI会生成三个结构清晰、风格统一的Prompt，而且每个角色之间会有视觉关联（比如都使用“冷色调+霓虹光”），形成系列感。

三个赛博朋克角色

关键点：思维链强迫AI“先思考再输出”，而不是直接生成随机结果。这对需要一致性的设计项目（如游戏角色设计、品牌视觉系统）尤其有用。

—

三、Prompt的“调试”与“迭代”：像程序员一样工作

很多设计师以为Prompt是一次性写好的，但实际工作中，Prompt是一个“调试-反馈-优化”的循环。就像写代码，你不可能一次就写出完美的函数。

3.1 建立“Prompt版本管理”习惯

我建议用Excel或Notion记录你的Prompt迭代过程，包括：

迭代原则：每次只改一个变量。比如这次只改“主体描述”，下次只改“CFG Scale”，这样你才能知道“哪个改动导致了效果变化”。

3.2 用“权重”和“混合”控制细节

在Midjourney V6中，你可以用`::`符号给关键词加权重：

`Chinese female warrior::2 cyberpunk::1.5 rain::1`

这表示“Chinese female warrior”的重要性是“rain”的两倍。AI会优先保证“中国女战士”特征，然后再考虑“雨”。

在Stable Diffusion中，权重用`(keyword:1.2)`或`(keyword:0.8)`表示，1.0是基准值。

实战技巧：

如果你想让“眼睛”更亮，可以用`(glowing eyes:1.4)`

如果你想减少“机械感”，可以用`(less mechanical:0.6)`

如果你想混合两种风格，可以用`[style A:style B:0.5]`（0.5表示在前50%步骤用风格A，后50%用风格B）

3.3 常见“翻车”场景与解决方案

Prompt调试对比图

—

总结与进阶建议

Prompt Engineering的本质，是一种精准的、结构化的沟通能力。它不是“魔法咒语”，而是一套可以学习、可以迭代的方法论。从“四要素法则”到“角色扮演Prompt”，再到“版本管理”，每一步都在帮你把模糊的创意转化为AI能理解的具体指令。

三个进阶建议��

1. 建立自己的Prompt库：每完成一个项目，就把高质量的Prompt整理成模板，标注参数和效果。下次遇到类似需求，直接复用。
2. 学习控制网络（ControlNet）：在Stable Diffusion中，ControlNet可以让你用“姿势骨架”“深度图”“线稿”等条件控制生成结果。Prompt + ControlNet = 从“文字控制”到“视觉控制”的飞跃。
3. 关注AI模型的更新：Midjourney V6对自然语言的理解能力大幅提升，Stable Diffusion 3引入了“文本渲染”能力。工具在变，但Prompt工程的原则——具体、结构化、可迭代——不会变。

最后，记住一句话：好的Prompt不是“写”出来的，是“改”出来的。 接受AI的“不完美”，把它当作一个需要反复沟通的合作伙伴，而不是一个“一键出图”的工具。

—

常见问题 FAQ

Q1：Prompt越长越好吗？
A：不一定。太长会稀释核心指令，AI的注意力有限。建议控制在50-80个单词内，用具体名词替代抽象形容词。如果需要更多细节，可以用“分段式Prompt”（比如先写主体，再写背景，最后写光影）。

Q2：负面Prompt（Negative Prompt）到底该怎么写？
A：负面Prompt的作用是“排除不想要的元素”。常见的包括：`ugly, blurry, low quality, watermark, text, extra fingers, bad anatomy, deformed`。但不要写太多，5-8个词足够。注意：负面Prompt中的词可能被AI“反向强化”，所以不要写`no hands`（可能导致手消失），而是写`bad hands`。

Q3：Midjourney和Stable Diffusion的Prompt写法一样吗？
A：不完全一样。Midjourney V6更擅长理解自然语言，你可以写“A cat sitting on a beach at sunset, cinematic lighting”这种完整句子。Stable Diffusion则更依赖关键词权重，需要用`()`和`[]`控制优先级。建议两个工具都学，但先掌握一个。

Q4：为什么我复制别人的Prompt，却生成不出同样的效果？
A：三个原因：1）参数不同（Seed、CFG Scale、Steps等）；2）模型不同（Midjourney版本、Stable Diffusion底模）；3）随机性（AI每次生成都有微小变化）。解决方案：固定Seed值，使用相同的模型版本，并调整参数到一致。

Q5：Prompt Engineering需要学编程吗？
A：不需要。但了解一些基础概念（如权重、种子值、采样方法）会很有帮助。更关键的是“结构化思维”——把复杂问题拆解成“主体-场景-风格-细节”的能力。这种能力可以通过大量练习获得，与编程无关。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

Prompt Engineering：AIGC 设计师的核心竞争力

Prompt Engineering：AIGC 设计师的核心竞争力