Prompt Engineering:AIGC 设计师的核心竞争力
上周,一位在火星人教育学习AIGC设计课程的同学发来一张图,问我:“老师,我用了同样的关键词,为什么生成的人物总是‘翻车’?不是手指畸形,就是眼神空洞,完全不像我想象中的‘东方赛博朋克女侠’。”
我点开他的Prompt一看,写的是:“A cyberpunk female warrior, eastern style, futuristic city, neon lights”。这个Prompt看似完整,但问题在于——它太“模糊”了。AI不是读心术,它只能根据你给出的文字去“猜”你的意图。结果就是:AI猜对了“赛博朋克”,但没猜对“东方”;猜对了“女侠”,但没猜对“眼神凌厉”。
这恰恰是很多设计师在接触AIGC时的共同困境:工具很强大,但Prompt写不好,就像手握顶级相机却不会对焦。
今天,我们就来深入聊聊Prompt Engineering——这项正在成为AIGC设计师核心竞争力的技能。它不是简单的“写关键词”,而是一种结构化、工程化的沟通方法。掌握它,你才能真正驾驭AI,而不是被AI的随机输出“牵着鼻子走”。
—
一、Prompt的底层逻辑:从“关键词堆砌”到“结构化描述”
很多初学者以为Prompt就是“堆关键词”,把想到的形容词全塞进去。但专业设计师都知道,AI的注意力是有限的,关键词堆砌反而会稀释核心指令。
1.1 结构化Prompt的“四要素法则”
经过大量测试(以Midjourney V6和Stable Diffusion WebUI 1.7为例),我总结出一个高效的结构化Prompt公式:
`[主体描述] + [环境/场景] + [风格/材质] + [细节/氛围] + [参数控制]`
举个例子,我们来生成一张“赛博朋克女侠”:
- 低效Prompt:`A cyberpunk female warrior, eastern style, futuristic city, neon lights`
(AI容易生成欧美脸+日式赛博朋克,比如《攻壳机动队》风格)
`A Chinese female warrior in a futuristic Shanghai street, wearing a bamboo-weave armor with LED circuits, holding a glowing katana, rain-soaked asphalt reflecting neon signs, cinematic lighting, dramatic shadows, shot on 35mm film, –ar 16:9 –v 6`
(AI会生成一个“中国面孔+元素融合”的赛博朋克角色,因为“Chinese female warrior”和“bamboo-weave armor”锁定了文化属性,“LED circuits”和“neon signs”保留了赛博朋克感)
关键点:AI的“理解”是基于词频和关联性的。你写“eastern style”,AI可能关联到“日本动漫”,但写“Chinese female warrior”就直接锁定中国元素。具体名词 > 抽象形容词。
1.2 实操案例:用Stable Diffusion生成一组“东方赛博朋克角色”
我们以Stable Diffusion WebUI 1.7 + Anything V5模型为例,做一个完整的Prompt工程流程:
步骤1:定义主体
`1girl, solo, Chinese face, black long hair tied into a ponytail, fair skin, serious expression`
步骤2:添加装备与环境
`wearing a futuristic armor with traditional Chinese cloud patterns, glowing blue circuits on the armor, holding a tech-sword with a jade handle, standing on a rooftop in a neon-lit Shanghai street`
步骤3:风格与光影
`cyberpunk style, neon lights, rain, wet surfaces, cinematic lighting, volumetric light, ray tracing, ultra-detailed, high fidelity`
步骤4:负面Prompt(关键!)
`ugly, deformed hands, extra fingers, bad anatomy, blurry, low quality, watermark, text, logo`
步骤5:参数设置
输出结果:AI生成的角色不再是“欧美脸+日本元素”,而是“中国面孔+赛博朋克装备”,且手指、眼神都正常。这就是结构化Prompt的力量——你给了AI清晰的边界,它就不会“跑偏”。
—
二、进阶技巧:用“角色扮演”和“思维链”控制AI行为
如果你觉得“四要素法则”还不够精细,那接下来这个技巧——角色扮演Prompt——会让你的输出质量再上一个台阶。它特别适合在ChatGPT、Claude等语言模型中使用,但也能用于图像生成(通过描述“摄影师视角”)。
2.1 什么是“角色扮演Prompt”?
简单说,就是给AI一个“身份设定”,让它以特定角色的视角去思考。比如,你不是说“生成一张产品图”,而是说“你是一个顶级商业摄影师,正在为苹果公司拍摄一组极简风格的产品图”。
原理:AI训练数据中包含了大量“专业角色”的语料。当你给它一个角色,它会自动调用该领域的“知识框架”,包括构图、光影、材质处理等细节。
2.2 实操案例:用ChatGPT生成一组“香水产品文案”
假设你要为一个小众香水品牌写广告文案,普通Prompt可能是:
`Write a product description for a unisex perfume named “Midnight Mist”.`
(结果:AI会写“这款香水融合了木质和花香…”这种千篇一律的文案)
但用“角色扮演Prompt”:
Prompt:
`你是一个为《Vogue》杂志工作10年的香水评论家,擅长用意象和情感来描述香气。现在,请为一款名为“午夜迷雾”的中性香水写一段300字的广告文案。这款香水的核心是“皮革+檀香+一点点烟熏味”,目标用户是25-35岁、住在城市、追求独立精神的年轻人。请用冷静、疏离的语气,避免“甜美”“温柔”等词汇。`
输出:
`“午夜的城市,你独自走在空荡的街道。路灯把影子拉长,空气中飘来皮革与檀香的气息——那是‘午夜迷雾’的味道。它不讨好任何人,就像你一样。前调是冰冷的金属感,像地铁站台的风;中调是旧书和雪松,让人想起深夜的图书馆;尾调是烟熏的木质,像壁炉里最后一缕余烬。这不是香水,是一件穿在身上的情绪。”`
差异:普通Prompt得到的是“说明书”,角色扮演Prompt得到的是“故事”。AI会调用“香水评论家”的词汇库(如“前调”“中调”“尾调”“意象”),并模仿杂志的写作风格。
2.3 思维链(Chain-of-Thought)在Prompt中的应用
思维链是一种分步推理的Prompt技巧,特别适合复杂任务(比如设计多个角色、多个场景的系列作品)。
示例:
`你是一个概念设计师,正在为一部赛博朋克电影设计三个主要角色。请按以下步骤思考:
1. 首先,确定三个角色的身份:一个黑客、一个警察、一个流浪者。
2. 然后,为每个角色分配一个核心视觉元素:黑客用“全息纹身”,警察用“透明装甲”,流浪者用“废品改造装备”。
3. 接着,描述每个角色的服装细节、色彩倾向和光影效果。
4. 最后,将这些描述转化为Midjourney V6的Prompt,每个角色输出一个独立的Prompt。`
输出:AI会生成三个结构清晰、风格统一的Prompt,而且每个角色之间会有视觉关联(比如都使用“冷色调+霓虹光”),形成系列感。
关键点:思维链强迫AI“先思考再输出”,而不是直接生成随机结果。这对需要一致性的设计项目(如游戏角色设计、品牌视觉系统)尤其有用。
—
三、Prompt的“调试”与“迭代”:像程序员一样工作
很多设计师以为Prompt是一次性写好的,但实际工作中,Prompt是一个“调试-反馈-优化”的循环。就像写代码,你不可能一次就写出完美的函数。
3.1 建立“Prompt版本管理”习惯
我建议用Excel或Notion记录你的Prompt迭代过程,包括:
| 版本 | Prompt内容 | 参数设置 | 输出结果 | 问题分析 | 改进方向 |
|——|————|———-|———-|———-|———-|
| V1 | “A cyberpunk female warrior” | 默认参数 | 手指畸形,欧美脸 | 主体描述不够具体,缺少负面Prompt | 加入“Chinese face”“extra fingers” |
| V2 | “A Chinese female warrior…” | CFG 7 | 手指正常,但背景模糊 | 场景描述太笼统 | 加入“neon-lit Shanghai street”“rain” |
| V3 | “A Chinese female warrior in Shanghai street, rain…” | CFG 8 | 背景清晰,但脸太成熟 | 年龄描述缺失 | 加入“young, 18 years old” |
迭代原则:每次只改一个变量。比如这次只改“主体描述”,下次只改“CFG Scale”,这样你才能知道“哪个改动导致了效果变化”。
3.2 用“权重”和“混合”控制细节
在Midjourney V6中,你可以用`::`符号给关键词加权重:
`Chinese female warrior::2 cyberpunk::1.5 rain::1`
这表示“Chinese female warrior”的重要性是“rain”的两倍。AI会优先保证“中国女战士”特征,然后再考虑“雨”。
在Stable Diffusion中,权重用`(keyword:1.2)`或`(keyword:0.8)`表示,1.0是基准值。
实战技巧:
3.3 常见“翻车”场景与解决方案
| 问题 | 原因 | 解决方案 |
|——|——|———-|
| 手指畸形 | AI对“手”的理解有限 | 加入负面Prompt `extra fingers, bad hands`,或使用ControlNet的“OpenPose”手部模型 |
| 脸崩 | 面部特征描述不足 | 加入`detailed face, symmetrical face, clear eyes, defined nose` |
| 背景空洞 | 场景描述太抽象 | 用具体名词替代:不用`futuristic city`,用`neon-lit Tokyo street at night` |
| 风格不统一 | 混合了冲突的风格词 | 避免同时出现`anime style`和`photorealistic`,选择一种为主 |
—
总结与进阶建议
Prompt Engineering的本质,是一种精准的、结构化的沟通能力。它不是“魔法咒语”,而是一套可以学习、可以迭代的方法论。从“四要素法则”到“角色扮演Prompt”,再到“版本管理”,每一步都在帮你把模糊的创意转化为AI能理解的具体指令。
三个进阶建议���
1. 建立自己的Prompt库:每完成一个项目,就把高质量的Prompt整理成模板,标注参数和效果。下次遇到类似需求,直接复用。
2. 学习控制网络(ControlNet):在Stable Diffusion中,ControlNet可以让你用“姿势骨架”“深度图”“线稿”等条件控制生成结果。Prompt + ControlNet = 从“文字控制”到“视觉控制”的飞跃。
3. 关注AI模型的更新:Midjourney V6对自然语言的理解能力大幅提升,Stable Diffusion 3引入了“文本渲染”能力。工具在变,但Prompt工程的原则——具体、结构化、可迭代——不会变。
最后,记住一句话:好的Prompt不是“写”出来的,是“改”出来的。 接受AI的“不完美”,把它当作一个需要反复沟通的合作伙伴,而不是一个“一键出图”的工具。
—
常见问题 FAQ
Q1:Prompt越长越好吗?
A:不一定。太长会稀释核心指令,AI的注意力有限。建议控制在50-80个单词内,用具体名词替代抽象形容词。如果需要更多细节,可以用“分段式Prompt”(比如先写主体,再写背景,最后写光影)。
Q2:负面Prompt(Negative Prompt)到底该怎么写?
A:负面Prompt的作用是“排除不想要的元素”。常见的包括:`ugly, blurry, low quality, watermark, text, extra fingers, bad anatomy, deformed`。但不要写太多,5-8个词足够。注意:负面Prompt中的词可能被AI“反向强化”,所以不要写`no hands`(可能导致手消失),而是写`bad hands`。
Q3:Midjourney和Stable Diffusion的Prompt写法一样吗?
A:不完全一样。Midjourney V6更擅长理解自然语言,你可以写“A cat sitting on a beach at sunset, cinematic lighting”这种完整句子。Stable Diffusion则更依赖关键词权重,需要用`()`和`[]`控制优先级。建议两个工具都学,但先掌握一个。
Q4:为什么我复制别人的Prompt,却生成不出同样的效果?
A:三个原因:1)参数不同(Seed、CFG Scale、Steps等);2)模型不同(Midjourney版本、Stable Diffusion底模);3)随机性(AI每次生成都有微小变化)。解决方案:固定Seed值,使用相同的模型版本,并调整参数到一致。
Q5:Prompt Engineering需要学编程吗?
A:不需要。但了解一些基础概念(如权重、种子值、采样方法)会很有帮助。更关键的是“结构化思维”——把复杂问题拆解成“主体-场景-风格-细节”的能力。这种能力可以通过大量练习获得,与编程无关。

评论(0)