从设计小白到 AIGC 高手的成长路径
上周,一位叫小林的学员在课后私信我:“老师,我学了两个月 Midjourney,生成的图总是不对味——要么构图混乱,要么光影假得一眼就能看出来。我看别人用 AI 出图像魔法,我用 AI 出图像车祸现场。”
这不是个例。很多刚接触 AIGC 的设计学习者,都会卡在“工具会用但不出效果”的阶段。今天,我就用火星人教育讲师的身份,拆解从入门到精通的完整路径,并给出一套可复现的操作方法。
—
第一章:从“会咒语”到“会设计”——Prompt 的底层逻辑
1.1 为什么你的 Prompt 总翻车?
很多初学者以为 Prompt 就是堆砌形容词:“beautiful, high quality, realistic, 8K”。结果出来的图要么是过度饱和的“网红风”,要么是元素堆砌的“大杂烩”。
真正高效的 Prompt 结构应该像写设计简报,包含四个核心要素:
- 主体 (Subject):明确核心对象,如“a woman in her 30s”
实操案例 1:从“车祸”到“大片”
使用工具:Midjourney V6.1(版本号 6.1,2024年8月更新)
平台:Discord 官方服务器或 Midjourney 网页版
错误 Prompt
a girl with a cat in a garden, beautiful, realistic, 8K
输出结果:画面模糊,女孩和猫的比例失调,花园背景像贴图。
优化后的 Prompt
A young Japanese woman in her late 20s, wearing a white linen dress, holding a ginger cat, sitting on a wooden bench in a mossy Kyoto garden, soft morning sunlight filtering through maple leaves, shallow depth of field, background slightly blurred, shot on Hasselblad X1D with 80mm f/1.9 lens, cinematic lighting, pastel color palette, natural skin texture --ar 3:2 --s 250 --v 6.1
关键参数说明:
输出结果:人物皮肤有真实毛孔,猫的毛发根根分明,背景的苔藓和石阶有立体感。
>
1.2 进阶技巧:用“负面提示词”过滤垃圾
负面提示词不是简单写“no bad quality”,而是用具体问题描述。例如在 Midjourney 中,用 `–no` 参数:
--no deformed hands, extra fingers, blurry eyes, oversaturated colors, plastic texture, watermark
如果你在用 Stable Diffusion(推荐 SDXL 1.0 或 SD3 Medium 模型),负面提示词可以更精准:
Negative prompt: ugly, deformed, blurry, low quality, jpeg artifacts, bad anatomy, extra limbs, fused fingers, watermark, text, signature
—
第二章:从“生成”到“控制”——ComfyUI 工作流实战
2.1 为什么要抛弃“一键生成”思维?
很多学员在学会 Midjourney 后就止步了,但真正的 AIGC 高手会使用 ComfyUI——一个基于节点的图像生成工具。它的核心优势是可控性:你可以像搭建积木一样组合不同的模型、LoRA、ControlNet,实现精准构图。
实操案例 2:用 ControlNet 控制人物姿势
使用工具:ComfyUI v0.2.4(2024年10月版本)
依赖模型:SDXL 1.0 base + ControlNet v11.1(OpenPose 模型)
目标:让 AI 生成一张“穿着赛博朋克风外套的女性,右手举起一把发光剑”的��,且姿势必须与参考图一致。
操作步骤:
1. 下载并安装节点
在 ComfyUI Manager 中搜索“ControlNet Preprocessor”和“OpenPose”,安装后重启。
2. 构建工作流
– 添加 `Load Checkpoint` 节点,选择 `sd_xl_base_1.0.safetensors`
– 添加 `Load Image` 节点,上传一张人物站姿的参考图(建议是清晰全身照)
– 添加 `ControlNet Loader` 节点,选择 `control_v11p_sd15_openpose.pth`
– 连接 `Load Image` → `ControlNet Preprocessor`(类型选 OpenPose)→ `ControlNet Loader`
– 添加 `KSampler` 节点,设置参数:
– `steps`: 30(步数越高细节越多,但耗时增加)
– `cfg`: 7.5(推荐范围 7-12,数值越大越忠于提示词)
– `sampler_name`: `dpmpp_2m`(平衡速度与质量)
– `scheduler`: `karras`(适合写实风格)
– 在 `Positive Prompt` 中输入:`cyberpunk woman, wearing metallic jacket, holding a glowing sword, neon lights, rainy street reflection, photorealistic, intricate details`
– 在 `Negative Prompt` 中输入:`cartoon, low quality, blurry, deformed hands`
3. 运行并微调
点击 Queue Prompt,生成 4 张图。如果姿势偏差大,可以增加 ControlNet 的 `strength` 参数(默认 0.7,可调至 0.9)。
结果:生成的图完全保留了参考图的站姿,同时服装和武器细节符合赛博朋克主题。
>
2.2 进阶技巧:用 LoRA 统一角色风格
LoRA(Low-Rank Adaptation)是微调模型的轻量级方法。例如,你想让生成的角色始终是“棕色皮肤、短卷发、穿红色卫衣”的风格,可以训练一个专属 LoRA。
训练工具:kohya_ss(推荐 v24.1.4 版本)
参数建议:
训练完成后,在 ComfyUI 中加载 LoRA,权重设为 0.8,即可在任意场景中生成统一角色。
—
第三章:从“单图”到“系列”——用 AI 做品牌视觉系统
3.1 为什么品牌设计需要 AIGC?
品牌视觉系统要求“统一性”——同一套 VI 中,所有图形的色调、风格、元素必须一致。传统设计需要手动调整颜色和排版,而 AIGC 可以通过“种子锁定”和“风格参考”实现批量生成。
实操案例 3:为咖啡品牌生成 3 张不同场景的视觉海报
使用工具:Adobe Firefly v3(2024年11月更新)
特色功能:`Generative Fill` 和 `Style Settings`
操作步骤:
1. 设定种子(Seed)
在 Firefly 的文本输入框下方,找到“Seed”选项。用第一张图的种子值(例如 123456),后续所有图都用相同种子,保证风格一致。
2. 上传风格参考图
点击“Style” → “Upload Reference”,上传一张你喜欢的咖啡杯照片(建议是暖色调、极简风)。
3. 生成不同场景
– 第一张:`A ceramic coffee cup on a wooden table, morning sunlight, soft shadows, minimalist`
– 第二张:`Same coffee cup held by a hand, blurred urban background, golden hour light`
– 第三张:`Coffee cup on a marble counter, with coffee beans scattered, macro shot, shallow depth`
每次生成时,种子和风格参考图保持不变。
4. 统一调色
在 Photoshop 中打开三张图,使用“Camera Raw Filter”统一调整色温(+5)、对比度(+10)、纹理(+15)。这样三张图在视觉上就像出自同一套设计。
>
3.2 进阶技巧:用 AI 生成 3D 图标集
如果你需要一套 3D 风格的应用图标,可以尝试“多视图生成法”:
—
总结与进阶建议
从“小白”到“高手”,本质是从“依赖工具”到“驾驭工具”的转变。我建议你按以下路径持续精进:
1. 第1-2周:每天用 Midjourney 生成 20 张图,重点练习 Prompt 结构(主体+环境+风格+参数)
2. 第3-4周:搭建 ComfyUI 工作流,至少跑通 ControlNet 和 LoRA 两个节点
3. 第5-6周:选择一个垂直领域(如产品摄影、角色设计、UI 图标),用 AI 生成 10 张风格统一的作品
4. 持续学习:关注 Stability AI 官网(stability.ai)和 Midjourney 官方更新日志,新版本往往带来质变
记住:AIGC 不是魔法,是设计工具的进化。当你能用参数控制每一处细节时,你就是真正的高手。
—
常见问题 FAQ
Q1:我的显卡只有 8GB 显存,能跑 ComfyUI 吗?
A:可以。推荐使用 SDXL 的“Tiny”版本(如 `sd_xl_tiny_1.0`),或使用云端服务如 RunPod、AutoDL。本地运行时,将 `batch_size` 设为 1,`–medvram` 参数可节省显存。
Q2:为什么我生成的图总是有六根手指?
A:这是 AI 模型的常见错误。解决方法:1)在负面提示词中加 `extra fingers`;2)使用 ControlNet 的 `DWpose` 模型(比 OpenPose 更精确);3)生成后手动修复(Photoshop 的 AI 填充最方便)。
Q3:Midjourney V6.1 和 V6.0 有什么区别?
A:V6.1 主要提升了光影真实度和材质细节,对人物皮肤、金属、玻璃等材质的处理更自然。建议所有新项目都使用 `–v 6.1`。
Q4:训练 LoRA 需要多少张图片?
A:最少 10 张,建议 20-30 张。图片要保证主体清晰、背景简单、角度多样(正脸、侧脸、半身、全身)。如果图片太少,LoRA 容易过拟合,生成的角色会“僵化”。
Q5:商用 AIGC 作品需要注意什么?
A:1)检查工具的服务条款(Midjourney 允许商用,但需付费订阅;Stable Diffusion 开源可商用);2)避免使用受版权保护的艺术家名字(如“in the style of Hayao Miyazaki”可能侵权);3)生成后手动修改至少 30% 的细节,降低风险。

评论(0)