从设计小白到 AIGC 高手的成长路径
上周,一位学员在直播间问我:“老师,我用 Midjourney 生成的图总是像‘塑料片’,光影假、结构崩,调了三天 prompt 还是不行。是不是我天赋不够?”
我让他发来作品——一张“赛博朋克城市”图,霓虹灯管悬浮在空气中,建筑边缘糊成一团,阴影方向完全混乱。问题不在天赋,而在于他跳过了两个关键阶段:视觉基础和工具逻辑。
AIGC 设计不是“咒语学”。从「小白」到「高手」,本质是从「依赖随机性」转向「掌控确定性」的过程。下面我会拆解这条路径上的三个核心阶梯,并给出可复用的操作框架。
一、筑基期:用「视觉拆解」替代「关键词堆砌」
大多数新手犯的第一个错误:以为 prompt 越长,AI 越懂你。实际上,Midjourney 6.1 的语义解析器更倾向于识别名词+形容词的组合,而非复杂从句。
案例1:从“塑料感”到“电影级质感”
问题学员原 prompt:
a futuristic city with neon lights, cyberpunk style, high quality, detailed, 8k, cinematic lighting, realistic shadows, volumetric fog, night scene
结果:画面过曝,霓虹灯像贴图,阴影模糊。
诊断: 缺少光源位置描述和材质关键词。AI 默认使用“上帝视角”的均匀光,导致缺乏立体感。
优化后 prompt(Midjourney 6.1):
cyberpunk street corner at midnight, wet asphalt reflecting neon signs from above, single warm yellow streetlamp casting long shadows on brick wall, volumetric fog glowing around light sources, Canon EOS R5, 35mm lens, f/1.8, shallow depth of field --ar 16:9 --s 50 --v 6.1
关键改动:
- 加入 `wet asphalt reflecting`(明确表面材质)
结果对比: 第二张图的阴影方向一致,高光集中在灯柱周围,路面反射呈现真实的镜面扭曲。
实操步骤:用「焦点控制」修复结构崩坏
如果你生成的建筑或人物出现“手部扭曲”“柱子断裂”,不要改 prompt,用 –iw(图像权重)参数:
1. 在 Photoshop 或 Canva 中画一个极简草图(黑白线条即可),标注主体位置和大致比例。
2. 上传到 Midjourney 作为参考图,在 prompt 末尾加 `–iw 2`(权重值范围 0-3,越高对参考图越忠实)。
3. 同时使用 `–no deformed, distorted, extra limbs` 作为负面提示。
注意: `–iw` 在 Midjourney 6.1 中会影响构图和颜色,如果只想要结构参考,建议配合 `–s 0` 使用。
二、进阶期:从「单图生成」到「工作流搭建」
高手和普通用户的分水岭在于:是否用流程管理随机性。AIGC 设计不是一次生成就结束,而是多工具协同的迭代过程。
案例2:用 ComfyUI 实现「可控角色一致性」
很多学员问:“为什么我用 Stable Diffusion 生成的同一角色,换个场景就变脸?” 因为 SD 的 Checkpoint 模型本身不具备角色记忆能力,需要借助 ControlNet 和 IP-Adapter。
操作流程(ComfyUI 工作流):
1. 准备参考图: 用 Photoshop 抠出角色面部,裁剪为 512×512 像素,确保五官清晰无遮挡。
2. 加载模型: 使用 `realisticVision V5.1`(写实类)或 `DreamShaper 8`(艺术类),采样器选 `DPM++ 2M Karras`,步数 25。
3. 搭建 ControlNet 节点:
– 加载 `controlnet-ip2p` 模型(用于保持姿势)
– 加载 `controlnet-depth` 模型(用于保持空间结构)
– 两个 ControlNet 的权重分别设为 0.8 和 0.6,避免过度约束
4. 使用 IP-Adapter: 在节点中加载 `ip-adapter-faceid-plusv2`,将参考脸图输入,权重设为 0.5。
5. 生成测试: 输入 prompt `a fantasy elf warrior in forest, holding a bow, dynamic pose`,负面 prompt 用 `bad anatomy, ugly, extra fingers`。
关键参数:
验证方法: 生成 5 张不同场景的角色图,用面部识别工具(如 InsightFace)计算相似度,应保持在 85% 以上。
工具逻辑小结
| 阶段 | 核心工具 | 关键参数 | 常见错误 |
|——|———-|———-|———-|
| 新手 | Midjourney | `–s`, `–iw`, `–no` | 过度依赖长 prompt |
| 进阶 | ComfyUI + ControlNet | Denoising, CFG Scale | 忽略负面 prompt |
| 高手 | 自定义 LoRA 训练 | Learning Rate, Epoch | 数据集不平衡 |
三、高手期:用「数据思维」建立个人风格库
真正的 AIGC 高手,不是 prompt 写得长,而是知道什么时候该训练自己的模型。当你在商业项目中需要输出统一风格(如品牌插画、IP 形象),必须用 LoRA 微调。
如何训练一个“赛博朋克”风格 LoRA(Kohya’s GUI)
1. 准备数据集: 收集 50-100 张高质量赛博朋克插画(推荐 DeviantArt、ArtStation),每张图打标签时,统一添加 `cyberpunk style, by [your name]` 作为触发词。
2. 图像预处理: 用 `WD14 Tagger` 自动打标,再手动删除 `1girl`, `solo` 等无关标签,保留 `neon lights`, `rainy street`, `hologram` 等关键元素。
3. 训练参数:
– `resolution`:512×512
– `batch size`:2
– `epochs`:20
– `learning rate`:1e-4(用 `cosine` 调度器)
– `network dimension`:64(控制 LoRA 容量)
4. 测试: 用基础模型 `SDXL 1.0` 加载 LoRA,权重设为 0.7,prompt 写 `a samurai standing in cyberpunk street, cyberpunk style`,观察是否能保持霓虹灯管、湿路面的风格特征。
进阶技巧: 在数据集中混合 10% 的真实摄影图(如东京涉谷夜景),能提升 AI 对光影的泛化能力,避免生成过度“塑料感”的插画。
四、总结与进阶建议
从设计小白到 AIGC 高手,本质上是三个认知升级:
1. 从“写 prompt”到“控参数”:把 `–s`、`–iw`、`CFG Scale` 当成设计工具,而不是咒语。
2. 从“单图生成”到“流程搭建”:学会用 ComfyUI 的节点逻辑,把生成变成可复用的工程。
3. 从“用别人模型”到“训自己风格”:LoRA 是商业设计师的护城河,能让你从“会用 AI”变成“AI 用你”。
给不同阶段学员的建议
最后一句真话: AIGC 不会淘汰设计师,但会淘汰“只会写 prompt”的设计师。当你能用参数控制光影、用流程管理风格、用数据训练模型时,AI 就不再是竞争对手,而是你手中最锋利的画笔。
—
常见问题 FAQ
Q1:为什么���用 Midjourney 生成的图总是“过曝”?
A:最常见原因是 `–s` 值过高(默认 100)。建议先设为 `–s 50`,如果画面偏灰再逐步增加。同时检查 prompt 中是否包含 `bright`、`sunlight` 等强光源词,可替换为 `soft light` 或 `overcast`。
Q2:Stable Diffusion 和 ComfyUI 哪个更适合新手?
A:ComfyUI 的学习曲线更陡,但可控性远高于 SD WebUI。建议先花 2 小时看官方节点教程,理解“采样器-模型-潜空间”的关系,之后会发现 WebUI 的局限性。
Q3:训练 LoRA 需要什么硬件配置?
A:最低要求:NVIDIA RTX 3060(12GB 显存),可以训练 512×512 分辨率的 LoRA。如果训练 SDXL 模型,建议 24GB 显存以上。云服务推荐 RunPod 或 AutoDL,按小时租用 A100 显卡。
Q4:为什么我的 ControlNet 不起作用?
A:检查三点:① ControlNet 模型是否与基础模型匹配(SD 1.5 和 SDXL 的 ControlNet 不通用);② 权重是否太低(建议从 0.8 开始);③ 参考图尺寸是否与生成图一致(建议 512×512 或 1024×1024)。
Q5:商业项目中使用 AI 生成图,如何避免版权问题?
A:① 使用开源模型(如 Stable Diffusion)而非 Midjourney 的付费版;② 训练 LoRA 时,数据集只使用自己拍摄或购买的图;③ 生成后手动修改 30% 以上的画面元素(如替换背景、调整构图),符合“改编作品”的法律定义。

评论(0)