从设计小白到 AIGC 高手的成长路径

上周五深夜,学员小林在群里发了一张海报——配色混乱、字体扎堆、构图失衡。她说:“老师,我用 Midjourney 生成了 50 张图,但没一张能直接用。AI 工具我学了一周,但设计出来的东西还是像拼凑的垃圾。”这不是小林一个人的困境。我在火星人教育带过三期 AIGC 设计班,发现 90% 的小白都卡在同一个点上:以为学会提示词就是学会设计

实际上,从“会用 AI 生成图”到“能靠 AI 做商业设计”,中间隔着三层能力:审美判断力、工具联动能力、以及设计思维的 AI 化重构。今天这篇文章,我会用两个完整的实战案例,手把手带你拆解这套成长路径。

一、第一层蜕变:从“写提示词”到“控制生成”

很多新手以为 Midjourney 是“输入文字出图”的傻瓜工具,结果生成的东西要么过于抽象,要么细节崩坏。真正的高手,会把 AI 当成一支可调参数的画笔。

案例 1:商业品牌海报设计(Midjourney + Photoshop Beta)

场景:为一个新式茶饮品牌设计“夏日限定”海报,要求清新、年轻、有食欲感。

新手做法

a cup of summer fruit tea, fresh, vibrant, photorealistic, 8k

结果:生成 4 张图,杯子形状奇怪,水果像塑料,背景过曝。

高手做法(四步控制法)

第一步:结构预写(Structured Prompt)
在 Midjourney V6(版本号 6.0,2024 年 4 月更新)中,使用“主体+环境+光线+构图+风格”的公式:

Subject: A transparent glass cup filled with layered summer fruit tea (mango, passion fruit, blueberry), condensation on glass
Environment: wooden table with natural sunlight, soft shadows, tropical leaves background
Lighting: golden hour, warm backlight, rim light on glass edges
Composition: close-up, 45-degree angle, shallow depth of field
Style: commercial product photography, shot on Canon EOS R5, 85mm f/1.4, clean minimal, 8k

参数设置:`–ar 3:4 –v 6.0 –s 250 –stylize 250`(风格化值 250 保证真实感,不破坏细节)。

第二步:种子锁定(Seed Consistency)
生成后选一张构图最好的,点击右上角“Add Reaction”选择信封图标,获取种子号(如 `–seed 123456`)。后续所有变体都带上这个种子号,保证主体一致。

第三步:局部重绘(Inpainting with Photoshop Beta)
下载图片后导入 Photoshop Beta(版本号 25.5,需安装“Generative Fill”插件)。选中杯子边缘模糊的冰块区域,输入���示词:

clear ice cubes with light refraction, realistic texture

AI 会自动补全细节。这一步可以修复 Midjourney 常见的“边缘模糊”和“物体粘连”问题。

第四步:色彩校准(Color Grading)
使用 Photoshop 的“Camera Raw Filter”(滤镜 > Camera Raw 滤镜),调整:

  • 色温:+5(让茶汤更暖)
  • 自然饱和度:+15(让水果更鲜艳)
  • 清晰度:+10(增强玻璃质感)
  • 曲线:提亮阴影,增加 S 型对比
  • 结果对比:经过这四步,生成了可以直接用于电商主图的海报,分辨率 4096×3072,细节经得起放大。

    商业海报生成过程对比图

    二、第二层蜕变:从“单打独斗”到“工具链协作”

    AIGC 设计不是靠一个工具完成所有事。高手会搭建自己的工具链,让每个工具做最擅长的事。

    案例 2:UI 界面图标设计(Stable Diffusion + Figma + Vectorizer)

    场景:为一个 SaaS 产品设计一套 32×32 的线性图标,要求风格统一、可缩放。

    新手做法:在 Midjourney 里生成“flat icon set”,然后手动一个个抠图。结果:图标风格不一致,放大后边缘有锯齿。

    高手做法(三步流水线)

    第一步:ControlNet 精准控制(Stable Diffusion WebUI)
    使用 Stable Diffusion WebUI(版本号 1.8.0)搭配 ControlNet(版本号 1.1.4),加载一个“Canny Edge”预处理器。

  • 在 Figma 里画一个简单的线框图(只有轮廓,无填充)
  • 导出为 PNG,拖入 ControlNet 的“Canny”模块
  • 设置参数:`Preprocessor: Canny, Model: control_v11p_sd15_canny, Weight: 0.8`
  • 输入提示词:
  • minimalist line icon, thin stroke, consistent thickness, flat design, white background, vector style, no shading
    
  • 负面提示词:`realistic, 3d, gradient, thick stroke, complex`
  • 参数设置:`Steps: 30, Sampler: DPM++ 2M Karras, CFG Scale: 7`
  • 这样生成的每个图标都严格遵循你的线框图结构,不会出现“多出一根线条”或“形状变形”的问题。

    第二步:批量生成与过滤(Batch Processing)
    使用 Stable Diffusion 的“Script > XY Plot”功能,批量生成 100 个变体。然后通过“Image Browser”插件(版本号 3.2)按“风格一致性”排序,选出前 20 个。

    第三步:矢量化(Vectorizer.ai + Figma)
    将选中的 PNG 导入 Vectorizer.ai(在线工具,支持批量上传),设置:

  • Output Format: SVG
  • Detail Level: High (保留细节但不过度)
  • Smoothing: Medium (消除锯齿)
  • Color Mode: Monochrome
  • 导出 SVG 后在 Figma 中打开,使用“Union”功能合并重叠路径,再用“Flatten”功能简化节点。最后用 Figma 的“Styles”功能统一设置描边粗细(2px)和圆角(4px)。

    结果:一套 20 个风格完全一致的线性图标,SVG 文件大小平均 2KB,支持任意缩放。

    图标设计工具链流程图

    三、第三层蜕变:从“模仿”到“创造风格”

    当你能熟练控制生成结果后,下一步是建立自己的设计风格。这需要你理解 AI 的“审美偏好”并反向利用它。

    风格迁移实战:打造专属视觉语言

    步骤 1:训练 LoRA 模型(Dreambooth)
    使用 Kohya_ss GUI(版本号 22.4.1)训练一个针对“赛博朋克+水墨风”的 LoRA。

  • 数据集:30 张参考图(15 张赛博朋克场景 + 15 张水墨山水画)
  • 预处理:统一分辨率 512×512,添加标签(如 `cyberpunk, ink wash, neon`)
  • 训练参数:`epochs: 50, batch size: 2, learning rate: 1e-4, network rank: 64`
  • 输出:一个 10MB 的 .safetensors 文件
  • 步骤 2:混合使用(Prompt Blending)
    在生成时,同时加载 LoRA 和基础模型:

    masterpiece, best quality, (cyberpunk ink wash:1.2), a neon dragon flying over traditional pagoda, glowing ink splashes, 
    

    参数 `0.8` 表示 LoRA 权重,太高会破坏构图,太低则风格不明显。

    步骤 3:风格一致性测试(Style Consistency Check)
    生成 10 张不同主题的图(人物、建筑、动物),用 CLIP Interrogator(在线工具)计算风格相似度。如果风格相似度低于 70%,调整 LoRA 权重或重新训练。

    进阶技巧:在 Photoshop 中创建一个“风格预设文件”(.psd 格式),包含你常用的色板(Color Palette)、渐变(Gradients)、纹理叠加(Texture Overlay)。每次生成后直接套用,可以快速统一视觉语言。

    风格迁移效果对比图

    总结与进阶建议

    从设计小白到 AIGC 高手,本质上是完成三次认知升级:
    1. 从“工具使用者”到“参数控制者”:学会用结构化提示词、种子锁定、局部重绘来控制生成结果。
    2. 从“单工具依赖”到“工具链思维”:掌握 Midjourney/Stable Diffusion + Photoshop/Figma + 矢量化工具的协作流程。
    3. 从“模仿者”到“风格创造者”:通过 LoRA 训练和风格预设,建立属于自己的视觉语言。

    给火星人学员的进阶建议

  • 每周做一次“控制力测试”:用同一个提示词,调整参数(如 CFG Scale 从 5 到 15),观察结果变化并记录。
  • 搭建个人素材库:在 Notion 或 Eagle 中分类存储“生成参数截图 + 提示词 + 后处理步骤”,方便复现。
  • 关注工具更新:Midjourney V6 的“Style Reference”功能(2024 年 6 月上线)和 Stable Diffusion 3.0(2024 年 7 月发布)都大幅提升了文本理解能力,建议第一时间测试。
  • AIGC 设计的核心不是“AI 替你画”,而是“你用 AI 画出自己画不了的东西”。当你不再纠结于“这张图是不是 AI 生成的”,而是思考“这张图是否传达了我想要的情绪和功能”,你就已经真正出师了。

    常见问题 FAQ

    Q1:我该先学 Midjourney 还是 Stable Diffusion?
    A:建议先学 Midjourney V6(上手快,审美下限高),掌握控制生成后再学 Stable Diffusion(可控性强,适合批量生产和精细调整)。两者不是替代关系,是互补关系。

    Q2:生成的图总是有手指畸形、文字乱码怎么办?
    A:手指畸形用 Photoshop Beta 的“Generative Fill”局部重绘修复;文字乱码目前最好用 AI 生成背景,文字后期在 Figma/PS 里手动添加。Midjourney V6 的文字识别能力提升了 40%,但仍不建议直接生成含文字的图。

    Q3:训练 LoRA 需要多少张图?硬件要求高吗?
    A:最少 15 张高质量参考图,30 张最佳。硬件建议:显存 8GB 以上(训练 512×512 分辨率),推荐 RTX 3060 或更高。可以用 Google Colab 免费版(T4 显卡)临时训练。

    Q4:AI 设计作品能商用吗?版权怎么处理?
    A:Midjourney 付费版(Pro 计划 $60/月)生成的图可以商用;Stable Diffusion 开源模型生成的图版权归用户所有。但注意:如果使用了他人风格作为参考(如 LoRA 训练),建议修改 30% 以上元素避免侵权。

    Q5:怎么判断自己的设计水平是否达到“商业级别”?
    A:三个标准:① 图片分辨率≥2048px,放大后无明显噪点或模糊;② 元素之间没有“AI 常见错误”(如多出的手指、不对称的眼睛);③ 风格一致性高,同一套图放在一起像出自同一人之手。建议用“像素级对比”工具(如 Photoshop 的“差值”图层模式)检查细节。

    声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。