从设计小白到 AIGC 高手的成长路径

上周,一位叫小林的学员在课后私信我:“老师,我学了两个月 Midjourney,生成的图总是不对味——要么构图混乱,要么光影假得一眼就能看出来。我看别人用 AI 出图像魔法,我用 AI 出图像车祸现场。”

这不是个例。很多刚接触 AIGC 的设计学习者,都会卡在“工具会用但不出效果”的阶段。今天,我就用火星人教育讲师的身份,拆解从入门到精通的完整路径,并给出一套可复现的操作方法。

第一章:从“会咒语”到“会设计”——Prompt 的底层逻辑

1.1 为什么你的 Prompt 总翻车?

很多初学者以为 Prompt 就是堆砌形容词:“beautiful, high quality, realistic, 8K”。结果出来的图要么是过度饱和的“网红风”,要么是元素堆砌的“大杂烩”。

真正高效的 Prompt 结构应该像写设计简报,包含四个核心要素:

  • 主体 (Subject):明确核心对象,如“a woman in her 30s”
  • 环境 (Environment):场景、光线、天气,如“in a dimly lit library, warm candlelight”
  • 风格 (Style):具体艺术家、流派或技术,如“photorealistic, shot on Fujifilm Pro 400H”
  • 参数 (Parameters):宽高比、风格化程度、负面提示词
  • 实操案例 1:从“车祸”到“大片”

    使用工具:Midjourney V6.1(版本号 6.1,2024年8月更新)
    平台:Discord 官方服务器或 Midjourney 网页版

    错误 Prompt

    a girl with a cat in a garden, beautiful, realistic, 8K
    

    输出结果:画面模糊,女孩和猫的比例失调,花园背景像贴图。

    优化后的 Prompt

    A young Japanese woman in her late 20s, wearing a white linen dress, holding a ginger cat, sitting on a wooden bench in a mossy Kyoto garden, soft morning sunlight filtering through maple leaves, shallow depth of field, background slightly blurred, shot on Hasselblad X1D with 80mm f/1.9 lens, cinematic lighting, pastel color palette, natural skin texture --ar 3:2 --s 250 --v 6.1
    

    关键参数说明

  • `–ar 3:2`:经典摄影画幅比例
  • `–s 250`:风格化程度(0-1000),250 是平衡创意与保真度的推荐值
  • `–v 6.1`:强制使用 V6.1 模型(该版本对光影和材质细节有大幅提升)
  • 输出结果:人物皮肤有真实毛孔,猫的毛发根根分明,背景的苔藓和石阶有立体感。

    > Prompt优化对比

    1.2 进阶技巧:用“负面提示词”过滤垃圾

    负面提示词不是简单写“no bad quality”,而是用具体问题描述。例如在 Midjourney 中,用 `–no` 参数:

    --no deformed hands, extra fingers, blurry eyes, oversaturated colors, plastic texture, watermark
    

    如果你在用 Stable Diffusion(推荐 SDXL 1.0 或 SD3 Medium 模型),负面提示词可以更精准:

    Negative prompt: ugly, deformed, blurry, low quality, jpeg artifacts, bad anatomy, extra limbs, fused fingers, watermark, text, signature
    

    第二章:从“生成”到“控制”——ComfyUI 工作流实战

    2.1 为什么要抛弃“一键生成”思维?

    很多学员在学会 Midjourney 后就止步了,但真正的 AIGC 高手会使用 ComfyUI——一个基于节点的图像生成工具。它的核心优势是可控性:你可以像搭建积木一样组合不同的模型、LoRA、ControlNet,实现精准构图。

    实操案例 2:用 ControlNet 控制人物姿势

    使用工具:ComfyUI v0.2.4(2024年10月版本)
    依赖模型:SDXL 1.0 base + ControlNet v11.1(OpenPose 模型)

    目标:让 AI 生成一张“穿着赛博朋克风外套的女性,右手举起一把发光剑”的��,且姿势必须与参考图一致。

    操作步骤

    1. 下载并安装节点
    在 ComfyUI Manager 中搜索“ControlNet Preprocessor”和“OpenPose”,安装后重启。

    2. 构建工作流
    – 添加 `Load Checkpoint` 节点,选择 `sd_xl_base_1.0.safetensors`
    – 添加 `Load Image` 节点,上传一张人物站姿的参考图(建议是清晰全身照)
    – 添加 `ControlNet Loader` 节点,选择 `control_v11p_sd15_openpose.pth`
    – 连接 `Load Image` → `ControlNet Preprocessor`(类型选 OpenPose)→ `ControlNet Loader`
    – 添加 `KSampler` 节点,设置参数:
    – `steps`: 30(步数越高细节越多,但耗时增加)
    – `cfg`: 7.5(推荐范围 7-12,数值越大越忠于提示词)
    – `sampler_name`: `dpmpp_2m`(平衡速度与质量)
    – `scheduler`: `karras`(适合写实风格)
    – 在 `Positive Prompt` 中输入:`cyberpunk woman, wearing metallic jacket, holding a glowing sword, neon lights, rainy street reflection, photorealistic, intricate details`
    – 在 `Negative Prompt` 中输入:`cartoon, low quality, blurry, deformed hands`

    3. 运行并微调
    点击 Queue Prompt,生成 4 张图。如果姿势偏差大,可以增加 ControlNet 的 `strength` 参数(默认 0.7,可调至 0.9)。

    结果:生成的图完全保留了参考图的站姿,同时服装和武器细节符合赛博朋克主题。

    > ComfyUI工作流示意图

    2.2 进阶技巧:用 LoRA 统一角色风格

    LoRA(Low-Rank Adaptation)是微调模型的轻量级方法。例如,你想让生成的角色始终是“棕色皮肤、短卷发、穿红色卫衣”的风格,可以训练一个专属 LoRA。

    训练工具:kohya_ss(推荐 v24.1.4 版本)
    参数建议

  • `resolution`: 512×512(基础分辨率,显存低于 8G 用 512)
  • `batch_size`: 2(显存 12G 以上可调至 4)
  • `epochs`: 20(过拟合风险低,适合新手)
  • `learning_rate`: 1e-4(使用 AdamW 优化器)
  • 训练完成后,在 ComfyUI 中加载 LoRA,权重设为 0.8,即可在任意场景中生成统一角色。

    第三章:从“单图”到“系列”——用 AI 做品牌视觉系统

    3.1 为什么品牌设计需要 AIGC?

    品牌视觉系统要求“统一性”——同一套 VI 中,所有图形的色调、风格、元素必须一致。传统设计需要手动调整颜色和排版,而 AIGC 可以通过“种子锁定”和“风格参考”实现批量生成。

    实操案例 3:为咖啡品牌生成 3 张不同场景的视觉海报

    使用工具:Adobe Firefly v3(2024年11月更新)
    特色功能:`Generative Fill` 和 `Style Settings`

    操作步骤

    1. 设定种子(Seed)
    在 Firefly 的文本输入框下方,找到“Seed”选项。用第一张图的种子值(例如 123456),后续所有图都用相同种子,保证风格一致。

    2. 上传风格参考图
    点击“Style” → “Upload Reference”,上传一张你喜欢的咖啡杯照片(建议是暖色调、极简风)。

    3. 生成不同场景
    – 第一张:`A ceramic coffee cup on a wooden table, morning sunlight, soft shadows, minimalist`
    – 第二张:`Same coffee cup held by a hand, blurred urban background, golden hour light`
    – 第三张:`Coffee cup on a marble counter, with coffee beans scattered, macro shot, shallow depth`

    每次生成时,种子和风格参考图保持不变。

    4. 统一调色
    在 Photoshop 中打开三张图,使用“Camera Raw Filter”统一调整色温(+5)、对比度(+10)、纹理(+15)。这样三张图在视觉上就像出自同一套设计。

    > 品牌视觉海报系列

    3.2 进阶技巧:用 AI 生成 3D 图标集

    如果你需要一套 3D 风格的应用图标,可以尝试“多视图生成法”:

  • 在 DALL-E 3(OpenAI 2024年9月版本���中输入:`3D icon of a camera, isometric view, glossy plastic texture, soft pink and white color scheme, white background, no shadows`
  • 生成后,用 Photoshop 的“AI 填充”功能扩展出不同角度(如俯视、侧视),再统一导成 SVG 矢量格式。
  • 总结与进阶建议

    从“小白”到“高手”,本质是从“依赖工具”到“驾驭工具”的转变。我建议你按以下路径持续精进:

    1. 第1-2周:每天用 Midjourney 生成 20 张图,重点练习 Prompt 结构(主体+环境+风格+参数)
    2. 第3-4周:搭建 ComfyUI 工作流,至少跑通 ControlNet 和 LoRA 两个节点
    3. 第5-6周:选择一个垂直领域(如产品摄影、角色设计、UI 图标),用 AI 生成 10 张风格统一的作品
    4. 持续学习:关注 Stability AI 官网(stability.ai)和 Midjourney 官方更新日志,新版本往往带来质变

    记住:AIGC 不是魔法,是设计工具的进化。当你能用参数控制每一处细节时,你就是真正的高手。

    常见问题 FAQ

    Q1:我的显卡只有 8GB 显存,能跑 ComfyUI 吗?
    A:可以。推荐使用 SDXL 的“Tiny”版本(如 `sd_xl_tiny_1.0`),或使用云端服务如 RunPod、AutoDL。本地运行时,将 `batch_size` 设为 1,`–medvram` 参数可节省显存。

    Q2:为什么我生成的图总是有六根手指?
    A:这是 AI 模型的常见错误。解决方法:1)在负面提示词中加 `extra fingers`;2)使用 ControlNet 的 `DWpose` 模型(比 OpenPose 更精确);3)生成后手动修复(Photoshop 的 AI 填充最方便)。

    Q3:Midjourney V6.1 和 V6.0 有什么区别?
    A:V6.1 主要提升了光影真实度和材质细节,对人物皮肤、金属、玻璃等材质的处理更自然。建议所有新项目都使用 `–v 6.1`。

    Q4:训练 LoRA 需要多少张图片?
    A:最少 10 张,建议 20-30 张。图片要保证主体清晰、背景简单、角度多样(正脸、侧脸、半身、全身)。如果图片太少,LoRA 容易过拟合,生成的角色会“僵化”。

    Q5:商用 AIGC 作品需要注意什么?
    A:1)检查工具的服务条款(Midjourney 允许商用,但需付费订阅;Stable Diffusion 开源可商用);2)避免使用受版权保护的艺术家名字(如“in the style of Hayao Miyazaki”可能侵权);3)生成后手动修改至少 30% 的细节,降低风险。

    声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。