用 AI 做插画:商业插画师的效率倍增器

上个月,一位从业5年的商业插画师学员向我求助。他接了一个儿童绘本项目,需要绘制24张风格统一的场景插画,客户要求两周内交付。按照传统手绘+PS上色的流程,他每天最多完成1.5张,还要反复修改配色和构图。他问我:“有没有办法用AI把前期草稿和配色试错的时间压缩掉,让我专注在细节刻画上?”

我直接给他部署了一套工作流:用 Midjourney 生成构图参考和配色方案,再用 Stable Diffusion 的 ControlNet 功能锁定人物造型,最后在 Procreate 中完成精修。结果他第3天就交付了全部线稿,第10天完成终稿,比预期提前了4天。

这不是个例。从2023年开始,AI插画工具已经从“生成一张好看的图”进化到“精准控制画面元素”的阶段。今天这篇文章,我会拆解两个最实用的商业插画工作流,涵盖构图生成、风格迁移、局部修改三个核心环节。工具版本以 Midjourney V6.1、Stable Diffusion WebUI 1.9.3、ComfyUI 最新版为准。

一、从“随机生成”到“可控输出”:AI插画的核心痛点与解法

很多插画师尝试AI后的第一反应是:“生成的东西确实漂亮,但不是我想要的。” 比如你画了一个穿红裙子的女孩站在森林里,AI却给你生成了一头戴帽子的鹿。这是因为大部分AI图像生成模型基于扩散原理,对文本的语义理解存在偏差。

解决方案:引入“构图控制层”

在 Stable Diffusion WebUI 中,ControlNet 插件(v1.1.456)提供了多种控制模式。商业插画最常用的是 Canny Edge(边缘检测)和 OpenPose(姿态骨架)。

操作步骤:
1. 安装 ControlNet 扩展(在 Extension 标签页搜索“sd-webui-controlnet”,安装后重启)
2. 准备一张你手绘的线稿或火柴人草图(JPEG/PNG,分辨率建议 512×512 以上)
3. 在 ControlNet 面板上传图片,勾选“Enable”,选择 Preprocessor(预处理)为“Canny”或“OpenPose”
4. 设置 Control Weight(控制权重)为 0.8-1.0,数值越高,AI越严格遵循你的构图
5. Prompt 输入:`masterpiece, best quality, (red dress:1.2), girl, forest, sunlight, detailed illustration`(权重用括号加数字控制)
6. Negative Prompt 输入:`worst quality, lowres, bad anatomy, extra limbs, blurry`
7. 采样步数设为 25-30,CFG Scale 设为 7-9

Canny边缘控制生成插画示例

通过这种方式,AI 会严格保持你手绘线稿的轮廓,同时填充���质、光影和细节。这个工作流适合需要保持角色造型一致性的系列插画。

二、商业插画实操案例:绘本场景批量生成

案例背景

需求:为儿童绘本《小狐狸的四季》生成4张不同季节的场景图,主角是一只橙色狐狸,要求每个场景的构图不同,但狐狸形象一致。

第一步:用 Midjourney 生成构图参考

Midjourney V6.1 在构图多样性上优于 Stable Diffusion。使用`/imagine`命令,输入:

A cute orange fox in a spring meadow, surrounded by flowers, soft sunlight, children's book illustration style, flat vector style, pastel colors --ar 3:2 --v 6.1 --s 250

参数说明:

  • `–ar 3:2`:设定宽高比,适合绘本横版构图
  • `–v 6.1`:指定模型版本
  • `–s 250`:风格化程度,数值越高艺术感越强,商业插画建议 100-300
  • 运行后得到4张图。选择一张构图最满意的,右键保存。重复此步骤生成夏季、秋季、冬季的构图参考。

    第二步:用 Stable Diffusion 锁定角色造型

    角色一致性是绘本项目的最大痛点。这里使用 InstantIDIP-Adapter 插件(ComfyUI 中更稳定)。

    在 ComfyUI 中搭建工作流:
    1. 加载 Checkpoint(推荐 `dreamshaper_8.safetensors`,对儿童插画风格友好)
    2. 加载你选中的狐狸角色参考图(最好是正面、侧面、背面三视图)
    3. 使用 IP-Adapter 节点(模型文件 `ip-adapter_sd15.bin`),将参考图作为“风格+内容”输入
    4. Prompt 填入场景描述:`summer lake, fox sitting on a rock, dragonfly, warm sunlight, storybook style`
    5. 设置 ControlNet Tile 节点(权重 0.6),防止AI过度修改角色细节

    ComfyUI工作流节点示意图

    关键参数:

  • IP-Adapter weight:0.7-0.9(太高会复制构图,太低会丢失角色特征)
  • Denoising strength:0.6-0.8(数值越低,越接近原图;数值越高,AI发挥空间越大)
  • 第三步:局部修改与精修

    AI生成的画面总会有瑕疵,比如狐狸的耳朵数量不对、草丛穿模等。使用 Photoshop Beta 版(25.0+)的“生成式填充”功能修复。

    操作步骤:
    1. 在 PS 中打开 AI 生成的图片
    2. 用套索工具选中狐狸的耳朵区域
    3. 点击“生成式填充”,输入 `fox ear, orange fur`
    4. PS 会自动生成3个修复方案,选择最自然的一个
    5. 重复此过程修复其他瑕疵

    三、风格迁移与材质表现:从概念到成品

    商业插画经常需要“模仿某位画师的风格”或“将照片转为插画”。AI 在风格迁移上的表现已经非常成熟,但需要避免“一眼AI”的廉价感。

    使用 LoRA 模型精准控制风格

    LoRA(Low-Rank Adaptation)是一种轻量级微调模型,文件大小通常 50-200MB。你可以训练自己的 LoRA 来固定特定角色或风格。

    训练步骤(以 Kohya_ss GUI v23.1.7 为例):
    1. 准备 15-30 张目标风格的图片(建议 512×512 或 768×768)
    2. 使用 BLIP 自动打标(Caption),然后手动修正关键词
    3. 设置训练参数:`learning_rate=1e-4`,`batch_size=4`,`epochs=20`
    4. 训练完成后得到 `.safetensors` 文件,放入 Stable Diffusion 的 `models/Lora` 文件夹
    5. 使用时在 Prompt 中调用:``(0.8为权重)

    对于不想训练的用户,推荐直接使用社区现成的 LoRA:Civitai 平台上搜索“children book illustration style”或“watercolor style”,下载量超过 10 万的模型通常质量可靠。

    材质表现:水彩 vs 油画 vs 蜡笔

    不同材质需要不同的采样器搭配。实验证明:

  • 水彩效果:DPM++ 2M Karras + 25步 + CFG 7
  • 油画效果:DDIM + 40步 + CFG 10(增加纹理感)
  • 蜡笔效果:Euler a + 20步 + CFG 5(保留粗糙笔触)
  • 在 Prompt 中加入材质词:`watercolor texture, paper grain, visible brush strokes, thick paint` 或 `colored pencil texture, rough paper, sketchy lines`。

    不同材质效果对比

    总结与进阶建议

    AI 插画工具不是替代插画师,而是将你从重复劳动中解放出来。当前阶段,最实用的能力排序是:
    1. 构图生成(Midjourney/Stable Diffusion 快速出草图)
    2. 角色一致性(IP-Adapter/InstantID 固定形象)
    3. 局部修复(Photoshop 生成式填充)
    4. 风格迁移(LoRA 微调)

    进阶建议:

  • 学习 ComfyUI 的节点式工作流,它比 WebUI 更适合复杂项目的批量处理
  • 建立自己的 Prompt 库,按“场景-角色-风格-材质”分类整理
  • 每周花 2 小时在 Civitai 浏览新发布的 LoRA 模型,保持对行业趋势的敏感度
  • 不要完全依赖 AI 生成的细节,手绘的“不完美”才是商业插画的灵魂
  • 常见问题 FAQ

    Q1:AI生成的图片分辨率太低,放大后模糊怎么办?
    A:使用 Upscaler 插件。Stable Diffusion WebUI 中自带“Extra”功能,选择 `R-ESRGAN 4x+` 模型,放大倍数设为 2-4 倍。对于超高清需求,可以配合 ComfyUI 的 `Ultimate SD Upscale` 节点,分块放大后再拼接。

    Q2:生成的狐狸角色,换了场景后造型变了,如何保持完全一致?
    A:除了使用 IP-Adapter,更稳妥的方法是先生成角色的“三视图”(正面、侧面、背面),然后使用 ControlNet 的 `Reference Only` 模式(权重 1.0),再配合 `Canny` 控制构图。如果还不行,建议训练一个专属 LoRA 模型。

    Q3:商业使用时,AI生成的图片版权归谁?
    A:Midjourney 付费用户拥有商业使用权;Stable Diffusion 开源模型的输出图片在美国法律下通常视为“公共领域”,但建议避免直接复制他人 LoRA 模型生成的风格。最安全的做法:用 AI 生成构图和参考,然后手绘重绘 70% 以上的细节。

    Q4:电脑配置不够,跑不动 Stable Diffusion 怎么办?
    A:使用云端服务。推荐 `RunDiffusion`(按小时计费,RTX 4090 约 $0.5/小时)或 `Google Colab Pro`(每月 $10,有 GPU 配额)。本地最低要求:8GB VRAM(NVIDIA 显卡),16GB 内存,Windows/Linux 系统。

    Q5:生成的图片总是出现六根手指或畸形,如何避免?
    A:在 Negative Prompt 中加入 `bad anatomy, extra fingers, missing fingers, mutated hands, disfigured`。如果问题依旧,使用 ControlNet `Depth` 模式锁定手部结构,或者生成后手动在 PS 中修复。目前 AI 对手部的处理仍是薄弱环节,建议手部区域用 Procreate 手绘。

    声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。