用 AI 做插画:商业插画师的效率倍增器
从“画不出来”到“画不完”:一个真实的效率跃迁
上周,一位从业5年的商业插画师学员小陈找到我,满脸焦虑。他接了个儿童绘本项目,需要30张风格统一的场景插画,甲方只给10天时间。按他以往的手绘速度,一天一张都算快的。更棘手的是,甲方中途还要求修改角色设定——从拟人小兔子改成小狐狸。这意味着前期的线稿和色彩方案几乎全部作废。
“老师,AI真能帮我赶工吗?我试过用Midjourney生成一些图,但风格太飘忽,细节也控制不住,根本没法直接商用。”这是大多数插画师初遇AI时的共同困惑——工具似乎很强大,但离“为我所用”总差那么一步。
我给他的方案很简单:用AI完成70%的“脏活累活”,把精力集中在20%的创意决策和10%的精细打磨上。 结果呢?他不仅提前两天交稿,还在项目中尝试了三种不同风格变体,甲方选了最惊艳的一款,额外加了20%的预算。
这个案例揭示了一个核心事实:AI不是来取代插画师的,而是来放大插画师价值的。关键在于,你得知道哪些环节可以“放手”,哪些环节必须“紧握”。今天,我们就从两个实战场景出发,拆解这套“人机协作”的工作流。
—
核心章节一:用 Midjourney 构建“无限素材库”——风格统一与角色控制的实战
很多插画师抱怨AI生成的图“不能用”,根本原因在于缺乏对生成过程的主动控制。商业插画最忌讳风格不一致、角色长相随机。要解决这个问题,必须掌握两个核心技巧:风格参考图(Style Reference) 和 种子值(Seed)锁定。
操作步骤:从一张草图到一套风格统一的角色
工具: Midjourney V6.1(截至2025年6月最新版本)
核心参数: `–sref` (风格参考), `–seed` (种子值), `–cw` (角色权重)
第一步:生成你的“风格锚点”
假设你要为一家奶茶店设计一套“城市探险猫”IP插画。先不要急着画所有动作,而是生成一张最能代表角色气质的“标准照”。
1. 准备Prompt: 不要写“一只可爱的猫”,这太宽泛。要写具体:`A cute cartoon cat, wearing a tiny baker hat and an apron, holding a coffee cup, chubby, round eyes, soft pastel colors, vector flat illustration, clean lines, white background –ar 3:4 –v 6.1`
2. 加入风格参考: 如果你有偏好的插画师风格(比如某位日本画师),可以上传他的作品作为 `–sref` 参数。但更推荐的做法是,先用Midjourney生成一张你满意的图,然后把这张图的URL作为后续所有生成的 `–sref` 参考。
`[第一步生成图的URL] –sref [第一步生成图的URL] –ar 3:4 –v 6.1`
这样能最大程度保证后续所有角色都沐浴在相同的光影和笔触下。
第二步:锁定角色面孔(Seed锁定)
这是最关键的一步。你会发现,即使风格一致,角色的脸也总是在变。解决方案是种子值(Seed)。
1. 从第一步的生成结果中,找到你最满意的那张角色面孔。
2. 在Discord中,对该图片添加反应(点击 `+` 号),搜索 `envelope` 表情(✉️),点击后Midjourney会私信你这张图的 `seed` 值,比如 `seed 123456789`。
3. 现在,生成新动作时,强制使用这个种子:
`[第一步生成图的URL] –sref [第一步生成图的URL] –seed 123456789 –cw 50 –ar 3:4 –v 6.1`
`–cw`(Character Weight)参数控制角色特征(脸、发型、服装)的继承强度,范围0-100。对于角色一致性,推荐从 `–cw 50` 开始测试。如果角色太像,降低 `–cw`;如果变化太大,提高 `–cw`。
效果: 你可以在几分钟内,让同一只猫做出“拉花”“端盘子”“骑自行车”等几十个不同动作,而它的脸始终是那张“标准照”。这彻底解决了商业插画中“角色崩坏”的痛点。
—
核心章节二:从“AI半成品”到“商业成品”——Stable Diffusion + ControlNet 的精细化控制
Midjourney擅长“从无到有”的创意发散,但在需要精确控制构图、姿态、透视的商业项目中,Stable Diffusion(SD)配合ControlNet才是真正的王牌。很多学员觉得SD难,是因为没理解它的工作逻辑:SD不是画手,而是“修图师”和“上色助理”。
操作步骤:用一张线稿生成完整插画
工具: Stable Diffusion WebUI (AUTOMATIC1111版本)
核心插件: ControlNet v1.1.462
核心模型: Canny (边缘检测) / Lineart (线稿提取) / OpenPose (姿态检测)
场景: 你手绘了一张“太空探险兔”的线稿,但没时间上色和细化。你需要AI帮你完成从线稿到成品的“最后一公里”。
第一步:预处理你的线稿
1. 将手绘线稿扫描或拍照,导入SD WebUI的“图生图”选项卡。
2. 在ControlNet面板中,勾选“启用”,选择“Lineart”预处理器。这个预处理器能识别你的手绘线条,并生成一张干净的线稿图。
3. 关键参数:
– 权重(Weight): 1.0(严格遵循线稿)
– 引导介入时机(Starting Control Step): 0.0
– 引导终止时机(Ending Control Step): 0.8(让AI在后期有自由发挥上色和细节的空间)
第二步:设定风格与色彩
1. 大模型选择: 推荐使用二次元或厚涂风格的大模型,如 `Counterfeit-V3.0` 或 `DreamShaper`。
2. Prompt编写: 在正向提示词中,描述你想要的最终效果:
`masterpiece, best quality, (space rabbit:1.2), wearing a retro spacesuit, holding a laser gun, stars and nebula in background, detailed illustration, vibrant colors, cinematic lighting`
反向提示词:`worst quality, low quality, blurry, distorted hands, extra limbs, ugly, deformed`
3. 采样器与步数: 推荐 `DPM++ 2M Karras`,采样步数 `30-40` 步。步数太低细节不足,太高会过度锐化。
第三步:迭代与修正
第一次生成的结果往往不尽如人意,比如兔子的手画成了“爪子”或者背景太空过于单调。这时不要重新生成,而是进入图生图的“局部重绘”(Inpaint)模式。
1. 把不满意的区域(比如手部)用蒙版涂黑。
2. 在ControlNet中,再次启��Lineart,但这次把“引导终止时机”设为 `0.4`,给AI更多自由去修复细节。
3. 在Prompt中强调:`detailed rabbit paw, holding laser gun correctly`
通过这种“线稿约束+局部重绘”的组合拳,你可以在15分钟内,把一张粗糙的铅笔线稿,变成一张细节丰富、光影完整的商业级插画。
—
总结与进阶建议:成为“AI指挥家”,而非“AI操作工”
回到开头的案例。那位学员之所以能成功,不是因为他会用Midjourney或Stable Diffusion,而是因为他建立了一套“创意决策-批量生成-精细打磨”的工作流。
- 创意决策(你来做): 设定角色性格、世界观、色彩情绪。这是AI无法替代的审美和故事感。
进阶学习建议:
1. 不要贪多,先“打透”一个工具: 初学者建议先用Midjourney练手,专注于 `–sref` 和 `–seed` 的组合。当你发现Midjourney满足不了你对构图的精确控制时,再切入Stable Diffusion。
2. 建立你的“风格资产库”: 把每次成功生成的 `–sref` URL和 `–seed` 值记录下来。这些是你的数字画笔,积累得越多,你“召唤”灵感的速度就越快。
3. 死磕“局部重绘”: 这是通往高阶的关键。学会用Inpaint修复手、眼睛、道具等细节,是区分“AI玩家”和“AI插画师”的分水岭。
4. 保持“手绘手感”: 每周至少留出1-2天完全不用AI,只用手绘板画画。AI是效率工具,但你的艺术直觉和手眼协调能力,才是你永远的核心竞争力。
AI插画不是“一键出图”的魔法,而是一场新的“人机协作”艺术。当工具足够强大,真正稀缺的,是那个懂得如何“指挥”它的你。
—
常见问题 FAQ
Q1:用AI生成的插画,版权归我吗?会不会有侵权风险?
A:这是一个非常关键的法律问题。目前,Midjourney和Stable Diffusion的开源模型,其生成的图片版权归属取决于你的付费计划和使用条款。商业用途建议使用付费版(如Midjourney Pro)并仔细阅读其服务条款。对于Stable Diffusion,使用本地部署的模型(非在线服务),生成内容的版权通常归你所有,但需注意训练数据中可能包含受版权保护的作品,这在商业项目中存在灰色地带。最稳妥的做法是:不要直接使用有明显特定画师风格的图片,而是将其作为灵感参考,进行二次创作和深度修改。
Q2:为什么我用 `–seed` 锁定时,角色脸还是变了?
A:最常见的原因是Prompt描述不一致。`–seed` 锁定的是生成过程的“噪声起点”,但最终的图像还受Prompt强烈影响。如果你第一张图的Prompt是“戴帽子的猫”,第二张图的Prompt是“不戴帽子的猫”,即使 `–seed` 相同,AI也会因为“帽子”这个元素的有无而改变面部结构。解决方案: 保持核心Prompt不变,只修改动作或背景描述。另外,检查 `–cw` 参数,如果设为0,则角色特征几乎不继承。
Q3:Stable Diffusion生成的图总是“油腻”或者“塑料感”很重,怎么办?
A:这是很多初学者的痛点。主要原因有两个:一是大模型选择,避免使用过于“商业化”的写实模型,尝试 `ReV Animated` 或 `GhostMix` 等偏向手绘质感的大模型;二是VAE(变分自编码器) 设置错误。确保在设置中正确加载了与模型匹配的VAE(如 `vae-ft-mse-840000-ema-pruned`),错误的VAE会导致���彩过饱和或质感奇怪。最后,降低 `CFG Scale`(提示词引导系数)到 `5-7` 之间,过高的CFG会让图片显得僵硬。
Q4:AI生成的画面里,手和手指总是画错,怎么修?
A:这是当前所有AI绘画工具的通用难题。最好的策略是预防:在Prompt中尽量避免让角色做出复杂的“比心”或“指人”手势。如果必须画手,建议在Stable Diffusion中使用ControlNet的 OpenPose 插件,先手动摆好手的姿态骨架,再生成。如果已经生成错误,用 局部重绘(Inpaint) 配合 `–denoising strength 0.6-0.8`,并仅用“hand, detailed fingers”作为Prompt,多次迭代直到满意。或者,更直接的办法——自己画上去,用Photoshop或Procreate替换掉AI生成的错误手部。
Q5:我想把AI生成的图用于NFT或印刷品,画质不够大怎么办?
A:Midjourney V6.1直接生成的图片最大为2048×2048像素,通常够用。如果需要更大尺寸,可以使用 图生图(img2img) 的 缩放(Upscale) 功能。在Stable Diffusion中,推荐使用 Ultimate SD Upscale 脚本,配合 `R-ESRGAN 4x+` 或 `4x-UltraSharp` 这类放大模型,可以将图片无损放大2-4倍,并补充细节。注意,放大时 `denoising strength` 设为 `0.2-0.4`,太低则模糊,太高则改变原图。

评论(0)