AI 漫画创作全流程:从分镜脚本到成图生成
上周有位学员找我诉苦,他花了两周手绘了一部短篇漫画的分镜,结果在AI生图环节彻底翻车——角色脸部频繁崩坏、场景风格不统一、连续动作无法连贯。他说:“明明Midjourney和Stable Diffusion我都装了,为什么画出来像拼接的碎片?”
这个问题非常典型。很多创作者以为AI漫画就是“写提示词→出图→堆在一起”,结果生成的画面像精神分裂患者的梦境。今天我们就从分镜脚本出发,拆解一套可复用的AI漫画全流程,重点讲清楚如何让AI理解叙事逻辑,而不是单纯输出漂亮的单图。
一、分镜脚本的AI化改造:让机器读懂你的故事
传统漫画家画分镜本时,会用手绘草图标注机位、景别、角色动作。但AI不吃这套——它需要结构化的文字指令。所以第一步,我们要把分镜脚本改造成AI可解析的“生图指令集”。
工具准备:
- 分镜脚本工具:Google Docs 或 飞书文档(用于结构化排版)
操作步骤1:分镜表格化
不要写“主角走进黑暗森林”这种模糊描述。我们要拆解成:
| 镜头编号 | 景别 | 角色状态 | 环境细节 | 光影/氛围 | 关键动作 |
|———|——|———|———|———-|———|
| 01 | 中景 | 主角(男,30岁,灰发) | 森林边缘,藤蔓缠绕 | 黄昏逆光,暖色调 | 右手拨开树枝 |
| 02 | 特写 | 主角面部 | 树影投射在脸上 | 侧光,半明半暗 | 瞳孔收缩,表情警觉 |
| 03 | 远景 | 主角背影 | 森林深处,雾气弥漫 | 冷色调,背光 | 向深处走去 |
这个表格就是AI的生图骨架。每个单元格对应一个提示词模块,后续组装时不会漏细节。
操作步骤2:提示词模块化组装
以镜头01为例,用ChatGPT 4o生成英文提示词:
Midjourney Prompt Template:
[Subject] + [Action] + [Environment] + [Lighting] + [Style] + [Technical Parameters]Example:
A 30-year-old man with gray hair, medium shot, right hand pushing aside vines, forest edge with twisted branches, golden hour backlight, warm color palette, cinematic lighting, manga style by Katsuhiro Otomo, --ar 16:9 --v 6.1 --style raw
关键参数说明:
避坑提示: 不要一次性生成所有镜头。先跑镜头01-03,确认风格统一后,再批量生成后续镜头。否则AI的“随机性”会让角色长相在5个镜头后变成另一个人。
—
二、角色一致性控制:用“锚点图”锁死主角长相
这是AI漫画最崩溃的环节——主角在第三格突然长出了络腮胡,第五格又变成了娃娃脸。解决方案是建立角色视觉锚点。
工具组合:Midjourney + InsightFace(SD插件)
实操案例:生成主角“林夜”的系列镜头
第一步:创建角色参考图
在Midjourney中生成一张标准正面照:
Prompt: Male character portrait, 30 years old, gray hair, sharp jaw, green eyes, serious expression, anime style, high detail, --ar 3:4 --v 6.1 --iw 2
选中最佳结果,右键复制图片链接(或保存到本地)。
第二步:使用Image-to-Image保持特征
在Stable Diffusion WebUI中,切换到img2img模式:
第三步:生成动作镜头
输入提示词:
linye (character), looking up at the sky, forest background, hand reaching towards sunlight, detailed illustration, sharp focus, anime style
点击生成。此时ControlNet会强制保持角色面部轮廓,而Canny边缘检测会保留原图的姿势骨架。
进阶技巧: 如果你需要角色穿不同衣服,用Inpaint功能。先生成全身图,遮罩衣服区域,输入“leather jacket, dark blue”,Denoising Strength设为0.7。这样角色脸和体型不变,只换服装。
多角色场景的“叠层法”
当画面出现两个角色时,用分层生成避免AI搞混:
1. 先生成角色A(单独图层,背景透明)
2. 再生成角色B(单独图层)
3. 最后用Photoshop(或GIMP)合成,用AI补全背景
或者更高效:在SD中使用MultiDiffusion插件,为每个角色分配独立的ControlNet权重区域。
—
三、动态连续性:让AI理解“前一个动作”
漫画的魅力在于“画格之间的时间流动”。AI不懂“上一格在挥拳,这一格拳头已经打到脸上”这种逻辑。我们需要用动作链提示法。
操作步骤:动作拆解与关键词锚定
以“主角挥剑斩断藤蔓”为例,拆解为3个连续镜头:
镜头A(准备动作):
Midjourney: linye character, holding a sword with both hands, raising it above head, muscles tense, forest background, dynamic pose, motion lines, --ar 16:9 --v 6.1
镜头B(斩击瞬间):
Midjourney: linye character, sword swinging diagonally downward, blade cutting through vine, sparks flying, mid-action, speed lines, impact effect, --ar 16:9 --v 6.1
镜头C(动作完成):
Midjourney: linye character, sword pointing at ground, vine pieces falling, dust settling, breathing heavily, aftermath scene, --ar 16:9 --v 6.1
关键技巧: 在镜头B的提示词中,加入`–seed 12345`(固定随机种子),与镜头A的seed一致。这能让AI保持角色位置、光线方向的一致性。
如果角色姿势变形: 用Stable Diffusion的OpenPose ControlNet。先在3D模型软件(如Blender)中摆好姿势,导出骨架图,作为ControlNet输入。这样AI会严格遵循你设定的动作轨迹。
实战案例:生成4格战斗分镜
我用这套方法帮学员生成了一组4格战斗场景,耗时仅40分钟(传统手绘约8小时):
1. 第一格: 主角发现怪物(全景,紧张氛围)
2. 第二格: 主角拔剑(中景,特写剑柄)
3. 第三格: 主角冲刺(动态模糊,速度线)
4. 第四格: 剑与怪物利爪碰撞(近景,火花特效)
唯一需要手动调整的是第四格——AI生成的碰撞位置偏了10度,用Photoshop的“内容感知移动”工具3秒修正。
—
四、总结与进阶建议
AI漫画的核心不是“生成好看的图”,而是用结构化思维控制叙事流。记住三个原则:
1. 分镜表格化:每个镜头拆解为5个模块,避免AI“自由发挥”
2. 锚点锁定:用Image-to-Image + ControlNet锁死角色特征
3. 动作链提示:用固定seed + 连续动作关键词保持动态连贯
进阶学习路径:
最后推荐三个工具组合:
—
常见问题 FAQ
Q1:为什么我用同样的提示词,生成的角色长相不一样?
A:因为Midjourney默认每次使用不同随机种子。解决方法:在提示词末尾加上`–seed 12345`(数字可任选),并确保所有镜头使用同一seed值。如果角色差异仍然明显,需要用Image-to-Image模式锁定脸部特征。
Q2:AI生成的漫画分镜总是太“平”,没有冲击力怎么办?
A:在提示词中加入透视关键词,如`extreme low angle`(极端仰角)或`dutch angle`(斜角镜头)。同时用ControlNet的Depth模式强制景深,让前景和背景拉开距离。
Q3:如何让AI理解“角色从左边走到右边”这种连续动作?
A:使用动作链提示法。第一格提示词包含`starting to walk`,第二格`mid-step`,第三格`arriving at destination`。配合固定seed和OpenPose骨架图,AI会保持角色步态连贯。
Q4:SD生成漫画时,背景总是模糊或崩坏怎么办?
A:启用Hires.fix(高分辨率修复),放大倍率设为2,重绘幅度0.3~0.4。如果背景依然崩坏,用Inpaint单独修复背景区域,提示词写`detailed forest background, high quality`。
Q5:我想生成黑白漫画风格,但AI总是自动上色?
A:在提示词中明确加`black and white, grayscale, no color`。同时将SD的CFG Scale设为7~9(数值越高越遵循提示词)。如果用了LoRA模型,确保它训练的是黑白漫画数据。

评论(0)