AI 漫画创作全流程:从分镜脚本到成图生成
上周三,一位学员深夜发来消息:“老师,我用 Midjourney 生成了几十张图,角色脸型、服装、场景全都对不上,拼成一页漫画像精神分裂现场。有没有办法让 AI 真正理解我的故事,而不是随机生成一堆漂亮的废图?”
这个问题太典型了。2025 年的今天,AI 绘画工具已经能生成单张惊艳的插画,但要让它们“讲一个连贯的故事”,很多创作者还在黑暗中摸索。今天我们就来拆解一套经过验证的全流程——从分镜脚本到最终的漫画成图,让你手里的 AI 工具真正为叙事服务。
—
一、分镜脚本:AI 漫画的“地基工程”
很多人的误区是直接跳到生成画面。结果呢?角色在不同分镜里穿不同的衣服,场景光线忽明忽暗,同一角色的脸型像换了三个人。要解决这个问题,必须从分镜脚本开始建立“一致性锚点”。
1.1 用 Excel 表格做分镜管理(比思维导图实用 10 倍)
打开 WPS 或 Excel,建立一张表格,列名如下:
| 分镜编号 | 画面描述 | 角色状态 | 场景 | 关键道具 | 镜头类型 |
|———|———|———|—–|———|———|
| P01 | 主角林夕在实验室调试机械臂 | 专注、戴护目镜 | 实验室(冷光) | 机械臂、数据屏 | 中景 |
| P02 | 机械臂突然失控,砸向培养皿 | 惊恐、后退 | 同上 | 碎片、培养皿 | 特写+动态模糊 |
关键操作:每一行都要标注“角色状态”和“场景”。这是后续用 AI 生成时保持一致的“密码”。
1.2 为角色建立“视觉身份证”
在开始生成前,先用 Midjourney 或 Stable Diffusion 为每个主要角色生成一组“标准照”。我习惯用 Midjourney v6.1 的 `–cref` 参数(角色参考),但更好的做法是生成一张“角色三视图”作为种子图。
实操案例:生成主角林夕的参考图
Prompt: character design sheet, young female scientist, Lin Xi, 25 years old, short black hair, lab coat, front view, side view, back view, clean lines, anime style --ar 3:4 --v 6.1 --s 250
得到这张图后,保存为 `linxi_ref.png`。后续所有分镜生成时,通过 `–cref linxi_ref.png –cw 80` 让 AI 参考这张图的脸型、发型、服装。
注意:`–cw` 参数控制参考强度,0-100。对于漫画场景,建议 60-80,既能保持角色一致性,又允许表情和动作变化。
—
二、ComfyUI 工作流:从单图到连续画面的“工业化”方案
如果你试过用 Midjourney 直接生成漫画,会发现一个问题:每次生成都是独立计算,画面之间的光影、透视、角色位置很难衔接。要解决这个问题,需要引入 ComfyUI 的工作流。
2.1 安装与基础节点配置(2025 年最新版本)
- Stable Diffusion:推荐使用 SDXL 1.0 + Realistic Vision V6.0(写实风)或 NijiJourney V5(日漫风)
– `Load Image`:加载分镜草图(可以是你手绘的简笔画,也可以是 AI 生成的线稿)
– `ControlNet Canny`:提取草图边缘,让 AI 严格遵循你的构图
– `IP-Adapter FaceID Plus v2`:保持角色面部一致性(比 `–cref` 更稳定)
– `KSampler`:步数 30-40,CFG Scale 7.0,Sampler 选 `DPM++ 2M Karras`
2.2 实操案例:生成 P01 分镜(实验室场景)
步骤 1:准备草图
用 Procreate 或 Photoshop 画一个简单的构图草稿:画面左侧是林夕,右侧是机械臂,背景是数据屏。导出为 `p01_sketch.png`。
步骤 2:加载 ControlNet
在 ComfyUI 中,添加 `ControlNetLoader` 节���,选择 `control_v11p_sd15_canny.pth`。连接 `Load Image` 节点,将草图输入。
步骤 3:设置 IP-Adapter 面部参考
添加 `IPAdapterUnifiedLoaderFaceID` 节点,加载 `ip-adapter-faceid-plusv2_sd15.bin`。将之前生成的 `linxi_ref.png` 连接到此节点。强度设为 0.8(太高会让表情僵硬)。
步骤 4:编写正向提示词
(masterpiece, best quality), anime style, young female scientist Lin Xi, short black hair, lab coat, wearing safety goggles, standing in front of a control panel, adjusting a robotic arm, blue-toned lighting, data screens on the wall, clean laboratory environment, dynamic pose, focused expression
步骤 5:生成与微调
点击 Queue Prompt。如果机械臂的位置不对,回到草图修改,重新生成。一般 2-3 次迭代就能得到满意的画面。
步骤 6:批量处理后续分镜
将 P02 的草图替换为 `p02_sketch.png`,只修改提示词中的动作和表情部分。角色参考和场景参考保持不变——这就是“工业化”的核心:一次性建好工作流模板,后续只改草图 + 动作描述。
—
三、从单页到连贯漫画:跨页一致性进阶技巧
很多人在这一步卡住:单张图都好看,拼在一起就像四个不同的漫画。问题出在“跨页一致性”上。
3.1 用“场景锚点”锁定环境
每个场景只生成一张“全景环境图”,后续的分镜都基于这张图裁剪和调整。比如实验室场景,先生成:
Prompt: laboratory interior, wide angle, blue and white color scheme, robotic arm on the left, control panels on the right, data screens on the wall, clean futuristic style, anime background --ar 16:9 --v 6.1
得到 `lab_background.png`。后续每个分镜生成时,通过 `–iw 1.5`(image weight)让 AI 参考这张图的背景风格。
关键参数:在 Midjourney 中,`–iw` 的默认值是 1.0,对于背景参考建议提升到 1.5-2.0,同时降低角色参考的权重(`–cw 60`),避免背景和角色互相干扰。
3.2 用“分格模板”统一排版
在 Photoshop 或 Figma 中建立漫画分格模板,比如 3×3 的九宫格,每个格子尺寸固定为 800×1200 像素。生成的所有单张图都 resize 到这个尺寸,然后拖入模板。
高级技巧:使用 SD 的 `Tile` 功能生成无缝拼接的背景。在 ComfyUI 中,添加 `VaeDecode` 节点后,连接 `ImageResize` 节点,将尺寸设为 800×1200,`interpolation` 选 `lanczos`,保证边缘清晰。
3.3 对话气泡与文字排版
AI 生成图一般不包含文字。用 Photoshop 的“文字工具”添加对话框,字体推荐“方正悠黑”或“Noto Sans SC”。注意气泡的指向要匹配角色的视线方向——这是很多新手忽略的细节。
实操案例:P01 分镜中,林夕说“机械臂的温度异常”。气泡应该从她的嘴部向左上方伸出(因为她的脸朝右)。如果气泡位置不对,读者会下意识觉得“谁在说话?”
—
四、总结与进阶建议
这套流程的核心逻辑是:用结构化思维管理 AI 的“随机性”。分镜脚本建立叙事框架,角色参考图和场景锚点锁定视觉一致性,ComfyUI 工作流实现批量生产。三个环节缺一不可。
进阶学习路径:
1. 学习 ControlNet 的高级用法:比如 `Lineart` 模式可以保留手绘线稿的质感,`Depth` 模式可以控制景深。推荐在 Civitai 上搜索“ControlNet comic workflow”模板。
2. 研究 IP-Adapter 的多人场景:如果漫画有多个角色,可以同时加载多个 `IPAdapterFaceID` 节点,为每个角色分配不同的参考图。注意调整 `weight` 参数,避免角色特征混淆。
3. 尝试 LoRA 微调:为你的漫画角色训练一个专属 LoRA 模型(需要 20-30 张不同角度的角色图),一致性可以接近 95%。工具推荐 Kohya_ss GUI v24.0。
最后给学员们的建议:不要追求一次性生成完美漫画。先画 5 页的短篇,用这套流程跑通,再回头看哪里需要优化。AI 漫画的核心不是技术,而是你讲故事的逻辑——工具只是放大器。
—
常见问题 FAQ
Q1:为什么我用 `–cref` 后角色脸型还是变来变去?
A:最常见原因是参考图不够清晰,或者角色在分镜中的角度变化太大。建议使用正面、侧面、3/4 侧面三张参考图,在提示词中明确标注角度(如 `front view`)。另外 `–cw` 值不要低于 60,否则参考强度不够。
Q2:ComfyUI 工作流跑一张图要 5 分钟,太慢了怎么办?
A:检查你的 GPU 显存。建议至少 8GB VRAM(RTX 3070 及以上)。如果硬件受限,可以降低分辨率(如 512×768),或者使用 `LCM-LoRA` 加速采样,步数降到 8-12 步,画质损失可控。
Q3:如何让 AI 理解“机械臂砸向培养皿”这种动态场景?
A:在提示词中加入动态描述词,如 `shattering glass`, `flying debris`, `motion blur`。ControlNet 的 `OpenPose` 模式可以手动标注角色的动作骨架,对于复杂动作很有帮助。
Q4:我的漫画是黑白风格,怎么让 AI 生成线稿而不是彩色图?
A:在提示词中加入 `black and white`, `line art`, `sketch style`。或者使用 SD 的 `Lineart` ControlNet 模式,直接输出线稿。后期在 Photoshop 中用“阈值”调整对比度即可。
Q5:生成的图有手指变形、眼睛不对称等细节问题,怎么修复?
A:如果是 SD 生成,用 `inpainting` 模式局部重绘。在 ComfyUI 中,用 `Mask` 节点遮住问题区域,输入 `correct hands` 或 `fix eyes`。如果是 Midjourney,用 `Vary (Region)` 功能手动选择修复区域。

评论(0)