AI 漫画创作全流程：从分镜脚本到成图生成

上周，一位学员拿着自己用 Midjourney 生成的“漫画”来找我，画面确实精致——光影、材质、细节都无可挑剔。但问题是：第一张图的角色长着蓝眼睛，第二张变成了绿眼睛；第三张主角穿着铠甲，第四张突然换成了便服。更致命的是，连续四张图的人物脸型完全不同，读者根本认不出这是同一个故事里的同一个人。

这其实是 AI 漫画创作中最常见的“翻车现场”——很多人以为只要写好提示词，AI 就能自动生成连贯的漫画。但真正的专业流程，远比想象中复杂。

今天，我就以火星人教育 AIGC 设计课程中的实战案例，拆解一套完整的 AI 漫画创作工作流。从分镜脚本的 AI 辅助编写，到角色一致性控制，再到多图生成与后期整合，每一个环节都有具体工具和参数。

一、分镜脚本的 AI 辅助编写：先有逻辑，再有画面

很多新手一上来就急着出图，结果往往陷入“单张好看，连起来尴尬”的困境。正确的做法是：先用 AI 工具把文字分镜做扎实。

1.1 用 ChatGPT 生成结构化分镜

我在火星人教育的课程中，要求学员使用 ChatGPT-4o（2024年5月版本）来完成分镜脚本的初稿。关键不是让 AI 自由发挥，而是给它一个严格的“分镜模板”。

操作步骤：

1. 创建分镜模板 Prompt：

你是一位专业的漫画编剧。请根据以下故事梗概，生成12格分镜脚本。每格分镜必须包含：镜头编号（P1-P12）镜头景别（远景/中景/近景/特写）画面描述（角色动作、表情、环境细节，50字以内）关键台词（如果有）情绪关键词（如：紧张、温馨、悬念）

故事梗概：[在此输入你的故事核心]

2. 填入具体故事内容，例如：

故事梗概：未来世界，程序员林夕发现自己的代码被公司用于操控人类意识。她决定潜入服务器机房删除核心数据，却被 AI 主管发现，两人在数据走廊展开追逐。

3. 优化输出结果：ChatGPT 会生成类似这样的分镜：

| 镜头编号 | 景别 | 画面描述 | 情绪 |
|———|——|———|——|
| P1 | 远景 | 赛博朋克城市夜景，霓虹灯下的写字楼 | 压抑 |
| P2 | 中景 | 林夕在工位盯着屏幕，瞳孔反射代码流 | 专注 |
| P3 | 特写 | 她的手悬停在键盘上，额头冒汗 | 紧张 |
| … | … | … | … |

1.2 用 Notion 进行分镜管理

得到初稿后，我推荐学员将分镜导入 Notion（免费版即可），建立数据库视图。每一条分镜作为一个条目，添加“画面描述”“参考图链接”“生成状态”等属性。这样做的好处是：后续生成图片时，可以随时对照分镜，避免剧情跳跃。

—

二、角色一致性控制：AI 漫画的“生死线”

这是整个流程中最关键、也最容易出问题的环节。2024年主流工具中，Midjourney V6 和 DALL-E 3 都支持角色参考，但各有局限。

2.1 用 Midjourney 的“角色参考”功能

Midjourney V6（2024年1月更新）引入了 `–cref` 参数，可以基于一张角色图生成新图，保持角色外观一致。

操作步骤：

1. 生成角色基准图：

/imagine prompt: 25岁亚洲女性，程序员，黑色短发，戴圆框眼镜，穿灰色连帽卫衣，正面半身，柔和光线，动漫风格 --ar 3:4 --v 6

选择一张最满意的作为基准图（记下种子号或直接保存图片链接）。

2. 生成新分镜画面时，引用角色参考：

/imagine prompt: 角色在数据走廊奔跑，背景是蓝色光缆，动态模糊，从背���拍摄 --cref [基准图链接] --cw 50 --ar 3:4 --v 6

`–cref`：角色参考（Character Reference）

`–cw`：参考权重（0-100），50表示中等一致性，数值越高越像基准图

注意：`–cw` 值过高可能导致服装、姿势也被锁定，不利于多分镜变化

3. 处理服装变化场景：如果角色需要换装（比如第5格穿外套，第8格脱掉），建议为每个服装状态单独生成基准图，然后用 `–cref` 分别引用。

2.2 DALL-E 3 的“种子锁定”技巧

如果你使用 DALL-E 3（通过 ChatGPT Plus 或 API），它的角色一致性相对较弱，但有一个技巧：通过描述锁定角色特征。

操作步骤：

1. 在第一张图中，详细描述角色特征（包括脸部、发型、身材、服装细节）。
2. 生成后续图时，复制上一张图的完整描述，并追加新的动作和环境描述。
3. 如果角色出现变形，回到 ChatGPT 对话中，用“保持角色特征不变，只改变[具体元素]”来微调。

实际案例对比：

错误做法：“一个女孩在跑步”（AI 可能生成完全不同的女孩）

正确做法：“一个25岁亚洲女性，黑色短发，圆框眼镜，灰色连帽卫衣，在数据走廊奔跑，动态模糊”

2.3 用 ComfyUI 实现“换脸式”一致性

对于对一致性要求极高的项目（比如长篇漫画），我推荐使用 ComfyUI（2024年4月版本）配合 InstantID 或 IP-Adapter 工作流。

核心逻辑：
1. 提取基准图的“角色特征编码”（Face Embedding）
2. 在每次生成时，将特征编码注入到 Stable Diffusion 的生成过程中
3. 通过 ControlNet 控制姿势和构图

参数参考：

模型：SDXL 1.0

InstantID 权重：0.8

ControlNet 姿势权重：1.0

采样步数：30

这个方案需要一定的技术基础，但一致性效果远超 Midjourney 的 `–cref`。

—

三、高效批量生成与后期整合

当分镜和角色一致性方案确定后，下一步就是批量出图。这里有两个关键技巧：提示词模板化和后期精修。

3.1 建立提示词模板库

将分镜中的“共性描述”提取出来，做成模板：

[角色描述] + [动作描述] + [环境描述] + [镜头参数] + [风格参数]

例如：

[25岁亚洲女性，黑色短发，圆框眼镜，灰色卫衣] + [在数据走廊奔跑，回头张望] + [蓝色光缆，霓虹灯光，金属质感地板] + [中景，动态模糊，仰拍] + [赛博朋克风格，4K，动漫渲染，--ar 3:4 --v 6]

在 Airtable 或 Excel 中建立表格，每一行是一个分镜，每个单元格对应模板的一部分。这样批量修改时，只需替换动作或环境，角色和风格保持不变。

3.2 用 Photoshop 进行后期一致性修复

即使有角色参考，AI 生成的连续画面中仍可能出现细节偏差（如眼镜颜色、头发长度）。这时需要 Photoshop 2024（生成式填充功能）进行修复：

1. 将生成的图片导入 PS
2. 选中不一致的区域（如变形的眼镜）
3. 使用“生成式填充”（Generative Fill），输入提示词：“圆框金属眼镜，黑色镜框”
4. 调整图层透明度，与原图融合

3.3 漫画排版与对话气泡

推荐使用 Clip Studio Paint EX（2024版）进行漫画排版。它的“素材库”功能可以一键添加对话框、拟声词和效果线。

流程建议：

将 AI 生成的图片按分镜顺序导入

用“帧边界”工具自动切割画面

添加对话气泡时，注意气泡的阅读顺序（从左到右，从上到下）

最后导出为 PNG 或 PDF

—

四、实操案例：一个完整的分镜生成

我们以开头提到的“程序员林夕”故事为例，演示从分镜到成图的完整流程。

案例：P4 分镜——林夕潜入机房

分镜内容：

景别：中景

画面：林夕蹲在服��器机架旁，手指在键盘上快速敲击，屏幕反射代码流

情绪：专注且紧张

台词：（无）

生成步骤：

1. 基准图引用： 使用之前生成的林夕基准图
2. 提示词：

/imagine prompt: 25岁亚洲女性程序员，黑色短发，圆框眼镜，灰色卫衣，蹲在服务器机架旁，手指敲击键盘，屏幕反射绿色代码流，蓝色光缆背景，中景，侧拍，专注表情，赛博朋克风格，动漫渲染，4K --cref [基准图链接] --cw 60 --ar 3:4 --v 6

3. 生成结果： 得到4张变体，选择最符合分镜的一张
4. 后期调整： 如果用 PS 发现眼镜颜色偏蓝，用生成式填充改为黑色

案例：P8 分镜——追逐场景

分镜内容：

景别：近景

画面：AI 主管从后方追来，金属手爪伸向林夕的肩膀

情绪：惊险

提示词调整：

角色描述不变

增加“从背后拍摄，AI 主管的金属手爪在前景，模糊效果”

使用 `–cw 40` 降低一致性权重，允许更多动态变化

—

总结与进阶建议

AI 漫画创作的核心不是“生成好看的图”，而是“生成能讲好故事的连续画面”。从分镜脚本的角色一致性控制，到批量生成的效率提升，每一个环节都需要系统的方法论。

进阶学习路径：

1. 工具层面： 熟练掌握 Midjourney V6 的 `–cref` 和 `–sref`（风格参考）参数；学习 ComfyUI 的节点式工作流
2. 理论层面： 研究漫画分镜的“黄金比例”（如 1:1.618 的画面分割）、情绪节奏（紧张-放松-高潮的交替）
3. 实战层面： 从4格短篇开始，逐步挑战12格、24格故事。每次生成后复盘“哪里角色崩了”“哪里剧情跳了”

最后提醒：AI 是工具，不是创作者。真正的价值在于你如何用分镜语言控制故事节奏，用角色设计传递情感。当你能让 AI 生成的每一格画面都服务于叙事时，你就真正掌握了 AI 漫画创作。

—

常见问题 FAQ

Q1：Midjourney 的 –cref 参数为什么有时候角色脸型会变？
A：`–cref` 是基于 CLIP 特征匹配的，如果基准图本身有光影遮挡（如侧脸、阴影），AI 可能提取不完整。建议基准图使用正面、均匀光照的全身或半身照。另外 `–cw` 值低于 40 时，角色一致性会显著下降。

Q2：DALL-E 3 能保持角色一致性吗？
A：DALL-E 3 没有官方的角色参考功能，只能通过“详细描述角色特征”来间接控制。对于短篇（4-6格），效果尚可；长篇建议使用 Midjourney 或 ComfyUI。

Q3：生成的图片分辨率不够怎么办？
A：Midjourney V6 默认输出 1024×1024，可以用 `–ar 3:4` 得到 1024×1365。需要更高分辨率时，使用 Topaz Gigapixel AI（7.0版本）进行无损放大，或通过 ComfyUI 的“高清修复”节点（Upscale by 2x）。

Q4：不同分镜中角色服装不一致如何解决？
A：方法一：为每套服装单独生成基准图；方法二：在提示词中明确“服装不变，只改变动作”。如果 AI 仍出错，后期用 Photoshop 的生成式填充修复。

Q5：AI 生成的漫画画面太“AI感”，如何增加手绘质感？
A：在提示词中加入“线稿风格”“水彩纹理”“铅笔素描”等关键词；也可以将 AI 图导入 Clip Studio Paint，用“自动描边”功能生成线稿，再叠加半色调网点。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

AI 漫画创作全流程：从分镜脚本到成图生成

AI 漫画创作全流程：从分镜脚本到成图生成

一、分镜脚本的 AI 辅助编写：先有逻辑，再有画面

1.1 用 ChatGPT 生成结构化分镜

1.2 用 Notion 进行分镜管理

二、角色一致性控制：AI 漫画的“生死线”

2.1 用 Midjourney 的“角色参考”功能

2.2 DALL-E 3 的“种子锁定”技巧

2.3 用 ComfyUI 实现“换脸式”一致性

三、高效批量生成与后期整合

3.1 建立提示词模板库

3.2 用 Photoshop 进行后期一致性修复

3.3 漫画排版与对话气泡

四、实操案例：一个完整的分镜生成

案例：P4 分镜——林夕潜入机房

案例：P8 分镜——追逐场景

总结与进阶建议

常见问题 FAQ

评论(0)

提示：请文明发言取消回复

近期文章

AI 漫剧导演课程：数字影视创作的新范式

AI 漫剧导演如何把控角色一致性与叙事节奏

水下气泡与焦散光效：UE5 环境特效的高级技巧

UE5 治疗技能特效制作：如何用光效传达”恢复”的视觉语言

水下气泡与焦散光效：UE5 环境特效的高级技巧

AIGC 时代设计师的转型之路：从传统到 AI 原生

AI 漫画创作全流程：从分镜脚本到成图生成

UE5 游戏技能特效设计原则：让每一次释放都有视觉冲击力

在线咨询

AI 漫画创作全流程：从分镜脚本到成图生成

AI 漫画创作全流程：从分镜脚本到成图生成

一、分镜脚本的 AI 辅助编写：先有逻辑，再有画面

1.1 用 ChatGPT 生成结构化分镜

1.2 用 Notion 进行分镜管理

二、角色一致性控制：AI 漫画的“生死线”

2.1 用 Midjourney 的“角色参考”功能

2.2 DALL-E 3 的“种子锁定”技巧

2.3 用 ComfyUI 实现“换脸式”一致性

三、高效批量生成与后期整合

3.1 建立提示词模板库

3.2 用 Photoshop 进行后期一致性修复

3.3 漫画排版与对话气泡

四、实操案例：一个完整的分镜生成

案例：P4 分镜——林夕潜入机房

案例：P8 分镜——追逐场景

总结与进阶建议

常见问题 FAQ

评论(0)

提示：请文明发言 取消回复

相关文章

近期文章

在线咨询

提示：请文明发言取消回复