AI 漫画创作全流程:从分镜脚本到成图生成

上周,一位学员拿着自己用 Midjourney 生成的“漫画”来找我,画面确实精致——光影、材质、细节都无可挑剔。但问题是:第一张图的角色长着蓝眼睛,第二张变成了绿眼睛;第三张主角穿着铠甲,第四张突然换成了便服。更致命的是,连续四张图的人物脸型完全不同,读者根本认不出这是同一个故事里的同一个人。

这其实是 AI 漫画创作中最常见的“翻车现场”——很多人以为只要写好提示词,AI 就能自动生成连贯的漫画。但真正的专业流程,远比想象中复杂。

今天,我就以火星人教育 AIGC 设计课程中的实战案例,拆解一套完整的 AI 漫画创作工作流。从分镜脚本的 AI 辅助编写,到角色一致性控制,再到多图生成与后期整合,每一个环节都有具体工具和参数。

一、分镜脚本的 AI 辅助编写:先有逻辑,再有画面

很多新手一上来就急着出图,结果往往陷入“单张好看,连起来尴尬”的困境。正确的做法是:先用 AI 工具把文字分镜做扎实。

1.1 用 ChatGPT 生成结构化分镜

我在火星人教育的课程中,要求学员使用 ChatGPT-4o(2024年5月版本)来完成分镜脚本的初稿。关键不是让 AI 自由发挥,而是给它一个严格的“分镜模板”。

操作步骤:

1. 创建分镜模板 Prompt:

你是一位专业的漫画编剧。请根据以下故事梗概,生成12格分镜脚本。每格分镜必须包含:
  • 镜头编号(P1-P12)
  • 镜头景别(远景/中景/近景/特写)
  • 画面描述(角色动作、表情、环境细节,50字以内)
  • 关键台词(如果有)
  • 情绪关键词(如:紧张、温馨、悬念)
  • 故事梗概:[在此输入你的故事核心]

    2. 填入具体故事内容,例如:

    故事梗概:未来世界,程序员林夕发现自己的代码被公司用于操控人类意识。她决定潜入服务器机房删除核心数据,却被 AI 主管发现,两人在数据走廊展开追逐。
    

    3. 优化输出结果:ChatGPT 会生成类似这样的分镜:

    | 镜头编号 | 景别 | 画面描述 | 情绪 |
    |———|——|———|——|
    | P1 | 远景 | 赛博朋克城市夜景,霓虹灯下的写字楼 | 压抑 |
    | P2 | 中景 | 林夕在工位盯着屏幕,瞳孔反射代码流 | 专注 |
    | P3 | 特写 | 她的手悬停在键盘上,额头冒汗 | 紧张 |
    | … | … | … | … |

    1.2 用 Notion 进行分镜管理

    得到初稿后,我推荐学员将分镜导入 Notion(免费版即可),建立数据库视图。每一条分镜作为一个条目,添加“画面描述”“参考图链接”“生成状态”等属性。这样做的好处是:后续生成图片时,可以随时对照分镜,避免剧情跳跃。

    二、角色一致性控制:AI 漫画的“生死线”

    这是整个流程中最关键、也最容易出问题的环节。2024年主流工具中,Midjourney V6DALL-E 3 都支持角色参考,但各有局限。

    2.1 用 Midjourney 的“角色参考”功能

    Midjourney V6(2024年1月更新)引入了 `–cref` 参数,可以基于一张角色图生成新图,保持角色外观一致。

    操作步骤:

    1. 生成角色基准图:

    /imagine prompt: 25岁亚洲女性,程序员,黑色短发,戴圆框眼镜,穿灰色连帽卫衣,正面半身,柔和光线,动漫风格 --ar 3:4 --v 6
    

    选择一张最满意的作为基准图(记下种子号或直接保存图片链接)。

    2. 生成新分镜画面时,引用角色参考:

    /imagine prompt: 角色在数据走廊奔跑,背景是蓝色光缆,动态模糊,从背���拍摄 --cref [基准图链接] --cw 50 --ar 3:4 --v 6
    
  • `–cref`:角色参考(Character Reference)
  • `–cw`:参考权重(0-100),50表示中等一致性,数值越高越像基准图
  • 注意:`–cw` 值过高可能导致服装、姿势也被锁定,不利于多分镜变化
  • 3. 处理服装变化场景:如果角色需要换装(比如第5格穿外套,第8格脱掉),建议为每个服装状态单独生成基准图,然后用 `–cref` 分别引用。

    2.2 DALL-E 3 的“种子锁定”技巧

    如果你使用 DALL-E 3(通过 ChatGPT Plus 或 API),它的角色一致性相对较弱,但有一个技巧:通过描述锁定角色特征

    操作步骤:

    1. 在第一张图中,详细描述角色特征(包括脸部、发型、身材、服装细节)。
    2. 生成后续图时,复制上一张图的完整描述,并追加新的动作和环境描述。
    3. 如果角色出现变形,回到 ChatGPT 对话中,用“保持角色特征不变,只改变[具体元素]”来微调。

    实际案例对比:

  • 错误做法:“一个女孩在跑步”(AI 可能生成完全不同的女孩)
  • 正确做法:“一个25岁亚洲女性,黑色短发,圆框眼镜,灰色连帽卫衣,在数据走廊奔跑,动态模糊”
  • 2.3 用 ComfyUI 实现“换脸式”一致性

    对于对一致性要求极高的项目(比如长篇漫画),我推荐使用 ComfyUI(2024年4月版本)配合 InstantIDIP-Adapter 工作流。

    核心逻辑:
    1. 提取基准图的“角色特征编码”(Face Embedding)
    2. 在每次生成时,将特征编码注入到 Stable Diffusion 的生成过程中
    3. 通过 ControlNet 控制姿势和构图

    参数参考:

  • 模型:SDXL 1.0
  • InstantID 权重:0.8
  • ControlNet 姿势权重:1.0
  • 采样步数:30
  • 这个方案需要一定的技术基础,但一致性效果远超 Midjourney 的 `–cref`。

    三、高效批量生成与后期整合

    当分镜和角色一致性方案确定后,下一步就是批量出图。这里有两个关键技巧:提示词模板化和后期精修。

    3.1 建立提示词模板库

    将分镜中的“共性描述”提取出来,做成模板:

    [角色描述] + [动作描述] + [环境描述] + [镜头参数] + [风格参数]
    

    例如:

    [25岁亚洲女性,黑色短发,圆框眼镜,灰色卫衣] + [在数据走廊奔跑,回头张望] + [蓝色光缆,霓虹灯光,金属质感地板] + [中景,动态模糊,仰拍] + [赛博朋克风格,4K,动漫渲染,--ar 3:4 --v 6]
    

    AirtableExcel 中建立表格,每一行是一个分镜,每个单元格对应模板的一部分。这样批量修改时,只需替换动作或环境,角色和风格保持不变。

    3.2 用 Photoshop 进行后期一致性修复

    即使有角色参考,AI 生成的连续画面中仍可能出现细节偏差(如眼镜颜色、头发长度)。这时需要 Photoshop 2024(生成式填充功能)进行修复:

    1. 将生成的图片导入 PS
    2. 选中不一致的区域(如变形的眼镜)
    3. 使用“生成式填充”(Generative Fill),输入提示词:“圆框金属眼镜,黑色镜框”
    4. 调整图层透明度,与原图融合

    3.3 漫画排版与对话气泡

    推荐使用 Clip Studio Paint EX(2024版)进行漫画排版。它的“素材库”功能可以一键添加对话框、拟声词和效果线。

    流程建议:

  • 将 AI 生成的图片按分镜顺序导入
  • 用“帧边界”工具自动切割画面
  • 添加对话气泡时,注意气泡的阅读顺序(从左到右,从上到下)
  • 最后导出为 PNG 或 PDF
  • 四、实操案例:一个完整的分镜生成

    我们以开头提到的“程序员林夕”故事为例,演示从分镜到成图的完整流程。

    案例:P4 分镜——林夕潜入机房

    分镜内容:

  • 景别:中景
  • 画面:林夕蹲在服��器机架旁,手指在键盘上快速敲击,屏幕反射代码流
  • 情绪:专注且紧张
  • 台词:(无)
  • 生成步骤:

    1. 基准图引用: 使用之前生成的林夕基准图
    2. 提示词:

    /imagine prompt: 25岁亚洲女性程序员,黑色短发,圆框眼镜,灰色卫衣,蹲在服务器机架旁,手指敲击键盘,屏幕反射绿色代码流,蓝色光缆背景,中景,侧拍,专注表情,赛博朋克风格,动漫渲染,4K --cref [基准图链接] --cw 60 --ar 3:4 --v 6
    

    3. 生成结果: 得到4张变体,选择最符合分镜的一张
    4. 后期调整: 如果用 PS 发现眼镜颜色偏蓝,用生成式填充改为黑色

    案例:P8 分镜——追逐场景

    分镜内容:

  • 景别:近景
  • 画面:AI 主管从后方追来,金属手爪伸向林夕的肩膀
  • 情绪:惊险
  • 提示词调整:

  • 角色描述不变
  • 增加“从背后拍摄,AI 主管的金属手爪在前景,模糊效果”
  • 使用 `–cw 40` 降低一致性权重,允许更多动态变化
  • 总结与进阶建议

    AI 漫画创作的核心不是“生成好看的图”,而是“生成能讲好故事的连续画面”。从分镜脚本的角色一致性控制,到批量生成的效率提升,每一个环节都需要系统的方法论。

    进阶学习路径:

    1. 工具层面: 熟练掌握 Midjourney V6 的 `–cref` 和 `–sref`(风格参考)参数;学习 ComfyUI 的节点式工作流
    2. 理论层面: 研究漫画分镜的“黄金比例”(如 1:1.618 的画面分割)、情绪节奏(紧张-放松-高潮的交替)
    3. 实战层面: 从4格短篇开始,逐步挑战12格、24格故事。每次生成后复盘“哪里角色崩了”“哪里剧情跳了”

    最后提醒:AI 是工具,不是创作者。真正的价值在于你如何用分镜语言控制故事节奏,用角色设计传递情感。当你能让 AI 生成的每一格画面都服务于叙事时,你就真正掌握了 AI 漫画创作。

    常见问题 FAQ

    Q1:Midjourney 的 –cref 参数为什么有时候角色脸型会变?
    A:`–cref` 是基于 CLIP 特征匹配的,如果基准图本身有光影遮挡(如侧脸、阴影),AI 可能提取不完整。建议基准图使用正面、均匀光照的全身或半身照。另外 `–cw` 值低于 40 时,角色一致性会显著下降。

    Q2:DALL-E 3 能保持角色一致性吗?
    A:DALL-E 3 没有官方的角色参考功能,只能通过“详细描述角色特征”来间接控制。对于短篇(4-6格),效果尚可;长篇建议使用 Midjourney 或 ComfyUI。

    Q3:生成的图片分辨率不够怎么办?
    A:Midjourney V6 默认输出 1024×1024,可以用 `–ar 3:4` 得到 1024×1365。需要更高分辨率时,使用 Topaz Gigapixel AI(7.0版本)进行无损放大,或通过 ComfyUI 的“高清修复”节点(Upscale by 2x)。

    Q4:不同分镜中角色服装不一致如何解决?
    A:方法一:为每套服装单独生成基准图;方法二:在提示词中明确“服装不变,只改变动作”。如果 AI 仍出错,后期用 Photoshop 的生成式填充修复。

    Q5:AI 生成的漫画画面太“AI感”,如何增加手绘质感?
    A:在提示词中加入“线稿风格”“水彩纹理”“铅笔素描”等关键词;也可以将 AI 图导入 Clip Studio Paint,用“自动描边”功能生成线稿,再叠加半色调网点。

    声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。