AI 漫画创作全流程:从分镜脚本到成图生成

上周有位学员找我诉苦,他花了两周手绘了一部短篇漫画的分镜,结果在AI生图环节彻底翻车——角色脸部频繁崩坏、场景风格不统一、连续动作无法连贯。他说:“明明Midjourney和Stable Diffusion我都装了,为什么画出来像拼接的碎片?”

这个问题非常典型。很多创作者以为AI漫画就是“写提示词→出图→堆在一起”,结果生成的画面像精神分裂患者的梦境。今天我们就从分镜脚本出发,拆解一套可复用的AI漫画全流程,重点讲清楚如何让AI理解叙事逻辑,而不是单纯输出漂亮的单图。

一、分镜脚本的AI化改造:让机器读懂你的故事

传统漫画家画分镜本时,会用手绘草图标注机位、景别、角色动作。但AI不吃这套——它需要结构化的文字指令。所以第一步,我们要把分镜脚本改造成AI可解析的“生图指令集”

工具准备:

  • 分镜脚本工具:Google Docs 或 飞书文档(用于结构化排版)
  • 提示词辅助:ChatGPT 4o / Claude 3.5(用于润色英文提示词)
  • 生图核心:Midjourney V6.1 + Stable Diffusion WebUI (AUTOMATIC1111 v1.9.3)
  • 操作步骤1:分镜表格化

    不要写“主角走进黑暗森林”这种模糊描述。我们要拆解成:

    | 镜头编号 | 景别 | 角色状态 | 环境细节 | 光影/氛围 | 关键动作 |
    |———|——|———|———|———-|———|
    | 01 | 中景 | 主角(男,30岁,灰发) | 森林边缘,藤蔓缠绕 | 黄昏逆光,暖色调 | 右手拨开树枝 |
    | 02 | 特写 | 主角面部 | 树影投射在脸上 | 侧光,半明半暗 | 瞳孔收缩,表情警觉 |
    | 03 | 远景 | 主角背影 | 森林深处,雾气弥漫 | 冷色调,背光 | 向深处走去 |

    这个表格就是AI的生图骨架。每个单元格对应一个提示词模块,后续组装时不会漏细节。

    操作步骤2:提示词模块化组装

    以镜头01为例,用ChatGPT 4o生成英文提示词:

    Midjourney Prompt Template:
    [Subject] + [Action] + [Environment] + [Lighting] + [Style] + [Technical Parameters]

    Example: A 30-year-old man with gray hair, medium shot, right hand pushing aside vines, forest edge with twisted branches, golden hour backlight, warm color palette, cinematic lighting, manga style by Katsuhiro Otomo, --ar 16:9 --v 6.1 --style raw

    关键参数说明:

  • `–ar 16:9`:宽屏比例适合漫画分镜
  • `–v 6.1`:Midjourney最新版本,角色一致性更好
  • `–style raw`:减少AI过度美化,保留写实质感
  • `–s 250`(可选):风格化数值,调低可保持镜头一致性
  • 避坑提示: 不要一次性生成所有镜头。先跑镜头01-03,确认风格统一后,再批量生成后续镜头。否则AI的“随机性”会让角色长相在5个镜头后变成另一个人。

    二、角色一致性控制:用“锚点图”锁死主角长相

    这是AI漫画最崩溃的环节——主角在第三格突然长出了络腮胡,第五格又变成了娃娃脸。解决方案是建立角色视觉锚点

    工具组合:Midjourney + InsightFace(SD插件)

    实操案例:生成主角“林夜”的系列镜头

    第一步:创建角色参考图
    在Midjourney中生成一张标准正面照:

    Prompt: Male character portrait, 30 years old, gray hair, sharp jaw, green eyes, serious expression, anime style, high detail, --ar 3:4 --v 6.1 --iw 2
    

    选中最佳结果,右键复制图片链接(或保存到本地)。

    第二步:使用Image-to-Image保持特征
    在Stable Diffusion WebUI中,切换到img2img模式:

  • 上传角色参考图
  • 设置Denoising Strength: 0.4~0.5(数值越低越接近原图��
  • 使用模型:Counterfeit-V3.0(适合二次元风格)
  • 开启ControlNet,选择Canny模式(边缘检测),权重0.8
  • 第三步:生成动作镜头
    输入提示词:

    linye (character), looking up at the sky, forest background, hand reaching towards sunlight, detailed illustration, sharp focus, anime style
    

    点击生成。此时ControlNet会强制保持角色面部轮廓,而Canny边缘检测会保留原图的姿势骨架。

    进阶技巧: 如果你需要角色穿不同衣服,用Inpaint功能。先生成全身图,遮罩衣服区域,输入“leather jacket, dark blue”,Denoising Strength设为0.7。这样角色脸和体型不变,只换服装。

    多角色场景的“叠层法”

    当画面出现两个角色时,用分层生成避免AI搞混:

    1. 先生成角色A(单独图层,背景透明)
    2. 再生成角色B(单独图层)
    3. 最后用Photoshop(或GIMP)合成,用AI补全背景

    或者更高效:在SD中使用MultiDiffusion插件,为每个角色分配独立的ControlNet权重区域。

    三、动态连续性:让AI理解“前一个动作”

    漫画的魅力在于“画格之间的时间流动”。AI不懂“上一格在挥拳,这一格拳头已经打到脸上”这种逻辑。我们需要用动作链提示法

    操作步骤:动作拆解与关键词锚定

    以“主角挥剑斩断藤蔓”为例,拆解为3个连续镜头:

    镜头A(准备动作):

    Midjourney: linye character, holding a sword with both hands, raising it above head, muscles tense, forest background, dynamic pose, motion lines, --ar 16:9 --v 6.1
    

    镜头B(斩击瞬间):

    Midjourney: linye character, sword swinging diagonally downward, blade cutting through vine, sparks flying, mid-action, speed lines, impact effect, --ar 16:9 --v 6.1
    

    镜头C(动作完成):

    Midjourney: linye character, sword pointing at ground, vine pieces falling, dust settling, breathing heavily, aftermath scene, --ar 16:9 --v 6.1
    

    关键技巧: 在镜头B的提示词中,加入`–seed 12345`(固定随机种子),与镜头A的seed一致。这能让AI保持角色位置、光线方向的一致性。

    如果角色姿势变形: 用Stable Diffusion的OpenPose ControlNet。先在3D模型软件(如Blender)中摆好姿势,导出骨架图,作为ControlNet输入。这样AI会严格遵循你设定的动作轨迹。

    实战案例:生成4格战斗分镜

    我用这套方法帮学员生成了一组4格战斗场景,耗时仅40分钟(传统手绘约8小时):

    1. 第一格: 主角发现怪物(全景,紧张氛围)
    2. 第二格: 主角拔剑(中景,特写剑柄)
    3. 第三格: 主角冲刺(动态模糊,速度线)
    4. 第四格: 剑与怪物利爪碰撞(近景,火花特效)

    唯一需要手动调整的是第四格——AI生成的碰撞位置偏了10度,用Photoshop的“内容感知移动”工具3秒修正。

    四、总结与进阶建议

    AI漫画的核心不是“生成好看的图”,而是用结构化思维控制叙事流。记住三个原则:

    1. 分镜表格化:每个镜头拆解为5个模块,避免AI“自由发挥”
    2. 锚点锁定:用Image-to-Image + ControlNet锁死角色特征
    3. 动作链提示:用固定seed + 连续动作关键词保持动态连贯

    进阶学习路径:

  • 如果想做彩色漫画:用SD的Tiled Diffusion插件进行高分辨率上色
  • 如果想做动态漫画:生成静态帧后,用Runway Gen-2Pika Labs生成微动效
  • 如果想做故事板预览:用ComfyUI搭建自动化工作流,批量处理分镜
  • 最后推荐三个工具组合:

  • 轻量级:Midjourney + ChatGPT(适合个人短篇)
  • 专业级:Stable Diffusion WebUI + ControlNet + Photoshop(适合连载)
  • 自动化:ComfyUI + LoRA模型(适合批量生产)
  • 常见问题 FAQ

    Q1:为什么我用同样的提示词,生成的角色长相不一样?
    A:因为Midjourney默认每次使用不同随机种子。解决方法:在提示词末尾加上`–seed 12345`(数字可任选),并确保所有镜头使用同一seed值。如果角色差异仍然明显,需要用Image-to-Image模式锁定脸部特征。

    Q2:AI生成的漫画分镜总是太“平”,没有冲击力怎么办?
    A:在提示词中加入透视关键词,如`extreme low angle`(极端仰角)或`dutch angle`(斜角镜头)。同时用ControlNet的Depth模式强制景深,让前景和背景拉开距离。

    Q3:如何让AI理解“角色从左边走到右边”这种连续动作?
    A:使用动作链提示法。第一格提示词包含`starting to walk`,第二格`mid-step`,第三格`arriving at destination`。配合固定seed和OpenPose骨架图,AI会保持角色步态连贯。

    Q4:SD生成漫画时,背景总是模糊或崩坏怎么办?
    A:启用Hires.fix(高分辨率修复),放大倍率设为2,重绘幅度0.3~0.4。如果背景依然崩坏,用Inpaint单独修复背景区域,提示词写`detailed forest background, high quality`。

    Q5:我想生成黑白漫画风格,但AI总是自动上色?
    A:在提示词中明确加`black and white, grayscale, no color`。同时将SD的CFG Scale设为7~9(数值越高越遵循提示词)。如果用了LoRA模型,确保它训练的是黑白漫画数据。

    声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。