AI 漫剧从零到一:角色设定、场景构建与分镜编排

上周有位学员拿着 Midjourney 生成的 20 张图找我:“老师,为什么我的人物在第三帧就变脸了?场景也完全不搭,根本连不成故事。” 他遇到的问题非常典型——很多创作者以为 AI 漫剧就是“画几幅好看的图拼起来”,结果成品像 AI 的随机抽卡现场。

今天这篇文章,我会用火星人教育的实战方法论,带你拆解 AI 漫剧的三大核心模块:角色设定场景构建分镜编排。全程有工具、有参数、有操作步骤。读完你就能直接上手,让 AI 真正听你的话。

一、角色设定:让 AI 记住同一张脸

角色一致性是 AI 漫剧的第一道坎。Midjourney 的随机性会让同一个 prompt 每次输出不同长相,更不用说换角度、换表情了。

1.1 核心工具:Midjourney V6 + 角色参考 (cref)

版本号:Midjourney V6.1(2024年12月更新版),支持 `–cref` 和 `–cw` 参数。

操作步骤

1. 生成角色基准图
写一个包含完整面部特征的 prompt,比如:

   /imagine prompt: A young woman with sharp jawline, high cheekbones, dark brown eyes, straight black hair to shoulders, wearing a white blouse --ar 2:3 --v 6.1
   

选一张你满意的正面照作为“角色锚点”。

2. 提取角色参考
右键这张图 → Copy Image URL。
在后续生成中,用 `–cref [URL]` 引用该图。

3. 控制角色相似度
`–cw` 参数范围 0-100:
– `–cw 100`:强制面部、发型、服装全匹配(适合近景)
– `–cw 50`:仅保画面部特征,服装、背景可自由变化(适合换装场景)
– `–cw 0`:只保留面部结构,表情角度可大幅变化(适合多角度)

实战案例
学员需要主角“小琳”在三个场景中(咖啡厅、地铁、家中)保持长相一致。

  • 第一张基准图用 `–cw 100` 生成,锁定完整形象。
  • 咖啡厅场景:`–cref [基准图URL] –cw 50`,服装自动变为咖啡师围裙,但脸不变。
  • 地铁场景:`–cref [基准图URL] –cw 30`,角度变为侧面,发型微调,但辨识度依然高。
  • 注意:`–cref` 对侧面和夸张表情支持有限。如果角色需要大笑或转头超过 60°,建议先做 3-4 张不同角度的基准图,交替引用。

    1.2 进阶:用 Pika 或 Runway 做动态角色

    如果要做动画漫剧,需要角色在视频中保持稳定。

  • Pika 2.0:支持上传角��图作为“Identity”(身份锚点),生成视频时自动参考。
  • Runway Gen-3 Alpha:在“Image to Video”模式下,用同一张角色图作为第一帧,后续帧会尽力保持相似。
  • 参数建议:Pika 中 Motion Strength 设为 0.5-0.7,太高会导致面部扭曲。

    角色一致性对比

    二、场景构建:从文字到沉浸式空间

    场景是漫剧的“舞台”,但 AI 经常把“咖啡馆”画成“带咖啡杯的白色房间”,缺乏细节和氛围。

    2.1 场景 prompt 的“三层结构”

    我总结了一个万能公式:主体 + 环境 + 光影氛围

    案例:构建“东京雨夜便利店”

  • 基础版:`a convenience store at night in Tokyo` → 结果:随便一个 7-11,毫无情绪。
  • 三层结构版:
  •   /imagine prompt: A small family-run convenience store in Shinjuku, rain-slicked asphalt reflecting neon signs, warm yellow light spilling from the entrance, steam rising from a vending machine, cinematic depth of field --ar 16:9 --v 6.1 --s 250
      

    参数说明

  • `–s 250`:Stylize 值,范围 0-1000。场景类建议 200-400,太高会偏离你的描述。
  • `–ar 16:9`:漫剧常用横屏比例,适合多格排列。
  • 2.2 场景一致性:用“环境参考”代替随机

    角色用 `–cref`,场景可以用 `–sref`(Style Reference)。

  • 先生成一张“理想场景风格图”,比如“有特定色调和光影的室内”。
  • 后续所有同系列场景,都引用这张图:`–sref [风格图URL] –sw 100`
  • `–sw`(Style Weight)控制风格强度:
  • – `sw 50`:保留色调和光线,但内容自由
    – `sw 100`:连建筑风格和植被类型都模仿

    学员实操
    一位学员要做“末日废墟”系列,他用一张《最后生还者》的游戏截图做 `–sref`,后续所有场景(医院、超市、停车场)都带有“破败、灰绿色调、植物蔓延”的统一风格。5 张图放在一起,就像同一个世界的不同角落。

    2.3 工具联动:Midjourney + Photoshop 补全

    AI 生成的场景有时边缘不完整或缺少细节。快速修复方法:

  • 用 Photoshop 2024 的“Generative Fill”(生成式填充):选中残缺区域,输入“extend the brick wall texture”,AI 自动补全。
  • 或者用 Clipdrop 的“Cleanup”去掉多余物体,再用“Relight”调整全局光照。
  • 场景构建流程

    三、分镜编排:让画面讲出故事

    有了角色和场景,最后一���是“怎么排列”。很多人的漫剧像幻灯片,因为忽略了镜头语言。

    3.1 分镜四要素:景别、角度、动作、情绪

    每一帧 prompt 里,必须包含这四个维度。示例:

    | 帧号 | 景别 | 角度 | 动作 | 情绪 | Prompt 示例 |
    |——|——|——|——|——|————|
    | 1 | 中景 | 平视 | 主角推门 | 期待 | `Medium shot, eye-level, a young woman pushing open a convenience store door, anticipation on her face` |
    | 2 | 近景 | 过肩镜头 | 主角看货架 | 犹豫 | `Close-up, over-the-shoulder shot, she scans the shelves, slight frown` |
    | 3 | 特写 | 低角度 | 手伸向商品 | 紧张 | `Extreme close-up, low angle, her hand reaching for a can, fingers trembling` |

    工具:在 Midjourney 中,景别关键词要放 prompt 开头,权重最高。比如 `Extreme wide shot` 比 `epic landscape` 更精准。

    3.2 镜头衔接:用“动作匹配”减少跳跃

    AI 生成的相邻帧如果毫无关联,看起来会非常生硬。解决方法:

    1. 动作延续法:前一帧是“主角拿起咖啡杯”,后一帧就是“主角喝咖啡”,让动作自然衔接。
    2. 视线引导法:前一帧主角看向右侧,后一帧就展示他看的东西(POV 镜头)。
    3. 固定构图法:同一场景使用相同的 `–ar` 和镜头焦距(如 50mm),避免画面比例突变。

    3.3 实操:用 Canva 或 Figma 做分镜板

    生成所有图片后,需要排版成漫剧格式。

    步骤
    1. 在 Canva 搜索“漫画分镜模板”,选一个 4-6 格模板。
    2. 每格添加一张 AI 图,并配上简短台词或旁白(用文本框)。
    3. 用“滤镜”统一色调:比如全部加“暖橙”滤镜,让画面风格一致。
    4. 导出为 PDF 或长图,用于分享。

    进阶:如果想做动态分镜(Animatic),用 Premiere Pro 或 DaVinci Resolve 把图片按时间轴排列,每张停留 2-3 秒,配上背景音乐和音效,就是最简单的动画漫剧。

    分镜板示例

    总结与进阶建议

    从角色锚点、场景风格到分镜四要素,这三步构成了 AI 漫剧的完整流水线。但真正的提升来自大量练习:

    1. 本周任务:选一个 3-5 格的小故事(比如“一个人早起出门”),严格按照本文流程生成。
    2. 工具清单
    – 角色:Midjourney V6.1 + `–cref`
    – 场景:Midjourney + `–sref` + Photoshop Generative Fill
    – 分镜:Canva 模板 + Premiere Pro 动态化
    3. 避坑指南
    – 不要用同一张 `–cref` 图生成超过 10 帧,角色会逐渐变形。
    – 场景 prompt 里加 `cinematic lighting` 和 `depth of field`,立刻提升质感。
    – 分镜排列时,相邻帧避免“跳跃景别”(如特写直接切远景)。

    如果你想深入学习,火星人教育的《AI 漫剧导演实战营》会讲到角色库建立、多角色互动、以及用 ComfyUI 做精细控制。保持好奇,动手去试——AI 只是工具,故事才是灵魂。

    常见问题 FAQ

    Q1:为什么我用 `–cref` 后,角色脸还是变了?
    A:最常见原因是 `–cw` 值太低。检查是否设了 `–cw 80` 以上。另外,基准图本身要清晰、正面、无遮挡,侧面照做参考效果会差很多。

    Q2:场景风格统一后,每张图都像同一个地方,如何避免单调?
    A:在 `–sref` 基础上,修改 prompt 中的“环境描述”部分,比如“室内”改“室外”,“白天”改“黄昏”。`–sw` 值可以降到 30-50,只保留色调和光线,内容自由变化。

    Q3:分镜排版时,图片尺寸不一致怎么办?
    A:Midjourney 生成时统一用 `–ar 16:9` 或 `–ar 3:2`。如果已有不同尺寸,用 Canva 的“裁剪到统一尺寸”功能,或 Photoshop 的“内容识别缩放”调整。

    Q4:AI 漫剧适合什么类型的叙事?
    A:最适合短篇、��绪驱动的故事(如悬念、浪漫、日常)。长篇或复杂剧情需要大量手动调整,建议先用 4-6 格练手。

    Q5:动态漫剧(视频)怎么做?
    A:用 Pika 或 Runway 把每张图转为 2-3 秒视频片段,再在 Premiere 中串联。关键:相邻片段之间加“交叉溶解”转场,掩盖动作不连贯。

    声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。