AI 漫剧从零到一:角色设定、场景构建与分镜编排
上周有位学员拿着 Midjourney 生成的 20 张图找我:“老师,为什么我的人物在第三帧就变脸了?场景也完全不搭,根本连不成故事。” 他遇到的问题非常典型——很多创作者以为 AI 漫剧就是“画几幅好看的图拼起来”,结果成品像 AI 的随机抽卡现场。
今天这篇文章,我会用火星人教育的实战方法论,带你拆解 AI 漫剧的三大核心模块:角色设定、场景构建与分镜编排。全程有工具、有参数、有操作步骤。读完你就能直接上手,让 AI 真正听你的话。
—
一、角色设定:让 AI 记住同一张脸
角色一致性是 AI 漫剧的第一道坎。Midjourney 的随机性会让同一个 prompt 每次输出不同长相,更不用说换角度、换表情了。
1.1 核心工具:Midjourney V6 + 角色参考 (cref)
版本号:Midjourney V6.1(2024年12月更新版),支持 `–cref` 和 `–cw` 参数。
操作步骤:
1. 生成角色基准图
写一个包含完整面部特征的 prompt,比如:
/imagine prompt: A young woman with sharp jawline, high cheekbones, dark brown eyes, straight black hair to shoulders, wearing a white blouse --ar 2:3 --v 6.1
选一张你满意的正面照作为“角色锚点”。
2. 提取角色参考
右键这张图 → Copy Image URL。
在后续生成中,用 `–cref [URL]` 引用该图。
3. 控制角色相似度
`–cw` 参数范围 0-100:
– `–cw 100`:强制面部、发型、服装全匹配(适合近景)
– `–cw 50`:仅保画面部特征,服装、背景可自由变化(适合换装场景)
– `–cw 0`:只保留面部结构,表情角度可大幅变化(适合多角度)
实战案例:
学员需要主角“小琳”在三个场景中(咖啡厅、地铁、家中)保持长相一致。
- 第一张基准图用 `–cw 100` 生成,锁定完整形象。
注意:`–cref` 对侧面和夸张表情支持有限。如果角色需要大笑或转头超过 60°,建议先做 3-4 张不同角度的基准图,交替引用。
1.2 进阶:用 Pika 或 Runway 做动态角色
如果要做动画漫剧,需要角色在视频中保持稳定。
参数建议:Pika 中 Motion Strength 设为 0.5-0.7,太高会导致面部扭曲。
—
二、场景构建:从文字到沉浸式空间
场景是漫剧的“舞台”,但 AI 经常把“咖啡馆”画成“带咖啡杯的白色房间”,缺乏细节和氛围。
2.1 场景 prompt 的“三层结构”
我总结了一个万能公式:主体 + 环境 + 光影氛围。
案例:构建“东京雨夜便利店”
/imagine prompt: A small family-run convenience store in Shinjuku, rain-slicked asphalt reflecting neon signs, warm yellow light spilling from the entrance, steam rising from a vending machine, cinematic depth of field --ar 16:9 --v 6.1 --s 250
参数说明:
2.2 场景一致性:用“环境参考”代替随机
角色用 `–cref`,场景可以用 `–sref`(Style Reference)。
– `sw 50`:保留色调和光线,但内容自由
– `sw 100`:连建筑风格和植被类型都模仿
学员实操:
一位学员要做“末日废墟”系列,他用一张《最后生还者》的游戏截图做 `–sref`,后续所有场景(医院、超市、停车场)都带有“破败、灰绿色调、植物蔓延”的统一风格。5 张图放在一起,就像同一个世界的不同角落。
2.3 工具联动:Midjourney + Photoshop 补全
AI 生成的场景有时边缘不完整或缺少细节。快速修复方法:
—
三、分镜编排:让画面讲出故事
有了角色和场景,最后一���是“怎么排列”。很多人的漫剧像幻灯片,因为忽略了镜头语言。
3.1 分镜四要素:景别、角度、动作、情绪
每一帧 prompt 里,必须包含这四个维度。示例:
| 帧号 | 景别 | 角度 | 动作 | 情绪 | Prompt 示例 |
|——|——|——|——|——|————|
| 1 | 中景 | 平视 | 主角推门 | 期待 | `Medium shot, eye-level, a young woman pushing open a convenience store door, anticipation on her face` |
| 2 | 近景 | 过肩镜头 | 主角看货架 | 犹豫 | `Close-up, over-the-shoulder shot, she scans the shelves, slight frown` |
| 3 | 特写 | 低角度 | 手伸向商品 | 紧张 | `Extreme close-up, low angle, her hand reaching for a can, fingers trembling` |
工具:在 Midjourney 中,景别关键词要放 prompt 开头,权重最高。比如 `Extreme wide shot` 比 `epic landscape` 更精准。
3.2 镜头衔接:用“动作匹配”减少跳跃
AI 生成的相邻帧如果毫无关联,看起来会非常生硬。解决方法:
1. 动作延续法:前一帧是“主角拿起咖啡杯”,后一帧就是“主角喝咖啡”,让动作自然衔接。
2. 视线引导法:前一帧主角看向右侧,后一帧就展示他看的东西(POV 镜头)。
3. 固定构图法:同一场景使用相同的 `–ar` 和镜头焦距(如 50mm),避免画面比例突变。
3.3 实操:用 Canva 或 Figma 做分镜板
生成所有图片后,需要排版成漫剧格式。
步骤:
1. 在 Canva 搜索“漫画分镜模板”,选一个 4-6 格模板。
2. 每格添加一张 AI 图,并配上简短台词或旁白(用文本框)。
3. 用“滤镜”统一色调:比如全部加“暖橙”滤镜,让画面风格一致。
4. 导出为 PDF 或长图,用于分享。
进阶:如果想做动态分镜(Animatic),用 Premiere Pro 或 DaVinci Resolve 把图片按时间轴排列,每张停留 2-3 秒,配上背景音乐和音效,就是最简单的动画漫剧。
—
总结与进阶建议
从角色锚点、场景风格到分镜四要素,这三步构成了 AI 漫剧的完整流水线。但真正的提升来自大量练习:
1. 本周任务:选一个 3-5 格的小故事(比如“一个人早起出门”),严格按照本文流程生成。
2. 工具清单:
– 角色:Midjourney V6.1 + `–cref`
– 场景:Midjourney + `–sref` + Photoshop Generative Fill
– 分镜:Canva 模板 + Premiere Pro 动态化
3. 避坑指南:
– 不要用同一张 `–cref` 图生成超过 10 帧,角色会逐渐变形。
– 场景 prompt 里加 `cinematic lighting` 和 `depth of field`,立刻提升质感。
– 分镜排列时,相邻帧避免“跳跃景别”(如特写直接切远景)。
如果你想深入学习,火星人教育的《AI 漫剧导演实战营》会讲到角色库建立、多角色互动、以及用 ComfyUI 做精细控制。保持好奇,动手去试——AI 只是工具,故事才是灵魂。
—
常见问题 FAQ
Q1:为什么我用 `–cref` 后,角色脸还是变了?
A:最常见原因是 `–cw` 值太低。检查是否设了 `–cw 80` 以上。另外,基准图本身要清晰、正面、无遮挡,侧面照做参考效果会差很多。
Q2:场景风格统一后,每张图都像同一个地方,如何避免单调?
A:在 `–sref` 基础上,修改 prompt 中的“环境描述”部分,比如“室内”改“室外”,“白天”改“黄昏”。`–sw` 值可以降到 30-50,只保留色调和光线,内容自由变化。
Q3:分镜排版时,图片尺寸不一致怎么办?
A:Midjourney 生成时统一用 `–ar 16:9` 或 `–ar 3:2`。如果已有不同尺寸,用 Canva 的“裁剪到统一尺寸”功能,或 Photoshop 的“内容识别缩放”调整。
Q4:AI 漫剧适合什么类型的叙事?
A:最适合短篇、��绪驱动的故事(如悬念、浪漫、日常)。长篇或复杂剧情需要大量手动调整,建议先用 4-6 格练手。
Q5:动态漫剧(视频)怎么做?
A:用 Pika 或 Runway 把每张图转为 2-3 秒视频片段,再在 Premiere 中串联。关键:相邻片段之间加“交叉溶解”转场,掩盖动作不连贯。



评论(0)