Seedance 2.0 提示词怎么写:分镜结构 + 八要素公式(附一键生成)
写 Seedance 2.0 提示词,难的不是辞藻,是结构。官方把它定义成一个"多模态 AI 导演":内部把画面拆成"空间层(画面里有什么)"和"时间层(怎么随时间变化)"两层来理解。所以好提示词不是"文案型形容",而是"工程型指令"——谁、在哪、做什么、怎么拍、按什么顺序。这篇按官方推荐的结构把文本提示词的写法讲全,并说明 VideoLens 如何从一条参考视频自动生成这套结构(本文只讲文本提示词写法,不涉及多素材参考生视频)。
一、八要素进阶公式
官方推荐的进阶公式是:精准主体 + 动作细节 + 场景环境 + 光影色调 + 镜头运镜 + 视觉风格 + 画质 + 约束条件。先锁"谁在干什么",再交代"在哪、什么氛围",然后告诉模型"怎么拍",最后用风格、画质和约束把结果收紧。
| 要素 | 写什么 | 例 |
|---|---|---|
| 精准主体 | 用 2–3 个稳定静态特征锁定对象(服饰/发型/外观/类别) | 穿红色连衣裙、戴草帽的女人 |
| 动作细节 | 具体到肢体部位 + 幅度/速度/力度 | 缓慢抬手、微微低头 |
| 场景环境 | 主体所处场景、位置、空间关系 | 傍晚的宿舍走廊 |
| 光影色调 | 画面的光影与色彩调性 | 暖黄日光从窗外洒入、光影柔和 |
| 镜头运镜 | 标准运镜术语,一镜一种 | 中景平稳跟拍、缓慢推近 |
| 视觉风格 | 美术画风与整体调性 | 电影纪实风 / 日系清新 / 3D 国漫 |
| 画质 | 清晰度、细节、质感 | 高清、电影质感、光影柔和 |
| 约束条件 | 划定边界、规避瑕疵 | 保持无字幕、不要 Logo/水印、面部不变形 |
二、空间层 × 时间层:为什么要分镜
模型内部对空间和时间是解耦建模的,所以一个复杂视频最理想的提示词形态是"时间轴化分镜":把视频拆成几个镜头,按事件发生顺序动态描述。笼统一句"男人在街头紧张地奔跑,很有电影感"远不如拆成镜头 1 / 镜头 2 / 镜头 3。
每个镜头按这个逻辑组织:① 运镜或切换方式 → ② 主体动作与表情 → ③ 位置或空间变化 → ④ 音频信息(音效/人声/BGM)。
三、动作怎么写(四个要点)
| 要点 | 做法 | 例 |
|---|---|---|
| 肢体细化 + 量化 | 具体到手/腿/头/肩背 + 幅度速度力度 | 缓慢抬手、快速转头、用力蹬地 |
| 优先低缓小动作 | 规避狂奔/大跳/剧烈翻滚等高爆发动作 | 缓慢行走、轻轻抬手、顺势坐下 |
| 补充过渡衔接 | 写明前后动作的惯性与承接关系 | 借转身惯性顺势抬手 |
| 情绪具象外化 | 用身体细节代替"很悲伤/很愤怒" | 见下表 |
情绪外化对照——把抽象情绪翻译成可拍的动作与细节:
| 抽象情绪 | 外化为动作与细节 |
|---|---|
| 悲伤 | 低头、肩膀微微颤抖、眼眶泛红、手指攥紧衣角、泪水打转但没落下 |
| 喜悦 | 嘴角抑制不住上扬、眉眼舒展、脚步轻快、忍不住原地转个圈 |
| 紧张/焦虑 | 频繁看表、手指敲桌、呼吸急促、眼神闪躲、无意识啃指甲 |
| 愤怒 | 双拳紧握、下颌紧绷、胸口剧烈起伏、眼神如刀、从牙缝挤出话语 |
| 释然 | 长舒一口气、紧绷的肩膀放松、淡淡的微笑、抬头望向远方 |
四、运镜、画质与约束词
运镜直接用标准术语,模型理解力很强:中景、特写、全景、缓慢推镜、平稳横移、固定镜头。注意——一个镜头尽量只用 1 种运镜,别同时要求推拉摇移,否则画面会不稳。
收尾三件套——画质、风格、约束词,把结果收紧:
| 类别 | 作用 | 模板 / 例 |
|---|---|---|
| 画质 | 定清晰度与质感 | 高清、细节丰富、电影质感、光影柔和 |
| 风格 | 统一美术调性 | 赛博朋克冷蓝紫、复古胶片、日系清新、3D 国漫 |
| 约束词 | 规避瑕疵与平台残留 | 保持无字幕 / 避免生成任何文字 / 不要生成 Logo / 不要生成水印 |
五、音频与台词的标记符号
Seedance 2.0 原生支持音视频联合生成,提示词里用固定符号区分信息类型,模型理解更准:
| 信息类型 | 符号 | 示例 |
|---|---|---|
| 音乐 | () | (背景播放快节奏摇滚乐) |
| 音效 | <> | <远处传来狗叫声> |
| 台词 | {} | {你好,世界};小语种需标注语种,如 用日语说{こんにちは} |
| 字幕 | 【】 | 【第一章:启程】 |
几个台词避坑:台词语言要统一,避免中英混用(专有名词除外);中文的多音字、生僻字容易读错,可换成发音一致的常用同音字(如"螭龙山"→"吃龙山");不想要字幕,就加上"保持无字幕"约束。
六、用 VideoLens 一键生成这套结构
上面这套结构,手写要逐镜敲。VideoLens 的创作助手做的是反过来——给它一条参考视频,它自动逐镜拆解,直接输出符合上述结构的 Seedance 2.0 提示词:
· 把视频里的固定角色、场景、道具各自锚定成可复用实体; · 按镜头顺序生成每个分镜的提示词(运镜 + 主体动作 + 场景光影); · 用风格收尾统一画质与调性,并默认加上"无字幕、无 Logo 水印"等约束; · 把台词、音效、BGM 拆出来,对应到各自的镜头。
也就是说,你不用从零写——VideoLens 给你的就是一份可直接微调的分镜提示词。
Seedance 2.0 的提示词本质是分镜级的"导演指令"。理解了空间层 + 时间层、八要素、分镜时序和符号规范,你就能写出稳定出片的提示词;想省掉逐镜手写,把参考视频丢给 VideoLens,它会直接给你一份可微调的分镜提示词。
