AI视频提示词怎么写?通用公式、模板与30个示例
AI视频提示词怎么写?本文提供从主体、动作、场景、运镜到光线风格的通用公式,并整理30个可直接修改的文生视频和图生视频提示词示例。

AI视频提示词的核心写法是:先说明谁在什么场景做什么,再补充动作过程、镜头运动、光线氛围、画面风格和保持不变的内容。提示词不一定越长越好,但必须具体、可视化,并符合几秒钟视频能够完成的动作量。
通用公式:主体 + 场景 + 核心动作 + 动作过程 + 景别与构图 + 运镜 + 光线氛围 + 视觉风格 + 速度节奏 + 限制条件
文生视频需要同时说明“画面里有什么”和“画面如何变化”;图生视频已有起始图片,应重点描述主体怎么动、镜头怎么动,以及哪些内容必须保持不变。
什么是AI视频提示词?
AI视频提示词是提供给视频生成模型的文字指令,用来描述主体、场景、动作、镜头和视觉效果。模型会把这些信息转换为连续画面。
类型 | 主要任务 | 描述重点 |
|---|---|---|
文生视频 | 从文字创建完整画面 | 人物、场景、动作、构图、运镜和风格 |
图生视频 | 让已有图片产生运动 | 动作过程、运动幅度、运镜和保持项 |
首尾帧视频 | 连接起始与结束画面 | 变化路径、动作顺序和过渡方式 |
参考视频生成 | 借鉴动作或镜头语言 | 要保留的动作、节奏和角色身份 |
AI视频提示词通用公式详解
1. 主体
先明确画面中的主要人物或物体。不要只写“一个女人”,应加入与镜头有关的稳定特征。
一名穿深灰色西装、黑色齐肩直发的年轻女性设计师
2. 场景
说明地点、时间、天气和环境。场景描述应服务于剧情,不必堆叠无关细节。
深夜的现代办公楼走廊,冷白色顶灯间歇闪烁,窗外下着大雨
3. 核心动作与过程
动作要写成可以观察的过程。相比“她很害怕”,“她停下脚步、缓慢低头、握紧文件夹”更容易生成。
4. 景别与构图
景别 | 适用内容 | 示例 |
|---|---|---|
大特写 | 眼睛、嘴唇、关键道具 | 眼睛大特写,倒映闪烁红灯 |
近景 | 表情和对白 | 肩部以上近景,人物居中 |
中景 | 手势和人物互动 | 腰部以上中景,人物在画面右侧 |
全景 | 完整动作和空间关系 | 全身全景,人物独自站在大厅 |
远景 | 城市、自然和宏大场景 | 高空远景,展示雨夜未来城市 |
5. 运镜
运镜 | 视觉效果 | 适合场景 |
|---|---|---|
缓慢推近 | 突出表情,增强紧张感 | 发现秘密、情绪变化 |
缓慢拉远 | 揭示环境或孤独感 | 结尾、反转、空间展示 |
横向跟拍 | 跟随主体移动 | 行走、奔跑、车辆 |
环绕镜头 | 增强立体感和戏剧性 | 角色亮相、产品展示 |
手持镜头 | 增加真实感和紧迫感 | 追逐、冲突、纪实场景 |
固定镜头 | 稳定、克制 | 对白、喜剧、监控视角 |
6. 光线、色彩与风格
选择一组统一的视觉方向即可,例如“冷蓝色电影灯光、低饱和色调、写实悬疑电影质感”。过多风格词可能互相冲突。
7. 速度与限制条件
说明动作快慢,并指出需要保持不变的部分。图生视频尤其需要这一项。
动作缓慢克制,镜头运动平稳;保持人物脸型、五官、发型、服装和背景结构不变,不新增人物。
文生视频提示词模板
[主体详细描述] 位于 [场景、时间和天气],[核心动作],[动作变化过程]。[景别和构图],[运镜方式]。[光线、色彩和氛围],[视觉风格],[速度节奏]。[限制条件]。
完整示例
一名穿深灰色西装、黑色齐肩直发的年轻女性设计师站在深夜的办公楼走廊。她突然停下脚步,缓慢低头看向地面,右手逐渐握紧蓝色文件夹。腰部以上中景,人物位于画面右侧,镜头缓慢推近至面部近景。冷白色顶灯轻微闪烁,低饱和蓝灰色调,写实悬疑电影质感。动作自然克制,不新增人物,不出现文字。
图生视频提示词模板
[主体] 从 [初始状态] 开始,[动作过程];[环境轻微变化]。镜头 [运镜方式],[速度节奏]。保持 [人物身份、五官、发型、服装、构图和背景] 不变。
完整示例
女人从低头阅读文件的状态开始,缓慢抬头,视线移向门口,眉头轻微皱起,右手停止翻页。窗帘被微风轻轻吹动。镜头从中景缓慢推近到面部近景。动作平稳自然,保持人物身份、五官、发型、服装、桌面物品和房间布局不变。
30个AI视频提示词示例
人物动作类
回头:年轻女人听到身后声音后停下脚步,先轻微侧头,再缓慢回头看向镜头,眼神由疑惑转为警觉。肩部近景,镜头轻微推近。
起身:男人双手撑住桌面,身体前倾后缓慢站起,目光始终锁定对面的人。腰部以上中景,固定镜头。
奔跑:女孩沿雨夜街道奔跑,外套和头发随步伐自然摆动,脚步踩过积水产生水花。低机位横向跟拍。
落泪:女人保持沉默,眼眶逐渐湿润,一滴眼泪从右眼滑过脸颊,她轻轻吸气并移开视线。面部特写。
拔剑:古装剑客右手握住剑柄,缓慢拔剑,剑身反射冷月光,衣摆被山风吹动。镜头轻微环绕。
运镜类
推近:镜头从房间全景缓慢推向桌上的旧照片,焦点从人物背影转移到照片中的陌生面孔。
拉远:从孤独人物的面部近景缓慢拉远,逐步揭示他独自站在巨大废弃车站中央。
跟拍:摄像机在人物左侧平行跟随,她快步穿过拥挤市场,前景行人自然遮挡后离开画面。
环绕:镜头围绕屋顶上的角色顺时针缓慢环绕半圈,背景城市灯光形成层次。
俯冲:从云层上方的城市远景平稳下降,穿过薄雾接近亮灯高楼,最终停在室内人物背后。
场景氛围类
雨夜悬疑:空旷巷道被蓝色霓虹照亮,雨水持续落下,地面积水倒映招牌,一个撑黑伞的人缓慢走近。
温暖清晨:晨光穿过白色窗帘,尘埃缓慢漂浮,女人端起咖啡走向窗边,生活电影质感。
末日城市:废弃街道覆盖灰尘,远处高楼冒出薄烟,纸张被风卷过地面,背包客谨慎前行。
仙侠云海:白衣剑客站在云海山巅,云层缓慢流动,远处仙鹤掠过,衣袖随风摆动。
未来实验室:透明屏幕发出青色光芒,机械臂有序移动,研究员伸手旋转悬浮三维模型。
短剧剧情类
发现异常:女职员走进办公室后突然停下,发现所有同事都保持同一姿势看向她。越肩镜头缓慢推近。
身份反转:老人摘下眼镜抬头,表情从慈祥变得冷静锐利,桌面警徽逐渐进入前景。
秘密曝光:男人打开抽屉,里面摆着多张同一个人的照片。他的手停在半空,镜头快速推向照片。
久别重逢:车站人群中,两个人隔着数米同时停下,先惊讶对视,再露出克制微笑。暖色逆光。
危险逼近:女人背对房门整理文件,门缝中的影子逐渐靠近。固定镜头,不展示来者面孔。
产品与物体类
手表:黑色智能手表悬浮在深色背景中央,镜头缓慢环绕,金属边缘出现流动高光。
咖啡:热咖啡缓慢倒入透明玻璃杯,蒸汽自然上升,液体形成旋涡。微距镜头,暖色晨光。
汽车:银色跑车沿海岸公路行驶,镜头低机位侧向跟拍,车身反射夕阳。
珠宝:银色项链置于黑色绒布上,镜头缓慢推近,宝石折射细小光点,背景纯净。
书页:古老书籍放在木桌中央,书页被微风翻动,烛光轻微摇曳,镜头从俯拍降低到侧面近景。
动画与特殊风格类
二维动画:短发少年骑自行车穿过夏日小镇,树影在道路上移动,衣角随风摆动,横向跟拍。
水墨动画:一叶小舟从水墨山谷中缓慢驶出,远山被雾气遮挡,墨色在水面自然晕染。
黏土动画:黏土小厨师踮脚搅拌汤锅,蒸汽形成柔软圆润的形状,固定中景。
像素风:像素角色举起火把进入地下洞穴,墙上光影随火焰轻微变化,横向卷轴镜头。
微缩世界:微小工人在巨大键盘上搬运发光字符,镜头从键帽之间低角度穿行,浅景深。
常见错误与改写方法
错误写法 | 问题 | 改写方向 |
|---|---|---|
一个美女在走路 | 主体和场景模糊 | 补充外貌、服装、地点、步伐和景别 |
人物非常害怕 | 情绪不可直接观察 | 改成后退、瞳孔放大、握紧物品 |
镜头很有电影感 | 缺少摄影信息 | 写清运镜、光线和色调 |
跑出门、下楼、上车并离开 | 单镜头动作过多 | 拆成多个3至5秒镜头 |
史诗、可爱、恐怖、浪漫、纪实 | 风格互相冲突 | 只保留一种主要风格 |
不要变形,不要变脸 | 限制过于抽象 | 明确保持五官、发型、服装和背景 |
怎样让AI更准确理解动作?
使用“先、随后、最终”说明动作顺序。
把情绪转换为表情、视线、呼吸和肢体动作。
描述动作幅度,例如轻微、缓慢、快速或突然。
避免在一个短镜头中安排多个地点变化。
多人场景分别说明人物位置、服装和动作。
需要角色稳定时,重复固定身份和外貌锚点。
AI视频提示词检查清单
是否明确主要人物或物体
是否说明地点、时间和环境
是否只有一个核心动作
动作是否写出可观察过程
是否选择合适景别和构图
是否只使用一种主要运镜
光线、色彩和风格是否统一
是否说明动作速度和节奏
图生视频是否写明保持项
是否存在互相冲突的要求
常见问题
AI视频提示词是不是越长越好?
不是。提示词应完整但不混乱。先保证主体、动作、镜头和风格清晰,再添加必要细节。
中文提示词和英文提示词哪个好?
取决于模型支持情况。多数面向中文用户的工具可以直接理解中文,具体、结构清晰比简单翻译更重要。
图生视频还需要描述人物长相吗?
通常不必重复全部外貌,但建议说明人物身份并列出需要保持的五官、发型和服装。
一个提示词可以写多个镜头吗?
模型明确支持多镜头时可以尝试,否则建议每个提示词生成一个镜头,再通过剪辑组合。
为什么写了运镜,镜头还是不动?
可能是描述不明确、主体动作与运镜冲突,或参考图缺少运动空间。只保留一种运镜,并说明起点和终点。
负面提示词越多越好吗?
不是。优先写最重要的保持项和常见错误,大量泛化否定词可能削弱指令重点。
同一套提示词可以用于所有模型吗?
基本结构可以通用,但不同模型对时长、镜头和参考素材的处理不同,应根据实际结果调整。
总结
写好AI视频提示词,关键是把创意转换成模型可以执行的画面变化。先写主体、场景和核心动作,再补充动作过程、景别、运镜、光线、风格和限制条件。文生视频重点描述完整画面,图生视频重点描述运动和保持项。每个镜头只安排一个主要动作,通常比一次生成复杂长镜头更稳定。
继续阅读:AI短剧从剧本到成片的完整流程、AI短剧角色一致性解决方法。