灵绘 AI
2026/6/14

AI视频提示词怎么写?通用公式、模板与30个示例

AI视频提示词怎么写?本文提供从主体、动作、场景、运镜到光线风格的通用公式,并整理30个可直接修改的文生视频和图生视频提示词示例。

AI视频提示词怎么写?通用公式、模板与30个示例

AI视频提示词的核心写法是:先说明谁在什么场景做什么,再补充动作过程、镜头运动、光线氛围、画面风格和保持不变的内容。提示词不一定越长越好,但必须具体、可视化,并符合几秒钟视频能够完成的动作量。

通用公式:主体 + 场景 + 核心动作 + 动作过程 + 景别与构图 + 运镜 + 光线氛围 + 视觉风格 + 速度节奏 + 限制条件

文生视频需要同时说明“画面里有什么”和“画面如何变化”;图生视频已有起始图片,应重点描述主体怎么动、镜头怎么动,以及哪些内容必须保持不变。

什么是AI视频提示词?

AI视频提示词是提供给视频生成模型的文字指令,用来描述主体、场景、动作、镜头和视觉效果。模型会把这些信息转换为连续画面。

类型

主要任务

描述重点

文生视频

从文字创建完整画面

人物、场景、动作、构图、运镜和风格

图生视频

让已有图片产生运动

动作过程、运动幅度、运镜和保持项

首尾帧视频

连接起始与结束画面

变化路径、动作顺序和过渡方式

参考视频生成

借鉴动作或镜头语言

要保留的动作、节奏和角色身份

AI视频提示词通用公式详解

1. 主体

先明确画面中的主要人物或物体。不要只写“一个女人”,应加入与镜头有关的稳定特征。

一名穿深灰色西装、黑色齐肩直发的年轻女性设计师

2. 场景

说明地点、时间、天气和环境。场景描述应服务于剧情,不必堆叠无关细节。

深夜的现代办公楼走廊,冷白色顶灯间歇闪烁,窗外下着大雨

3. 核心动作与过程

动作要写成可以观察的过程。相比“她很害怕”,“她停下脚步、缓慢低头、握紧文件夹”更容易生成。

4. 景别与构图

景别

适用内容

示例

大特写

眼睛、嘴唇、关键道具

眼睛大特写,倒映闪烁红灯

近景

表情和对白

肩部以上近景,人物居中

中景

手势和人物互动

腰部以上中景,人物在画面右侧

全景

完整动作和空间关系

全身全景,人物独自站在大厅

远景

城市、自然和宏大场景

高空远景,展示雨夜未来城市

5. 运镜

运镜

视觉效果

适合场景

缓慢推近

突出表情,增强紧张感

发现秘密、情绪变化

缓慢拉远

揭示环境或孤独感

结尾、反转、空间展示

横向跟拍

跟随主体移动

行走、奔跑、车辆

环绕镜头

增强立体感和戏剧性

角色亮相、产品展示

手持镜头

增加真实感和紧迫感

追逐、冲突、纪实场景

固定镜头

稳定、克制

对白、喜剧、监控视角

6. 光线、色彩与风格

选择一组统一的视觉方向即可,例如“冷蓝色电影灯光、低饱和色调、写实悬疑电影质感”。过多风格词可能互相冲突。

7. 速度与限制条件

说明动作快慢,并指出需要保持不变的部分。图生视频尤其需要这一项。

动作缓慢克制,镜头运动平稳;保持人物脸型、五官、发型、服装和背景结构不变,不新增人物。

文生视频提示词模板

[主体详细描述] 位于 [场景、时间和天气],[核心动作],[动作变化过程]。[景别和构图],[运镜方式]。[光线、色彩和氛围],[视觉风格],[速度节奏]。[限制条件]。

完整示例

一名穿深灰色西装、黑色齐肩直发的年轻女性设计师站在深夜的办公楼走廊。她突然停下脚步,缓慢低头看向地面,右手逐渐握紧蓝色文件夹。腰部以上中景,人物位于画面右侧,镜头缓慢推近至面部近景。冷白色顶灯轻微闪烁,低饱和蓝灰色调,写实悬疑电影质感。动作自然克制,不新增人物,不出现文字。

图生视频提示词模板

[主体] 从 [初始状态] 开始,[动作过程];[环境轻微变化]。镜头 [运镜方式],[速度节奏]。保持 [人物身份、五官、发型、服装、构图和背景] 不变。

完整示例

女人从低头阅读文件的状态开始,缓慢抬头,视线移向门口,眉头轻微皱起,右手停止翻页。窗帘被微风轻轻吹动。镜头从中景缓慢推近到面部近景。动作平稳自然,保持人物身份、五官、发型、服装、桌面物品和房间布局不变。

30个AI视频提示词示例

人物动作类

  1. 回头:年轻女人听到身后声音后停下脚步,先轻微侧头,再缓慢回头看向镜头,眼神由疑惑转为警觉。肩部近景,镜头轻微推近。

  2. 起身:男人双手撑住桌面,身体前倾后缓慢站起,目光始终锁定对面的人。腰部以上中景,固定镜头。

  3. 奔跑:女孩沿雨夜街道奔跑,外套和头发随步伐自然摆动,脚步踩过积水产生水花。低机位横向跟拍。

  4. 落泪:女人保持沉默,眼眶逐渐湿润,一滴眼泪从右眼滑过脸颊,她轻轻吸气并移开视线。面部特写。

  5. 拔剑:古装剑客右手握住剑柄,缓慢拔剑,剑身反射冷月光,衣摆被山风吹动。镜头轻微环绕。

运镜类

  1. 推近:镜头从房间全景缓慢推向桌上的旧照片,焦点从人物背影转移到照片中的陌生面孔。

  2. 拉远:从孤独人物的面部近景缓慢拉远,逐步揭示他独自站在巨大废弃车站中央。

  3. 跟拍:摄像机在人物左侧平行跟随,她快步穿过拥挤市场,前景行人自然遮挡后离开画面。

  4. 环绕:镜头围绕屋顶上的角色顺时针缓慢环绕半圈,背景城市灯光形成层次。

  5. 俯冲:从云层上方的城市远景平稳下降,穿过薄雾接近亮灯高楼,最终停在室内人物背后。

场景氛围类

  1. 雨夜悬疑:空旷巷道被蓝色霓虹照亮,雨水持续落下,地面积水倒映招牌,一个撑黑伞的人缓慢走近。

  2. 温暖清晨:晨光穿过白色窗帘,尘埃缓慢漂浮,女人端起咖啡走向窗边,生活电影质感。

  3. 末日城市:废弃街道覆盖灰尘,远处高楼冒出薄烟,纸张被风卷过地面,背包客谨慎前行。

  4. 仙侠云海:白衣剑客站在云海山巅,云层缓慢流动,远处仙鹤掠过,衣袖随风摆动。

  5. 未来实验室:透明屏幕发出青色光芒,机械臂有序移动,研究员伸手旋转悬浮三维模型。

短剧剧情类

  1. 发现异常:女职员走进办公室后突然停下,发现所有同事都保持同一姿势看向她。越肩镜头缓慢推近。

  2. 身份反转:老人摘下眼镜抬头,表情从慈祥变得冷静锐利,桌面警徽逐渐进入前景。

  3. 秘密曝光:男人打开抽屉,里面摆着多张同一个人的照片。他的手停在半空,镜头快速推向照片。

  4. 久别重逢:车站人群中,两个人隔着数米同时停下,先惊讶对视,再露出克制微笑。暖色逆光。

  5. 危险逼近:女人背对房门整理文件,门缝中的影子逐渐靠近。固定镜头,不展示来者面孔。

产品与物体类

  1. 手表:黑色智能手表悬浮在深色背景中央,镜头缓慢环绕,金属边缘出现流动高光。

  2. 咖啡:热咖啡缓慢倒入透明玻璃杯,蒸汽自然上升,液体形成旋涡。微距镜头,暖色晨光。

  3. 汽车:银色跑车沿海岸公路行驶,镜头低机位侧向跟拍,车身反射夕阳。

  4. 珠宝:银色项链置于黑色绒布上,镜头缓慢推近,宝石折射细小光点,背景纯净。

  5. 书页:古老书籍放在木桌中央,书页被微风翻动,烛光轻微摇曳,镜头从俯拍降低到侧面近景。

动画与特殊风格类

  1. 二维动画:短发少年骑自行车穿过夏日小镇,树影在道路上移动,衣角随风摆动,横向跟拍。

  2. 水墨动画:一叶小舟从水墨山谷中缓慢驶出,远山被雾气遮挡,墨色在水面自然晕染。

  3. 黏土动画:黏土小厨师踮脚搅拌汤锅,蒸汽形成柔软圆润的形状,固定中景。

  4. 像素风:像素角色举起火把进入地下洞穴,墙上光影随火焰轻微变化,横向卷轴镜头。

  5. 微缩世界:微小工人在巨大键盘上搬运发光字符,镜头从键帽之间低角度穿行,浅景深。

常见错误与改写方法

错误写法

问题

改写方向

一个美女在走路

主体和场景模糊

补充外貌、服装、地点、步伐和景别

人物非常害怕

情绪不可直接观察

改成后退、瞳孔放大、握紧物品

镜头很有电影感

缺少摄影信息

写清运镜、光线和色调

跑出门、下楼、上车并离开

单镜头动作过多

拆成多个3至5秒镜头

史诗、可爱、恐怖、浪漫、纪实

风格互相冲突

只保留一种主要风格

不要变形,不要变脸

限制过于抽象

明确保持五官、发型、服装和背景

怎样让AI更准确理解动作?

  • 使用“先、随后、最终”说明动作顺序。

  • 把情绪转换为表情、视线、呼吸和肢体动作。

  • 描述动作幅度,例如轻微、缓慢、快速或突然。

  • 避免在一个短镜头中安排多个地点变化。

  • 多人场景分别说明人物位置、服装和动作。

  • 需要角色稳定时,重复固定身份和外貌锚点。

AI视频提示词检查清单

  • 是否明确主要人物或物体

  • 是否说明地点、时间和环境

  • 是否只有一个核心动作

  • 动作是否写出可观察过程

  • 是否选择合适景别和构图

  • 是否只使用一种主要运镜

  • 光线、色彩和风格是否统一

  • 是否说明动作速度和节奏

  • 图生视频是否写明保持项

  • 是否存在互相冲突的要求

常见问题

AI视频提示词是不是越长越好?

不是。提示词应完整但不混乱。先保证主体、动作、镜头和风格清晰,再添加必要细节。

中文提示词和英文提示词哪个好?

取决于模型支持情况。多数面向中文用户的工具可以直接理解中文,具体、结构清晰比简单翻译更重要。

图生视频还需要描述人物长相吗?

通常不必重复全部外貌,但建议说明人物身份并列出需要保持的五官、发型和服装。

一个提示词可以写多个镜头吗?

模型明确支持多镜头时可以尝试,否则建议每个提示词生成一个镜头,再通过剪辑组合。

为什么写了运镜,镜头还是不动?

可能是描述不明确、主体动作与运镜冲突,或参考图缺少运动空间。只保留一种运镜,并说明起点和终点。

负面提示词越多越好吗?

不是。优先写最重要的保持项和常见错误,大量泛化否定词可能削弱指令重点。

同一套提示词可以用于所有模型吗?

基本结构可以通用,但不同模型对时长、镜头和参考素材的处理不同,应根据实际结果调整。

总结

写好AI视频提示词,关键是把创意转换成模型可以执行的画面变化。先写主体、场景和核心动作,再补充动作过程、景别、运镜、光线、风格和限制条件。文生视频重点描述完整画面,图生视频重点描述运动和保持项。每个镜头只安排一个主要动作,通常比一次生成复杂长镜头更稳定。

继续阅读:AI短剧从剧本到成片的完整流程AI短剧角色一致性解决方法