跳转到内容
中文

Veo 3.1 Fast API

POST /v1/tasks

所有模型都通过 统一异步接口 POST /v1/tasks 调用,区别只在 input 字段(见下方 input 参数)。

模型概览

模型名称 veo-3.1-fast/text-to-video
类型 视频生成(文生视频)
接口 POST /v1/tasks
价格 HiAPI 定价

Google Veo 3.1 Fast 文生视频 API,支持原生音频和最高 4K 分辨率,生成 4 / 6 / 8 秒视频片段,在画质与速度间取得平衡,适合快速产出带声音的短视频。

生产建议

生产环境建议
  • 生产环境建议在请求体顶层传 callback.url,让 HiAPI 在任务进入终态时主动通知你的服务,减少无效轮询。
  • GET /v1/tasks/:id 更适合本地调试、低频任务,或作为回调失败后的补偿查询。
  • callback.when 当前建议固定为 final;success 和 fail 都可能触发终态通知,你的服务端需要按 taskId 做幂等处理。

适用场景

带声音的短视频

一次生成画面和原生音频(环境音/配乐),省去后期配音,适合社媒短视频、广告片头。

promptgenerate_audio
快速创意验证

4 / 6 / 8 秒短片快速返回,适合分镜验证、批量试拍和创意打样。

durationresolution
高清到 4K 交付

支持 720p / 1080p / 4K,按需选清晰度,满足需要高分辨率成片的投放场景。

resolution
横竖屏适配

16:9 与 9:16 用一套提示词适配信息流横屏和竖屏短视频。

aspect_ratio

请求参数

model string 必填

固定填 veo-3.1-fast/text-to-video。

示例 veo-3.1-fast/text-to-video
input object 必填

业务参数对象;Veo 3.1 Fast 的模型专属配置都放在这里。

prompt string 必填

描述要生成视频内容的文本提示词。

aspect_ratio enum 可选

输出视频的画面比例。

默认 16:9 可选值: 16:99:16
resolution enum 必填

输出视频分辨率,分辨率越高单价越高。

默认 720p 可选值: 720p1080p4k
duration enum 必填

视频时长(秒),按秒计费,时长越长费用越高。

默认 8 可选值: 468
generate_audio boolean 可选

是否生成原生音频轨道;开启时单价更高,画面不需要声音时设为 false 可降本。

默认 true
negative_prompt string 可选

描述视频中要避免出现的内容。

seed integer 可选

随机种子,用于可复现生成。

callback object 可选

可选回调配置;设置后任务进入终态时 HiAPI 会主动通知你的服务,减少轮询。

url string 必填

传入 callback 时必填;接收任务终态通知的 HTTPS 地址。

示例 https://your-domain.com/hiapi/callback
when enum 可选

回调触发时机;当前建议固定为 final。

默认 final 可选值: final

用例示例

带音频的电影感短片

默认含音,1080p / 8 秒,适合需要声音和叙事感的成片。

请求体
{
  "model": "veo-3.1-fast/text-to-video",
  "input": {
    "prompt": "夕阳下金毛犬在沙滩奔跑,慢动作,海浪轻拍,电影感暖光",
    "aspect_ratio": "16:9",
    "resolution": "1080p",
    "duration": 8,
    "generate_audio": true
  }
}
竖屏短视频(无音更省)

9:16 竖屏、720p / 4 秒、关闭音频,适合成本敏感的批量竖屏内容。

请求体
{
  "model": "veo-3.1-fast/text-to-video",
  "input": {
    "prompt": "雨后夜晚的霓虹街道,地面倒影,赛博朋克氛围",
    "aspect_ratio": "9:16",
    "resolution": "720p",
    "duration": 4,
    "generate_audio": false
  }
}
4K 高清成片

4K / 8 秒、含音,适合需要高分辨率交付的场景。

请求体
{
  "model": "veo-3.1-fast/text-to-video",
  "input": {
    "prompt": "晨雾中的雪山湖泊,镜头缓缓推进,宁静辽阔",
    "aspect_ratio": "16:9",
    "resolution": "4k",
    "duration": 8,
    "generate_audio": true
  }
}

获取结果

  1. 提交成功后立即返回 taskId(不等待生成完成)。
  2. 生产环境优先等待 callback.url 收到终态通知;本地调试时可轮询 GET /v1/tasks/:id。
  3. status=success 后,从返回的 output[].url 下载生成的视频。
  4. 如果 status=fail,按返回的错误信息修正请求,不要盲目重试同一个无效请求。

常见问题

Veo 3.1 Fast 支持哪些分辨率和时长?

分辨率支持 720p / 1080p / 4K,时长支持 4 / 6 / 8 秒。价格按分辨率和时长(按秒)组合计费,4K 和开启音频单价更高,实时价格见价格页。 查看价格

generate_audio 怎么影响价格?

开启原生音频(generate_audio=true)单价更高;画面不需要声音时设为 false 可明显降本。每秒单价以价格页为准。 查看价格

怎么拿到生成的视频?

提交后立即返回 taskId,任务进入终态后从 output[].url 下载视频。生产环境建议在请求体顶层传 callback.url 收终态通知,减少无效轮询。

支持图生视频或参考图吗?

veo-3.1-fast/text-to-video 是纯文生视频,只接受文本提示词,不接受参考图输入。

下一步