Skip to main content

概述

对口型(lip-sync)用于将已有视频与音频或文本结合,生成嘴型同步的视频。
[!NOTE]
  • 本平台接口POST https://models.kapon.cloud/vidu/ent/v2/lip-sync
  • 官方接口POST https://api.vidu.cn/ent/v2/lip-sync,详见 官方 API 文档

请求参数

参数类型必填说明
video_urlstring原视频 URL
audio_urlstring⚠️音频文件 URL(与 text 二选一)
textstring⚠️驱动口型的文本(与 audio_url 二选一)
speedfloat语速 0.5–2,默认 1.0(仅文字驱动)
voice_idstring音色 ID(仅文字驱动)
ref_photo_urlstring人脸参考图 URL(多人脸时指定目标)
volumeint音量 0–10,默认 0
callback_urlstring回调地址
payloadstring透传字段
[!IMPORTANT] audio_urltext 至少需要提供其中之一。

音频驱动

curl -X POST "https://models.kapon.cloud/vidu/ent/v2/lip-sync" \
  -H "Authorization: Bearer <kapon Token>" \
  -H "Content-Type: application/json" \
  -d '{
    "video_url": "https://your.cdn.com/source.mp4",
    "audio_url": "https://your.cdn.com/audio.wav",
    "callback_url": "https://your.service.com/callback"
  }'
支持的音频格式: wav / mp3 / wma / m4a / aac / ogg

文本驱动

curl -X POST "https://models.kapon.cloud/vidu/ent/v2/lip-sync" \
  -H "Authorization: Bearer <kapon Token>" \
  -H "Content-Type: application/json" \
  -d '{
    "video_url": "https://your.cdn.com/source.mp4",
    "text": "你好<#2#>我是 Vidu<#1.5#>很高兴见到你",
    "speed": 1.0,
    "voice_id": "your_voice_id"
  }'
文本语法: 使用 <#x#> 插入 x 秒停顿

返回示例

{
  "task_id": "your_task_id_here",
  "state": "created",
  "payload": "user_123_order_456",
  "created_at": "2025-01-01T15:41:31.968Z"
}

视频要求

  • 编码:H.264
  • 时长:1–600 秒
  • 大小:≤ 5GB

查询结果

任务创建成功后,通过 任务查询 接口获取最终结果。