视频生成

使用 OpenAI Sora 模型生成视频内容。kapon 支持完整的视频生成工作流，包括任务创建、状态查询和内容下载。

创建视频任务

通过提供文本提示词来生成视频：

curl -X POST "https://models.kapon.cloud/v1/videos" \
  -H "Authorization: Bearer $TOKEN" \
  -F "model=sora-2" \
  -F "prompt=百事可乐宣传片" \
  -F "seconds=10" \
  -F "size=720x1280"

请求参数

说明：OpenAI 官方 / Azure OpenAI 渠道不会对 seconds 做归一化，直接透传。

model：模型名称，支持 sora-2 和 sora-2-pro
prompt：视频生成的文本描述
seconds：视频时长（秒，字符串传递更兼容）。常见可用档位：
- sora-2：10、15
- sora-2-pro：15、25
- OpenAI 官方 API 仅支持：4、8、12
size：视频分辨率（或宽高比）。平台会按上游能力做兼容与映射，建议优先使用“标准分辨率”：
- sora-2：720x1280、1280x720
- sora-2-pro：720x1280、1280x720、1024x1792、1792x1024 常见兼容输入（会自动映射到上述标准分辨率）：
- 宽高比：16x9、9x16

时长选择建议：

快速预览：优先 10 秒（若使用 OpenAI 官方 API，请按其仅支持的 4/8/12 秒档位）
正式成片：sora-2-pro 的 25 秒可以呈现更完整叙事，但生成与下载时间也更长

角色视频（Character）扩展（特定上游）

当 OpenAI 渠道的上游支持 Sora 角色扩展能力时，平台会对 /v1/videos 进行扩展，支持官方文档中的角色相关参数。典型用法是先通过 /sora/v1/characters 创建一个角色，再在视频提示词或参数中引用该角色。

额外参数（仅在支持该扩展能力的上游生效）

character_url：包含目标角色的视频 URL（通常与 /sora/v1/characters 中的 url 一致）
character_timestamps：角色在视频中的时间片段范围，单位秒，格式如 1,3（表示 1～3 秒）
private：是否为私有角色，字符串 "true" 或 "false"（不填时由上游按默认策略处理）

JSON 调用示例（支持角色扩展的上游）

curl -X POST "https://models.kapon.cloud/v1/videos" \
  -H "Authorization: Bearer $TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "sora-2",
    "prompt": "让刚才创建的角色在咖啡馆场景中阅读一本书",
    "seconds": 10,
    "size": "16x9",
    "character_url": "https://filesystem.site/cdn/20251030/example-character.mp4",
    "character_timestamps": "1,3",
    "private": "false"
  }'

在上述特定上游场景下：

JSON 请求会在网关层自动转换为 multipart/form-data，并透传上述字段到上游；
multipart 请求则保持原样透传，你也可以直接使用 -F character_url=... 的形式提交。

响应示例

{
  "id": "video_691209aab0a08198a4e78870277f7e3d0215e09cec47a737",
  "object": "video",
  "created_at": 1762789802,
  "status": "queued",
  "model": "sora-2",
  "prompt": "百事可乐宣传片",
  "progress": 0,
  "seconds": "10",
  "size": "720x1280"
}

状态说明

任务创建后会经历以下状态：

queued：任务已排队，等待处理
processing：正在生成视频
completed：生成完成，可以下载视频
failed：生成失败

任务完成后，响应会包含 completed_at（完成时间）和 expires_at（过期时间）字段。视频文件会在过期时间后自动删除。

错误处理

当任务状态为 failed 时，响应中会包含 error 字段，说明失败原因。kapon 对各上游供应商的错误进行了统一归一化处理，方便开发者做错误判断和用户提示。

错误响应结构

{
  "id": "video_xxx",
  "status": "failed",
  "error": {
    "type": "one_hub_error",
    "code": "content_policy_violation",
    "category": "policy",
    "retryable": true,
    "message": "视频内容违反安全策略"
  }
}

错误字段说明

字段	类型	说明
`type`	string	错误类型标识，固定为 `one_hub_error`
`code`	string	标准化错误码，见下表
`category`	string	错误分类，用于快速判断错误类型
`retryable`	boolean	是否建议重试
`message`	string	人类可读的错误描述

标准错误码

错误码	分类	可重试	说明
`content_policy_violation`	policy	❌	内容违反安全策略（通用）
`content_policy_violation_real_person_image`	policy	❌	涉及写实人物/人脸生成被拒绝
`content_policy_violation_sexual`	policy	❌	涉及裸露或色情内容
`content_policy_violation_harassment_hate`	policy	❌	涉及骚扰、歧视或仇恨内容
`resource_exhausted`	resource	✅	上游资源繁忙或容量不足
`rate_limited`	upstream	✅	请求频率超限
`upstream_timeout`	upstream	✅	上游服务超时
`upstream_error`	upstream	✅	上游服务内部错误
`invalid_request`	request	❌	请求参数无效
`unknown_error`	unknown	❌	未知错误

错误分类说明

分类	含义	建议处理方式
`policy`	内容安全策略	修改 prompt 或更换图片后重新提交（直接重试无效）
`resource`	资源限制	等待一段时间后重试
`upstream`	上游服务问题	稍后重试，通常为临时性问题
`request`	请求参数问题	检查并修正请求参数
`unknown`	未知错误	联系平台支持

处理建议：

policy 类错误：内容审核未通过，直接重试无效，需修改描述或更换图片后重新提交
resource/upstream 类错误：属于临时性问题，建议使用指数退避策略自动重试
request 类错误：参数有误，请检查 message 字段中的具体提示

错误处理示例

job = client.videos.retrieve(video_id)

if job.status == "failed":
    error = job.error
    
    if error.category == "policy":
        print(f"内容审核未通过: {error.message}")
        print("建议: 请修改 prompt 后重试")
    elif error.category in ("resource", "upstream"):
        if error.retryable:
            print(f"临时错误: {error.code}，将在 30 秒后重试")
            time.sleep(30)
            # 重新提交任务...
    elif error.category == "request":
        print(f"请求参数错误: {error.message}")
    else:
        print(f"未知错误: {error.code} - {error.message}")

完整示例

创建任务并等待完成：

# 1. 创建视频任务
RESPONSE=$(curl -X POST "https://models.kapon.cloud/v1/videos" \
  -H "Authorization: Bearer $TOKEN" \
  -F "model=sora-2" \
  -F "prompt=百事可乐宣传片" \
  -F "seconds=10" \
  -F "size=720x1280")

VIDEO_ID=$(echo $RESPONSE | jq -r '.id')
echo "视频任务 ID: $VIDEO_ID"

# 2. 轮询查询状态
while true; do
  RESPONSE=$(curl "https://models.kapon.cloud/v1/videos/$VIDEO_ID" \
    -H "Authorization: Bearer $TOKEN")
  
  STATUS=$(echo $RESPONSE | jq -r '.status')
  PROGRESS=$(echo $RESPONSE | jq -r '.progress')
  
  echo "当前状态: $STATUS (进度: $PROGRESS%)"
  
  if [ "$STATUS" = "completed" ]; then
    echo "✓ 视频生成完成"
    break
  elif [ "$STATUS" = "failed" ]; then
    echo "✗ 视频生成失败"
    exit 1
  fi
  
  sleep 5
done

# 3. 下载视频
curl -L "https://models.kapon.cloud/v1/videos/$VIDEO_ID/content" \
  -H "Authorization: Bearer $TOKEN" \
  --output "${VIDEO_ID}.mp4"

echo "✓ 视频已保存到 ${VIDEO_ID}.mp4"

kapon 会对不同供应商的返回结构进行统一封装，status 字段取值为 queued、processing、completed、failed 等。视频完成后会包含 completed_at 和 expires_at 时间戳。

计费模型与升级说明

计费模式：Sora 视频任务采用“终态实扣，失败不扣”的模式：
- 创建阶段：仅记录任务与预估信息，不对用户/Token 实际扣费；
- 终态结算：当任务进入 completed 或 failed 时，由后台轮询器根据最终时长与价目表一次性结算；
- 失败任务：不扣费，仅更新计费状态。
新旧版本兼容：
- 老版本曾采用“创建阶段先扣，失败时退款”的策略，部分历史任务的计费记录可能存在“预扣 + 退款”；
- 新版本仅对创建时 Quota=0 的任务启用终态计费；历史数据的对账与核对可以通过 logs.metadata.platform_task_id 与 tasks.platform_task_id 进行关联审计。

脚本示例（Python，本地文件参考图）

仓库提供了基于 openai Python SDK 的本地验证脚本，可通过 input_reference 上传参考图并自动轮询与下载：

export OPENAI_BASE_URL="https://models.kapon.cloud/v1"
export OPENAI_API_KEY="$TOKEN"

python3 scripts/sora2_image_to_video_sdk.py \
  --prompt "百事可乐宣传片" \
  --seconds 4 \
  --size 720x1280 \
  --image /absolute/path/to/ref.jpg \
  --output sora_video.mp4

参考图生视频（Image-to-Video）

除纯文本生视频外，kapon 也支持“带参考图”的视频生成。按照 OpenAI Sora 的接口规范，在创建任务时以 multipart/form-data 方式上传参考图文件字段 input_reference。

curl 示例（multipart）

curl -X POST "https://models.kapon.cloud/v1/videos" \
  -H "Authorization: Bearer $TOKEN" \
  -F "model=sora-2" \
  -F "prompt=百事可乐宣传片，都市街拍风，年轻活力，镜头运动丰富" \
  -F "seconds=10" \
  -F "size=720x1280" \
  -F "input_reference=@/absolute/path/to/ref.jpg"

若通道为 OpenAI 官方 API，seconds 必须是 4、8 或 12 且需在 multipart 表单中显式提供。请确保 -F seconds=8 使用的是纯数字，不要加引号，也不要误用 Bash/Zsh 的保留变量 SECONDS。

Python SDK 示例（openai-python）

from openai import OpenAI

client = OpenAI(
    base_url="https://models.kapon.cloud/v1",
    api_key="$TOKEN",
)

with open("./ref.jpg", "rb") as f:
    job = client.videos.create(
        model="sora-2",
        prompt="百事可乐宣传片，都市街拍风，年轻活力，镜头运动丰富",
        seconds="10",         # 以字符串传递更兼容
        size="720x1280",
        input_reference=f,     # 关键：参考图文件
    )

print("任务ID:", job.id, "状态:", job.status)

# 轮询
import time
while True:
    cur = client.videos.retrieve(job.id)
    print("状态:", cur.status, "进度:", getattr(cur, "progress", None))
    if cur.status in ("completed", "failed"):
        job = cur
        break
    time.sleep(2)

if job.status == "completed":
    content = client.videos.download_content(job.id)
    content.write_to_file("output.mp4")
    print("已保存到 output.mp4")
else:
    print("生成失败:", getattr(job, "error", None))

本仓库已提供两个可执行脚本便于本地验证：

curl 版本：scripts/validate_image2video.sh（自动下载示例参考图、轮询并下载成片）
SDK 版本：scripts/sora2_image_to_video_sdk.py（基于 openai Python SDK，支持 --image/--seconds/--size 参数）

Authorizations

Authorization

string

header

required

API Key

Body

model

enum<string>

required

模型名称

Available options:

veo-3.1-generate-preview,

veo-3.1-fast-generate-preview

Example:

"veo-3.1-fast-generate-preview"

prompt

string

required

文本提示词

Example:

"A cinematic lion at sunset"

seconds

视频时长（秒）：4、6、8

Example:

6

size

enum<string>

default:1280x720

分辨率

Available options:

1280x720,

720x1280,

1920x1080,

1080x1920

Example:

"1280x720"

input_reference

string[]

参考图 URL 数组（1-3 张）

Example:

["https://example.com/image.jpg"]

Response

任务创建成功

string

任务 ID

Example:

"video_abc123"

object

enum<string>

Available options:

video

Example:

"video"

created_at

integer

创建时间戳

Example:

1761234567

completed_at

integer

完成时间戳

status

enum<string>

任务状态

Available options:

queued,

in_progress,

completed,

failed

Example:

"queued"

model

string

模型名称

Example:

"veo-3.1-fast-generate-preview"

prompt

string

提示词

progress

number

进度（0-100）

Example:

0

seconds

integer

视频时长

Example:

6

size

string

分辨率

Example:

"1280x720"

video_url

string

视频直链（完成后返回）

error

object

Show child attributes

概述

文本生成

音频

图像

视频

其他

创建视频任务

请求参数

角色视频（Character）扩展（特定上游）

额外参数（仅在支持该扩展能力的上游生效）

JSON 调用示例（支持角色扩展的上游）

响应示例

状态说明

错误处理

错误响应结构

错误字段说明

标准错误码

错误分类说明

错误处理示例

完整示例

计费模型与升级说明

脚本示例（Python，本地文件参考图）

参考图生视频（Image-to-Video）

curl 示例（multipart）

Python SDK 示例（openai-python）

Authorizations

Body

Response

概述

文本生成

音频

图像

视频

其他

​创建视频任务

​请求参数

​角色视频（Character）扩展（特定上游）

​额外参数（仅在支持该扩展能力的上游生效）

​JSON 调用示例（支持角色扩展的上游）

​响应示例

​状态说明

​错误处理

​错误响应结构

​错误字段说明

​标准错误码

​错误分类说明

​错误处理示例

​完整示例

​计费模型与升级说明

​脚本示例（Python，本地文件参考图）

​参考图生视频（Image-to-Video）

​curl 示例（multipart）

​Python SDK 示例（openai-python）

Authorizations

Body

Response

创建视频任务

请求参数

角色视频（Character）扩展（特定上游）

额外参数（仅在支持该扩展能力的上游生效）

JSON 调用示例（支持角色扩展的上游）

响应示例

状态说明

错误处理

错误响应结构

错误字段说明

标准错误码

错误分类说明

错误处理示例

完整示例

计费模型与升级说明

脚本示例（Python，本地文件参考图）

参考图生视频（Image-to-Video）

curl 示例（multipart）

Python SDK 示例（openai-python）