本文面向平台开发者,说明如何通过 kapon 统一 API 调用阿里百炼模型。你不需要直接保存阿里云百炼 API Key,也不需要直连 DashScope endpoint;后台渠道由平台管理员配置,开发者只使用 kapon Token 和模型名。
当前文档覆盖北京站百炼渠道。模型是否可用取决于你的 kapon Token 权限、平台渠道配置、阿里百炼账号权益和 GET /v1/models 的实时返回。
环境配置
export BASE_URL="https://models.kapon.cloud"
export TOKEN="your-api-token"
所有接口统一使用 Bearer Token:
Authorization: Bearer $TOKEN
快速体验
curl -X POST "$BASE_URL/v1/chat/completions" \
-H "Authorization: Bearer $TOKEN" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3.7-plus",
"messages": [
{"role": "user", "content": "用一句话介绍阿里百炼。"}
]
}'
支持的接口
| 能力 | 接口 | 说明 |
|---|
| 模型列表 | GET /v1/models | 返回当前 Token 可见模型 |
| Chat Completions | POST /v1/chat/completions | 文本、流式、部分视觉理解模型 |
| Responses | POST /v1/responses | OpenAI Responses 兼容入口,支持非流式与流式 |
| Anthropic Messages | POST /v1/messages | Anthropic Messages 兼容入口,后台转发到百炼 Anthropic path,并透传 thinking、tool、媒体输入和缓存字段 |
| Embeddings | POST /v1/embeddings | 文本向量 |
| 图像生成 | POST /v1/images/generations | 百炼文生图模型 |
| 图像编辑 | POST /v1/images/edits | 百炼改图模型,建议使用 URL 形式图片输入 |
| 视频创建 | POST /v1/videos | 百炼异步视频任务 |
| 视频查询 | GET /v1/videos/{video_id} | 查询任务状态和产物 |
| 视频下载 | GET /v1/videos/{video_id}/content | 下载完成后的视频文件 |
推荐先调用 GET /v1/models 确认账号可见模型,再发起生成请求。百炼上的第三方模型也会受上游权益控制。
页面导航
模型清单
P0 主推模型
| 分类 | 模型 | 推荐用途 |
|---|
| Qwen 文本 | qwen3.7-max | 高质量文本、复杂推理、Agent |
| Qwen 文本 | qwen3.7-plus | 通用文本、多模态理解、成本和质量均衡 |
| Qwen 文本 | qwen3.6-flash | 低延迟、高吞吐文本 |
| Qwen 文本 | qwen-flash | 轻量问答、低成本场景 |
| 第三方文本 | deepseek-v4-pro, deepseek-v4-flash | DeepSeek 系列文本能力 |
| 第三方文本 | glm-5.1 | GLM 系列文本能力 |
| 第三方文本 | kimi-k2.6, kimi-k2.5 | Kimi 系列文本能力 |
| 第三方文本 | MiniMax-M2.5 | MiniMax 系列文本能力 |
| Embedding | text-embedding-v4 | 文本向量、检索、RAG |
| 图像生成 | wan2.7-image-pro, wan2.7-image | 百炼 Wan 文生图 |
| 图像生成 | qwen-image-2.0-pro, qwen-image-2.0 | Qwen Image 文生图 |
| 图像编辑 | qwen-image-edit-max, qwen-image-edit-plus, qwen-image-edit | 改图、参考图编辑 |
| 视频生成 | happyhorse-1.0-t2v, happyhorse-1.0-i2v | 文生视频、图生视频 |
| 视频生成 | wan2.7-t2v, wan2.7-i2v | Wan 文生视频、图生视频 |
P1 扩展模型
| 分类 | 模型 |
|---|
| Qwen 开源新版 | qwen3.6-35b-a3b, qwen3.6-27b, qwen3.5-397b-a17b, qwen3.5-122b-a10b, qwen3.5-35b-a3b, qwen3.5-27b |
| 厂商命名空间 | kimi/kimi-k2.6, kimi/kimi-k2.5, ZHIPU/GLM-5.1, ZHIPU/GLM-5, MiniMax/MiniMax-M3, MiniMax/MiniMax-M2.7, MiniMax/MiniMax-M2.5, xiaomi/mimo-v2.5-pro, vanchin/deepseek-v4-pro |
| 视频参考/编辑 | happyhorse-1.0-r2v, happyhorse-1.0-video-edit, wan2.7-r2v, wan2.7-videoedit |
不再推荐的旧模型
qwen-turbo、qwen-plus、qwen-max、qwen-max-longcontext、text-embedding-v1、旧 DeepSeek、旧 GLM、旧 Kimi、旧 MiniMax 和旧 Qwen3/Coder 快照模型不在默认推荐列表中。
如果平台管理员手动配置了旧模型,kapon 不会在网关侧强制拦截;实际可用性和错误信息由阿里百炼上游返回。
Chat Completions
非流式
curl -X POST "$BASE_URL/v1/chat/completions" \
-H "Authorization: Bearer $TOKEN" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3.7-plus",
"messages": [
{"role": "system", "content": "你是一个简洁的中文助手。"},
{"role": "user", "content": "写一个三点式项目风险清单。"}
]
}'
curl -N -X POST "$BASE_URL/v1/chat/completions" \
-H "Authorization: Bearer $TOKEN" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3.7-plus",
"stream": true,
"messages": [
{"role": "user", "content": "给我一个 30 字以内的产品标题。"}
]
}'
图像理解
curl -X POST "$BASE_URL/v1/chat/completions" \
-H "Authorization: Bearer $TOKEN" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3-vl-plus",
"messages": [
{
"role": "user",
"content": [
{"type": "text", "text": "描述这张图的主体和风格。"},
{"type": "image_url", "image_url": {"url": "https://example.com/image.jpg"}}
]
}
]
}'
Responses
curl -X POST "$BASE_URL/v1/responses" \
-H "Authorization: Bearer $TOKEN" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3.7-plus",
"input": [
{
"role": "user",
"content": [
{"type": "input_text", "text": "把这段需求整理成验收标准。"}
]
}
]
}'
流式调用时加入 "stream": true。
Anthropic Messages
curl -X POST "$BASE_URL/v1/messages" \
-H "Authorization: Bearer $TOKEN" \
-H "anthropic-version: 2023-06-01" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3.7-plus",
"max_tokens": 1024,
"messages": [
{"role": "user", "content": "用 Anthropic Messages 格式返回一句问候。"}
]
}'
该入口透传 Anthropic Messages 请求/响应字段,包括 anthropic-version、anthropic-beta、thinking、tool、媒体输入和 cache_control。复杂 tool 结果、多轮 thinking、媒体输入与缓存组合仍建议按模型做真实上游抽样。
Embeddings
curl -X POST "$BASE_URL/v1/embeddings" \
-H "Authorization: Bearer $TOKEN" \
-H "Content-Type: application/json" \
-d '{
"model": "text-embedding-v4",
"input": ["阿里百炼模型接入", "统一网关与计费"]
}'
图像生成
curl -X POST "$BASE_URL/v1/images/generations" \
-H "Authorization: Bearer $TOKEN" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen-image-2.0-pro",
"prompt": "一张干净的 SaaS 控制台产品宣传图,真实屏幕,浅色背景",
"size": "1024x1024",
"response_format": "url",
"n": 1
}'
图像编辑
curl -X POST "$BASE_URL/v1/images/edits" \
-H "Authorization: Bearer $TOKEN" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen-image-edit-plus",
"prompt": "保持主体不变,替换为干净的电商白底图",
"images": [
{"image_url": "https://example.com/product.png"}
],
"size": "1024x1024",
"response_format": "url",
"n": 1
}'
视频生成
百炼视频任务是异步任务。创建任务后,使用任务 ID 查询状态,完成后再下载文件。
文生视频
curl -X POST "$BASE_URL/v1/videos" \
-H "Authorization: Bearer $TOKEN" \
-H "Content-Type: application/json" \
-d '{
"model": "wan2.7-t2v",
"prompt": "城市夜景中的新能源车广告片,电影感镜头,平稳推进",
"seconds": 5,
"resolution": "720p"
}'
图生视频
curl -X POST "$BASE_URL/v1/videos" \
-H "Authorization: Bearer $TOKEN" \
-H "Content-Type: application/json" \
-d '{
"model": "wan2.7-i2v",
"prompt": "让画面中的人物自然转身微笑,镜头轻微推进",
"input_reference": {"image_url": "https://example.com/first-frame.jpg"},
"seconds": 5,
"resolution": "720p"
}'
参考视频生成
curl -X POST "$BASE_URL/v1/videos" \
-H "Authorization: Bearer $TOKEN" \
-H "Content-Type: application/json" \
-d '{
"model": "wan2.7-r2v",
"prompt": "参考视频运动节奏,生成同风格产品展示短片",
"references": {
"video": ["https://example.com/reference.mp4"]
},
"input_reference": {"image_url": "https://example.com/product.png"},
"seconds": 5,
"resolution": "720p"
}'
查询任务:
curl "$BASE_URL/v1/videos/$VIDEO_ID" \
-H "Authorization: Bearer $TOKEN"
下载结果:
curl -L "$BASE_URL/v1/videos/$VIDEO_ID/content" \
-H "Authorization: Bearer $TOKEN" \
--output "$VIDEO_ID.mp4"
用量与计费
| 能力 | 用量口径 |
|---|
| 文本与多模态理解 | 输入 token、输出 token、缓存命中 token |
| Embeddings | 输入 token |
| 图像生成/编辑 | 成功返回图片张数 |
| 视频生成 | 成功输出秒数和分辨率档位 |
账单单价以控制台模型价格配置为准。百炼渠道内部会把北京站模型归入 #bailian-cn 计费 SKU,用于日志、对账和渠道成本隔离。
常见问题
| 问题 | 处理方式 |
|---|
model_not_found 或模型不可见 | 先调用 GET /v1/models,确认 Token 和模型权限 |
| 百炼上游返回权限错误 | 联系平台管理员检查百炼账号、模型开通和渠道 Key |
| 旧模型还能不能请求 | 不推荐默认使用;如果管理员手动配置,错误由上游返回 |
| 视频任务创建成功但查询失败 | 保留 video_id、请求时间和响应 request_id,提交给平台排查 |
| 图像编辑没有产物 | 确认 images[].image_url 可公网访问,并且模型是图像编辑模型 |