本文面向平台开发者,列出当前阿里百炼北京站渠道在 kapon 中默认纳入的模型,以及对应的计量方式。最终可用性仍以你的 kapon Token、平台渠道配置、阿里百炼账号权益和 GET /v1/models 返回为准。
价格表为平台默认配置口径,用于帮助开发者理解成本维度;实际销售单价、折扣和客户结算以 kapon 控制台价格配置为准。
快速选型
| 场景 | 首选模型 | 备选模型 |
|---|
| 通用文本、复杂推理、Agent | qwen3.7-max | qwen3.7-plus |
| 通用低延迟文本 | qwen3.6-flash | qwen-flash |
| DeepSeek 文本 | deepseek-v4-pro | deepseek-v4-flash, vanchin/deepseek-v4-pro |
| GLM 文本 | glm-5.1 | ZHIPU/GLM-5.1, ZHIPU/GLM-5 |
| Kimi 文本 | kimi-k2.6 | kimi-k2.5, kimi/kimi-k2.6, kimi/kimi-k2.5 |
| MiniMax 文本 | MiniMax-M2.5 | MiniMax/MiniMax-M3, MiniMax/MiniMax-M2.7 |
| 文本向量 | text-embedding-v4 | - |
| 图像理解 | qwen3-vl-plus | qwen-vl-plus |
| 文生图 | qwen-image-2.0-pro | wan2.7-image-pro, qwen-image-2.0, wan2.7-image |
| 改图 | qwen-image-edit-plus | qwen-image-edit-max, qwen-image-edit |
| 文生视频 | wan2.7-t2v | happyhorse-1.0-t2v |
| 图生视频 | wan2.7-i2v | happyhorse-1.0-i2v |
| 参考视频/视频编辑 | wan2.7-r2v, wan2.7-videoedit | happyhorse-1.0-r2v, happyhorse-1.0-video-edit |
文本、视觉与 Embedding
| 分类 | 模型 | 推荐级别 | 默认输入价 | 默认输出价 | 缓存命中价 |
|---|
| Qwen 文本 | qwen3.7-max | P0 | ¥12 / 1M tokens | ¥36 / 1M tokens | 输入价 20% |
| Qwen 文本 | qwen3.7-plus | P0 | ¥2 / 1M tokens | ¥8 / 1M tokens | 输入价 20% |
| Qwen 文本 | qwen3.6-flash | P0 | ¥1.2 / 1M tokens | ¥7.2 / 1M tokens | 输入价 20% |
| Qwen 文本 | qwen-flash | P0 | ¥0.15 / 1M tokens | ¥1.5 / 1M tokens | 输入价 20% |
| DeepSeek 文本 | deepseek-v4-pro | P0 | ¥12 / 1M tokens | ¥24 / 1M tokens | 输入价 8.3333333% |
| DeepSeek 文本 | deepseek-v4-flash | P0 | ¥1 / 1M tokens | ¥2 / 1M tokens | 输入价 2% |
| GLM 文本 | glm-5.1 | P0 | ¥6 / 1M tokens | ¥24 / 1M tokens | 输入价 21.6666667% |
| Kimi 文本 | kimi-k2.6 | P0 | ¥6.5 / 1M tokens | ¥27 / 1M tokens | 输入价 16.9230769% |
| Kimi 文本 | kimi-k2.5 | P0 | ¥4 / 1M tokens | ¥21 / 1M tokens | 输入价 17.5% |
| MiniMax 文本 | MiniMax-M2.5 | P0 | ¥2.1 / 1M tokens | ¥8.4 / 1M tokens | 输入价 10%;写入 125% |
| Embedding | text-embedding-v4 | P0 | ¥0.5 / 1M tokens | ¥0.5 / 1M tokens | - |
| 视觉理解 | qwen3-vl-plus | P0 | ¥1 / 1M tokens | ¥10 / 1M tokens | 输入价 20% |
| 视觉理解 | qwen-vl-plus | P1 | ¥0.8 / 1M tokens | ¥2 / 1M tokens | 输入价 20% |
qwen3.7-plus 可用于文本与部分多模态理解;图像理解请求会走百炼 DashScope 原生多模态路径。
qwen3-vl-plus 默认价格展示 0-32K 输入档;32K-128K 档为 ¥1.5 / ¥15 每百万 tokens,128K-256K 档为 ¥3 / ¥30 每百万 tokens,平台会按请求输入 token 动态升档。
缓存计费口径
| 缓存类型 | 上游字段 | 默认计费倍率 | 适用说明 |
|---|
| 隐式缓存命中 | cached_tokens | 按模型配置,百炼部署模型常见为输入价 20%,部分三方模型有专属比例 | 不需要开发者显式传 cache_control |
| 显式缓存创建 | cache_creation_input_tokens | 输入价 125% | 支持显式缓存的模型在请求中传 cache_control 时产生 |
| 显式缓存命中 | cached_tokens 或 Anthropic cache_read_input_tokens | 输入价 10% | 平台会在检测到显式缓存请求时把 billing usage 归一化为 cached_read_tokens,避免与隐式 cached_tokens 重复折扣 |
缓存字段来自上游 usage。最终消费仍以平台日志、渠道价格配置和账单为准;如果需要做财务对账,请同时保留请求 ID、模型名和原始 usage。
开源与厂商命名空间模型
| 分类 | 模型 | 推荐级别 | 默认输入价 | 默认输出价 | 缓存命中价 |
|---|
| Qwen 开源新版 | qwen3.6-35b-a3b | P1 | ¥1.8 / 1M tokens | ¥10.8 / 1M tokens | - |
| Qwen 开源新版 | qwen3.6-27b | P1 | ¥3 / 1M tokens | ¥18 / 1M tokens | - |
| Qwen 开源新版 | qwen3.5-397b-a17b | P1 | ¥1.2 / 1M tokens | ¥7.2 / 1M tokens | - |
| Qwen 开源新版 | qwen3.5-122b-a10b | P1 | ¥0.8 / 1M tokens | ¥6.4 / 1M tokens | - |
| Qwen 开源新版 | qwen3.5-35b-a3b | P1 | ¥0.4 / 1M tokens | ¥3.2 / 1M tokens | - |
| Qwen 开源新版 | qwen3.5-27b | P1 | ¥0.6 / 1M tokens | ¥4.8 / 1M tokens | - |
| Kimi 命名空间 | kimi/kimi-k2.6 | P1 | ¥6.5 / 1M tokens | ¥27 / 1M tokens | 输入价 16.9230769% |
| Kimi 命名空间 | kimi/kimi-k2.5 | P1 | ¥4 / 1M tokens | ¥21 / 1M tokens | 输入价 17.5% |
| GLM 命名空间 | ZHIPU/GLM-5.1 | P1 | ¥8 / 1M tokens | ¥28 / 1M tokens | 输入价 25% |
| GLM 命名空间 | ZHIPU/GLM-5 | P1 | ¥6 / 1M tokens | ¥22 / 1M tokens | 输入价 25% |
| MiniMax 命名空间 | MiniMax/MiniMax-M3 | P1 | ¥4.2 / 1M tokens | ¥16.8 / 1M tokens | - |
| MiniMax 命名空间 | MiniMax/MiniMax-M2.7 | P1 | ¥2.1 / 1M tokens | ¥8.4 / 1M tokens | 输入价 20%;写入 125% |
| MiniMax 命名空间 | MiniMax/MiniMax-M2.5 | P1 | ¥2.1 / 1M tokens | ¥8.4 / 1M tokens | 输入价 10%;写入 125% |
| 小米开源 | xiaomi/mimo-v2.5-pro | P1 | ¥7 / 1M tokens | ¥21 / 1M tokens | 输入价 20% |
| VanChin 命名空间 | vanchin/deepseek-v4-pro | P1 | ¥12 / 1M tokens | ¥24 / 1M tokens | 输入价 8.3333333% |
图像模型
| 能力 | 模型 | 推荐级别 | 默认计量 | 默认价格 |
|---|
| 文生图 | wan2.7-image-pro | P0 | 成功图片张数 | ¥0.50 / 张 |
| 文生图 | wan2.7-image | P0 | 成功图片张数 | ¥0.20 / 张 |
| 文生图 | qwen-image-2.0-pro | P0 | 成功图片张数 | ¥0.50 / 张 |
| 文生图 | qwen-image-2.0 | P0 | 成功图片张数 | ¥0.20 / 张 |
| 改图 | qwen-image-edit-max | P0 | 成功图片张数 | ¥0.50 / 张 |
| 改图 | qwen-image-edit-plus | P0 | 成功图片张数 | ¥0.20 / 张 |
| 改图 | qwen-image-edit | P0 | 成功图片张数 | ¥0.30 / 张 |
图像生成走 POST /v1/images/generations,图像编辑走 POST /v1/images/edits。平台只对成功产物计量,失败请求不应产生图片张数扣费。
视频模型
| 能力 | 模型 | 推荐级别 | 720p 默认价 | 1080p 默认价 |
|---|
| 文生视频 | happyhorse-1.0-t2v | P0 | ¥0.90 / 秒 | ¥1.60 / 秒 |
| 图生视频 | happyhorse-1.0-i2v | P0 | ¥0.90 / 秒 | ¥1.60 / 秒 |
| 参考视频 | happyhorse-1.0-r2v | P1 | ¥0.90 / 秒 | ¥1.60 / 秒 |
| 视频编辑 | happyhorse-1.0-video-edit | P1 | ¥0.90 / 秒 | ¥1.60 / 秒 |
| 文生视频 | wan2.7-t2v | P0 | ¥0.60 / 秒 | ¥1.00 / 秒 |
| 图生视频 | wan2.7-i2v | P0 | ¥0.60 / 秒 | ¥1.00 / 秒 |
| 参考视频 | wan2.7-r2v | P1 | ¥0.60 / 秒 | ¥1.00 / 秒 |
| 视频编辑 | wan2.7-videoedit | P1 | ¥0.60 / 秒 | ¥1.00 / 秒 |
视频任务采用异步终态计费口径:创建任务阶段返回任务 ID,任务成功后按成功输出秒数和分辨率档位计费。任务失败不应产生成功秒数扣费。
前端默认模型中可能出现百炼固定日期快照,例如 wan2.7-t2v-2026-04-25 和 wan2.7-i2v-2026-04-25。这些快照用于锁定上游版本,计费时会分别归一到 wan2.7-t2v 与 wan2.7-i2v 的 #bailian-cn SKU,并继续按 720p / 1080p 分辨率档位结算。
内部计费 SKU
百炼北京站会把对外模型名映射到内部计费 SKU,避免与独立 DeepSeek、Kimi、GLM、MiniMax 渠道混价:
{model}#bailian-cn
{video-model}#bailian-cn#720p
{video-model}#bailian-cn#1080p
开发者请求仍然填写对外模型名,例如 qwen3.7-plus 或 wan2.7-t2v,不需要在请求体中填写 #bailian-cn 后缀。