阿里百炼模型与计费 - {{brandName}} 用户文档

本文面向平台开发者，列出当前阿里百炼北京站渠道在 kapon 中默认纳入的模型，以及对应的计量方式。最终可用性仍以你的 kapon Token、平台渠道配置、阿里百炼账号权益和 GET /v1/models 返回为准。

价格表为平台默认配置口径，用于帮助开发者理解成本维度；实际销售单价、折扣和客户结算以 kapon 控制台价格配置为准。

快速选型

场景	首选模型	备选模型
通用文本、复杂推理、Agent	`qwen3.7-max`	`qwen3.7-plus`
通用低延迟文本	`qwen3.6-flash`	`qwen-flash`
DeepSeek 文本	`deepseek-v4-pro`	`deepseek-v4-flash`, `vanchin/deepseek-v4-pro`
GLM 文本	`glm-5.1`	`ZHIPU/GLM-5.1`, `ZHIPU/GLM-5`
Kimi 文本	`kimi-k2.6`	`kimi-k2.5`, `kimi/kimi-k2.6`, `kimi/kimi-k2.5`
MiniMax 文本	`MiniMax-M2.5`	`MiniMax/MiniMax-M3`, `MiniMax/MiniMax-M2.7`
文本向量	`text-embedding-v4`	-
图像理解	`qwen3-vl-plus`	`qwen-vl-plus`
文生图	`qwen-image-2.0-pro`	`wan2.7-image-pro`, `qwen-image-2.0`, `wan2.7-image`
改图	`qwen-image-edit-plus`	`qwen-image-edit-max`, `qwen-image-edit`
文生视频	`wan2.7-t2v`	`happyhorse-1.0-t2v`
图生视频	`wan2.7-i2v`	`happyhorse-1.0-i2v`
参考视频/视频编辑	`wan2.7-r2v`, `wan2.7-videoedit`	`happyhorse-1.0-r2v`, `happyhorse-1.0-video-edit`

文本、视觉与 Embedding

分类	模型	推荐级别	默认输入价	默认输出价	缓存命中价
Qwen 文本	`qwen3.7-max`	P0	￥12 / 1M tokens	￥36 / 1M tokens	输入价 20%
Qwen 文本	`qwen3.7-plus`	P0	￥2 / 1M tokens	￥8 / 1M tokens	输入价 20%
Qwen 文本	`qwen3.6-flash`	P0	￥1.2 / 1M tokens	￥7.2 / 1M tokens	输入价 20%
Qwen 文本	`qwen-flash`	P0	￥0.15 / 1M tokens	￥1.5 / 1M tokens	输入价 20%
DeepSeek 文本	`deepseek-v4-pro`	P0	￥12 / 1M tokens	￥24 / 1M tokens	输入价 8.3333333%
DeepSeek 文本	`deepseek-v4-flash`	P0	￥1 / 1M tokens	￥2 / 1M tokens	输入价 2%
GLM 文本	`glm-5.1`	P0	￥6 / 1M tokens	￥24 / 1M tokens	输入价 21.6666667%
Kimi 文本	`kimi-k2.6`	P0	￥6.5 / 1M tokens	￥27 / 1M tokens	输入价 16.9230769%
Kimi 文本	`kimi-k2.5`	P0	￥4 / 1M tokens	￥21 / 1M tokens	输入价 17.5%
MiniMax 文本	`MiniMax-M2.5`	P0	￥2.1 / 1M tokens	￥8.4 / 1M tokens	输入价 10%；写入 125%
Embedding	`text-embedding-v4`	P0	￥0.5 / 1M tokens	￥0.5 / 1M tokens	-
视觉理解	`qwen3-vl-plus`	P0	￥1 / 1M tokens	￥10 / 1M tokens	输入价 20%
视觉理解	`qwen-vl-plus`	P1	￥0.8 / 1M tokens	￥2 / 1M tokens	输入价 20%

qwen3.7-plus 可用于文本与部分多模态理解；图像理解请求会走百炼 DashScope 原生多模态路径。

qwen3-vl-plus 默认价格展示 0-32K 输入档；32K-128K 档为￥1.5 / ￥15 每百万 tokens，128K-256K 档为￥3 / ￥30 每百万 tokens，平台会按请求输入 token 动态升档。

缓存计费口径

缓存类型	上游字段	默认计费倍率	适用说明
隐式缓存命中	`cached_tokens`	按模型配置，百炼部署模型常见为输入价 20%，部分三方模型有专属比例	不需要开发者显式传 `cache_control`
显式缓存创建	`cache_creation_input_tokens`	输入价 125%	支持显式缓存的模型在请求中传 `cache_control` 时产生
显式缓存命中	`cached_tokens` 或 Anthropic `cache_read_input_tokens`	输入价 10%	平台会在检测到显式缓存请求时把 billing usage 归一化为 `cached_read_tokens`，避免与隐式 `cached_tokens` 重复折扣

缓存字段来自上游 usage。最终消费仍以平台日志、渠道价格配置和账单为准；如果需要做财务对账，请同时保留请求 ID、模型名和原始 usage。

开源与厂商命名空间模型

分类	模型	推荐级别	默认输入价	默认输出价	缓存命中价
Qwen 开源新版	`qwen3.6-35b-a3b`	P1	￥1.8 / 1M tokens	￥10.8 / 1M tokens	-
Qwen 开源新版	`qwen3.6-27b`	P1	￥3 / 1M tokens	￥18 / 1M tokens	-
Qwen 开源新版	`qwen3.5-397b-a17b`	P1	￥1.2 / 1M tokens	￥7.2 / 1M tokens	-
Qwen 开源新版	`qwen3.5-122b-a10b`	P1	￥0.8 / 1M tokens	￥6.4 / 1M tokens	-
Qwen 开源新版	`qwen3.5-35b-a3b`	P1	￥0.4 / 1M tokens	￥3.2 / 1M tokens	-
Qwen 开源新版	`qwen3.5-27b`	P1	￥0.6 / 1M tokens	￥4.8 / 1M tokens	-
Kimi 命名空间	`kimi/kimi-k2.6`	P1	￥6.5 / 1M tokens	￥27 / 1M tokens	输入价 16.9230769%
Kimi 命名空间	`kimi/kimi-k2.5`	P1	￥4 / 1M tokens	￥21 / 1M tokens	输入价 17.5%
GLM 命名空间	`ZHIPU/GLM-5.1`	P1	￥8 / 1M tokens	￥28 / 1M tokens	输入价 25%
GLM 命名空间	`ZHIPU/GLM-5`	P1	￥6 / 1M tokens	￥22 / 1M tokens	输入价 25%
MiniMax 命名空间	`MiniMax/MiniMax-M3`	P1	￥4.2 / 1M tokens	￥16.8 / 1M tokens	-
MiniMax 命名空间	`MiniMax/MiniMax-M2.7`	P1	￥2.1 / 1M tokens	￥8.4 / 1M tokens	输入价 20%；写入 125%
MiniMax 命名空间	`MiniMax/MiniMax-M2.5`	P1	￥2.1 / 1M tokens	￥8.4 / 1M tokens	输入价 10%；写入 125%
小米开源	`xiaomi/mimo-v2.5-pro`	P1	￥7 / 1M tokens	￥21 / 1M tokens	输入价 20%
VanChin 命名空间	`vanchin/deepseek-v4-pro`	P1	￥12 / 1M tokens	￥24 / 1M tokens	输入价 8.3333333%

图像模型

能力	模型	推荐级别	默认计量	默认价格
文生图	`wan2.7-image-pro`	P0	成功图片张数	￥0.50 / 张
文生图	`wan2.7-image`	P0	成功图片张数	￥0.20 / 张
文生图	`qwen-image-2.0-pro`	P0	成功图片张数	￥0.50 / 张
文生图	`qwen-image-2.0`	P0	成功图片张数	￥0.20 / 张
改图	`qwen-image-edit-max`	P0	成功图片张数	￥0.50 / 张
改图	`qwen-image-edit-plus`	P0	成功图片张数	￥0.20 / 张
改图	`qwen-image-edit`	P0	成功图片张数	￥0.30 / 张

图像生成走 POST /v1/images/generations，图像编辑走 POST /v1/images/edits。平台只对成功产物计量，失败请求不应产生图片张数扣费。

视频模型

能力	模型	推荐级别	720p 默认价	1080p 默认价
文生视频	`happyhorse-1.0-t2v`	P0	￥0.90 / 秒	￥1.60 / 秒
图生视频	`happyhorse-1.0-i2v`	P0	￥0.90 / 秒	￥1.60 / 秒
参考视频	`happyhorse-1.0-r2v`	P1	￥0.90 / 秒	￥1.60 / 秒
视频编辑	`happyhorse-1.0-video-edit`	P1	￥0.90 / 秒	￥1.60 / 秒
文生视频	`wan2.7-t2v`	P0	￥0.60 / 秒	￥1.00 / 秒
图生视频	`wan2.7-i2v`	P0	￥0.60 / 秒	￥1.00 / 秒
参考视频	`wan2.7-r2v`	P1	￥0.60 / 秒	￥1.00 / 秒
视频编辑	`wan2.7-videoedit`	P1	￥0.60 / 秒	￥1.00 / 秒

视频任务采用异步终态计费口径：创建任务阶段返回任务 ID，任务成功后按成功输出秒数和分辨率档位计费。任务失败不应产生成功秒数扣费。

前端默认模型中可能出现百炼固定日期快照，例如 wan2.7-t2v-2026-04-25 和 wan2.7-i2v-2026-04-25。这些快照用于锁定上游版本，计费时会分别归一到 wan2.7-t2v 与 wan2.7-i2v 的 #bailian-cn SKU，并继续按 720p / 1080p 分辨率档位结算。

内部计费 SKU

百炼北京站会把对外模型名映射到内部计费 SKU，避免与独立 DeepSeek、Kimi、GLM、MiniMax 渠道混价：

{model}#bailian-cn
{video-model}#bailian-cn#720p
{video-model}#bailian-cn#1080p

开发者请求仍然填写对外模型名，例如 qwen3.7-plus 或 wan2.7-t2v，不需要在请求体中填写 #bailian-cn 后缀。

​快速选型

​文本、视觉与 Embedding

​缓存计费口径

​开源与厂商命名空间模型

​图像模型

​视频模型

​内部计费 SKU

快速选型

文本、视觉与 Embedding

缓存计费口径

开源与厂商命名空间模型

图像模型

视频模型

内部计费 SKU