Skip to main content
本文面向平台开发者,列出当前阿里百炼北京站渠道在 kapon 中默认纳入的模型,以及对应的计量方式。最终可用性仍以你的 kapon Token、平台渠道配置、阿里百炼账号权益和 GET /v1/models 返回为准。
价格表为平台默认配置口径,用于帮助开发者理解成本维度;实际销售单价、折扣和客户结算以 kapon 控制台价格配置为准。

快速选型

场景首选模型备选模型
通用文本、复杂推理、Agentqwen3.7-maxqwen3.7-plus
通用低延迟文本qwen3.6-flashqwen-flash
DeepSeek 文本deepseek-v4-prodeepseek-v4-flash, vanchin/deepseek-v4-pro
GLM 文本glm-5.1ZHIPU/GLM-5.1, ZHIPU/GLM-5
Kimi 文本kimi-k2.6kimi-k2.5, kimi/kimi-k2.6, kimi/kimi-k2.5
MiniMax 文本MiniMax-M2.5MiniMax/MiniMax-M3, MiniMax/MiniMax-M2.7
文本向量text-embedding-v4-
图像理解qwen3-vl-plusqwen-vl-plus
文生图qwen-image-2.0-prowan2.7-image-pro, qwen-image-2.0, wan2.7-image
改图qwen-image-edit-plusqwen-image-edit-max, qwen-image-edit
文生视频wan2.7-t2vhappyhorse-1.0-t2v
图生视频wan2.7-i2vhappyhorse-1.0-i2v
参考视频/视频编辑wan2.7-r2v, wan2.7-videoedithappyhorse-1.0-r2v, happyhorse-1.0-video-edit

文本、视觉与 Embedding

分类模型推荐级别默认输入价默认输出价缓存命中价
Qwen 文本qwen3.7-maxP0¥12 / 1M tokens¥36 / 1M tokens输入价 20%
Qwen 文本qwen3.7-plusP0¥2 / 1M tokens¥8 / 1M tokens输入价 20%
Qwen 文本qwen3.6-flashP0¥1.2 / 1M tokens¥7.2 / 1M tokens输入价 20%
Qwen 文本qwen-flashP0¥0.15 / 1M tokens¥1.5 / 1M tokens输入价 20%
DeepSeek 文本deepseek-v4-proP0¥12 / 1M tokens¥24 / 1M tokens输入价 8.3333333%
DeepSeek 文本deepseek-v4-flashP0¥1 / 1M tokens¥2 / 1M tokens输入价 2%
GLM 文本glm-5.1P0¥6 / 1M tokens¥24 / 1M tokens输入价 21.6666667%
Kimi 文本kimi-k2.6P0¥6.5 / 1M tokens¥27 / 1M tokens输入价 16.9230769%
Kimi 文本kimi-k2.5P0¥4 / 1M tokens¥21 / 1M tokens输入价 17.5%
MiniMax 文本MiniMax-M2.5P0¥2.1 / 1M tokens¥8.4 / 1M tokens输入价 10%;写入 125%
Embeddingtext-embedding-v4P0¥0.5 / 1M tokens¥0.5 / 1M tokens-
视觉理解qwen3-vl-plusP0¥1 / 1M tokens¥10 / 1M tokens输入价 20%
视觉理解qwen-vl-plusP1¥0.8 / 1M tokens¥2 / 1M tokens输入价 20%
qwen3.7-plus 可用于文本与部分多模态理解;图像理解请求会走百炼 DashScope 原生多模态路径。
qwen3-vl-plus 默认价格展示 0-32K 输入档;32K-128K 档为 ¥1.5 / ¥15 每百万 tokens,128K-256K 档为 ¥3 / ¥30 每百万 tokens,平台会按请求输入 token 动态升档。

缓存计费口径

缓存类型上游字段默认计费倍率适用说明
隐式缓存命中cached_tokens按模型配置,百炼部署模型常见为输入价 20%,部分三方模型有专属比例不需要开发者显式传 cache_control
显式缓存创建cache_creation_input_tokens输入价 125%支持显式缓存的模型在请求中传 cache_control 时产生
显式缓存命中cached_tokens 或 Anthropic cache_read_input_tokens输入价 10%平台会在检测到显式缓存请求时把 billing usage 归一化为 cached_read_tokens,避免与隐式 cached_tokens 重复折扣
缓存字段来自上游 usage。最终消费仍以平台日志、渠道价格配置和账单为准;如果需要做财务对账,请同时保留请求 ID、模型名和原始 usage。

开源与厂商命名空间模型

分类模型推荐级别默认输入价默认输出价缓存命中价
Qwen 开源新版qwen3.6-35b-a3bP1¥1.8 / 1M tokens¥10.8 / 1M tokens-
Qwen 开源新版qwen3.6-27bP1¥3 / 1M tokens¥18 / 1M tokens-
Qwen 开源新版qwen3.5-397b-a17bP1¥1.2 / 1M tokens¥7.2 / 1M tokens-
Qwen 开源新版qwen3.5-122b-a10bP1¥0.8 / 1M tokens¥6.4 / 1M tokens-
Qwen 开源新版qwen3.5-35b-a3bP1¥0.4 / 1M tokens¥3.2 / 1M tokens-
Qwen 开源新版qwen3.5-27bP1¥0.6 / 1M tokens¥4.8 / 1M tokens-
Kimi 命名空间kimi/kimi-k2.6P1¥6.5 / 1M tokens¥27 / 1M tokens输入价 16.9230769%
Kimi 命名空间kimi/kimi-k2.5P1¥4 / 1M tokens¥21 / 1M tokens输入价 17.5%
GLM 命名空间ZHIPU/GLM-5.1P1¥8 / 1M tokens¥28 / 1M tokens输入价 25%
GLM 命名空间ZHIPU/GLM-5P1¥6 / 1M tokens¥22 / 1M tokens输入价 25%
MiniMax 命名空间MiniMax/MiniMax-M3P1¥4.2 / 1M tokens¥16.8 / 1M tokens-
MiniMax 命名空间MiniMax/MiniMax-M2.7P1¥2.1 / 1M tokens¥8.4 / 1M tokens输入价 20%;写入 125%
MiniMax 命名空间MiniMax/MiniMax-M2.5P1¥2.1 / 1M tokens¥8.4 / 1M tokens输入价 10%;写入 125%
小米开源xiaomi/mimo-v2.5-proP1¥7 / 1M tokens¥21 / 1M tokens输入价 20%
VanChin 命名空间vanchin/deepseek-v4-proP1¥12 / 1M tokens¥24 / 1M tokens输入价 8.3333333%

图像模型

能力模型推荐级别默认计量默认价格
文生图wan2.7-image-proP0成功图片张数¥0.50 / 张
文生图wan2.7-imageP0成功图片张数¥0.20 / 张
文生图qwen-image-2.0-proP0成功图片张数¥0.50 / 张
文生图qwen-image-2.0P0成功图片张数¥0.20 / 张
改图qwen-image-edit-maxP0成功图片张数¥0.50 / 张
改图qwen-image-edit-plusP0成功图片张数¥0.20 / 张
改图qwen-image-editP0成功图片张数¥0.30 / 张
图像生成走 POST /v1/images/generations,图像编辑走 POST /v1/images/edits。平台只对成功产物计量,失败请求不应产生图片张数扣费。

视频模型

能力模型推荐级别720p 默认价1080p 默认价
文生视频happyhorse-1.0-t2vP0¥0.90 / 秒¥1.60 / 秒
图生视频happyhorse-1.0-i2vP0¥0.90 / 秒¥1.60 / 秒
参考视频happyhorse-1.0-r2vP1¥0.90 / 秒¥1.60 / 秒
视频编辑happyhorse-1.0-video-editP1¥0.90 / 秒¥1.60 / 秒
文生视频wan2.7-t2vP0¥0.60 / 秒¥1.00 / 秒
图生视频wan2.7-i2vP0¥0.60 / 秒¥1.00 / 秒
参考视频wan2.7-r2vP1¥0.60 / 秒¥1.00 / 秒
视频编辑wan2.7-videoeditP1¥0.60 / 秒¥1.00 / 秒
视频任务采用异步终态计费口径:创建任务阶段返回任务 ID,任务成功后按成功输出秒数和分辨率档位计费。任务失败不应产生成功秒数扣费。
前端默认模型中可能出现百炼固定日期快照,例如 wan2.7-t2v-2026-04-25wan2.7-i2v-2026-04-25。这些快照用于锁定上游版本,计费时会分别归一到 wan2.7-t2vwan2.7-i2v#bailian-cn SKU,并继续按 720p / 1080p 分辨率档位结算。

内部计费 SKU

百炼北京站会把对外模型名映射到内部计费 SKU,避免与独立 DeepSeek、Kimi、GLM、MiniMax 渠道混价:
{model}#bailian-cn
{video-model}#bailian-cn#720p
{video-model}#bailian-cn#1080p
开发者请求仍然填写对外模型名,例如 qwen3.7-pluswan2.7-t2v,不需要在请求体中填写 #bailian-cn 后缀。