Skip to main content
kapon 支持以下 Gemini 图像生成模型:
模型最大分辨率特点
gemini-3-pro-image-preview4K高质量,支持复杂提示词理解和参考图编辑
gemini-2.5-flash-image / gemini-2.5-flash-image-preview1K快速生成,低延迟,适合原型验证

选择调用方式

根据您的使用场景和技术偏好,选择合适的 API 调用方式:

快速对比

特性OpenAI 兼容接口Gemini 原生 API
学习成本低(兼容 OpenAI SDK)
文生图
参考图编辑
多参考图融合✅ 最多 14 张✅ 最多 15 张
自动分辨率推断

模型对比

模型最大分辨率推荐场景
gemini-3-pro-image-preview4K (4096×4096)复杂提示词、参考图编辑、高质量生产
gemini-2.5-flash-image / gemini-2.5-flash-image-preview1K (1024×1024)快速原型验证、低延迟场景
对于需要理解复杂语义或进行风格迁移的场景,优先使用 gemini-3-pro-image-preview

分辨率与宽高比

Gemini 2.5 Flash 图片

gemini-2.5-flash-image 为单档位 1K 输出,不同宽高比对应的典型分辨率如下(单张固定约 1K image tokens):
宽高比分辨率令牌
1:11024x10241120
2:3832x12481120
3:21248x8321120
3:4864x11841120
4:31184x8641120
4:5896x11521120
5:41152x8961120
9:16768x13441120
16:91344x7681120
21:91536x6721120

Gemini 3 Pro Image 预览版

gemini-3-pro-image-preview 支持 1K / 2K / 4K 三个分辨率档位,不同宽高比对应的典型分辨率如下(仅展示上游当前公开栅格,实际可能随官方更新而调整):
宽高比1K 分辨率1K 令牌2K 分辨率2K 令牌4K 分辨率4K 令牌
1:11024x102411202048x204811204096x40962000
2:3848x126411201696x252811203392x50562000
3:21264x84811202528x169611205056x33922000
3:4896x120011201792x240011203584x48002000
4:31200x89611202400x179211204800x35842000
4:5928x115211201856x230411203712x46082000
5:41152x92811202304x185611204608x37122000
9:16768x137611201536x275211203072x55042000
16:91376x76811202752x153611205504x30722000
21:91584x67211203168x134411206336x26882000

计费说明

计费项说明
文本输入按提示词 tokens 数量计费
图像输出优先使用上游 usageMetadata 中的 image tokens;若未提供,按 1K/2K=1120、4K=2000 tokens/张近似折算
kapon 会自动从响应中提取 token 使用量并计费,无需手动处理。