Error
文本生成
Chat Completions
通过 兼容 OpenAI 的对话补全与工具调用接口。
POST
Error
POST /v1/chat/completions 是最常用的对话生成接口,支持流式输出、函数调用(tools/functions)以及 JSON mode。请求示例
常见用法
- 流式输出:在请求体中设置
stream: true。cURL 请添加-N选项,Python 端可组合requests.post(..., stream=True)逐行读取。 - 函数调用:通过
tools与tool_choice描述可调用的函数,后续在响应中解析tool_calls并执行业务逻辑。 - JSON 约束:配合
response_format设置为{"type": "json_schema"},可让模型严格返回结构化数据。
kapon 会自动对齐常见第三方兼容实现中的差异字段,减少模型切换带来的适配成本。
kapon 扩展字段
以下字段是 kapon 在标准 OpenAI 响应体基础上的扩展,用于暴露上游模型的计费明细。usage.prompt_tokens_details
| 字段 | 含义 | 适用模型 |
|---|---|---|
cached_tokens | 命中缓存的输入 token 数 | 所有支持缓存的模型 |
cached_write_tokens | 缓存写入总量(= 5m + 1h) | Claude |
cached_write_5m_tokens | 写入 5 分钟有效期缓存的 token 数 | Claude |
cached_write_1h_tokens | 写入 1 小时有效期缓存的 token 数 | Claude |
prompt_tokens 为输入 token 总量(含缓存命中与缓存写入)。缓存写入相关字段为 omitempty,GPT 等无缓存写入的模型不会输出。Authorizations
Authorization: Bearer
Body
application/json
The body is of type object.
Response
200 - application/json
OK
The response is of type object.
