9 折定价说明
Token Hub 对所有模型提供 9 折 优惠定价。页面上展示的价格均为折扣后的实际价格,您无需额外操作即可享受优惠。
折扣说明
所有模型定价已包含 9 折优惠,折扣长期有效。账单中显示的金额即为实际扣费金额,无需手动计算。
计费模式
Token Hub 根据模型类型采用不同的计费方式:
1. Token 计费 — LLM 模型
适用于大语言模型(如 GPT-4o、Claude 3.5 等),按实际消耗的 Token 数量计费:
- 输入 Token (Input):发送给模型的所有内容,包括系统提示词、用户消息、历史对话等
- 输出 Token (Output):模型生成的回复内容
- 输入与输出 Token 的单价不同,输出 Token 通常更贵
- 计费公式:
费用 = 输入 Token 数 × 输入单价 + 输出 Token 数 × 输出单价
Token 计费示例
使用 GPT-4o 模型,发送 1,000 输入 Token,收到 500 输出 Token:
¥0.045 = 1,000 × ¥0.00003 + 500 × ¥0.00003
* 以上价格为示例,实际价格请参考模型列表页
2. 按次计费 — 图像/视频模型
适用于图像生成、视频生成等模型,每次调用收取固定费用:
- 每次成功调用收取固定金额,与生成内容的数量无关
- 不同模型/分辨率/质量等级的单次价格不同
- 计费公式:
费用 = 调用次数 × 单次价格
按次计费示例
使用 DALL·E 3 生成 1 张 1024×1024 图片:
¥0.040 = 1 次 × ¥0.040/次
* 以上价格为示例,实际价格请参考模型列表页
余额扣减方式
Token Hub 采用预付费模式,通过账户余额进行扣费:
- 实时扣费:每次 API 调用完成后立即从账户余额中扣除相应费用
- 预估算机制:对于流式输出,系统在请求开始时预扣估算费用,请求完成后按实际用量结算,多扣部分即时退还
- 精度:费用计算精确到小数点后 6 位(0.000001 元)
- 余额可在控制台「账户概览」页面实时查看
失败请求计费规则
| 错误类型 | HTTP 状态码 | 是否计费 | 说明 |
|---|---|---|---|
| 服务端错误 | 5xx (500, 502, 503) | 不计费 | 服务端异常导致的失败,不收取任何费用 |
| 客户端错误 | 4xx (400, 401, 403, 429) | 计费 | 因请求参数错误、认证失败等客户端问题导致的失败,消耗的输入 Token 计费 |
注意
4xx 错误中,如果模型已经处理了输入但参数校验在之后失败,输入 Token 仍会产生费用。建议在发送请求前仔细校验参数。
余额不足行为
当账户余额不足以支付当前请求时,API 的处理方式如下:
- 非流式请求:直接返回
403 insufficient_quota错误,请求不会发送到模型 - 流式请求:
- 如果请求开始时余额已不足,返回
403 insufficient_quota错误 - 如果请求进行中余额耗尽,已生成的部分内容会正常返回,但后续内容会被截断,并返回余额不足提示
- 如果请求开始时余额已不足,返回
重要
余额归零后所有 API 调用将被拒绝,直到充值完成。建议设置余额预警,当余额低于阈值时自动通知。
{
"error": {
"message": "Your account balance is insufficient. Please top up your account to continue using the API.",
"type": "permission_error",
"code": "insufficient_quota"
}
}
账单查询
实时账单
每次 API 调用完成后,账单信息实时更新。您可以在调用完成后立即在控制台查看:
- 更新延迟:通常在请求完成后 1-3 秒内显示
- 查看路径:控制台 → 用量统计 → 调用明细
- 包含信息:调用时间、模型、输入/输出 Token 数、费用金额
用量统计
控制台提供多维度的用量统计视图:
| 统计维度 | 说明 |
|---|---|
| 按时间 | 查看每小时/每日/每周/每月的用量趋势 |
| 按模型 | 查看各模型的调用量和费用占比 |
| 按 API Key | 查看各 Key 的使用情况和费用分布 |
| 按请求类型 | 区分 Chat、Embeddings、Image 等不同接口的用量 |
导出用量数据
Token Hub 支持将用量数据导出为 CSV 文件,方便您进行离线分析和财务对账。
导出步骤
- 登录 Token Hub 控制台
- 进入「用量统计」页面
- 选择时间范围(支持自定义起止日期)
- 点击「导出 CSV」按钮
- 文件将自动下载到本地
CSV 文件格式
导出的 CSV 文件包含以下字段:
timestamp,api_key,model,request_type,input_tokens,output_tokens,cost_cny,status
2026-06-12T10:30:00+08:00,sk-***abc,gpt-4o,chat,1520,380,0.057000,success
2026-06-12T10:31:15+08:00,sk-***abc,gpt-4o-mini,chat,820,210,0.001935,success
2026-06-12T10:32:40+08:00,sk-***def,dall-e-3,image,0,0,0.040000,success
2026-06-12T10:33:05+08:00,sk-***abc,gpt-4o,chat,1500,0,0.045000,error_400
| 字段 | 类型 | 说明 |
|---|---|---|
timestamp |
string | 请求时间(ISO 8601 格式) |
api_key |
string | API Key(脱敏显示) |
model |
string | 使用的模型名称 |
request_type |
string | 请求类型:chat / embeddings / image 等 |
input_tokens |
integer | 输入 Token 数 |
output_tokens |
integer | 输出 Token 数 |
cost_cny |
float | 费用金额(人民币,元) |
status |
string | 请求状态:success / error_4xx / error_5xx |
计费 FAQ
如何查看当前余额?
登录控制台,在「账户概览」页面即可查看当前余额、近 7 天消费趋势和余额预警状态。
Token 是如何计算的?
Token 的计算方式与 OpenAI 一致。英文约 1 个单词 = 1 个 Token,中文约 1.5-2 个汉字 = 1 个 Token。您可以使用 OpenAI Tokenizer 工具估算 Token 用量。
流式输出的费用如何计算?
流式输出(stream=true)的费用计算方式与非流式完全相同,按最终输入 + 输出的总 Token 数计费。流式过程中会先预扣估算费用,请求完成后按实际用量结算。
5xx 错误的预扣费用会退还吗?
会。5xx 错误不计费,如果请求过程中有预扣费用,会在请求失败后立即退还到账户余额。
可以设置消费上限吗?
可以。在控制台「账户设置」中可以为每个 API Key 设置每月消费上限,达到上限后该 Key 将自动停用。