计费说明

了解 Token Hub API 的计费规则与用量管理

9 折定价说明

Token Hub 对所有模型提供 9 折 优惠定价。页面上展示的价格均为折扣后的实际价格,您无需额外操作即可享受优惠。

折扣说明

所有模型定价已包含 9 折优惠,折扣长期有效。账单中显示的金额即为实际扣费金额,无需手动计算。

计费模式

Token Hub 根据模型类型采用不同的计费方式:

1. Token 计费 — LLM 模型

适用于大语言模型(如 GPT-4o、Claude 3.5 等),按实际消耗的 Token 数量计费:

  • 输入 Token (Input):发送给模型的所有内容,包括系统提示词、用户消息、历史对话等
  • 输出 Token (Output):模型生成的回复内容
  • 输入与输出 Token 的单价不同,输出 Token 通常更贵
  • 计费公式:费用 = 输入 Token 数 × 输入单价 + 输出 Token 数 × 输出单价

Token 计费示例

使用 GPT-4o 模型,发送 1,000 输入 Token,收到 500 输出 Token:

¥0.045 = 1,000 × ¥0.00003 + 500 × ¥0.00003

* 以上价格为示例,实际价格请参考模型列表页

2. 按次计费 — 图像/视频模型

适用于图像生成、视频生成等模型,每次调用收取固定费用:

  • 每次成功调用收取固定金额,与生成内容的数量无关
  • 不同模型/分辨率/质量等级的单次价格不同
  • 计费公式:费用 = 调用次数 × 单次价格

按次计费示例

使用 DALL·E 3 生成 1 张 1024×1024 图片:

¥0.040 = 1 次 × ¥0.040/次

* 以上价格为示例,实际价格请参考模型列表页

余额扣减方式

Token Hub 采用预付费模式,通过账户余额进行扣费:

  • 实时扣费:每次 API 调用完成后立即从账户余额中扣除相应费用
  • 预估算机制:对于流式输出,系统在请求开始时预扣估算费用,请求完成后按实际用量结算,多扣部分即时退还
  • 精度:费用计算精确到小数点后 6 位(0.000001 元)
  • 余额可在控制台「账户概览」页面实时查看

失败请求计费规则

错误类型 HTTP 状态码 是否计费 说明
服务端错误 5xx (500, 502, 503) 不计费 服务端异常导致的失败,不收取任何费用
客户端错误 4xx (400, 401, 403, 429) 计费 因请求参数错误、认证失败等客户端问题导致的失败,消耗的输入 Token 计费

注意

4xx 错误中,如果模型已经处理了输入但参数校验在之后失败,输入 Token 仍会产生费用。建议在发送请求前仔细校验参数。

余额不足行为

当账户余额不足以支付当前请求时,API 的处理方式如下:

  • 非流式请求:直接返回 403 insufficient_quota 错误,请求不会发送到模型
  • 流式请求
    • 如果请求开始时余额已不足,返回 403 insufficient_quota 错误
    • 如果请求进行中余额耗尽,已生成的部分内容会正常返回,但后续内容会被截断,并返回余额不足提示

重要

余额归零后所有 API 调用将被拒绝,直到充值完成。建议设置余额预警,当余额低于阈值时自动通知。

余额不足错误响应
{
  "error": {
    "message": "Your account balance is insufficient. Please top up your account to continue using the API.",
    "type": "permission_error",
    "code": "insufficient_quota"
  }
}

账单查询

实时账单

每次 API 调用完成后,账单信息实时更新。您可以在调用完成后立即在控制台查看:

  • 更新延迟:通常在请求完成后 1-3 秒内显示
  • 查看路径:控制台 → 用量统计 → 调用明细
  • 包含信息:调用时间、模型、输入/输出 Token 数、费用金额

用量统计

控制台提供多维度的用量统计视图:

统计维度 说明
按时间 查看每小时/每日/每周/每月的用量趋势
按模型 查看各模型的调用量和费用占比
按 API Key 查看各 Key 的使用情况和费用分布
按请求类型 区分 Chat、Embeddings、Image 等不同接口的用量

导出用量数据

Token Hub 支持将用量数据导出为 CSV 文件,方便您进行离线分析和财务对账。

导出步骤

  1. 登录 Token Hub 控制台
  2. 进入「用量统计」页面
  3. 选择时间范围(支持自定义起止日期)
  4. 点击「导出 CSV」按钮
  5. 文件将自动下载到本地

CSV 文件格式

导出的 CSV 文件包含以下字段:

CSV 字段说明
timestamp,api_key,model,request_type,input_tokens,output_tokens,cost_cny,status
2026-06-12T10:30:00+08:00,sk-***abc,gpt-4o,chat,1520,380,0.057000,success
2026-06-12T10:31:15+08:00,sk-***abc,gpt-4o-mini,chat,820,210,0.001935,success
2026-06-12T10:32:40+08:00,sk-***def,dall-e-3,image,0,0,0.040000,success
2026-06-12T10:33:05+08:00,sk-***abc,gpt-4o,chat,1500,0,0.045000,error_400
字段 类型 说明
timestamp string 请求时间(ISO 8601 格式)
api_key string API Key(脱敏显示)
model string 使用的模型名称
request_type string 请求类型:chat / embeddings / image 等
input_tokens integer 输入 Token 数
output_tokens integer 输出 Token 数
cost_cny float 费用金额(人民币,元)
status string 请求状态:success / error_4xx / error_5xx

计费 FAQ

如何查看当前余额?

登录控制台,在「账户概览」页面即可查看当前余额、近 7 天消费趋势和余额预警状态。

Token 是如何计算的?

Token 的计算方式与 OpenAI 一致。英文约 1 个单词 = 1 个 Token,中文约 1.5-2 个汉字 = 1 个 Token。您可以使用 OpenAI Tokenizer 工具估算 Token 用量。

流式输出的费用如何计算?

流式输出(stream=true)的费用计算方式与非流式完全相同,按最终输入 + 输出的总 Token 数计费。流式过程中会先预扣估算费用,请求完成后按实际用量结算。

5xx 错误的预扣费用会退还吗?

会。5xx 错误不计费,如果请求过程中有预扣费用,会在请求失败后立即退还到账户余额。

可以设置消费上限吗?

可以。在控制台「账户设置」中可以为每个 API Key 设置每月消费上限,达到上限后该 Key 将自动停用。