# Token 概念
模型服务用量的一个重要概念是 token。在调用模型推理服务时,会将输入内容进行分词(tokenize),转化为模型可以理解的 token ,经过模型处理后,同样输出 token,并转化为您需要的文本或者其他内容载体。而模型处理(包括输入、输出)的 token 数量会被作为模型推理服务用量的一个重要计量单位。
如语言大模型推理服务费用的一种较为常见的计算方式如下:
费用 = token 使用数量 * token 单价
- 由于不同模型采用的分词策略不同,同一段文本可能会被转化为不同数量的 token。
# 模型价格
请以https://training.xfyun.cn/account以及实际购买页价格为准。
# 在线推理
# 按 token 使用量付费(后付费)
- 出账时间:每小时出账。
- 付款类型:按量后付费。
- 推理服务(输出):包含模型输出的内容,包括模型返回信息里输出(content字段)以及深度模型的思维链(reasoning_content字段)内容。
# 按模型单元付费
- 算力资源:独占的算力资源。
- 售卖方式:按小时售。
# 模型精调
按 token 使用量(训练文本*训练迭代次数)计费,训练完成后出账,按量后付费。
参考https://training.xfyun.cn/account,实际购买价格以下单页面为准。
# 余额不足提醒与欠费处理
# 余额不足提醒
根据实际的输入及输出总和tokens数量,系统每一小时扣费一次,针对三个节点(您的余额小于等于之前三小时的消费金额、您开始欠费、您欠费时长超出24小时缓冲期)给您发送短信提示,请您收到短信后及时前往平台确认余额并充值。
# 欠费处理
欠费后您开通付费的产品将进入欠费状态,平台给您24小时缓冲期,过期后,请求系统将不再响应。
在这篇文章中: