学习地图
第 9 篇 · API · 让你的程序调用 AI
约 5 分钟
9-4

token 计费:自己算一次就懂了

API 按 token 收费——光看数字没感觉,下面这个计价器让你亲手摸到"一次调用几分钱"。

① 讲

token 是文字的最小计费单位(中文一个字常算 1~2 token),输入和输出分开算、输出通常更贵。这些规则光记没用,下面这个计价器让你自己试:打点字、点示例换长短、切不同模型,看一次调用到底多少钱、批量跑一个月多少。数字为示意量级,重点是建立"杆秤"。

② 练

这段话,调用一次要花多少钱?自己试试

把 token 这个抽象的东西"摸"一下:在框里打字(或点示例换长短),看它折算多少 token、用不同模型各要多少钱。数字为示意量级,让你心里有杆秤。

① 输入内容(试试从一句话换成一篇文章):
② 这段内容大约 0 token
中文一个字≈1~2 token,标点也算。越长越贵——这就是为什么要"少喂废话"。
③ 按哪个模型算(点不同的看价差):
先在上面打点字、选个模型,这里算给你看 👇
省钱招
  • ·简单活(分类、改错字、短问答)用小而快的模型(mini / Flash / Haiku),难活才上旗舰——上面切模型时的价差你已经看到了。
  • ·只喂必要的上下文、长对话适当精简——输入越长越贵(你拖动文本时亲眼看到了 token 在涨)。
  • ·反复用的大段固定前缀(系统提示、长文档)开"提示缓存",命中只花约 1/10 输入价。
  • ·不急的批量任务走"批处理"接口,多数家直接打 5 折;想更省可换 DeepSeek / 智谱 GLM 等便宜的源(见 5-2)。
两条红线(别等花了冤枉钱才记住)
  • ·密钥(API Key)绝不写进会提交的代码、绝不放网页前端——前端任何人都能看到,泄露就是别人花你的钱;用环境变量存,发现泄露立刻去控制台吊销重发。
  • ·调太频繁会被限流(报 HTTP 429);官方 SDK 一般会自动退避重试,但写程序时也要给超时、余额不足这些情况留好兜底。