Token怎么收费的？各家模型价格大PK

上一期我们聊了Token是什么——就是AI数"字"算钱的单位。那问题来了：这一个Token到底值多少钱？各家模型的价格差距有多大？

我直接说答案吧：最便宜的模型和贵的之间，价格差了快100倍。用错了，一个月多花几千块都有可能。

一、先看一个最直接的对比

先上硬数据。以下是我在写这篇文章时（2026年5月）各主流模型的输入价格（每百万Token，美元）：

模型	输入价格	输出价格
GPT-4o	$2.50	$10.00
Claude 3.5 Sonnet	$3.00	$15.00
Claude 3 Haiku	$0.25	$1.25
Gemini 1.5 Pro	$1.25-$3.50	$5.00-$10.50
Gemini 1.5 Flash	$0.075	$0.30
DeepSeek-V3	$0.27	$1.10
DeepSeek-R1	$0.55	$2.19
通义千问-Max	~$0.60	~$2.40
Llama 3 (自部署)	~$0.10 (算力成本)	~$0.40

看出什么规律了吗？

输出价格通常是输入价格的3-5倍。为什么？因为让AI"想"出答案比让它"读"你的问题要费劲得多——输出的每个Token都是实时计算出来的。

二、这些数字到底意味着什么？

百万Token听起来很大，但换算成日常使用就直观了：

1个Token ≈ 0.75个汉字（中文效率高，因为AI会把常见中文词打包成一个Token）。

所以100万个Token ≈ 75万个汉字 ≈ 三本《三体》。

这么一算：

用GPT-4o读完三本书的输入量：$2.50
用Claude Haiku：$0.25
用DeepSeek-V3：$0.27

读的成本其实没你想的那么高。大头在让AI写。

三、用一个真实场景算账

假设你每天的工作场景是这样的：

每轮对话：问题100字 + AI回答800字
每天：20轮对话
一个月：22个工作日

算一下：

每轮对话：
- 输入：~130 Token × $2.50/百万 = $0.00033
- 输出：~1050 Token × $10.00/百万 = $0.0105
- 每轮总价：约 $0.0108

每天20轮：$0.216
每月22天：$4.75

一个月才4.75美元——这是GPT-4o的价格。

换DeepSeek-V3呢？

- 每轮输入：~130 Token × $0.27/百万 = $0.000035
- 每轮输出：~1050 Token × $1.10/百万 = $0.00116
- 每轮总价：约 $0.0012

每天20轮：$0.024
每月22天：**0.53美元**

一个月五毛三。是的你没看错。

所以对日常使用来说，API其实不贵。真正烧钱的是这两个场景：

场景一：长文档处理

你让AI读一本10万字的书（约130K Token），让它写一份摘要。

GPT-4o读一次：$0.33 写摘要（2000字输出）：$0.026

一次就要$0.36。如果你每天读5本书做分析：$1.8/天，$54/月。

场景二：大批量自动处理

比如你是一家电商公司，每天用AI生成1000条商品描述，每条500字。

DeepSeek写1000条：约$7.3 GPT-4o写1000条：约$66

差价接近10倍。规模上来了，差距就恐怖了。

四、各家模型的"性价比"分层

根据实际使用，我把主流模型分了五个梯队：

第一梯队：廉价走量款

Gemini 1.5 Flash、Claude Haiku、DeepSeek-V3
日常翻译、分类、提取、简单写作
成本极低，质量够用
推荐：大多数人日常用DeepSeek-V3就够了

第二梯队：性价比之王

GPT-4o mini、通义千问-Max
中等复杂度任务，编码辅助
价格适中，能力不错
推荐：中文场景首选千问-Max，英文场景GPT-4o mini

第三梯队：旗舰全能

GPT-4o、Claude Sonnet、Gemini 1.5 Pro
复杂推理、长文写作、代码生成
贵，但确实强
推荐：重要工作用GPT-4o，编程用Claude Sonnet

第四梯队：推理怪兽

DeepSeek-R1、o1/o3
数学证明、复杂逻辑推理
会"思考"再回答，所以输出Token多（Chain of Thought）
推荐：只有真正需要深度推理时才用

第五梯队：免费/自部署

Llama 3、Mistral、Qwen的开源版本
自己租服务器跑，硬件成本固定
适合高吞吐量、隐私敏感场景
推荐：日均百万Token以上再考虑

五、一个你可能没注意到的"隐形收费"

各家模型都是按Token收费。但注意：同样的字数，不同模型切出来的Token数不一样。

打个比方：你说了同样一句话，有的模型把它切成10个Token，有的切成15个。

这对价格的影响是直接的——15个Token比10个Token贵50%。

具体来说：

中文上，DeepSeek和千问的分词效率最高（针对中文优化）
英文上，GPT和Claude的分词效率最高
多语言混用（中英夹杂）的情况下，所有模型的Token数都会暴涨

小技巧：如果主要用中文，选DeepSeek或千问，同样的内容可能少花20-30%的钱。

六、实操建议：怎么省钱？

月消耗小于$50

直接用DeepSeek-V3或通义千问-Max就够了。别为了一周一次的复杂任务买GPT-4o订阅，那不值得。

月消耗$50-$200

组合使用：90%日常用廉价模型 + 10%复杂任务用旗舰模型。目前很多API平台（OpenRouter、One API等）支持自动路由，设置好规则后不用手动切换。

月消耗$200以上

考虑自部署开源模型。一台A100（约$1.5/小时）可以跑Llama 3 70B，一个月$1080。如果每天百万Token级别，自部署比API便宜一半以上。

最省钱的办法

减少输出Token。前面说过输出比输入贵3-5倍。所以：

让AI"用一句话回答"而不是"请详细分析"
少说废话，指令越精确越好
能用程序处理的结构化数据，别让AI转述

七、特别提醒：API vs 会员订阅

很多人纠结：ChatGPT Plus（$20/月）和用API，哪个划算？

答案是：取决于你的用量。

如果每天20轮以内，API更便宜（$4-5/月）
如果重度使用（每天50+轮），Plus会员更划算
Plus会员还能免费用DALL-E绘图、数据分析、联网搜索

Claude Pro同理（$20/月），Sonnet随便用，但Opus有每日限额。

折中方案：Plus会员 + DeepSeek API做特殊任务。或者直接用Poe/You等聚合平台。

小结

Token收费没那么神秘，记住这几句话就够了：

读便宜写贵——输出比输入贵3-5倍
旗舰便宜梯队的差距在10-50倍——选对模型省大钱
中文场景选国产模型更划算——分词效率高
规模大了差距才恐怖——个人用户不用太焦虑
订阅制适合重度用户——每天50轮对话以上再考虑

最值得的起点：先用DeepSeek-V3免费API（或者通义千问），等发现不够用了再往上加钱。

📖 本文是MST「30天AI科普专栏」第7篇 / 共25篇 🔖 分类：日常使用 关注MST，每天一个AI小知识，把大模型讲明白。