AI账单暴涨，实际效益难言：谁在助推“Token通胀”？

开云(kaiyun)中国官方网站-登录入口围绕体育资讯与赛事内容服务打造综合平台，整合热门赛事动态、比赛信息、实时内容更 - 开云

AI账单暴涨，实际效益难言：谁在助推“Token通胀”？

100万亿，即1后面跟14个零，这个数字庞大，但可能还不足以覆盖国人每日的Token用量。到2026年上半年，从科技中心的讨论到企业内部的闲聊，一个热门话题是：“你今天消耗了多少Token？”这个数字可能从几十万到几千万不等，对于不了解情况的人来说，听起来像是在夸大其词或精神失常。然而，这并非虚言，他们谈论的单位是Token，而非人民币。

尽管Token与实际货币之间存在巨大的价值差异，但Token数量的急剧增长导致其价值迅速稀释。有报道称，一家国外公司在为员工批量开通Anthropic的Claude企业版时，未设置消费上限，一个月的账单高达5亿美元，折合人民币约34亿元。

在国内，米哈游也出现了类似情况。该公司《崩坏》系列技术团队负责人郑银河在2026年5月的阿里云峰会上透露，一名工程师在测试多Agent协同工作时，因未设置熔断机制，导致数十个智能体陷入循环调用，在短短13小时内消耗了200万元的Token。

尽管AI账单高企，但其带来的实际效益却难以明确。米哈游工程师那200万元的Token消耗，足以支付一个小型研发团队一个月的工资，最终却只换来了无意义的“AI摸鱼”。

或许，企业内部只有人力资源部门完成了裁员目标，而企业主则将节省下来的人力成本重新投入到AI建设和Token购买上。

Token作为AI时代的核心媒介，其单位价值不断缩水，消耗规模呈指数级增长，投入与产出之间出现错位，呈现出明显的通货膨胀特征，甚至比历史上某些恶性通货膨胀的情况更为严峻。那么，究竟是谁在加剧“Token通胀”的局面？

从无限制使用到额度限制

2026年上半年，硅谷盛行“Tokenmaxxing”的风潮，大型科技公司鼓励员工尽可能多地使用Token，甚至将其与绩效考核挂钩。

Meta内部设立了追踪8.5万名员工Token消耗的排行榜，为消耗量靠前的员工颁发“Token传说”、“缓存大师”等称号。亚马逊推出了名为“KiroRank”的内部AI使用排行榜，将Token消耗数据纳入团队绩效评估。

英伟达CEO黄仁勋的言论更是火上浇油：“如果我的工程师消耗的Token价值达不到他们年薪的一半，我会深感忧虑。”

国内厂商也迅速跟进。腾讯在2026年3月启动了全员AI激励计划，为每位员工提供年均22万元的Token资源，涵盖Cursor、CodeBuddy等多种国内外工具，内部也曾一度出现Token消耗排行榜。

结果不出所料，它们的AI账单纷纷失控。

Meta员工在短短30天内消耗了60.2万亿Token，支出超过1亿美元。Uber仅用了4个月就耗尽了2026年的全年AI预算，管理层不得不紧急实施限额政策，规定每位员工每月AI工具使用费用不得超过1500美元。亚马逊也开始推行严格的Token限额管理，高级副总裁Dave Treadwell甚至亲自呼吁“不要为了使用AI而使用AI”。

就在上个月，腾讯内部也发布了额度调整通知：全员Token配额大幅削减，核心研发团队的月额度从宽松状态收紧至7000元，外包岗位的额度更是降至1000元。

从全员无限制使用到实施额度限制，短短三个月内，情况发生了巨大转变。究其原因，主要是不断飙升的账单让即使是财力雄厚的大公司也感到难以承受。

正如OpenAI CEO山姆·奥特曼近期在一个企业客户活动上所言：“今年年初，AI的运行成本还不是一个被提及的问题，现在它突然变成了一个巨大的问题。”

这背后是需求的爆炸式增长。国家数据局数据显示，2026年3月，中国日均Token调用量已超过140万亿，而2024年初仅为1000亿，两年内增长超过千倍。

从全球范围来看，这种增长趋势丝毫没有放缓的迹象。高盛近期发布的报告预测，到2030年，全球Token月消耗量将比2026年增长24倍，达到约120千万亿（120 quadrillion）Token/月，其中企业级智能体是主要的增长驱动力。

Token账单失控还带来了一个负面效应。为了弥补AI的高昂成本，今年第一季度，全球十几家科技巨头裁员超过4万人，程序员首当其冲；在国内，许多互联网从业者将“630”视为共同的“最后一天”。

在Meta，几乎已经没有人手动编写代码；在国内的头部大厂，新增代码中高达90%由AI生成。AI代码生成率的急剧上升，直接导致了人力需求的下降，并引发了职场动荡。

Token账单飙升之谜

账单费用由“用量”和“价格”两部分构成。在这个看似简单的公式背后，隐藏着两层不透明的成本推高逻辑，最终叠加导致了指数级的成本膨胀。

许多人存在一个误解：大模型的价格一直在下降，AI难道不应该越来越便宜吗？实际上，这只说对了一半——价格下降的主要是通用轻量模型，而企业真正需要的编程、长上下文处理、复杂推理等高价值场景，其价格不仅没有下降，反而逆势上涨。

Anthropic推出的安全增强版模型Fable 5，定价高达每百万Token输入10美元、输出50美元，是同期Opus系列的两倍。

国内的智谱AI也是一个典型例子。据天眼查数据显示，2026年第一季度，智谱AI伴随新模型的迭代，连续三次上调了核心API价格，累计涨幅达83%。其面向通用场景的GLM-4.7轻量模型，输入价格仅为2-4元/百万Token，输出为8-16元；但针对编程和Agent场景的GLM-5.2，输入价格上涨至8元，输出高达28元，两者价差最高达4倍。

此外，腾讯云在2026年3月至4月经历了两次调价，混元HY 2.0 Instruct模型的输入价格涨幅高达463%；MiniMax核心模型的价格也上调了30%-50%。

与此同时，模型厂商的计费模式从订阅制全面转向按量付费，厂商的收入直接与Token消耗量挂钩。这就形成了一个结构性矛盾：客户的目标是用最少的Token完成任务，而厂商的商业利益则天然地倾向于让客户消耗更多Token。

从实际数据来看，近期的Token消耗量增长并非线性，而是呈指数级增长。

自2025年底至今，AI产业最核心的变化是从对话式AI向智能体（Agent）的跃迁。AI不再是简单的一问一答式交互，而是演变为自主规划、循环调用、多轮纠错的复杂流程，Token消耗也因此从线性增长转变为指数级膨胀。

Agent虽然能力强大，但据腾讯研究院分析，其内部隐藏着几类典型的低效消耗：

一是“上下文陷阱”，智能体在每一步操作中都会重复携带历史对话、工具日志和文件内容，同一批信息被反复计费。

二是“技能冗余”，对49个软件工程技能的基准测试显示，79.6%的技能对任务通过率没有提升作用，却可能带来最高451%的Token开销增长。

三是多Agent间的“沟通成本”，当多个智能体协同工作时，它们会不断重复任务背景、结论和格式化的套话，每一次对话都意味着一次重复计费。

四是长任务的“熵增”，任务链条越长，越容易出现偏差，而为了纠偏又需要增加摘要、检查、回滚等机制，进一步推高消耗。

这些损耗并非简单的叠加，而是互相叠加的乘积效应。一个复杂的多Agent任务，可能有近一半的Token被用于内部协调、自我纠偏和重复读取，真正用于生成有效内容的比例并不高。对于缺乏技术能力的企业来说，这更是一笔难以弄清的糊涂账。

害怕错失的焦虑

如果说大模型厂商的产品和定价策略是公开的“阳谋”，那么企业内部的Token消费则是一场自上而下的“自我消耗”。

出于对错过AI变革浪潮的担忧，企业纷纷积极拥抱AI。这种压力自然会传递给每一位员工，尤其是在AI可能取代人工的阴影下，员工普遍将“会使用AI、多使用AI”视为一种安全感来源。

许多公司将AI代码生成率、工具使用时长纳入OKR目标，甚至上线全员可见的数据看板，以此来“倒逼”每个人增加Token消耗。一些本可以用搜索引擎或人力在几秒钟内解决的简单任务，如回复邮件、编写基础代码片段、进行常规数据查询，也被交给大模型处理——反正预算不是自己掏钱，用得越多，越显得“拥抱变革”。

企业将Token消耗量与员工绩效挂钩，默认“AI使用量”等同于“价值创造”，并愿意为此支付高昂的账单。

有人认为，这是历史发展的规律。历史上，每一次通用技术革命都经历过类似的阶段。蒸汽机刚发明时，工厂主计算后发现其成本不如使用马匹；电灯刚投入商业使用时，成本远高于煤气灯。

但不同的是，电力消耗产出的是实实在在、可衡量的工厂效益，而Token换来的“智能”究竟创造了多少价值？答案是，目前仍难以量化。

据《晚点LatePost》报道，一位互联网大厂的技术管理者透露，其部门20多个人，一个月消耗5万元Token，但回顾下来，并未沉淀出多少可落地的成果。这笔钱相当于10名实习生的月薪，化为无形的Token后，甚至连清晰的产出物都没有。

在许多基础场景中，使用AI反而比人工成本更高。国内一家人力资源服务商曾进行测算：使用AI筛选并初步评估一份简历，Token和系统成本约为1.2元/份，而雇佣兼职人事处理的成本仅为0.8元/份。类似的情况在数据标注、基础文案撰写、简单客服问答等领域也普遍存在。

AI还带来了更隐蔽的成本。有软件公司的研发负责人反馈，引入AI编程工具后，虽然初级开发者的效率看似提升了，但高级工程师的评审工作量翻倍，线上故障的返工成本增加了30%以上。总体核算下来，反而不划算，而且员工的工作负担也更重了。

这正是Token经济最核心的矛盾：Token消耗与价值创造之间，从来不是线性关系。消耗的Token越多，产出的价值并不一定越大；相反，很多时候消耗的增长恰恰源于无效的循环、冗余的设计以及盲目的焦虑。

结语

回到最初的问题，谁在推动“Token通胀”？这并非是某一家AI厂商的恶意营销，也不是个别员工的滥用浪费，而是我们所有人的共同作用。

从提供底层算力基础设施的GPU和存储厂商，到大模型架构固有的膨胀属性；从每一个担心错过AI浪潮而焦虑的企业，到每一位害怕落伍的员工——所有人都共同推高了Token的消耗，导致了Token的贬值，也推高了那本日益增长的AI账单。

每个人都在助推Token的通胀，而每个人又在自身的推动下步履维艰。

27 May, 2015
Khandaker
09 Comments

68 Comments

开云围绕开云官网不断创新，回应用户的真实需求。

06 June 2014 at 10.30

在kaiyun.com方面，开云提供贴心周到的支持。

开云以开云入口为核心，带来高效便捷的体验。

2026年5月20日

通过开云入口，您可以便捷地访问我们精心打造的体育内容平台。无论是宏观赛事概览还是微观数据分析，都能在这里找到您所需的信息。

- 开云专注开云入口，为用户提供专业可靠的体验。
  
  06 June 2014 at 10.30
  
  开云以开云入口为核心，带来高效便捷的体验。
  
开云深耕开云官网领域，用心服务每一位用户。

06 June 2014 at 10.30

想了解更多kaiyun相关内容，尽在开云。

想了解更多kaiyun相关内容，尽在开云。

06 June 2014 at 10.30

开云围绕开云官网不断创新，回应用户的真实需求。

June 2015
M	T	W	T	F	S	S
« Mar
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

June 2015
M	T	W	T	F	S	S
« Mar
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

开云以开云入口为核心，带来高效便捷的体验。