
本文来自微信公众号: 新浪科技 ,作家:郑峻,原文标题:《一个月烧掉 5 亿好意思元 Token!多家好意思国科技巨头进击叫停,硅谷运转从头招东说念主》,题图来自:AI 生成AI 时间什么最贵?在阅历了此前哄抢显卡和争夺东说念主才的高潮之后,咫尺看来是算力,是 Token 本钱。不仅庸碌企业只可省吃俭用,连科技巨头王人没多余粮了。" Tokenmaxxing "马上变成了一个见笑。
云工作公司 Box CEO 亚伦 · 莱维(Aaron Levie)默示,他近期参预了一场有广博顶级企业高管的晚宴,发现商界首脑们考虑最多的话题,不是宏不雅经济议题,而是他们企业的 Token 本钱。
2026世界杯开云(中国)官方入口莱维所说的并不令东说念主未必。Uber 的 CTO 普拉文 · 内帕利 · 纳加(Praveen Neppalli Naga)上个月坦承:公司将 Claude Code 部署给约 5000 名工程师后,短短四个月内就将全年 AI 预算烧光殆尽,让他措手不足。
Uber 高层的本意是推广工程师们普及 AI 器具,从这个角度来看,他们达到了主张。上个月 Uber 工程师的 Claude Code 月使用率已飙至 95%。但高层并莫得琢磨到另一面,单个工程师每月产生的 API 本钱高达 500 到 2000 好意思元。
濒临着缄口藏舌的 Token 预算,即即是 Uber 这么市值 1500 亿好意思元的大企业王人不得不进击制定严苛的分级料理,放胆职工的使用流量,像过去从简纸张一样量入制出着每一个 Token 的本钱。
科技巨头王人烧不起了 令东说念主未必的是,收紧 AI 预算的不仅有 Uber 这么的中型企业,以致还包括了微软和亚马逊的超等云狡计巨头。
旧年年底,微软最中枢的 Experiences and Devices 部门——隐敝 Windows、Microsoft 365、Outlook、Teams 及 Surface 全线家具的中枢工程团队——着手在里面大界限扩充 Claude Code。
天然微软对外强调并莫得将 AI 使用量纳入职工绩效窥探体系,但他们里面却流传着一份劝诱部门负责东说念主朱莉娅 · 刘松(Julia Liuson)的里面备忘录,称 AI 的使用"不再是可选项,而是每个岗亭、每个级别的中枢条目"。
但只是六个月后,这场实验就不得不被进击叫停。这并不是因为成果不好,而是职工们用得太爽,用量太猛,才让 IT 部门猝不足防。就在本周,微软运转入辖下手关闭大部分里面 Claude Code 授权。数以千计的工程师被强制挪动回微软自家的 GitHub Copilot CLI,以便进行本钱管控。
关联词,更胆战心慌的案例来自 Axios 本周的独家报说念。一家科技巨头因为莫得对职工的 Claude 许可证成就使用上限,在短短一个月内烧掉了 5 亿好意思元。这不是一个抽象的数字:5 亿好意思元尽头于许多中型科技公司的全年营收。
天然报说念莫得实名,但外界普遍合计这说的是亚马逊,因为亚马逊此前在公司里面放荡扩充 AI 器具,并将劝诱者的 AI 使用量纳入里面名次榜窥探,条目超过 80% 的劝诱者每周必须使用 AI。
这套窥探机制马上催生了一个新词:Tokenmaxxing ——特指职工为了刷高名次榜数据而东说念主为制造无真义 AI 花费的举止。亚马逊职工们用 MeshClaw 自动化那些根底不需要 AI 的广博任务,让 AI 智能体在后台空转,只为让我方的 token 花费数字面子。
濒临每个月高达 5 亿好意思元的天价 Token 账单,亚马逊高管最终执意到,职工多数使用 AI 是为了普及排名,而不是治理实践业务问题。

就在上周,亚马逊放手了 AI 使用量窥探,条目职工高效使用 AI 器具。一位亚马逊高管以致警戒旗下职工,不要单纯地为了使用 AI 而使用 AI。这种气魄和此前酿成了昭彰对比。
雷同的刷 Token 闹剧也在 Meta 献技。Meta 首席东说念主力官贾内尔 · 盖尔(Janelle Gale)明确秘书,AI 使用情况与业务影响力将从 2026 年起厚爱纳入绩效窥探体系,顶尖职工的奖金上限将超过年薪的 200%。

Meta 以致条目职工必须在办公电脑上装配一套软件,在防护跟踪他们的 AI 使用情况的同期,也为 AI 自动化办公提供熟谙数据。Meta CTO 安德鲁 · 博斯沃念念(Andrew Bosworth)曾公开默示,地点是异日劝诱大概自主推广责任任务的 AI 代理。
博斯沃念念默示,他最顶尖的工程师花在 AI Token 上的钱尽头于我方的年薪,并以此当作分娩力倍增的字据。在这套指引棒下,Token 花费量从一个工程贪图悄然改革为职场晋升的通货。
Meta 里面以致出现了一个名为" Claudeonomics "的非官方名次榜,跟踪全公司约 8.5 万名用户的 Token 花费量。终结在 30 天的统计窗口内,该名次榜骄横的总使用量超过 60 万亿个 Token。名次榜曝光两天后,因"里面数据遭外部取得"而进击下线。
账单让企业一忽儿表示 这种烧不起 Token 的戏剧性场合似乎回转得太快。因为就在不久之前,科技企业还在纷繁饱读励旗下职工全面转型 AI,为职工提供无适度的 Token 额度。
在本年 3 月的英伟达 GTC 时期,黄仁勋公开默示,贪图为英伟达每一个职工提供每年 50 万好意思元的 Token 额度。黄仁勋以致强调,要是哪个职工在年底前莫得把这 50 万好意思元的 Token 额度用完,他以致会感到"失望",因为这意味着职工莫得充分应用 AI 来重塑我方的责任神色。
在这场科技巨头争相向华尔街讲明 AI 转型故事的时候,Token 花费量被当成 AI 落地深度的代理贪图。Token 花费得越多,尊龙凯时2026世界杯中国官网就越讲明 AI 渗入进了责任流。于是,花费量本人成了地点,分娩力反而成了附带品。
但现实情况是,将 AI 使用量纳入绩效窥探只会带来毫无真义的 Token 阔绰。根据好意思国软件智能平台 Jellyfish 的估算,在轻度使用 AI 的情况下,合并一次拉取苦求的本钱仅为 0.28 好意思元,但在重度使用 AI 的情况下,这一册钱可能一忽儿就会急剧飙升到 89.32 好意思元。Token 花费得更多了,但委派的家具并莫得变多,只是带来了更大的账单。
科技媒体 Axios 用一个词精确抽象了当下的企业 AI 逆境:sticker shock ——价钱虚高综合征。那些也曾急于拥抱 AI 的企业,正在集体濒临扩张的 IT 本钱、难以量化的分娩力普及,以及职工日益生长的怀疑情谊。
高盛最新展望骄横,跟着企业和消费者大界限接纳 AI 智能体,到 2030 年群众 Token 花费量可能增长 24 倍,达到每月 120 千万亿(Quadrillion)。这是一个令东说念主昏迷的数字——但数字本人并不创造价值。考虑公司 Mavvrik 的打听骄横,85% 的企业 AI 本钱展望舛讹超过 10%;84% 的企业默示,AI 支拨已将公司毛利率压低了 6 个百分点以上。
Gartner 的展望则让东说念主透顶表示:即便到 2030 年 AI 推理本钱下落近 90%,企业 AI 总账单也不会因此变得低廉。原因很简便——智能体责任流所花费的 token 量,是庸碌单次对话的数百倍乃至数千倍;消费量的增长速率,绝对足以归并单价下落带来的红利。
"首席家具官们不应该把商品 Token 的通缩,误读为前沿推理才气的普惠化," Gartner 高档分析师威尔 · 萨默(Will Sommer)如斯申饬。
那些也曾以"大开 AI、望望会发生什么"为计谋的公司,正在补课——补那些本该在推广前就该成就的治理体系和本钱管控机制。
Token 账单正在倒逼企业从头念念考一个最基本的问题:AI 到底在为我治理什么问题?这个问题,在采购许可证之前就应该修起。咫尺,市集用账单替他们给出了谜底。
Uber COO 安德鲁 · 麦克唐纳(Andrew Macdonald)对此快言快语:" AI 本钱越来越难以合理化。"这与他们 CTO 早先的表态酿成了一组千里重的呼应:Uber 的 CEO 以致公开默示,他看不出顶点的 Token 花费量与的确委派有价值的家具之间存在职何明确的关系。
从头运转雇佣职工 天然好多企业正在以" AI 不错替代东说念主工"为由扩充裁人,但 Token 本钱急剧高潮与 AI 申报低效还是让一些企业运转踩起了急刹车。
瑞典金融科技巨头 Klarna 曾是 AI 替代东说念主工最激进的饱读动者。2024 年,该公司 CEO 塞巴斯蒂安 · 西米亚特科夫斯基(Sebastian Siemiatkowski)声称 AI "还是能胜任东说念主类通盘的责任",并以此为由冻结招聘、缩短约 1200 名职工,职工总和从 2022 年的 5500 东说念主骤降至 3400 东说念主。
关联词到了 2026 年头,Klarna 运转悄然回转:从头启动东说念主工客服招募,并亲口承认决策差错——"本钱灾难成为过于主导的评估身分,终结是工作质料的下落"。AI 的确快,但它不擅所长理盛怒客户、复杂纠纷和需要共情的场景。Klarna 用一次耗资宏大的回头路,给通盘这个词行业立下了一块警示碑。
澳大利亚联邦银行(CBA)的案例雷同典型。2025 年 7 月,这家澳洲最大银行秘书用 AI 语音机器东说念主替代 45 名客服职工,事理是 AI 已能自动处理多数简便回电。关联词现实马上打脸:机器东说念主上线后,客服回电量不降反升,主顾投诉激增,剩余职工被动多数加班,料理层以致切身下场接听客服热线。只是一个月后,联邦银行向被裁职工公开说念歉并支付赔偿,秘书退避裁人决定,邀请这 45 东说念主统统返岗。澳大利亚金融业工会将此称为"一次宏大的到手"。
这两起事件,折射出 AI 时间一个尚未被充分正视的结构性罗网:企业在考虑 AI 替代决策时,频频只算了"省下若干东说念主工本钱",却漏算了 AI 失效后的善后本钱——主顾流失、品牌受损、从头招募培训,以及向职工赔付赔偿。
考虑机构 Orgvue 和 Forrester 的持续打听骄横,那些急于用 AI 替代东说念主力的企业中,有 55% 过后默示后悔。Token 不错很低廉,但用 Token 替代东说念主所付出的隐性代价,频频远比账单上的数字奋斗得多。
这场回转来得比任何东说念主预期的王人快。从黄仁勋在 GTC 舞台上秘书"职工烧不完 50 万好意思元 Token 我会失望",到亚马逊高管警戒职工"不要为了用 AI 而用 AI ",前后不外几个月。硅谷对 Token 的气魄,完成了一次 180 度的曲线。
但这并不料味着 AI 时间已毕了,而是意味着它的确运转了。此前阿谁"巨流漫灌"式的推广阶段,实质上是一场以算力阔绰为代价的组织实验——企业用真金白银买单,用职工的时刻陪跑,用客户的信任背书。咫尺账单摆上桌面,该算明晰的事终于到了要算的时候:哪些场景确实需要 AI,哪些只是在为名次榜饰演。
Gartner 那句话值得通盘决策者贴在办公室墙上:不要把 Token 的降价,误读为 AI 才气的普惠。的确的问题从来不是 Token 贵不贵尊龙凯时2026世界杯中国官网,而是每一个被花费掉的 Token,究竟在为谁创造价值。