一文看懂"算力通胀":为什么你用AI越来越便宜,算力公司却越来越赚钱?

2026年3月,中国日均Token调用量达到140万亿次,较2024年初增长超过千倍。(来源:东方财富,2026年5月)

同期,主流AI大模型的API调用价格,普遍跌去了80%-99%——DeepSeek、Kimi、通义千问等,百万token的调用成本,已经从2023年的几十元降到了几分钱。

听起来,这是一个用户赢了的故事:AI越来越便宜,算力越来越普惠。

但与此同时,另一组数字在反向运动:算力租赁企业东阳光云智算签下160亿至190亿元的算力服务大单(来源:东阳光公告,2026年5月);GPU租赁价格从2025年10月的1.70美元/小时上涨至2026年3月的2.35美元/小时,涨幅近40%(来源:利通电子年报,2026年5月)。

但我觉得,这次最值得注意的,不是某家公司的订单有多大——而是:算力行业的定价模式,正在经历一次悄悄的转移,而这次转移,正在重塑整个AI产业链的利润分配。

有人可能会说,不就是量大所以便宜吗?规模经济而已。

其实,不是的。老规矩,我争取用一篇文章,帮你读明白这件事。

AI变便宜了,算力为什么反而更贵?

要搞清楚这件事,需要先理解一个概念:算力通胀悖论。

从表面上看,AI调用越来越便宜,应该意味着算力供给越来越充裕,价格应该下降。但实际情况是——AI变便宜,导致用量爆炸式增长,而用量增长的速度,远超价格下降的速度,算力的总需求量反而急速膨胀。

跨行业类比:这就像高速公路收费降价之后,路上的车反而更多,收费站赚的总钱更多了。2023年,大多数企业一个月用不了100万token。2026年,一个普通的AI编程工具,一天的调用量就超过1亿token。

总需求的爆炸,完全抵消了单价的下降,并且还倒过来推动了算力的稀缺。

这就是算力通胀悖论的本质:单价降,但总花费涨;用户感受到便宜,但整个行业的算力账单在急速膨胀。

定价模式的转移,才是真正的关键

但仅仅说"量涨价跌总量增",还不足以解释算力公司的利润为什么在上升。更深一层的变化,发生在定价模式上。

过去,算力是按照「固定时长租赁」来定价的——就像租停车位,按月付钱,不管你用没用,钱都要付。

2026年,算力租赁行业正在快速切换到「按Token调用量分成」的模式——就像加油站,你用多少付多少,用量越大付钱越多。

我把这个变化叫做:从「停车位」到「加油站」的定价权转移。停车位的钱,买的是空间。加油站的钱,买的是消耗。当消耗量指数级增长时,加油站的生意远比停车位好做。

在固定时长模式下,一台GPU服务器的年收入是固定的。在Token分成模式下,只要上面跑的AI应用用量增长,算力公司的收入就跟着增长。而2026年,AI应用的用量增长是指数级的。

算力通胀的三个具体结果

【结果一】算力稀缺性在上升,而不是下降直觉上,算力芯片产能在增加,算力应该越来越不稀缺。但这里有一个时间差:需求增长的速度,比产能扩张的速度快得多。谷歌将2026年资本支出上调至1800-1900亿美元,亚马逊、微软也在同步加码,三家合计超过4500亿美元(来源:东方财富,2026年5月)。这些钱在建的,是2028年才能交付的数据中心。而AI应用的需求,是2026年就在爆炸的。

【结果二】AI应用层定价权在向算力层转移  过去,大家以为AI产业链的利润大头,会在"模型"这一层。但算力通胀的存在,正在让算力层的议价能力提升。跨时代类比:这有点像1990年代互联网泡沫时期,最终没有靠着网页内容公司赚钱,而是靠着卖网线和服务器的公司——"镐头铲子"胜过了"淘金人"。在AI时代,算力就是那把镐头铲子。

【结果三】Token经济形成了一套新的利润分配机制  Token分成模式的出现,让算力公司开始直接参与AI应用的商业变现。这让算力公司的商业模式,从"按时间卖租约"变成了"参与AI应用的商业生态分成"——这是算力层在整个AI产业价值链中地位的系统性提升。

算力通胀悖论,可以迁移到哪里?

这个框架的真正价值,在于它可以迁移。

迁移到个人电费账单:家用电器越来越节能,但家里的耗电量为什么越来越高?因为节能降低了使用门槛,带来了更多设备、更长使用时间。电力公司的总收入不降反升。这和算力通胀完全同构。

迁移到带宽经济: 4G时代,流量单价大幅下降,但运营商总收入没崩溃,因为用量增长吃掉了降价。5G同理,单价降,但连接设备数、传输数据量指数级扩张。

通用框架:只要满足两个条件——单价在降、用量在爆炸,这种「通胀悖论」就会出现。理解这个框架,可以帮你识别任何供给侧正在经历类似结构的行业。

对你意味着什么?

如果你是AI产品的普通用户: 用AI会越来越便宜,这个判断是对的。但当算力通胀传导到应用层,你会发现高端功能开始分级收费(豆包推出付费版即是信号),免费的部分越来越基础,真正有价值的任务开始需要付钱。这是结构使然。

如果你是企业决策者:算力成本正在成为AI应用企业的核心成本项,且在Token分成模式下会随着用量线性增长。做好算力成本的预算管控,是AI时代企业财务规划的新课题。

如果你关注AI产业投资: "AI应用层会最赚钱"的判断需要重新审视。算力层的议价能力正在提升,且这种提升是由定价模式变化驱动的,不是一次性题材炒作。当然,具体到个股,这不是投资建议。

这篇文章做了大量简化。现实中,不同类型的算力、不同客户群体的定价模式差异很大,Token分成模式目前还在早期。

文章能给你的,是理解算力通胀悖论的框架:单价降→用量爆→总需求涨→稀缺性维持→定价权从买方向卖方转移。 读懂这个框架,下次看到"AI越来越便宜"和"算力公司大单"同时出现时,你会知道,这两件事不是矛盾的。

本文来自微信公众号 “BT财经”(ID:btcjv1),作者:BT财经,36氪经授权发布。

发布时间:2026-05-09 16:12