暴涨27倍,一群华人卖Token:年入22亿

AI行业,又出现一家千亿公司。 

5月27日,据彭博社报道,美国AI推理平台Fireworks AI正在洽谈新一轮融资,目标估值150亿美元(约1024亿元人民币)。 

而7个月前,它的估值还是40亿美元。如果再往前看:2024年7月,它B轮估值仅5.52亿美元。也就是说,不到两年,Fireworks AI估值暴涨约27倍。 

Fireworks AI估值变化 

更猛的是收入。研究机构Sacra数据显示:2026年2月,Fireworks AI年化收入已经达到3.15亿美元(约22亿元人民币),同比增长416%,较2024年B轮时增长约3-4倍。 

与此同时,它的平台每天处理约15万亿Token。 

这个数字是什么概念?国家数据局此前披露:2025年12月,中国日均Token消耗量约100万亿。 

也就是说,Fireworks AI一家公司的日Token处理量,已经接近中国全社会AI调用量的15%。而它成立才不到4年。 

一帮华人,在AI行业卖Token

Fireworks AI成立于2022年,总部位于美国加州Redwood City。 

公司共有7位联合创始人,其中3位是华人。CEO乔琳(Lin Qiao):复旦本科、硕士,UCSB博士,前Meta工程高级总监。 

Fireworks AI的核心团队 

她曾主导PyTorch在数据中心、移动设备和AR/VR设备上的开发部署。 

另外两位华人联合创始人:Benny Chen曾在Meta做到首席软件工程师;Chenyu Zhao则长期负责Google Cloud Vertex AI相关业务。 

这家公司不训练大模型,也不直接做AI应用。它做的事情很简单:帮企业运行各种开源模型,然后按Token收费。 

目前,其支持的模型包括DeepSeek、Kimi、MiniMax等多家开源或开放API模型。 

开发者无需自己购买GPU、搭建推理集群或进行底层优化,即可通过兼容OpenAI格式的API直接调用。 

Fireworks AI产品界面 

而Fireworks AI则按调用量收费。AI应用跑得越猛,它赚得越多。目前,全球最火的AI编程工具之一Cursor,就是其客户。 

据官方披露:Cursor在Fireworks AI平台上,已经实现1000 token/秒的生成速度。 

钱从“训练”流向“调用”

过去两年,AI行业最烧钱的地方,是训练。 

OpenAI、Google、Anthropic、xAI都在疯狂囤GPU,单轮大模型训练成本动辄数亿美元。 

但现在,一个变化开始越来越明显:模型训练越来越像“一次性投入”,而推理调用开始变成“长期收费”。 

算力结构已经彻底反转:2023年,全球AI算力中训练占2/3、推理仅1/3;到2026年,推理占比飙升至65%–70%,是训练算力的4.5倍。 

在中国,这一趋势更极端 ——推理算力已是训练算力的8倍。英伟达黄仁勋甚至判断:未来推理规模将达到训练负载的十亿倍。 

市场规模同样爆发:Lightspeed此前披露:过去3年,AI推理市场已经从0增长到超过50亿美元。 

资本也开始疯狂涌入这一赛道。 

除了Fireworks AI,Baseten最近被曝出正以110亿美元估值融资,Together AI估值达到75亿美元,Modal估值46.5亿美元,Fal估值45亿美元。 

其中,Baseten在2026年1月刚完成一轮融资估值50亿美元,5个月后新一轮融资估值直接翻倍至110亿美元。 

更夸张的是收入增速。 

据The Information报道:Baseten年化收入已经从2026年初的2亿美元,增长到Q1末的6亿美元。3个月,增长200%。 

这些公司有一个共同特点:它们都不直接做大模型,而是帮整个AI行业“跑模型”——做AI时代的“卖水人”,靠永续的Token调用收费,赚取长期、稳定的现金流。 

NVIDIA等巨头进场投资

Fireworks AI背后的投资方越来越豪华。其股东包括Lightspeed、Index Ventures、红杉资本,以及NVIDIA和AMD。 

原因很现实:AI应用爆发后,整个行业真正稀缺的东西开始变成GPU,而推理平台本质上是在帮助整个行业更高效率地使用GPU。 

NVIDIA此前曾公开表示:基于Blackwell架构的新一代推理系统,已经将单Token成本降低约10倍。在部分大模型场景下,成本甚至可降至原来的1/35。 

这意味着,DeepSeek、Llama 3、Kimi等开源模型,在推理成本上已接近甚至挑战GPT-4等闭源API,性价比拐点正式到来。 

而谁能把Token成本压得更低,谁就更容易拿下AI应用公司。 

目前,Fireworks AI估值对应约3.15亿美元ARR,市销率约47倍。放在2023年AI泡沫期,这个数字不算离谱。 

横向对比同行:Together AI估值75亿美元、对应ARR约1.5亿美元,市销率约50倍;Baseten估值110亿美元、对应ARR约6亿美元,市销率约18倍。 

放在2023年AI泡沫期,头部AI公司市销率普遍在80–150倍,这个数字不算离谱;在2026年,这种估值仍能成立,核心原因是AI调用量仍在爆炸式增长。 

Fireworks AI的平台日Token处理量,已从2025年底的10万亿增长到2026年5月的15万亿,5个月增长50%。按此增速,2026年底有望突破25万亿 / 日,全年处理量将超7000万亿Token——相当于为全球AI应用提供了近1/5的推理算力支撑。 

中国,何时出现千亿公司?

Fireworks AI最值得关注的,其实不只是150亿美元估值,而是“按Token收费”这件事已经真正形成商业规模。 

过去很多人认为推理平台只是技术服务,但现在3.15亿美元年化收入、416%增速、15万亿日Token处理量,这些数字已经说明:AI调用本身,正在变成一门真正的大生意。 

这也是为什么国内越来越多公司开始进入推理层,包括硅基流动、无问芯穹,以及越来越多AI Infra创业公司。仅2025–2026年,国内新增推理赛道创业项目就超过200家。 

过去几年,AI行业拼的是谁能训练更大的模型。而现在,越来越多人开始盯上另一件事:谁能替整个AI行业,更低成本地“跑模型”。 

本文信源:Bloomberg、Sacra、AIWire、The Information、Fireworks AI官网等。融资尚未最终完成,估值可能变化。 

本文来自微信公众号 “铅笔道”(ID:pencilnews),作者:惜文,36氪经授权发布。

发布时间:2026-05-28 16:00