暴涨27倍，一群华人卖Token：年入22亿-新糖宝胶囊官方网站

AI行业，又出现一家千亿公司。

5月27日，据彭博社报道，美国AI推理平台Fireworks AI正在洽谈新一轮融资，目标估值150亿美元（约1024亿元人民币）。

而7个月前，它的估值还是40亿美元。如果再往前看：2024年7月，它B轮估值仅5.52亿美元。也就是说，不到两年，Fireworks AI估值暴涨约27倍。

Fireworks AI估值变化

更猛的是收入。研究机构Sacra数据显示：2026年2月，Fireworks AI年化收入已经达到3.15亿美元（约22亿元人民币），同比增长416%，较2024年B轮时增长约3-4倍。

与此同时，它的平台每天处理约15万亿Token。

这个数字是什么概念？国家数据局此前披露：2025年12月，中国日均Token消耗量约100万亿。

也就是说，Fireworks AI一家公司的日Token处理量，已经接近中国全社会AI调用量的15%。而它成立才不到4年。

一帮华人，在AI行业卖Token

Fireworks AI成立于2022年，总部位于美国加州Redwood City。

公司共有7位联合创始人，其中3位是华人。CEO乔琳（Lin Qiao）：复旦本科、硕士，UCSB博士，前Meta工程高级总监。

Fireworks AI的核心团队

她曾主导PyTorch在数据中心、移动设备和AR/VR设备上的开发部署。

另外两位华人联合创始人：Benny Chen曾在Meta做到首席软件工程师；Chenyu Zhao则长期负责Google Cloud Vertex AI相关业务。

这家公司不训练大模型，也不直接做AI应用。它做的事情很简单：帮企业运行各种开源模型，然后按Token收费。

目前，其支持的模型包括DeepSeek、Kimi、MiniMax等多家开源或开放API模型。

开发者无需自己购买GPU、搭建推理集群或进行底层优化，即可通过兼容OpenAI格式的API直接调用。

Fireworks AI产品界面

而Fireworks AI则按调用量收费。AI应用跑得越猛，它赚得越多。目前，全球最火的AI编程工具之一Cursor，就是其客户。

据官方披露：Cursor在Fireworks AI平台上，已经实现1000 token/秒的生成速度。

钱从“训练”流向“调用”

过去两年，AI行业最烧钱的地方，是训练。

OpenAI、Google、Anthropic、xAI都在疯狂囤GPU，单轮大模型训练成本动辄数亿美元。

但现在，一个变化开始越来越明显：模型训练越来越像“一次性投入”，而推理调用开始变成“长期收费”。

算力结构已经彻底反转：2023年，全球AI算力中训练占2/3、推理仅1/3；到2026年，推理占比飙升至65%–70%，是训练算力的4.5倍。

在中国，这一趋势更极端 ——推理算力已是训练算力的8倍。英伟达黄仁勋甚至判断：未来推理规模将达到训练负载的十亿倍。

市场规模同样爆发：Lightspeed此前披露：过去3年，AI推理市场已经从0增长到超过50亿美元。

资本也开始疯狂涌入这一赛道。

除了Fireworks AI，Baseten最近被曝出正以110亿美元估值融资，Together AI估值达到75亿美元，Modal估值46.5亿美元，Fal估值45亿美元。

其中，Baseten在2026年1月刚完成一轮融资估值50亿美元，5个月后新一轮融资估值直接翻倍至110亿美元。

更夸张的是收入增速。

据The Information报道：Baseten年化收入已经从2026年初的2亿美元，增长到Q1末的6亿美元。3个月，增长200%。

这些公司有一个共同特点：它们都不直接做大模型，而是帮整个AI行业“跑模型”——做AI时代的“卖水人”，靠永续的Token调用收费，赚取长期、稳定的现金流。

NVIDIA等巨头进场投资

Fireworks AI背后的投资方越来越豪华。其股东包括Lightspeed、Index Ventures、红杉资本，以及NVIDIA和AMD。

原因很现实：AI应用爆发后，整个行业真正稀缺的东西开始变成GPU，而推理平台本质上是在帮助整个行业更高效率地使用GPU。

NVIDIA此前曾公开表示：基于Blackwell架构的新一代推理系统，已经将单Token成本降低约10倍。在部分大模型场景下，成本甚至可降至原来的1/35。

这意味着，DeepSeek、Llama 3、Kimi等开源模型，在推理成本上已接近甚至挑战GPT-4等闭源API，性价比拐点正式到来。

而谁能把Token成本压得更低，谁就更容易拿下AI应用公司。

目前，Fireworks AI估值对应约3.15亿美元ARR，市销率约47倍。放在2023年AI泡沫期，这个数字不算离谱。

横向对比同行：Together AI估值75亿美元、对应ARR约1.5亿美元，市销率约50倍；Baseten估值110亿美元、对应ARR约6亿美元，市销率约18倍。

放在2023年AI泡沫期，头部AI公司市销率普遍在80–150倍，这个数字不算离谱；在2026年，这种估值仍能成立，核心原因是AI调用量仍在爆炸式增长。

Fireworks AI的平台日Token处理量，已从2025年底的10万亿增长到2026年5月的15万亿，5个月增长50%。按此增速，2026年底有望突破25万亿 / 日，全年处理量将超7000万亿Token——相当于为全球AI应用提供了近1/5的推理算力支撑。

中国，何时出现千亿公司？

Fireworks AI最值得关注的，其实不只是150亿美元估值，而是“按Token收费”这件事已经真正形成商业规模。

过去很多人认为推理平台只是技术服务，但现在3.15亿美元年化收入、416%增速、15万亿日Token处理量，这些数字已经说明：AI调用本身，正在变成一门真正的大生意。

这也是为什么国内越来越多公司开始进入推理层，包括硅基流动、无问芯穹，以及越来越多AI Infra创业公司。仅2025–2026年，国内新增推理赛道创业项目就超过200家。

过去几年，AI行业拼的是谁能训练更大的模型。而现在，越来越多人开始盯上另一件事：谁能替整个AI行业，更低成本地“跑模型”。

本文信源：Bloomberg、Sacra、AIWire、The Information、Fireworks AI官网等。融资尚未最终完成，估值可能变化。

本文来自微信公众号 “铅笔道”（ID：pencilnews），作者：惜文，36氪经授权发布。

发布时间：2026-05-28 16:00

暴涨27倍，一群华人卖Token：年入22亿

一帮华人，在AI行业卖Token

钱从“训练”流向“调用”

NVIDIA等巨头进场投资

中国，何时出现千亿公司？

首席执行官访谈 | 乐高掌舵人倪志伟复盘：以精简革新重塑企业增长引擎

为什么拨号键盘123在上，计算器的123在下？