“中国最会烧钱的4个男人，坐上了同一张牌桌”-新糖宝胶囊官方网站

今天，让我们来拆一拆中国AI年轻军团的绝对新生力量对比：

智谱最贵，市值超7000亿，营收7.24亿元，同比增长131.9%，是四家中营收规模最大的，但年内亏损高达47.18亿元，同比扩大59.5%，经调整净亏损31.82亿元，毛利率从56.3%骤降至41.0%。

MiniMax最早实现自负盈亏，营收7903.8万美元，同比增长158.9%，海外收入占比超70%，毛利率从12.2%大幅提升至25.4%，是四家中唯一毛利率持续改善的。

月之暗面增长速度最快，2025年全年收入一般，却在2026年初迎来爆炸式增长，K2.5模型发布后不到一个月，ARR（年度经常性收入，下同）突破1亿美元，2026年4月更增至2亿美元。

最近，月之暗面已启动赴港IPO磋商，估值也从2025年底的43亿美元飙升至超过200亿美元。

而DeepSeek成本结构最低也最有理想，成立三年多几乎没有营收，完全靠母公司幻方量化每年数十亿元的利润输血，却在2026年4月启动首轮外部融资，投后估值约450亿美元。

今天，我们带你从这些财报数字出发，逐一拆解DeepSeek、MiniMax、智谱、月之暗面这四家公司截然不同的经营逻辑和决策底牌。

一切的缘起：

创始人的四种背景，四种执念

1.DeepSeek梁文锋：一位量化实验室里走出的AGI信徒

梁文锋，1985年生，浙江大学信息与通信工程硕士，2008年在读研期间与人联合创立量化投资机构幻方量化。这家量化私募在2021年管理规模曾突破千亿元，到2025年仍有超700亿元，年收益率56.55%，是中国头部量化机构之一。

量化与AGI，看起来没关系，其实共享同一种内核：对数据、算法与算力的极致信仰。

2023年7月，梁文锋以幻方量化为主体孵化了深度求索（DeepSeek），初始定位是“AGI大语言模型的基础研究”。

他明确表示，做大模型不为短期商业变现，而是“为了解决最重要的问题”，吸引顶尖技术人才。

DeepSeek的出圈，是2025年1月。那时候，DeepSeek发布推理大模型R1及开源模型V3，在性能上逼近OpenAI o1和GPT-4o的同时，训练成本之低震惊了整个行业。

DeepSeek的核心护城河之一是成本结构——它把价格打到别人的三十分之一，靠的是架构创新和国产算力。

2.MiniMax闫俊杰：一名押注“规模效应”的产业老兵

1989年出生的闫俊杰，他的履历代表了另一种路径：产业经验优先。

他本硕博均就读于中科院自动化所，2014年加入商汤科技，从早期员工一路升至副总裁，负责计算机视觉等核心研发工作。2019年离开商汤，2021年12月创立MiniMax。

闫俊杰的判断是：大模型的竞争最终是“规模效应”的竞争——用户越多、数据越多、模型越好、价格越低，进而用户更多。这是一种更接近互联网商业逻辑的思路。

MiniMax从一开始就将商业化放在核心位置：API收入、订阅付费、企业级解决方案三条腿走路，且海外优先，因为海外用户付费意愿强、生命周期价值更高。

它是四家里最早跨过盈亏平衡线的。靠C端出海产品Talkie，2024年就打平了。全模态五线并进，文本、图像、视频、音频、音乐全覆盖。

3.智谱张鹏：一个拥有技术自觉与资本市场的耐心考验的学院派

2019年，清华大学知识工程实验室（KEG）联合校内多个实验室，正式孵化智谱AI，由时任KEG副研究员的张鹏担任CEO。这是“中国AI四小龙”中最具学院背景的一家。

与纯商业化路线不同，智谱从一开始就将“认知智能”和“安全可控”作为核心标签。

其GLM系列大模型在中文语义理解、逻辑推理、多模态理解等指标上持续迭代，同时积极参与国产大模型的标准制定与政府合作项目。

本地化部署是智谱的核心商业模式，客户（主要是政府和大型企业）将模型部署在自有服务器上，智谱收取授权费用和技术服务费。这一模式的优势是客单价高、现金流稳定；风险在于增长天花板相对有限，且面临开源模型的技术替代压力。

智谱的市值是最贵的，一度超过7000亿市值，三次涨价83%，调用量反涨400%。

据新浪财经报道，前十大互联网公司有9家每天调用它的GLM模型。

4.月之暗面杨植麟：最年轻的CTO与最快的融资机器，并存。

1992年出生的杨植麟是“四小强”创始人中最年轻的一位，也是节奏最快、争议最大的一位。

他本科毕业于清华大学，后赴卡内基梅隆大学读博，师从苹果AI研究团队负责人。2023年6月创立月之暗面，发布AI助手Kimi，成为国内最早推出200万字无损上下文窗口的大模型应用之一。

杨植麟的风格鲜明：极度追求技术指标和增长数据，愿意以高估值、高融资密度换取时间窗口。“长期主义”是他早期反复使用的词汇，但2026年5月的港股IPO筹备，标志着这一叙事正在被现实改写。

经营的四套答卷，折射出四条不同路径

1.梁文锋：AI的本质是基础模型的无限逼近

在梁文锋看来，AI行业的一切商业化，都建立在模型能力的基础上。皮之不存，毛将焉附？

所以DeepSeek的唯一战略，就是把模型做到极致，且必须开源。API定价极低、Web端免费，都是服务于“最大化技术影响力”这个目标。

然而，这种纯粹也在面临现实压力。2026年4月，DeepSeek正式启动首轮外部融资，这背后是人才争夺战的现实压力。

当字节、小米等巨头抛出极具吸引力的薪酬方案时，没有股权变现通道的DeepSeek处于明显劣势。即便纯粹如梁文锋，也不得不在理想与现实之间寻找新的平衡。

2.闫俊杰：AI的本质是“成本-体验”的最优解

闫俊杰的第一性原理是博弈论。他认为，大模型的竞争本质是一场“成本-体验”的优化博弈。

用户不会为“最强的模型”付费，只会为“在可接受成本内体验最好的模型”付费。因此MiniMax的战略重心不是追求模型参数的绝对领先，而是追求模型效率、推理成本、用户体验三者之间的最优平衡。

这种思维贯穿了MiniMax的所有决策：坚定出海（避开国内价格战）、自研多模态（降低外部依赖）、ALL-in C端（用户增长驱动模型迭代）。

2025年，MiniMax毛利率从12.2%提升至25.4%，是四家中唯一毛利率持续改善的。研发开支仅增长33.8%，远低于158.9%的收入增速，规模效应开始兑现——每增加1元收入所需的研发投入从2024年的6.19元降至2025年的3.20元。

同时，营销费用同比下降约40%，意味着增长更多来自用户口碑和自然流量，而非买量推动。

尽管年内账面亏损高达18.7亿美元，但约16亿美元是非现金的优先股公允价值重估，经调整后实际经营亏损仅2.5亿美元。

3.张鹏：AI的本质是生产力工具的可靠性

智谱的学院派出身，决定了它对AI的理解更接近“基础设施”：成为企业可依赖的生产力工具。

所以智谱的产品设计以稳定著称。它提供全栈式服务：从模型层到平台层再到应用层。这种“全家桶”策略让客户可以一站式解决需求，但也面对着更高的研发投入和更重的交付压力。

2025年，智谱研发开支达31.80亿元，同比增长44.9%，每赚1元钱，就要在研发上花掉4.4元。

但另一面是：云端部署业务收入增幅达292.6%，企业级智能体收入同比增长248.8%。云端毛利率从2024年的3.3%大幅提升至2025年的18.9%，展现出标准化服务的规模效应与盈利潜力。

这在结构上对冲了本地化部署毛利率下降（从66.0%降至48.8%）带来的压力，验证了张鹏的判断：企业对可靠、可定制的AI工具有着真实且刚性的需求。

据钛媒体梳理，GLM-4.5就开始押注Coding路线，比其他家早了将近一年。据CSDN的实测对比，GLM-5.1编程能力在国内模型里是天花板。

4.杨植麟：AI的本质是人与信息的连接方式

杨植麟可能是四人中最有“产品感”的一个。他对AI的理解不局限于技术本身，而是上升到信息交互的范式变革：从搜索框到对话框，从点击链接到直接获取答案。

因此，Kimi的产品哲学是“让信息触手可及”。它主打长文本处理，支持200万字的上下文窗口，就是要让用户可以“一次喂一本书，然后随意提问”。这种能力直接击中了知识工作者、学生、研究者的痛点。

杨植麟相信，只要把“人连接信息”的体验做到极致，用户愿意付费。2026年初的爆发式增长初步验证了这个假设。

据界面新闻2026年5月9日报道及36氪报道，ARR从3月的1亿美元飙升至4月的超2亿美元，付费用户和API调用量大涨，海外API调用收入在2025年9至11月增长4倍，全球付费用户月度环比增速突破170%。

但另一面是，2025年全年收入有限，商业化爆发完全集中在2026年初，对单一模型和单一产品的依赖度极高，持续性和抗风险能力仍有待时间检验。

四种不同思维背后的决策底牌与护城河

不同的底层逻辑，决定了各自手上有了不同的底牌。自媒体号“AI实用工具盒”作者章逸寒对AI四强的底牌进行了一一解析。

1.DeepSeek

DeepSeek的底牌是成本结构。据36氪报道，V4-Pro的API理论利润率高达545%，缓存命中仅0.025元/百万token。这不是降价，这是在重写AI的成本曲线。

梁文锋拒绝阿里生态捆绑、限制腾讯话语权，84%的股权牢牢握在手里，用独立性换来了定价权。

DeepSeek做的事极度聚焦。不做多模态，不做语音模型，不做视频模型——V4.1才开始试水图像和音频。梁文锋把所有资源砸在一个点上：用最低的成本，训出最强的语言模型。

DeepSeek走的路是：人少、聚焦、极致效率。

但命门同样清晰：DeepSeek至今没有真正的商业化闭环。1.27亿月活是免费用户，700亿融资是为了AGI而不是赚钱。这条路OpenAI走了8年还没走完。

他的团队确实精干，270人做出1.6万亿参数模型，人均产出极高，但AGI不是光靠人效能解决的。

2.MiniMax

MiniMax的底牌是全模态加出海。据高盛研报，Talkie年营收约7000万美元，是四家里唯一有C端现金奶牛的。

Lightning Attention架构让它做到400万token上下文窗口，据remoteopenclaw.com评测，这是全球所有生产模型中最长的。技术上有独门绝技。

但命门是Coding转身太晚。2025年10月M2才第一次明确按Coding导向设计基础模型，据钛媒体梳理，比智谱晚了将近一年。

闫俊杰在2021年押注C端娱乐加全模态加出海，这条路在2024年看起来最聪明——当年就自负盈亏了，但错过Coding的窗口，代价是市值只有智谱的1/3。

据钛媒体报道，智谱M2.7技术上追平了第一梯队，但在开发者心智和Agent生态上慢了至少两个季度。

3.智谱

智谱的底牌是Coding最早最深。据钛媒体梳理，GLM-4.5就开始押注Coding路线，比其他家早了将近一年。这个时间差让它在开发者心智里抢占了先机。

智谱做了40+款国产芯片适配、1.2万企业客户、全栈API服务。智谱有Coding先发优势、涨价能力以及和字节深度绑定，基本盘最扎实。

但命门也在这里：如果Anthropic或OpenAI的Coding模型突然大幅降价，智谱的溢价空间就会被压缩。前十大互联网公司9家在用它，意味着一旦有人跑路，就是巨大的负面信号。

4.月之暗面

月之暗面的底牌是增长速度。据《晚点LatePost》和美团龙珠合伙人王新宇透露，ARR两个月翻倍，从1亿到2亿美元只用了60天。

K2.6开源后开发者生态快速膨胀，Kimi Claw踩中了Agent风口，海外营收占比超50%，不再被国内C端价格战卡脖子。

但命门在于：月活从3600万跌到967万，说明C端用户用脚投票了。Kimi押注的是“中国版Anthropic”——纯模型公司，不卷C端。

但如果模型能力追不上Anthropic，估值就撑不住。200亿美元对应的是“下一个Anthropic”的预期，不是“又一个国产模型”的现实。

结语

DeepSeek、MiniMax、智谱、月之暗面这四家公司，分别代表了中国AI创业的四种原型：技术理想主义、商业现实主义、学院派稳健主义、产品精英主义。

它们都信奉AGI，但通向AGI的路径大相径庭，有人走开源、有人走闭源、有人走B端、有人走C端、有人走国内、有人走出海。

没有普适的最佳实践，但都是中国AI之路的前行者，终极强者未见分晓，但每一条路都是一种极致的探索。这或许就是从这四家公司身上，我们能学到的最重要的一课。

参考来源：1.《AI五虎2026年中数据全景：月之暗面、阶跃星辰、MiniMax、深度求索、智谱原创》，AI实用工具盒。

*文章为作者独立观点，不代表笔记侠立场。

本文来自微信公众号 “笔记侠”（ID：Notesman），作者：智勇，36氪经授权发布。

发布时间：2026-05-31 16:04

“中国最会烧钱的4个男人，坐上了同一张牌桌”

一切的缘起：

创始人的四种背景，四种执念

经营的四套答卷，折射出四条不同路径

四种不同思维背后的决策底牌与护城河

结语

华尔街最火00后

暂无

“中国最会烧钱的4个男人，坐上了同一张牌桌”

一切的缘起：

创始人的四种背景，四种执念

经营的四套答卷， 折射出四条不同路径

四种不同思维背后的决策底牌与护城河

结语

华尔街最火00后

暂无

经营的四套答卷，折射出四条不同路径