今天,让我们来拆一拆中国AI年轻军团的绝对新生力量对比:
智谱最贵,市值超7000亿,营收7.24亿元,同比增长131.9%,是四家中营收规模最大的,但年内亏损高达47.18亿元,同比扩大59.5%,经调整净亏损31.82亿元,毛利率从56.3%骤降至41.0%。
MiniMax最早实现自负盈亏,营收7903.8万美元,同比增长158.9%,海外收入占比超70%,毛利率从12.2%大幅提升至25.4%,是四家中唯一毛利率持续改善的。
月之暗面增长速度最快,2025年全年收入一般,却在2026年初迎来爆炸式增长,K2.5模型发布后不到一个月,ARR(年度经常性收入,下同)突破1亿美元,2026年4月更增至2亿美元。
最近,月之暗面已启动赴港IPO磋商,估值也从2025年底的43亿美元飙升至超过200亿美元。
而DeepSeek成本结构最低也最有理想,成立三年多几乎没有营收,完全靠母公司幻方量化每年数十亿元的利润输血,却在2026年4月启动首轮外部融资,投后估值约450亿美元。
今天,我们带你从这些财报数字出发,逐一拆解DeepSeek、MiniMax、智谱、月之暗面这四家公司截然不同的经营逻辑和决策底牌。
1.DeepSeek梁文锋:一位量化实验室里走出的AGI信徒
梁文锋,1985年生,浙江大学信息与通信工程硕士,2008年在读研期间与人联合创立量化投资机构幻方量化。这家量化私募在2021年管理规模曾突破千亿元,到2025年仍有超700亿元,年收益率56.55%,是中国头部量化机构之一。
量化与AGI,看起来没关系,其实共享同一种内核:对数据、算法与算力的极致信仰。
2023年7月,梁文锋以幻方量化为主体孵化了深度求索(DeepSeek),初始定位是“AGI大语言模型的基础研究”。
他明确表示,做大模型不为短期商业变现,而是“为了解决最重要的问题”,吸引顶尖技术人才。
DeepSeek的出圈,是2025年1月。那时候,DeepSeek发布推理大模型R1及开源模型V3,在性能上逼近OpenAI o1和GPT-4o的同时,训练成本之低震惊了整个行业。
DeepSeek的核心护城河之一是成本结构——它把价格打到别人的三十分之一,靠的是架构创新和国产算力。
2.MiniMax闫俊杰:一名押注“规模效应”的产业老兵
1989年出生的闫俊杰,他的履历代表了另一种路径:产业经验优先。
他本硕博均就读于中科院自动化所,2014年加入商汤科技,从早期员工一路升至副总裁,负责计算机视觉等核心研发工作。2019年离开商汤,2021年12月创立MiniMax。
闫俊杰的判断是:大模型的竞争最终是“规模效应”的竞争——用户越多、数据越多、模型越好、价格越低,进而用户更多。这是一种更接近互联网商业逻辑的思路。
MiniMax从一开始就将商业化放在核心位置:API收入、订阅付费、企业级解决方案三条腿走路,且海外优先,因为海外用户付费意愿强、生命周期价值更高。
它是四家里最早跨过盈亏平衡线的。靠C端出海产品Talkie,2024年就打平了。全模态五线并进,文本、图像、视频、音频、音乐全覆盖。
3.智谱张鹏:一个拥有技术自觉与资本市场的耐心考验的学院派
2019年,清华大学知识工程实验室(KEG)联合校内多个实验室,正式孵化智谱AI,由时任KEG副研究员的张鹏担任CEO。这是“中国AI四小龙”中最具学院背景的一家。
与纯商业化路线不同,智谱从一开始就将“认知智能”和“安全可控”作为核心标签。
其GLM系列大模型在中文语义理解、逻辑推理、多模态理解等指标上持续迭代,同时积极参与国产大模型的标准制定与政府合作项目。
本地化部署是智谱的核心商业模式,客户(主要是政府和大型企业)将模型部署在自有服务器上,智谱收取授权费用和技术服务费。这一模式的优势是客单价高、现金流稳定;风险在于增长天花板相对有限,且面临开源模型的技术替代压力。
智谱的市值是最贵的,一度超过7000亿市值,三次涨价83%,调用量反涨400%。
据新浪财经报道,前十大互联网公司有9家每天调用它的GLM模型。
4.月之暗面杨植麟:最年轻的CTO与最快的融资机器,并存。
1992年出生的杨植麟是“四小强”创始人中最年轻的一位,也是节奏最快、争议最大的一位。
他本科毕业于清华大学,后赴卡内基梅隆大学读博,师从苹果AI研究团队负责人。2023年6月创立月之暗面,发布AI助手Kimi,成为国内最早推出200万字无损上下文窗口的大模型应用之一。
杨植麟的风格鲜明:极度追求技术指标和增长数据,愿意以高估值、高融资密度换取时间窗口。“长期主义”是他早期反复使用的词汇,但2026年5月的港股IPO筹备,标志着这一叙事正在被现实改写。
1.梁文锋:AI的本质是基础模型的无限逼近
在梁文锋看来,AI行业的一切商业化,都建立在模型能力的基础上。皮之不存,毛将焉附?
所以DeepSeek的唯一战略,就是把模型做到极致,且必须开源。API定价极低、Web端免费,都是服务于“最大化技术影响力”这个目标。
然而,这种纯粹也在面临现实压力。2026年4月,DeepSeek正式启动首轮外部融资,这背后是人才争夺战的现实压力。
当字节、小米等巨头抛出极具吸引力的薪酬方案时,没有股权变现通道的DeepSeek处于明显劣势。即便纯粹如梁文锋,也不得不在理想与现实之间寻找新的平衡。
2.闫俊杰:AI的本质是“成本-体验”的最优解
闫俊杰的第一性原理是博弈论。他认为,大模型的竞争本质是一场“成本-体验”的优化博弈。
用户不会为“最强的模型”付费,只会为“在可接受成本内体验最好的模型”付费。因此MiniMax的战略重心不是追求模型参数的绝对领先,而是追求模型效率、推理成本、用户体验三者之间的最优平衡。
这种思维贯穿了MiniMax的所有决策:坚定出海(避开国内价格战)、自研多模态(降低外部依赖)、ALL-in C端(用户增长驱动模型迭代)。
2025年,MiniMax毛利率从12.2%提升至25.4%,是四家中唯一毛利率持续改善的。研发开支仅增长33.8%,远低于158.9%的收入增速,规模效应开始兑现——每增加1元收入所需的研发投入从2024年的6.19元降至2025年的3.20元。
同时,营销费用同比下降约40%,意味着增长更多来自用户口碑和自然流量,而非买量推动。
尽管年内账面亏损高达18.7亿美元,但约16亿美元是非现金的优先股公允价值重估,经调整后实际经营亏损仅2.5亿美元。
3.张鹏:AI的本质是生产力工具的可靠性
智谱的学院派出身,决定了它对AI的理解更接近“基础设施”:成为企业可依赖的生产力工具。
所以智谱的产品设计以稳定著称。它提供全栈式服务:从模型层到平台层再到应用层。这种“全家桶”策略让客户可以一站式解决需求,但也面对着更高的研发投入和更重的交付压力。
2025年,智谱研发开支达31.80亿元,同比增长44.9%,每赚1元钱,就要在研发上花掉4.4元。
但另一面是:云端部署业务收入增幅达292.6%,企业级智能体收入同比增长248.8%。云端毛利率从2024年的3.3%大幅提升至2025年的18.9%,展现出标准化服务的规模效应与盈利潜力。
这在结构上对冲了本地化部署毛利率下降(从66.0%降至48.8%)带来的压力,验证了张鹏的判断:企业对可靠、可定制的AI工具有着真实且刚性的需求。
据钛媒体梳理,GLM-4.5就开始押注Coding路线,比其他家早了将近一年。据CSDN的实测对比,GLM-5.1编程能力在国内模型里是天花板。
4.杨植麟:AI的本质是人与信息的连接方式
杨植麟可能是四人中最有“产品感”的一个。他对AI的理解不局限于技术本身,而是上升到信息交互的范式变革:从搜索框到对话框,从点击链接到直接获取答案。
因此,Kimi的产品哲学是“让信息触手可及”。它主打长文本处理,支持200万字的上下文窗口,就是要让用户可以“一次喂一本书,然后随意提问”。这种能力直接击中了知识工作者、学生、研究者的痛点。
杨植麟相信,只要把“人连接信息”的体验做到极致,用户愿意付费。2026年初的爆发式增长初步验证了这个假设。
据界面新闻2026年5月9日报道及36氪报道,ARR从3月的1亿美元飙升至4月的超2亿美元,付费用户和API调用量大涨,海外API调用收入在2025年9至11月增长4倍,全球付费用户月度环比增速突破170%。
但另一面是,2025年全年收入有限,商业化爆发完全集中在2026年初,对单一模型和单一产品的依赖度极高,持续性和抗风险能力仍有待时间检验。
不同的底层逻辑,决定了各自手上有了不同的底牌。自媒体号“AI实用工具盒”作者章逸寒对AI四强的底牌进行了一一解析。
1.DeepSeek
DeepSeek的底牌是成本结构。据36氪报道,V4-Pro的API理论利润率高达545%,缓存命中仅0.025元/百万token。这不是降价,这是在重写AI的成本曲线。
梁文锋拒绝阿里生态捆绑、限制腾讯话语权,84%的股权牢牢握在手里,用独立性换来了定价权。
DeepSeek做的事极度聚焦。不做多模态,不做语音模型,不做视频模型——V4.1才开始试水图像和音频。梁文锋把所有资源砸在一个点上:用最低的成本,训出最强的语言模型。
DeepSeek走的路是:人少、聚焦、极致效率。
但命门同样清晰:DeepSeek至今没有真正的商业化闭环。1.27亿月活是免费用户,700亿融资是为了AGI而不是赚钱。这条路OpenAI走了8年还没走完。
他的团队确实精干,270人做出1.6万亿参数模型,人均产出极高,但AGI不是光靠人效能解决的。
2.MiniMax
MiniMax的底牌是全模态加出海。据高盛研报,Talkie年营收约7000万美元,是四家里唯一有C端现金奶牛的。
Lightning Attention架构让它做到400万token上下文窗口,据remoteopenclaw.com评测,这是全球所有生产模型中最长的。技术上有独门绝技。
但命门是Coding转身太晚。2025年10月M2才第一次明确按Coding导向设计基础模型,据钛媒体梳理,比智谱晚了将近一年。
闫俊杰在2021年押注C端娱乐加全模态加出海,这条路在2024年看起来最聪明——当年就自负盈亏了,但错过Coding的窗口,代价是市值只有智谱的1/3。
据钛媒体报道,智谱M2.7技术上追平了第一梯队,但在开发者心智和Agent生态上慢了至少两个季度。
3.智谱
智谱的底牌是Coding最早最深。据钛媒体梳理,GLM-4.5就开始押注Coding路线,比其他家早了将近一年。这个时间差让它在开发者心智里抢占了先机。
智谱做了40+款国产芯片适配、1.2万企业客户、全栈API服务。智谱有Coding先发优势、涨价能力以及和字节深度绑定,基本盘最扎实。
但命门也在这里:如果Anthropic或OpenAI的Coding模型突然大幅降价,智谱的溢价空间就会被压缩。前十大互联网公司9家在用它,意味着一旦有人跑路,就是巨大的负面信号。
4.月之暗面
月之暗面的底牌是增长速度。据《晚点LatePost》和美团龙珠合伙人王新宇透露,ARR两个月翻倍,从1亿到2亿美元只用了60天。
K2.6开源后开发者生态快速膨胀,Kimi Claw踩中了Agent风口,海外营收占比超50%,不再被国内C端价格战卡脖子。
但命门在于:月活从3600万跌到967万,说明C端用户用脚投票了。Kimi押注的是“中国版Anthropic”——纯模型公司,不卷C端。
但如果模型能力追不上Anthropic,估值就撑不住。200亿美元对应的是“下一个Anthropic”的预期,不是“又一个国产模型”的现实。
DeepSeek、MiniMax、智谱、月之暗面这四家公司,分别代表了中国AI创业的四种原型:技术理想主义、商业现实主义、学院派稳健主义、产品精英主义。
它们都信奉AGI,但通向AGI的路径大相径庭,有人走开源、有人走闭源、有人走B端、有人走C端、有人走国内、有人走出海。
没有普适的最佳实践,但都是中国AI之路的前行者,终极强者未见分晓,但每一条路都是一种极致的探索。这或许就是从这四家公司身上,我们能学到的最重要的一课。
参考来源:1.《AI五虎2026年中数据全景:月之暗面、阶跃星辰、MiniMax、深度求索、智谱原创》,AI实用工具盒。
*文章为作者独立观点,不代表笔记侠立场。
本文来自微信公众号 “笔记侠”(ID:Notesman),作者:智勇,36氪经授权发布。
发布时间:2026-05-31 16:04