沉默了五个月的DeepSeek,在被期待什么?

外界对DeepSeek的期待正在变得更加具体而复杂:它能否重新证明自己的技术领导力?能否将技术势能转化为可持续的营收?甚至,能否用有限算力训练出足够强的“中国模型”?

4月初,The Information报道称,DeepSeek V4将在4月下旬发布,且会率先支持华为新一代AI芯片昇腾950PR。4月18日,The Information称DeepSeek正与投资者洽谈首轮外部股权融资,计划以不低于100亿美元的估值,募集不少于3亿美元资金。

上述消息均未得到DeepSeek方面的确认。不过,《财经》从相关资本机构了解到,The Information目前有关DeepSeek的估值和融资规模的信息均不准确。

有关DeepSeek市场传闻几乎每个月都会有,但DeepSeek几乎从来没有回应。即便如此,这些信息仍然每一次都能引发市场的广泛讨论和关注。

DeepSeek很少像其他模型公司一样及时公布自身业务进展。2025年1月DeepSeek-R1发布后,一度引发全球震动。此后一年,DeepSeek-V4/R2不断被传闻即将发布但一直没有发布。DeepSeek也没有高频率推出新模型。

DeepSeek最新的模型是DeepSeek-V3.2,它在2025年12月1日发布。截至2026年4月20日,DeepSeek已有140天,也就是近五个月没有发布新模型。

DeepSeek发布模型的频率在主流模型厂商中几乎是最低的。

据《财经》不完全统计,2025年12月1日-2026年4月20日,美国市场(OpenAI、Anthropic、谷歌Gemini)和中国(包括阿里千问、字节跳动豆包、腾讯混元、小米MiMo、DeepSeek、月之暗面、智谱、MiniMax)的11家主流模型公司,至少发布或迭代了50款模型,几乎每2.8天就会有一款模型发布或迭代。

2025年初惊艳全球,被认为是“中国技术理想主义”范本的DeepSeek,如今也不得不面对一个残酷的现实:其最新版本DeepSeek-V3.2在各项性能基准测试中已不再领先。商业化能力也是DeepSeek被外界讨论最多的,它迄今为止仍然没有开启大规模商业化,但智谱、MiniMax、月之暗面等模型创业公司的营收都在快速增长。

DeepSeek正走到一个十字路口:到底是继续坚持研究创新和技术突破,并保持低频发布新模型;还是转向更高频的产品迭代与商业化,以应对越来越激烈的市场竞争?

在这种压力下,外界对DeepSeek的期待也变得更加具体而复杂:它能否推出下一代旗舰基础模型,重新证明自己的技术领导力?能否在商业化上迈出关键一步,将技术势能转化为可持续的营收?甚至,国产AI芯片生态尚不完善的当下,它能否用国产算力训练出足够强的“中国模型”。

这已不完全是一家公司的选择,而是整个行业在特定时期对一家特殊公司的特殊期许。

DeepSeek-V3.2已经不再领先

由于五个月没有发布新模型,DeepSeek的最新模型DeepSeek-V3.2在最新的基准测试中,性能并不领先。

国际市场调研机构Artificial Analysis截至4月20日的性能基准测试显示,DeepSeek-V3.2的综合性能、Coding(代码生成)性能、Agent(智能体)性能分别处于全球第16名、第17名、第15名。它落后于OpenAI、Anthropic、谷歌Gemini、阿里千问、月之暗面Kimi、智谱GLM、MiniMax、小米MiMo等旗舰模型。

DeepSeek-V3.2的相对排名没有超越去年初的DeepSeek-R1。

2025年1月20日发布的DeepSeek-R1,性能几乎追平了当时OpenAI的o1(2024年9月12日发布)。它只落后3-6个月。且由于定价出乎意料的低,因此引发了全球轰动。

2025年12月1日发布的DeepSeek-V3.2,对标OpenAI的GPT-5(2025年8月8日发布)、Anthropic的Claude Sonnet 4.5(2025年9月29日发布)、谷歌的Gemini 3 Pro(2025年11月19日发布)。它在发布之初,性能就和这三款旗舰模型存在一定差距。

在发布之后的几个月,DeepSeek-V3.2也没有像其他模型一样小步快跑、迅速迭代。

DeepSeek-V3.2在发布后的五个月内,OpenAI的GPT-5历经四次迭代到了5.4版本。Anthropic的Claude 4.5系列历经两次迭代到了4.7版本。谷歌的Gemini 3 Pro迭代到了3.1版本。但DeepSeek-V3.2一直停留在原地,没有发布新的版本号。这导致DeepSeek-V3.2和国际领先模型的相对差距被迅速拉大。

更关键的问题是,2026年是模型竞赛的又一个拐点。由于Agent大爆发,Coding能力强弱几乎直接决定了Agent的成本、效率和体验。

2025年,模型竞赛的核心还是推理能力,但这种差异往往表现为问题的回答质量。纯文本问答,推理能力展现出来的差距并不明显。

但Coding能力不一样,它甚至对不写代码的普通用户也很重要,因为Agent都是靠生成代码来规划并执行任务的。Coding能力强弱,直接决定了一项Agent任务的成功率、执行时间,以及Token消耗量。在多任务执行场景中,Coding能力的差异会被指数级放大,模型的体验差距会变得很明显(报道详见《今天,50%的Token正在被浪费》)。

DeepSeek-V3.2在这个过程中,它被OpenAI、Anthropic、谷歌Gemini迅速拉开了差距。与此同时,月之暗面K2.5/2.6、智谱GLM-5/5.1、MiniMax 2.5/2.7等国产模型都在强化Coding和Agent能力,这导致DeepSeek-V3.2对比几款国产模型都显得相对落后了。

一位算法工程师和一位大模型创业公司人士对《财经》表示,前沿开发者在考虑AI代码生成或是Agent任务成功率的时候,如果不在意价格,会优先使用OpenAI、Anthropic的旗舰模型。如果考虑性价比,会选择月之暗面K2.5/2.6、智谱GLM-5/5.1、MiniMax 2.5/2.7等模型。DeepSeek-V3.2通常在纯文本任务,比如AI角色扮演等对话场景中使用。

性能有差距,市场份额却仍然领先

DeepSeek-V3.2的性能并不领先,但它的市场份额却长期保持领先。

DeepSeek-V3.2发布后,它在全球模型聚合平台OpenRouter上的Token调用排名长期位居全球前五。截至4月20日, DeepSeek-V3.2在OpenRouter月调用量仍然达到了5.35万亿,位居全球第三。近五个月(2025年12月1日-2026年4月20日),DeepSeek在OpenRouter上的调用量的市场份额长期处在5%-10%之间。

OpenRouter反映了前沿开发者和创业企业的偏好,它集成了300多个主流模型,每月Token(词元,模型调用的基础单位)消耗量超过50万亿。麻省理工大学数字经济倡议研究科学家弗兰克·纳格尔(Frank Nagle)2026年1月的研究显示,OpenRouter的Token消耗量占全球可统计Token消耗量约1%。

市场份额领先,这得益于DeepSeek-V3.2的定价在主流模型中几乎是最低的。

DeepSeek-V3.2每百万Tokens输入/输出价格是0.28美元/0.42美元,这是很多国产模型的10%-30%,是OpenAI、Anthropic、谷歌Gemini旗舰模型的2%-5%。

更重要的是,DeepSeek有着极强的生命力。即使是在未发布新模型之后的五个月,它各个版本的模型依旧在被开发者广泛使用。开源是让它具备如此强的生命力的关键因素。

模型开源,意味着可以免费在本地部署。而且,DeepSeek-V3.2使用了目前最宽松的MIT开源许可,它几乎没有任何版权约束,允许任何人进行商业或非商业使用,包括修改、再分发、销售。这比阿里千问、月之暗面等开源模型采用的Apache2.0开源许可(有明确的专利授权框架,二次修改要说明修改内容)还要宽松。

对开发者来说,部署、使用、修改DeepSeek的模型几乎没有心理门槛,也不会有任何法律风险。这让它像种子一样,能够被开发者扩散、播种并四处生根发芽。

OpenRouter数据显示,20多款不同版本的DeepSeek近三个月(1月20日-4月20日)仍在不断被使用,其中不仅包括DeepSeek-V3.2,还包括2025年发布的DeepSeek-V3和R1。

OpenRouter的统计信息还显示,DeepSeek-V3.2正在被开发者广泛部署在OpenClaw、Hermes这几款今年流行的Agent工具中。DeepSeek-V3/R1则是仍然在被Janitor AI这样的AI角色扮演应用使用。

免费、开源且版本众多,这让DeepSeek不仅在中国市场拥有巨大影响力,它甚至在全球发展中国家或地区被不断扩散。

微软人工智能经济研究所2026年1月《2025全球AI采用情况》报告中指出,DeepSeek在北美、欧洲采用率较低,但在中国、俄罗斯、非洲地区份额迅速增长。DeepSeek在俄罗斯份额高达43%,在埃塞俄比亚份额接近20%,在非洲大部分国家或地区份额超过10%。

这份报告认为,DeepSeek在未被欧美AI产品充分覆盖的市场迅速获得影响力。它为数百万人降低了AI的使用门槛。下一批十亿级的AI用户,可能会出现在发展中国家,并由开源创新所推动。

唯一没有大规模商业化的模型公司

DeepSeek虽然市场份额庞大,但它一直没有开启大规模商业化。

36氪暗涌Waves 2024年7月曾在专访DeepSeek创始人梁文锋的报道中称,DeepSeek是中国大模型创业公司中,唯一一家放弃“既要又要”路线,一直专注研究和技术的公司。也是唯一一家未全面考虑商业化,坚定选择开源路线甚至都没融过资的公司。

DeepSeek证明了开源可以迅速扩散模型、占领市场,但仍未证明开源可以支撑一家大模型公司的长期发展。在所有模型公司都在用大规模亏损换增长的阶段,DeepSeek的商业化步伐仍然非常克制。

目前,DeepSeek公开的商业化路径是,通过DeepSeek官网调用模型API(应用接口)。它没有开放销售Token套餐(Coding Plan或Token Plan),也没有设置App订阅付费门槛。

但通过DeepSeek官网API销售模型这条路径目前并不稳定。因为,对开发者来说,他们不一定需要通过DeepSeek官网调用模型。比DeepSeek算力充裕、稳定的算力服务商更多,开发者甚至可以自己在云上部署免费的DeepSeek。

DeepSeek的开源策略也是影响商业化的重要因素。因为开源等于是免费,主流云厂商(包括亚马逊AWS、阿里云、字节跳动旗下的火山引擎、腾讯云等)都部署了DeepSeek的模型,却不需要为DeepSeek付费或收入分成。DeepSeek从中无法获得一分钱收入。

市场之所以关注DeepSeek是否要融资。一个重要原因是,一旦启动融资,后续必然要关注投资者回报,大规模商业化几乎将同步而来。这家公司将进入新的发展路径。

今年3月,DeepSeek某高管在一次会议透露,外界关注DeepSeek商业模式落地和技术进程,DeepSeek其实一直在做很多努力和尝试,也初步验证找到了一些路径。

目前,主流的模型公司几乎都脱离了“纯研究”的阶段。美国市场,OpenAI、Anthropic,曾经历以研究为主导的阶段,但最终都转向以产品和收入来支撑持续迭代。中国市场,月之暗面两三年前一度也是另一个“技术理想主义”的范本,但它目前也在拥抱商业化。

一位月之暗面人士今年4月对《财经》表示,他们的API团队正在快速扩张,目标是向具备付费能力的大型企业客户销售模型。《财经》了解到,月之暗面正在尝试突破海外大客户群体,且已经取得了全球最大的独立AI代码生成工具Cursor、知名金融支付平台Stripe等关键客户。

国内外主流的模型厂商几乎都在大规模商业化,收入快速增长。从结果来看,追求商业化和追求模型性能提升并不矛盾。

美国市场,OpenAI 2026年2月ARR(年度经常性收入,当月收入×12)超过250亿美元,预计2030年盈利。Anthropic 2026年3月ARR超过300亿美元,预计最早将在2029年盈利。OpenAI和Anthropic均计划在2026年-2027年上市。

中国市场,月之暗面2026年2月收入超过2025全年。界面新闻称,月之暗面2026年3月ARR超过1亿美元。MiniMax财报及财报电话会显示,2025年营收0.79亿美元(约合5.6亿元),2026年2月ARR超过1.5亿美元(约合10.5亿元)。智谱财报及财报电话会信息显示,2025年营收7.2亿元,2026年3月模型API的ARR达到17亿元,同比增长60倍。

不过,三家中国模型公司也在亏损。月之暗面亏损规模尚未披露。MiniMax 2025年经调整后的净亏损2.5亿美元(约合17.5亿元),智谱2025年经调整后的净亏损31.8亿元。

DeepSeek不急于商业化的另一种可能性是——商业化本身并不等于商业正循环。两家美国最大的模型厂商和三家中国模型创业公司目前都在大规模亏损。

市场期待国产AI芯片训练的新模型

除了关注DeepSeek是否融资,市场关注的另一个问题是,DeepSeek的新一代模型是否会提前适配华为昇腾950PR等国产AI芯片,甚至是否会基于国产AI芯片完成训练。

多位算法工程师曾对《财经》表示,DeepSeek相比月之暗面、智谱、MiniMax的一大优势在于,它自建了AI Infra(AI算力基础设施)。它的研究团队有能力折腾模型训练背后的算力集群等硬件基础设施。但能不能靠国产AI芯片训练出自己的模型,仍然是个未知数。

一位算法工程师对《财经》表示,DeepSeek的新模型适配国产AI芯片在预期内。因为模型推理对国产AI芯片来说并不是难点。几乎所有中国模型公司发布新模型后,都会Day0适配包括华为昇腾、阿里平头哥、百度昆仑芯、寒武纪等国产AI芯片。但如果DeepSeek能在国产AI芯片上从零开始训练,并开源训练工具和经验,意义会大得多。

比如,训练过程中算子适配、精度对齐、故障恢复、并行策略等工程经验能被开源或公开,这将减少国产AI芯片训练模型的踩坑过程。这将逐步减轻中国科技公司对英伟达的依赖,中国市场甚至有可能将另起炉灶一套新的生态。

英伟达创始人黄仁勋尤其关注这个动向。

今年4月17日,黄仁勋在和德瓦凯什·帕特尔(Dwarkesh Patel)的播客中直言,“DeepSeek在华为芯片上首发的那一天,对我们国家(美国)来说是一个可怕的后果。”他认为,美国对中国的芯片出口管制的后果是,这将把中国的AI生态推向华为等国产AI芯片,进而威胁美国AI技术栈的全球领导地位。

黄仁勋解释,DeepSeek是开源的,它可以跑在任何芯片上。假设未来DeepSeek专门为华为的芯片架构优化,那会让英伟达处于劣势……更重要的是,当大模型扩散到全球范围,且在非美国技术栈上跑得更好,这对我们是灾难。

中国市场现在的局面是,主要模型公司(阿里、字节跳动、腾讯、小米、月之暗面、智谱、MiniMax)的核心训练任务依然在用英伟达的芯片(如H800/H20等)。从零开始训练一个全球领先的基础模型,且被大规模使用和部署的完整工程路径尚未被公开验证过。

因为,模型训练是个复杂的系统工程。一个基础大模型,通常在数万甚至数十万枚AI芯片(如英伟达GB200/H200/H100)组成的算力集群上,进行数周甚至数月的不间断训练。

这个复杂系统,其中包括芯片与网络的拓扑耦合、芯片故障恢复速度、编译器能否把模型结构映射到硬件特性、电力与散热的协同设计等一系列工程问题。在万卡集群中,芯片、网络、软件随时可能故障。集群规模越大,故障概率就越高。一旦故障,训练任务就会中断。这不仅浪费时间,还浪费算力。

利用英伟达之外的芯片训练模型很难,但并非不可能。2025年之后,英伟达的生态裂缝正在变大。通过其他芯片训练的模型越来越多,且性能越来越强。

谷歌用自研的TPU v5和TPU v6从零开始训练出了Gemini 3 Pro,亚马逊使用自研的Trainium系列芯片从零开始训练了Nova 2。Anthropic的Claude系列模型也使用了谷歌的TPU系列芯片和亚马逊的Trainium系列芯片进行训练。

《财经》了解到,一些国产AI芯片(如昇腾910系列、百度昆仑芯三代、阿里平头哥真武810E)也开始支撑了部分国产模型的部分训练工作(报道详见《国产算力,如何突破大模型训练这道“天堑”?》)。

但问题在于,这里面几乎没有一款模型是万亿参数规模以上,且被大规模商用的公开案例。而且,国产AI芯片的性能落后主流英伟达芯片两代以上。国产AI芯片的软件栈也不成熟,训练的工程代价显著高于英伟达。

大量中国工程师正在实际业务的锤炼中,为国产AI芯片写算子(深度学习最小的可执行计算单元)、修Bug(程序错误)。工程师要把基于英伟达CUDA软件生态的代码,重新写在国产芯片的软件栈上,再把计算精度和英伟达的芯片对齐。算子适配和精度对齐,决定了究竟要花多少芯片、多长时间才能达到英伟达相同的效果。

一家计算机视觉企业的模型训练负责人2025年11月曾对《财经》表示,他们2025年用英伟达某款芯片训练了一款小参数视觉理解模型,后来尝试用某款国产AI芯片复现,发现同样能达成目标。只是训练周期要长20%以上,综合成本要高出一倍以上。

一位模型训练工程师对《财经》表示,一篇顶会论文的开源代码,在英伟达的芯片上大概率能一键复现,在TPU上需要改JAX(由谷歌开发的用于优化科学计算Python库)代码。但在Trainium或昇腾上,需要大量适配工作,包括算子兼容性调试、精度对齐、性能调优才能真正跑起来。

2025年初,中国市场的真实焦虑是,在芯片出口管制且缺乏充足算力的情况下,中国的基础模型能否缩小和美国基础模型的差距。这个问题的答案已经不言而喻——2026年,DeepSeek虽然没有发布新模型,但月之暗面、智谱、MiniMax、小米MiMo轮番登上OpenRouter全球调用前三的位置。中国已经不缺便宜好用、性能不俗的基础模型。

2026年,中国市场的新焦虑是,能否用国产AI芯片训练出足够强的国产模型,进而摆脱对英伟达的依赖。DeepSeek曾经在论文中披露称,他们曾经“用2048张英伟达H800芯片组成的集群和558万美元训练成本”训练出了DeepSeek-V3。这几乎一度被认为是不可能完成的任务。

中国市场期待再一次突破。这种期待的情绪,落到了DeepSeek身上。

本文来自微信公众号“半熟财经”(ID:Banshu-Caijing),作者:吴俊宇,编辑:谢丽容,36氪经授权发布。

发布时间:2026-04-22 15:08