DeepSeek-V4明确支持华为昇腾950芯片

受限于高端算力,目前DeepSeek-V4-Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调

时隔145 天,DeepSeek终于发布了新模型。

4月24日,DeepSeek宣布上线DeepSeek-V4的预览版本——其中包括两款模型,高性能版的DeepSeek-V4-Pro、轻量版的DeepSeek-V4-Flash。

按照DeepSeek官方披露的信息,DeepSeek-V4拥有百万字超长上下文,在Agent(智能体)能力、世界知识和推理性能上均在国内和开源领域保持领先。

DeepSeek还披露,目前DeepSeek-V4已成为公司内部员工使用的Agentic Coding(智能体编程)模型,评测反馈使用体验优于Claude Sonnet 4.5,交付质量接近Claude Opus 4.6非思考模式,但仍与Claude Opus 4.6的思考模式存在一定差距。

和全球最强模型的差距只有两个月

目前Anthropic旗下最先进的基础模型是4月16日发布的Claude Opus 4.7,它的综合性能几乎位居全球第一。Claude Opus 4.6于2月25日发布。

也就是说,DeepSeek-V4和全球性能最先进的模型性能差距几乎只有两个月左右。

DeepSeek发布模型的频率在主流模型厂商中几乎是最低的,时隔近五个月,它才发布了这款新模型。

据《财经》不完全统计,2025年12月1日-2026年4月24日,美国市场(OpenAI、Anthropic、谷歌Gemini)和中国(包括阿里千问、字节跳动豆包、腾讯混元、小米MiMo、DeepSeek、月之暗面、智谱、MiniMax)的11家主流模型公司,在144天内至少发布或迭代了53款模型,几乎每2.7天就会有一款模型发布或迭代。

DeepSeek-V4的技术报告披露,它使用了32万亿以上的Tokens(词元)进行训练。它的训练过程经历了三个阶段——预训练(Pre-training)、后训练(Post-training)、推理能力强化(Reasoning scaling)。

其中DeepSeek-V4-Pro的参数规模是1.6万亿,激活参数是490亿。DeepSeek-V4-Flash的参数规模是2840亿,激活参数是130亿。由于架构创新且不是全量激活,DeepSeek-V4每次激活时的推理计算成本只相当于百亿级参数规模的模型。

DeepSeek还公布了DeepSeek-V4两个版本模型的价格。其中高性能版的DeepSeek-V4-Pro输入价格1元/百万Tokens,输出价格24元/百万Tokens。轻量版的DeepSeek-V4-Flash输入价格0.2元/百万Tokens,输出价格2元/百万Tokens。

明确支持华为昇腾950,Token价格将大幅下降

市场关注的另一个问题是,DeepSeek-V4是否会提前适配华为昇腾950等国产AI(人工智能)芯片,甚至是否会基于国产AI芯片完成训练。

目前可以确认的是,DeepSeek-V4一定会支持华为昇腾950,并使用昇腾950进行推理。但它不一定是基于华为昇腾950训练的。

因为,DeepSeek在披露价格的同时,还在价格栏的小字中明确提到——受限于高端算力,目前DeepSeek-V4-Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调。

(图片来源:DeepSeek微信公众号)

也就是说,DeepSeek-V4系列的模型明确支持华为昇腾950这款国AI产芯片,且预计将在国产AI芯片上大幅降低单位Token价格。

昇腾950华为规划于2026年推出,面向大模型训练和推理的新一代AI芯片,它是昇腾910系列的升级版。一位华为计算产品合作伙伴今年3月曾向《财经》评价,在当前国产AI推理卡中,华为昇腾950极具竞争力。因为该卡采用全新架构,是目前国内唯一已商用、并明确支持FP4低精度推理的AI加速卡。

支持FP4意味着能把模型“压缩得更狠”,同样一张卡,能跑得动更大、更复杂的AI模型,而且速度更快、成本更低。《财经》了解到,华为昇腾950的单卡算力是英伟达H20的2.87倍,且搭载了华为自研国产HBM(高带宽内存)芯片。

一位算法工程师对《财经》表示,DeepSeek-V4适配国产AI芯片在预期之内。因为模型推理对国产AI芯片来说并不是难点。几乎所有中国模型公司发布新模型后,都会Day0适配包括华为昇腾、阿里平头哥、百度昆仑芯、寒武纪等国产AI芯片。

本文来自微信公众号“半熟财经”(ID:Banshu-Caijing),作者:吴俊宇 周源,编辑:谢丽容,36氪经授权发布。

发布时间:2026-04-24 17:20