外国开发者:我们该开始学习中文了吗?
绷不住了,美国科技公司最新发布的大模型,思考时怎么一直在说中文?
本周,知名 AI 代码工具 Cursor 发布了 2.0 版重大更新,推出了首个自家的代码模型 Composer,以及用于并行协作多个智能体的新界面。
新模型一发布,大家在祝贺 Cursor 终于「扬眉吐气」、用上自家模型的同时,也发现这个大模型在思考的时候一直讲中文,而且行为和国产模型极其相似。
Composer 是 Cursor 使用强化学习训练的一个大型 MoE 模型,能够出色地处理实际代码,并且速度非常快。
内部基准测试中该模型在编码任务上达到行业前沿水准,生成速度比同类模型快四倍。
据官方博客介绍,在研发过程中,他们试验了一个代号为 Cheetah 的原型智能体模型,以更好地理解更高速智能体模型的影响。Composer 是该模型的更智能升级版,凭借足够的速度支撑交互式体验,让编码始终丝滑。
不过在看到模型输出了这么多中文之后,人们纷纷开始猜测它背后的「基础」是哪家大模型,难道是 Qwen Code?
无独有偶。
AI 编程独角兽 Cognition 近期也推出了他们最新 AI 模型 SWE-1.5。这是一款快速智能体模型,参数量达到了数千亿,在编码性能上接近 SOTA,并显著提升了速度 —— 比 Haiku 4.5 快 6 倍,比 Sonnet 4.5 快 13 倍。
目前该模型已在他们的 IDE 平台 Windsurf 上开放使用。
不过,模型发布出来之后很快就被人们仔细分析了一通,有网友认为 Cognition 的新模型背后也是基于中国的 AI 模型进行开发和改进的。
有人对 SWE 1.5 进行了大模型「越狱」,结果模型直接回答自己是智谱 AI 开发的 GLM 大模型。
智谱的官推也来转推祝贺。
业界大佬:证据指向中国开源模型
X 博主 @deedydas 认为,Cognition 的 SWE-1.5 是基于中国公司智谱的 GLM 4.6 模型进行定制(精调 / 强化学习),并运行在 Cerebras 的硬件上;Cursor 的 Composer 模型也带有中国式推理痕迹。
最新消息,cerebras 发邮件官宣,11 月 5 日推出 zai-glm-4.6 作为新编码模型,这是给实锤了?
系统架构师 Daniel Jeffries 也发帖表示,有很多证据表明 WindSurf 和 Cursor 这些新模型都是经过微调,而不是从零开始训练的,这对于开源社区来说是一个胜利。
Jeffries 进一步指出,从头开始训练一个基础模型的成本极其高昂,许多资金和计算资源更雄厚的公司都未能成功。因此,WindSurf 和 Cursor 团队选择在后期训练阶段投资强化学习是非常合逻辑的,尤其是他们已经拥有强大的数据集和大量用户编码数据,这些数据更容易进行处理。
他还认为,Cursor 和 WindSurf 的团队并没有足够的资金来建设一个庞大的训练集群,也没有足够的数据和团队支持从零开始建立一个大模型。在当前,许多大型实验室已经在这一领域建立了强大的规模,单靠独立开发是无法成功的。
此外,他还指出,一些反对开源的公司和个人阻碍了开源模型的发展,影响了现代软件开发和创新的进程。他呼吁美国公司意识到开源的重要性,回归开源理念,而不是发布功能受限的专有模型。
目前,Jeffries 发布的这篇帖子已被 LeCun 转发,进一步引发了讨论。
网友们纷纷表示,中国的开源基础模型已经具备了足够的能力来支持西方产品的开发,这意味着全球 AI 正进入多极化竞争的新格局。
有网友幽默评论道:是不是该开始学中文了?
国产开源模型,已成为 AI 领域主流
10 月 29 日,英伟达 CEO 黄仁勋在华盛顿的 GTC 大会上,除了发布新 GPU,也说了一番对目前 AI 行业现状的观察。他表示开源模型已变得非常强大,大大加速了 AI 应用的进程,开发者、研究者、全球的公司都需要开源。
在老黄展示的全球开源模型的下载及采用情况图中可以看到,2025 年以来,阿里的通义千问模型(Qwen)已占据开源模型的大部分市场份额,并且领先优势还在持续扩大中,衍生模型数量也是全球第一。
随着开源模型的推理能力、多模态能力、专业领域能力的提升,它们不仅仅在帮助开发者,甚至已成为初创公司的命脉。或许对于 Cursor 和 Cognition 来说就是这样。
除此之外,在 AI 社区 HuggingFace 的趋势榜上,排行前列的模型都出自国内公司,有 MiniMax、DeepSeek、Kimi、百度、混元、千问,还有美团的 LongCat。
在第三方的基准平台 ArtificialAnalysis 上比较和分析模型质量、性能、推理速度、上下文窗口、参数数量和许可详情等性能指标,排行前列的也大多数是国产模型。
看起来不论是在模型技术水平与能力,还是全球开发者、科技公司的接受度上,国内开源大模型都已经确立了领先的地位,正在改变着全球 AI 领域的竞争格局。
这场大模型技术竞赛中,追赶者和领先者的身位,正在慢慢发生变化。
本文来自微信公众号 “机器之心”(ID:almosthuman2014),作者:泽南、杨文,36氪经授权发布。
发布时间:2025-11-01 14:00