Stanford HAI 人类及人工智能中心,刚发布了 2026 年度 AI Index 报告,这是 AI 领域最权威的年度体检单。过去一年,斯坦福研究员们通过一系列观察,得出的核心结论是:AI 正在以超越 PC 和互联网的速度被全球采纳,但人类社会的制度、就业市场和衡量工具全面滞后。
AI 在冲刺,人类还在找鞋。十张图带你看看,有哪些地方,AI 跑得比人快。
「AI 超越人类」,这类标题都建立在 benchmark 的可信度上。但 Stanford 报告发现, 被广泛使用的数学基准测试 GSM8K 里,有近 42% 的题目是无效的。 其他测试也存在被「刷题」的嫌疑,模型在测试数据上训练过之后,可以得高分,但不代表它变聪明了。很多公司拒绝公开相关的 benchmark成绩。 报告的作者之一Gil 说:「不公开成绩本身可能就说明了一些事。」
截至 2026 年 3 月,美国最强模型 Claude Opus 4.6 的 Elo 评分是 1503,中国最强模型紧跟其后,差距只有 2.7%。过去一年里两国模型多次交替领先,2025 年 2 月 DeepSeek R1 一度追平美国的最强模型。
不过两国的 AI 优势完全不同。美国有更强的模型、更多资本,还拥有 5427 个数据中心,是任何其他国家的 10 倍以上。中国则领先在 AI 论文、专利和机器人部署上。简单说,美国赢在算力和钱,中国赢在研究和制造。
截至 2026 年 3 月,Anthropic(1503)、xAI(1495)、Google(1494)、OpenAI(1481)挤在极窄的区间内。这意味着「谁的模型更强」已经不是竞争的重点。竞争焦点正在转向成本、可靠性和特定领域的优化——这也解释了为什么 Anthropic 在做 Advisor Tool(降低成本)、Google 在买 Wiz(云安全)、OpenAI 在买各种应用层公司(扩大场景)。在模型自身智能表现逐渐趋同的情况下,需要在别处制造差异化。
生成式 AI 三年内达到了超过 53%的人口级采纳率,88%的组织已在使用 AI。但就业影响不是均匀的。Stanford 经济学家 2025 年的研究发现,22-25 岁软件开发者的就业人数自 2022 年以来下降了近 20%,而年长群体仍在增长。McKinsey 2025 年调查显示,1/3 的组织预计未来一年将因 AI 减少员工,裁减集中在服务运营、供应链和软件工程。
整体数据还没有显示大规模失业,但这也足以体现出,就业市场正在温水煮青蛙,危机是在慢慢生长的。
生成式 AI 在三年内达到 53%的人口级采纳率,这个速度超过了个人电脑和互联网。但最反直觉的数据点是:美国在 AI 投资和模型开发上领先全球,但人口采纳率只有 28.3%,全球排第 24。 阿联酋 64%,新加坡 60.9%。花钱最多的国家,用得最少。
2025 年全球 AI 企业投资总额达到$5817 亿,同比增长 129.9%。美国私人 AI 投资$2859 亿,是中国的 23 倍,英国的 48.5 倍。光加州一个州就占了美国的 75%以上。大额交易也很密集:OpenAI 融了$400 亿,估值$3000 亿;Anthropic 融了$130 亿,估值$1830 亿;Cursor 以$293 亿估值融了$23 亿。
不过这里有一个隐藏信息:在国内,国资基金在 2000 年到 2023 年间向 AI 企业注入了约$1840 亿,这笔钱没有被计入私人投资统计。加上这部分的话,中美之间的资金差距可能比账面数字小得多。
2025 年是 AI Agent 元年。OSWorld(测试 AI 在操作系统上完成任务的能力)准确率从 12%飙升刳 66.3%,距离人类表现仅差 6 个百分点。WebArena 达到 74.3%,Cybench(网络安全任务)从 15%飙到 93%。
但整体看,Agent 仍然有约 1/3 的失败率。而且企业实际部署仍在个位数——大多数业务场景中,超过 2/3 的受访者表示完全没有使用 AI Agent。Benchmark 上的进步和实际部署之间,还有很大的差距。
AI 在虚拟世界里已经很强,但在物理世界里仍然很弱。在软件模拟环境中机器人操作成功率达 89.4%,但在真实家庭任务成功率仅有 12.4%。一个是干净的实验室,一个是乱糟糟的家,在后者这种真实环境中,机器人的参与还微不足道。
不过,自动驾驶是例外:Waymo 每周约 45 万次出行,Apollo Go 2025 年完成约 1100 万次全无人出行。
报告引用的 Pew 调查揭示了一个惊人的分裂:73%的 AI 专家认为 AI 将对工作产生正面影响,但只有 23%的美国公众这么认为——完全是两极分化。
另一个有趣的数据:在所有受调查国家中,美国人对政府监管 AI 的信任度最低。专家同样对 AI 在教育和医疗上的前景更乐观,但双方都认为 AI 会伤害选举和人际关系。
AI 的进步,背后是环境在付出代价。全球 AI 数据中心现在可以抽取 29.6GW 的电力,这个数量级,足以在用电高峰时期撑起整个纽约州。仅 OpenAI 的 GPT-4o 一个模型,年度用水量就可能超过 1200 万人的饮用水需求。
这些庞大的消耗,注入一个又一个的模型训练,可与此同时,模型背后芯片供应链极度脆弱。美国拥有全球大多数 AI 数据中心,但几乎每一颗前沿 AI 芯片都由台湾的台积电一家公司制造。所有的算力、所有的投资、所有的模型进步,都建立在这个物理基础之上。
以上只是报告的冰山一角,却足以看出,我们正在用史上最快的速度,「拥抱」一个我们还不完全理解的技术。
完整报告还覆盖了更多关于 AI 安全、监管动态、科研趋势等更多维度,强力推荐感兴趣的朋友们阅读原报告全文,指路
发布时间:2026-04-15 08:20