Agent改写互联网,赢家通吃越来越难了

过去一周,腾讯和阿里相继交出新一季财报。

2026 财年第四季度,阿里整体营收 2433.8 亿元,同比增长 3%。剔除投资收益后,反映主营经营质量的 Non-GAAP 净利润仅为 0.86 亿元,同比下滑近 100%。 

增速看上去平淡,利润端压力陡增。但阿里第一次把 AI 账目摆到了台面上:2026 财年第四季度,阿里云外部商业化收入同比加速增长至 40%,AI 相关产品收入占比首次突破 30%,年化超过 358 亿元

腾讯 2026 年第一季度营收 1964.58 亿元,同比增长 9%;Non-IFRS 经营利润 756 亿元,同比增长 9%。它没有把 AI 单列为收入科目,而是嵌进广告、云与企业服务等业务线:

营销服务和企业服务收入均同比增长 20%,单季资本开支超过 300 亿元;混元、元宝、CodeBuddy、WorkBuddy、QClaw 等新 AI 产品仍处投入期,对当季 Non-IFRS 经营利润的净影响约 88 亿元。

两家公司讲述 AI 的方式不同,但财务结构上的转向是一致的:Capex、ARR、Token 调用量,这些过去更多出现在制造业和云厂商语境里的用词,正在替代 DAU、时长、GMV,成为互联网科技公司对外叙事的新"主语"。

这是一组耐人寻味的变化。从"轻资产"到"重投入",互联网公司正在经历集体的叙事换挡。

过去二十年,互联网公司之所以能跑出极高的资本回报率,靠的是一组特殊的经济学条件:边际成本接近于零,规模效应近乎无限,网络效应一旦启动就自我强化,最终走向赢家通吃

AI 时代,这套法则开始失效了。每一次推理都要烧 Token、占 GPU、调度内存;每多服务一个用户、每多完成一次任务,都意味着实打实的算力成本。

当边际成本不再趋近于零,赢家通吃就变得越来越难了。如果找不到合理的商业化方式,用户规模反而会变成沉重的成本负担。

腾讯总裁刘炽平在财报当天的业绩会上说:当一项服务必须靠付费才能支撑,它大概率就不会是赢家通吃的生意。阿里首席执行官吴泳铭同日的发言几乎一致:AI 服务每一次调用都有可变成本,市场会由多个玩家共同占据。

一个关键问题被推到所有玩家面前:互联网过去赖以建立护城河的那套逻辑——入口、产品形态、衡量指标、商业模式——都将被重新定义。

入口的另一面:从"用户打开"到"Agent 调用"

「深流研究所」统计了过去半年,腾讯、阿里、字节在 AI 产品上的动作。

今年以来,三家大厂的产品发布节奏密集,进入春节之后加速明显。到了4月,行业甚至进入"每周一更"的发布期

值得注意的是,Agent 已经从概念走向 BAT 三家 AI 产品矩阵的发力主轴。其中,腾讯 Q1 财报也披露,年初以来累计上线数十款 Agent 及相关产品,覆盖入口、能力、底座三层,其发布密度在三家中最高。

中国互联网的竞争,"入口"一直是主战场——谁先承接用户需求,谁就能把需求导向内容、关系、交易和服务,比如微信承接通信,淘宝承接购物,抖音承接内容消费。

Agent 时代,入口的位置正在从前台界面,移到后台调用链。用户不再亲自点开每一个 App,而是把需求交给 Agent,由 Agent 在后台调用多个产品能力,直接把任务推进到结果。

钉钉 CEO 陈航在今年 3 月 AI 钉钉 2.0 发布会上的那句话,正是这层变化的注脚:"过去是人用钉钉来工作,未来是 AI 用钉钉来工作。"

于是,关于Agent竞争分成了两个维度:

第一层是 Agent 的入口之争——用户习惯把任务交给谁,谁就是 AI 时代的"默认前台",延续的是抢用户心智的旧逻辑;第二层是 被调用之争——谁的能力能被 Agent 优先调用、编排、嵌进任务链路,谁才真正握住价值入口。

今年以来,阿里、字节、腾讯的 AI 产品更新,都是在这个方向发力。三家公司的做法差异,可以从Agent 的从调用形态看出来。

阿里是"链式"调用,把 AI 接入交易和履约链路。从 1 月推出的千问任务助理,到 3 月阿里妈妈 AI 万相把商家经营拆成多 Agent 协同、飞猪 FlyAI 把旅行服务开放成可调用能力,再到 5 月千问与淘宝全面打通——AI 购物从对话直接进入挑选、对比、下单。链路是预设的,Agent 沿着"需求、服务、交易、履约"这条线走完。

字节是"流式"调用,把 AI 接入内容生产和开发者的工作流。内容侧,Seedance 2.0 接入豆包、即梦、剪映,小云雀 AI 短剧 Agent、随变 AI、抖音 AI 创作入口陆续上线,视频生成能力被推到短剧、娱乐和分发场景。开发者侧,Trae、DeerFlow、扣子 Agent World 把 AI 接进代码开发、任务拆解和 Agent 执行环境。每一条工作流里,工具被串起来服务一个具体产出。

腾讯则是"网式"调用,不预设单一链路,而是把分散在微信、企业微信、文档、会议、地图、浏览器、云和安全体系里的能力,封装成一个个标准的"技能点",进而构建 Agent 可发现、可调用、可治理的能力网络。

这个网络大致分为三层:

入口层是 WorkBuddy、QClaw、ClawBot 等不同形态的 Agent 前端;能力层是 SkillHub 和官方 Skills,把文档、会议、地图、ima、QQ 浏览器的功能封装成可被 Agent 调用的标准模块;底座层是 ADP、CloudAgent、ClawPro、Agent Memory、Agent Storage 和 AI Agent 安全中心,提供运行、记忆、存储和治理。

马化腾在 3 月业绩会上谈到的"养虾"构想,指向的正是这种形态:不是把所有任务塞进一个超级入口,而是让不同 Agent 在不同场景里,按需调用不同能力。

这张能力网络还在持续迭代中。能力网络的价值,并不取决于单个节点,而是节点覆盖的密度,节点之间自由组合、调用的顺畅度。

一个关键变量是,微信侧的 Agent 入口尚未完全展开。微信独特的地方,不只是流量入口,而是背后连接着小程序、支付、公众号、服务号等一整套服务生态。如果未来 Agent 能够稳定调用小程序,微信生态里的能力就会从"用户主动打开"变成"Agent 按任务调度"。

对原生 AI 产品的新尝试:界面做减法,能力做加法

当入口从用户界面变成调用链路,产品本身的形态也会相应改变。

PC 原生的起点是鼠标、键盘和大屏,软件可以承载复杂的视觉层级和精确操作,于是有了文档、表格、窗口这套产品语言。

移动原生的起点是触屏、摄像头、随身定位,于是基于位置的地理服务、随时随地的关系连接、单手上下滑的信息流,催生了微信、美团、抖音等产品。

每一代原生产品的诞生,不是因为新技术变得可用,而是产品设计把新条件当作起点,从零生长。

那么,AI 时代新的基础条件是什么?

首先,是"理解力"成为软件可以直接调用的基础设施。过去做产品,最难的事情之一是猜用户想干什么——按钮、菜单、引导流程,本质都是用界面替用户表达意图。AI 之后,意图理解不再是产品经理需要绞尽脑汁解决的设计问题,而是一种可以像调用数据库一样被调用的能力。

其次,产品具备非确定性的特征。过去,软件是确定性系统:相同输入对应相同输出,偏差被称为 bug。AI 时代的产品,每次输出的结果都不同,它可能会犯错、会幻觉、会误判。

再者,是产品具备了自主行动力。过去的软件是被动的——用户点击,它才响应;Agent 出现之后,AI 可以自己决定下一步做什么、什么时候做、调用谁。它从工具变成了行动者。

把这三个条件作为产品的设计起点,就能给"AI 原生"画一个大致的蓝图:按照理解力、非确定性、自主行动力这三个新条件,从零长出来的产品形态。

这种形态在今年三家大厂的密集发布里,已经显出三个具体特征。

3 月底,钉钉、飞书、企业微信在一周内同步开源 CLI,行业讨论很热闹,但多数解读还停留在"Agent 操作软件的新方式"。这件事更深一层的意味在于,GUI 不再是软件的必需品

当意图理解变成基础设施,按钮、菜单、流程引导就成了多余的中间层——Agent 不需要被引导,它需要被允许直接行动。AI 原生产品的特征之一,正是在做界面的减法、能力的加法

此外,腾讯今年密集发布的 Sandbox、Memory、Storage、AI Agent 安全中心,阿里和字节也都在补类似的部件。Sandbox 负责让 Agent 在隔离环境里试错。Memory 和 Storage 负责让 Agent 记住长期信息和任务状态。安全中心和权限系统负责决定 Agent 能做什么、不能做什么、做错了如何追溯。

在大模型还无法做到零幻觉、零失误的当下,一款原生的 AI 产品如果接受自己会出错、会幻觉、会跑偏,就必须从一开始预留容错空间——可中断、可回滚、可追问、可纠正、可审计。这不是"做完产品再补安全",而是产品设计的起点之一。

此外,三家今年的发布节奏呈现出一种碎片化的形态——从 GitHub commit、文档更新、能力上架到 Skill 入库,单个发布的"分量"明显变轻、频次明显变密。这种碎片化放在 AI 原生的框架下看,恰恰是合理的。

当产品的核心能力会随模型迭代、prompt 调整、工具组合而每日变化,发布的内容则越来越不像传统的产品,而是一个个能力单元,迭代更新的速度也将进一步加快。

产品标准在改变:从"用户停留了多久"到"任务推进了多远"

产品发布的形态变了之后,下一个问题是:怎么衡量它有没有用?

移动互联网时代,互联网公司判断一个产品是否成功,核心的标准是 DAU、MAU、下载量、使用时长、留存和 GMV。这些指标背后有一个共同假设:用户打开越多、停留越久、点击越频繁,商业价值就越高。

但 Agent 产品不完全适用这套指标。从硅谷到中国,关于"AI 该用什么指标衡量"的讨论密集出现。

2026 年初,行业里讨论过一个传闻:OpenAI 内部正在弱化 DAU,转向一个新的核心指标 TPD,也就是 Tokens Per Day。这个说法尚未得到 OpenAI 官方确认,但它提出的问题是成立的:DAU 反映的是"用户打开了多少次",TPD 反映的是"AI 替用户调动了多少计算资源"。

5 月 13 日,李彦宏在百度 Create 2026 开发者大会上提出,AI 时代可能需要一个新的度量衡——DAA,即日活智能体数。他的核心意思是,Token 更多反映算力消耗,不一定代表价值产出;真正能说明 AI 落地程度的,可能是每天有多少智能体在被使用、在完成任务。

相关的说法还有单位 Token 价值转化率、任务闭环触发率、用户自我纠错率、提示词摩擦效率等等。涉及企业 Agent 的效用衡量则更直接:单位任务耗时、返工率、单位人力产能等。

TPD 衡量的是算力消耗,回答的是"AI 这台机器转得多快";DAA 衡量的是调度密度,回答的是"有多少 Agent 在被使用";任务交付衡量的是产出本身,回答的是 Agent 到底干完了什么。

这些指标的共同点是,它们不再围绕"用户待了多久",而是围绕"任务推进了多远"

2025 年底,Anthropic 与 Material 对 500 多位技术领导者做的调研显示:57% 的组织已经将 AI Agent 用于多阶段工作流。调研附带的企业案例,更直观地说明了"Agent 指标"长什么样:

网络安全公司 eSentire 把安全威胁分析时间从 5 小时压缩到 7 分钟,AI 与高级安全专家的判断一致率达 95%;医疗预约平台 Doctolib 的功能交付速度提升 40%。

国内公司也已经开始用同类指标对外披露。

比如,腾讯云在介绍 Agent Memory 时给出的关键数据,不是用户量,而是"在复杂长任务中 Token 消耗降低超过 50%、任务完成率提升 23%"。

阿里通义灵码披露的核心数据是"代码采纳率",即开发者接受 AI 建议的比例。其内部全员使用通义灵码企业版后,AI 代码生成占比达到 34%,研发效率提升 21%。

这些数据在传统互联网评价体系里很难对应位置,但在重视"调用"的 Agent 时代里反而成为最值得关注的数字。

值得注意的是,新指标解决了旧指标的方向性偏差,但还没解决自身的标准化问题。移动互联网用了十年才让 DAU 的口径相对统一,Agent 的指标体系同样得走一段很长的路。

Agent 重构互联网:价值锚点从流量分发走向任务交付

衡量指标变了,对应的商业模式也在重构。

5 月以来,豆包推出付费订阅,DeepSeek 大幅降价,阿里和腾讯同一天对外披露 AI 业务进展。围绕"AI 这门生意到底怎么算账"的讨论,密集出现在同一个时间窗口里。

过去一周,阿里、腾讯相继发布新一季度财报。阿里这本账,把 AI 算成"工厂"。吴泳铭在财报发布当晚的发言里直接把 AI 比作制造业:"必须建两个核心工厂,一个训练工厂,一个推理工厂,工厂规模决定未来收入规模。"腾讯没有把 AI 单独列出来,而是把 AI 的价值嵌进了广告、云与企业服务、游戏、内容等业务里。

阿里在向外界证明,AI 本身就是一门可独立计量、可单独定价的生意;腾讯则在证明,AI 是一种能让广告、云、协作等业务生态都更有价值的乘数。两种账法没有优劣之分,反映的是 AI 商业化正在沿着不同形态展开。

如果把视角从两家公司放大到整个 AI 行业,能看到三条正在被改写的商业路径。

第一条线,从"按使用权付费"到"按调用量付费"。AI 让"智能"这件事,被像水电一样可计量、可定价。今年 3 月,黄仁勋在 GTC 大会上把 Token 称为"新的大宗商品"。国家数据局披露,中国日均 Token 调用量从 2024 年初的 1000 亿,跃升到 2026 年 3 月的 140 万亿,两年增长超千倍

今年以来,每家公司发布新模型时,除了常规披露参数规模、跑分、下载量,还会强调模型的调用量。腾讯混元 Hy3 preview 4 月底上线后两周内,OpenRouter 最近一周调用量冲到 2.68 万亿 Token,并连续数周登顶全球榜首;DeepSeek 三款模型同时入围全球前十。

OpenRouter 这张本来给开发者用的"大模型选型榜单",变成了大模型公司新的"销量榜"。

第二条线,是从"卖软件"到"卖任务"。这一变化在海外更先发生。Salesforce 的 Agentforce 已经按"每次对话 2 美元"计费,Intercom 的 Fin 按"每个被解决的问题"计费——计价的颗粒度,从"软件被使用了",细化到"问题被解决了"。国内的尝试还在更早期,腾讯会议 AI、企业微信 AI 助手、钉钉 AI 助理都在做按场次、按条数、按解决率的探索。

吴泳铭在业绩会上说过一句可以解释这条线的话:在企业里,只要部分工作任务创造的价值大于 Token 的成本,对 Token 的需求就是无限的。换句话说,当软件能直接交付结果,企业愿意付的就不再是"工具费",而是"代工费"

第三条线,是从"独立产品"到"嵌入网络"。这条线最难直接定价,是让 AI 渗透到现有业务,进而放大业务生态的商业价值。

阿里千问与淘宝打通后,"挑选、对比、下单"在对话里一次完成,价值不只在 AI 本身,还有 GMV 和履约效率。企业微信、钉钉把 AI 嵌进每一个协作动作,变现点也不只有 AI 助手单独收费,还在于企业渗透率和单客单价。

此外,腾讯总裁刘炽平在这次业绩会上把"AI 赋能小程序"称为"未来发展的必然走势"——让智能体把小程序当作工具来调用,让微信生态里的资源逐渐"转化为智能体的技能"。AI 在这条路径上不是新的收费对象,而是生态价值的乘数——它让广告点击率更高、让交易转化更短、让小程序留存更久。

这件事注定快不了。腾讯董事会主席兼首席执行官马化腾曾提到:"Agent 伙伴希望自己有流量和入口,但也不想自己被单纯地调用。"其设计难点不只是技术,还有如何在"平台调用"和"开发者自主权"之间找到平衡。

估值坐标系换了:互联网公司正被重新定价

过去二十年,资本市场给互联网公司定价,用的是一套高度统一的坐标系:DAU 看规模、时长看粘性、GMV 看变现、网络效应看护城河。

这个坐标系背后是一个隐含前提——服务一个用户和服务一亿个用户,成本几乎相同。一旦跨过临界点,飞轮自动转起来,规模即利润,赢家通吃。这套逻辑跑通了 PC 时代,也跑通了移动时代。

互联网时代,DAU意味着收入。AI时代,DAU则意味着成本。

当边际成本不再趋零,规模就不再天然带来正反馈,过往的估值标准也将被重新审视。取而代之的,是一组新的刻度:Capex 衡量产能、ARR 衡量持续性、Token 调用量衡量需求、代码采纳率和任务完成率衡量交付

这也让市场的关注点不再局限于投入,而是更看重兑现。

一个绕不开的参照系是 Anthropic。2023 年,它的年化收入约 1 亿美元;2024 年底,跨过 10 亿美元。进入 2025 年后,这条曲线几乎以季度为单位向上跳——年初约 20 亿美元,年中突破 50 亿美元,年底甚至超过 70 亿美元 ARR。

据多家媒体援引的内部规划,Anthropic 对 2026 年的收入指引区间,已经放到了 200 亿到 260 亿美元。三年之间,收入增长200倍以上,这个增速在 SaaS 与云服务历史上几乎没有先例。

Anthropic 的增长几乎押在两件事上:

一是 Agent,二是 coding——恰恰是 AI 当前最容易被量化交付的两个场景。代码可以跑通或跑不通,任务可以完成或未完成,模型的价值能直接落到"产出"这一端,而不是停留在调用次数或对话轮数上。

这一点对当下的行业判断尤为关键。

今天的 AI 竞争里,弥漫着一种 FOMO 式的焦虑:模型必须更大、Capex 必须更高,"投入即正确"几乎成了默认叙事。

Anthropic 给出的另一种参照是——真正撑起估值的,并不是投入本身,而是投入能否被转化为可用、可持续、可衡量的交付能力。烧钱可以换来产能,但只有交付才能换来收入。

这次切换的意义,已经超出"业务转型"的范畴。它意味着资本市场需要重新给一家科技公司定价:

不再是"用边际零成本换规模回报"的高 ROE 生意,而是"用持续投入换能力密度"的长周期生意。前者奖励扩张速度,后者奖励重构的耐心。

赢家通吃或许越来越难了,但更长、更慢、也更需要耐心的竞争,才刚刚开始。

本文来自微信公众号“深流研究所”,作者:绛枫,36氪经授权发布。

发布时间:2026-05-20 21:05