神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。
编者按:软件不再为人而做?当智能体数量达到人类的千倍,API和按量付费将成为开发者在这一纪元唯一的生存法则。文章来自编译。
在过去的几个月里,智能体领域正发生着巨变。去年年底,我们开始进入这样一个阶段:编码智能体已经能够处理运行周期更长的任务,且在整个开发过程中不再需要过多的人工干预。
这些智能体不再是仅具备基础工具的聊天机器人。相反,它们通常拥有独立的沙盒计算环境,能够针对遇到的任何问题编写并运行代码,直接与 API 和命令行界面(CLI)交互,并拥有自己的文件系统和长期记忆。这套核心原语、智能体框架最佳实践的普及,以及模型在工具调用和软件开发方面的惊人进步,让我们得以窥见能够处理任何任务的智能体未来。
尽管这种架构起初是由 Claude Code、Devin、Codex、Factory、Cursor 或 Replit 等编码智能体定义的,但我们最近已经跨越鸿沟,进入了个人体验和知识工作的各个领域。这得益于 Claude Cowork、Perplexity Computer、Manus 以及 OpenClaw 等智能体的出现。特别是 OpenClaw,它将未来推向了更深处,实现了一个在持久化环境中 24/7 全天候运行的智能体。
随着能力的飞速提升,智能体将渗透到几乎所有的工作领域。它们将被部署去审查每一份合同,处理绝大多数一线客户支持,审计每一家公司的财务,梳理每一项用于药物研发的医学研究,生成几乎所有的代码,创建大部分销售和咨询演示文稿,代表消费者在网上进行交易。总而言之,智能体将参与社会中几乎每一个具有经济价值的任务。
这不仅仅是执行我们现有的任务。我们将利用智能体完成远超以往的工作——运行以前负担不起的模拟,为每个创意原型化多种方案。由于启动成本低廉且易于关闭,我们将开展更多的项目,并对每一条数据进行全面审查,而非仅仅进行抽样调研。
综合来看,我们可以预见,组织中的每位员工都将拥有多个替自己工作的智能体。不难想象,一家公司的智能体数量将是员工人数的 100 倍甚至 1000 倍。随着数以万亿计的智能体奔忙协作,智能体将成为未来所有软件的主要使用者。
鉴于大多数软件是为人类设计的,这意味着我们将见证软件未来形态的重大转变。那么,下一步是什么?
保罗·格雷厄姆(Paul Graham)曾用最简洁的语言概括了如何开发软件:做出大家想要的东西。
这一建议成就了 21 世纪一些最伟大的软件成功故事,并推动了一场运动:构建易于使用、易于采用、能用直白语言解决明确问题、定价清晰透明的工具。
而现在,前进的方向是开发智能体想要用的软件。虽然目前智能体最大的用户群体是开发者或高度技术化的用户,他们通常有自己的工具偏好,但在智能体为知识工作者执行各类任务的世界里,这种偏好将逐渐淡化。除非企业已经有了标准,否则智能体将在特定工作流的工具采纳上占据主导地位。
这可能涉及它们注册的工具、编写的代码、使用的库、杠杆化的技能等等。那些更易于被智能体采用并能完美解决智能体(及用户)问题的平台,将比那些做不到这一点的平台进步得快得多。智能体不会参加你的网络研讨会,也不会看你的广告;它们只会选用最适合该任务的工具,而你一定希望那个工具就是你的。
这一建议最大的启示在于,你所构建的一切必须“API 优先”。如果你没有为某个功能提供 API,它就如同不存在。如果它不能通过命令行界面(CLI)或模型上下文协议(MCP)服务器暴露出来,你就处于劣势。如果你的 API 令人困惑,或者给智能体提供了冲突的执行路径,你就是在削弱自己对智能体的价值。我们在为智能体构建文件系统时,一直在梳理 API 的方方面面,以找出在智能体世界里哪些环节会崩溃,从而实现以往只在用户体验(UX)设计中才会考虑的易用性水平。
正如为用户设计软件意味着要设身处地为他们着想,思考智能体会遇到什么也是如此。比方说,Y Combinator 的 Jared Friedman 曾提醒大家:“即使是最好的开发者工具,大多仍不支持通过 API 注册账户。这在 Claude Code 时代是一个重大失误,因为这意味着 Claude 无法自行注册。将所有账户管理功能接入 API 应当成为现在的基本要求。”如果智能体不能轻松注册并开始使用你的服务,你在智能体眼中就基本上出局了。
在智能体成为未来软件最大使用者的世界里,商业模式也将面临重大调整。在某些情况下,由用户席位触发的智能体可能仍适用于基于席位的商业模式,但有大量智能体用例无法与现有用户挂钩,或者是因为它们的工作负荷量已完全不同。比方说,智能体只需几句话或几行文字,就能在软件中完成相当于人类数小时的工作,而只将最终结果呈现给终端用户。
这最终将意味着部分软件商业模式的演变,因为任何想要在智能体时代生存下来的工具,都需要在其系统中内置某种形式的按量付费或基于规模的商业模式,甚至需要支持智能体能够自行支付这些服务的费用。
把电脑交给人类是一个好主意。但把电脑交给电脑是一个更好的主意,这样它们就能在电脑上创造出与我们工作中相同的产出。
—— Aravind Srinivas, Perplexity
随着智能体拥有自己使用的电脑,能够编写并执行自己的代码,调用常用技能进行重复操作,并接入外部工具和服务,这将为智能体专用的一整套新技术创造机会。想象一下用户在电脑上做什么,智能体就需要一套专门为其设计的类似能力。
其中一些核心服务将自然而然地来自现有玩家,因为智能体正在利用现有数据,或者系统中现有的人类用户与智能体用户之间的协作或连接具有价值。同样,也将出现全新的类别,因为这些问题空间与人类用户以前的需求或能力如此迥异,以至于从头开始设计服务才合乎逻辑。
比方说,显而易见的是,智能体需要拥有自己的基础设施来运行,且规模将达到前所未有的程度。下一个超大规模云服务商(或是现有的某一家)将建立在这样一个理念之上:未来的服务器农场不再是为我们的应用服务的,而是为我们的智能体服务的。E2B、Daytona、Modal 和 Cloudflare 都在朝这个方向努力,这些沙盒环境将对我们以往见过的任何计算规模构成挑战。
智能体还需要访问企业的核心文件,并能管理自己的记忆和长期工作数据,这正是我们致力于构建的内容。同样,大型企业系统也需要实现“API 优先”,以便智能体能够处理组织中的关键服务和数据——如人力资源信息系统(HRIS)、客户关系管理(CRM)、工作流、数据湖和其他主要系统。那些能为智能体提供最无缝工具以在任何地方操作这些数据的产品,将处于赢得未来这些工作负荷的最佳位置。
智能体可能还需要身份标识,并具备与其他方沟通的能力;比方说,Agentmail 正在为智能体提供信箱,让它们拥有自己的持久化电子邮件。Parallel、Exa 等公司正在重新构建网页搜索,以应对智能体成为抓取网络信息最大使用者的世界。许多类型的智能体将需要通过 Stripe 或 Coinbase 的钱包管理自己的支出预算,我们可能终于会迎来微额支付的真实应用场景,智能体借此可以接入付费工具和信息。
安全、合规和治理将成为这些智能体面临的主要问题。在一个智能体访问并处理工作流中的敏感信息,或执行受监管工作流(如制药或银行业)的世界里,公司需要治理并保留这些智能体所做的所有工作。长期运行的智能体可能需要自己的身份,以便认证进入各项服务,并对它们可以采取的操作类型以及在企业中可以访问的数据进行严格控制。我们需要全新的软件和平台来应对这些挑战,就像我们多年来为人类和应用所构建的那样。
总的来说,我们显然正进入一个软件新纪元,我们需要专门为智能体的大规模使用而设计和构建工具。在数以万亿计的智能体执行工作的世界里,这将开启一种全新的软件协作方式。
译者:boxi。
发布时间:2026-04-10 07:25