最近,几乎所有人都在问同一个问题:
AI 应用还有没有价值,OpenAI 和 Anthropic 会不会终结一切?
这个问题背后,其实藏着一种很典型的 AI 焦虑。
很多人现在越来越相信,所有软件最终都会被模型吞掉。今天是 Codex、Claude Code,明天可能就是更强的新模型。无论你现在做什么应用,都可能被底层模型直接“内置化”,最后失去价值。
昨天,A16Z 合伙人乔·施密特专门写了一篇文章,讨论这个问题。
他认为,大模型确实正在进入应用层,而且会吃掉相当一部分市场。但问题在于,很多人把“AI 应用”理解得太简单了。真实世界里的企业流程,远比“一个聪明模型”复杂得多。
即使今天通用模型已经很强,距离真正进入企业核心业务之间,仍然隔着很长一段距离。而这段距离,恰恰也是 AI 应用公司的机会所在。
现在的AI应用大致可以分为两类:
一种,是走在大模型公司正在铺的“黄砖路”上。所谓“黄砖路”,可以理解为大模型实验室最自然会进入的方向。
比如,代码生成、通用办公助手、文档总结、图像生成、通用 Agent。这类产品有一个共同点,它们的核心体验,很大程度上随着模型能力提升而提升。
这正是 OpenAI 和 Anthropic 最擅长的事情。
它们掌握模型本身,也掌握分发渠道。更重要的是,它们能够决定产品的底层架构。比如,采用“模型加工具调用”的方式,让AI连接 Google Drive、Slack、Salesforce 等常见软件,再完成搜索、总结、写作、编程这类横向任务。
如果一家初创公司也只是接入同样的模型,连接同样的软件,再做一层简单的智能编排,本质上就是在和大模型公司走同一条路。
问题是,OpenAI不仅有模型、有品牌、有分发,也有更强的定价权。
即便AI应用公司短期做出一个更好用的产品,也很难保证这种优势能长期存在。因为下一代模型更新后,很多功能可能会直接变成基础能力。
这也是为什么很多 AI 应用看起来增长很快,但长期风险很高。因为它们离大模型公司的主航道太近。
另一种,是深入那些复杂、垂直、难以标准化的真实业务世界里。
这才是AI应用真正的机会。比如保险、法律、医疗、财务、销售、客服、供应链。这些行业的问题,不是简单问一句 AI 就能解决的。
因为很多企业今天的运作方式,仍然建立在过去十几年甚至几十年的软件体系上。数据分散在不同系统里,流程横跨多个部门,中间夹杂着大量人工确认、例外处理和经验判断。软件虽然很多,但彼此之间并不真正连通。
员工每天做的事情,并不是坐在那里等 AI 回答问题,而是在多个系统之间来回切换,复制数据、上传文件、核对信息、发邮件确认,再根据上下文做判断。
这才是企业里最真实的工作。
比如一家保险公司,看起来只是“审核保单”,但真正运行起来,背后牵扯到不同地区的监管规则、不同团队的风险偏好、不同客户的历史记录,以及大量没有明确写进文档里的经验判断。
同样一份材料,在不同公司、不同团队,甚至不同负责人那里,处理方式都可能不一样。
这些东西,并不会天然存在于大模型的训练数据里。
模型可以提供智能,但它并不知道某家公司过去为什么拒绝某类风险,也不知道某个核保员为什么在某个特殊案例里推翻了系统建议。它更不知道一个企业内部那些没有写进流程文档、却长期影响业务判断的隐性规则。
这就是垂直 AI 应用的价值所在。
从目前看,通用模型和真实业务之间,仍然存在一段很长的距离。这段距离,就是 AI 应用公司的机会。
模型能力与真实业务的距离,主要来自三个层面:
第一层壁垒,来自数据和经验的积累。
很多行业知识并不在公开互联网上,更多是在真实工作中不断沉淀出来的。
一次法律审查为什么被合伙人打回,一份保险申请为什么被升级处理,一个销售线索为什么最终成交,一个客服问题为什么需要转人工,这些经验只有在大量真实流程中反复运行,才会慢慢变成系统能力。
这类数据未必能跨客户直接复用,但问题类型、处理路径和异常模式会不断积累。
做过上百次法律审查的系统,和第一次进入这个行业的新产品,理解问题的深度是不一样的。处理过上千次保险承保流程的系统,也会更清楚哪些环节最容易出错,哪些信息最影响最终判断。
这就是垂直应用公司的学习飞轮。它是在真实生产环境里跑出来的。
第二类壁垒,来自对模型复杂度和成本的管理。
真实业务不会只靠一个最强模型解决所有问题。
如果所有任务都调用最贵的前沿模型,成本很快就会失控。真正成熟的 AI 应用公司,会根据不同任务选择不同模型。有些复杂判断交给最强模型,有些批量处理交给中等模型,有些高度重复的任务则可以用更便宜的小模型或微调模型完成。
这件事的关键是,判断每个环节需要用什么样的模型。这需要对业务足够熟。
大模型实验室可以提供通用能力,但它们不可能替每个行业、每家公司、每个工作流都做精细的成本优化和模型调度。
垂直应用公司的机会在于,用更低、更稳定的成本交付具体结果。
第三类壁垒,来自治理和责任。
越是进入企业核心流程,AI 产品对可控性要求就更高。
医疗有隐私和合规要求,金融有监管要求,法律有职业规范,保险也有州级监管和审计要求。
在这些场景里,企业关心的不只是 AI 能不能完成任务,还包括它能访问哪些数据,能做哪些操作,结果如何记录,出了问题如何追溯。
这不是一个通用聊天框能解决的事情。它需要把权限、审计、审批、人工介入、操作记录都放进系统里,让企业能够放心使用。
所以在很多行业里,AI 应用公司真正交付的,是一套可被企业接受的运行机制。
销售就是一个典型例子。表面上看,AI 做销售很简单:找客户、写邮件、发消息、跟进线索。
但真正做起来,问题会迅速变复杂。
一个潜在客户到底是不是目标客户?一家公司的母公司和子公司该怎么识别?CRM 里的数据是不是过时?同一个联系人过去有没有被触达过?某类客户适合电话沟通,还是适合邮件沟通?
这些细节看起来很小,但它们决定了销售结果。
如果只是让一个通用模型写几封邮件,价值并不高。真正有价值的,是把客户筛选、信息补全、背景调研、渠道选择、话术生成、发送节奏和结果反馈连成一个完整流程。
这时候,AI 才不只是写作工具,而是进入了销售团队的真实工作方式。
时间长了,这套系统就不只是脚本,而会逐渐成为一家公司的运营记忆。
这才是大模型实验室很难直接拿走的部分。
因为它们可以提供更好的模型,却很难长期深入每一家保险公司、每一家律所、每一家医院,去理解它们内部真实而细碎的运作方式。
那么,怎么判断一家 AI 应用公司是不是在“黄砖路”之外?
可以看三个问题。
第一个问题是,这个任务到底有多复杂。
如果一个产品只是帮用户在 Google Drive 里搜文件、总结内容,流程很短,结果也比较宽容。即便错了,用户可以再问一次。
但如果是根据一家公司的历史案例做法律审查,情况就完全不同。它可能要调取多个系统的数据,经过多轮判断,最后还要由合伙人审核,甚至影响真实诉讼结果。
两者看起来都像“AI 在执行任务”,但难度完全不是一回事。
第二个问题是,它到底是工具,还是系统。
工具只是给现有流程加一点智能,系统则会成为客户真正工作的地方。
如果客户离开这个产品,原来的流程就跑不动,或者效率大幅下降,那它更像一个系统。如果某个大模型公司推出类似功能后,客户可以轻松替换,那它更像一个工具。
AI 应用真正的价值,往往来自成为系统,而不是成为插件。
第三个问题是,客户到底为什么付钱。
如果客户只是为通用能力付钱,比如写得更快、总结得更好、代码补全更顺,那大模型公司迟早会进入。
但如果客户为具体业务结果付钱,比如销售线索增加、结账时间缩短、理赔处理更快、合同审查更稳,那应用公司就有更大的空间。
未来,大模型公司和 AI 应用公司都会赢。
OpenAI 和 Anthropic 会继续拿走一大块横向市场,因为它们拥有模型、品牌和分发渠道。代码、写作、搜索、办公助手这类通用场景,很自然会向大模型平台集中。
但这不意味着应用层没有机会。在更复杂的行业里,模型只是基础设施。真正决定价值的,是谁能把模型变成可运行、可管理、可持续优化的业务系统。
底层模型可以替换,但企业的工作系统很难频繁替换。
一家公司一旦把核心流程、历史数据、审批机制和运营经验都放进某个系统里,迁移成本就会变得很高。随着时间推移,这个系统会越来越懂业务,也越来越难被简单替代。
所以,AI 应用不是没有价值。
没有价值的,是那些离大模型公司主航道太近、又没有真实业务深度的应用。
下一代企业软件,很可能不会诞生在最显眼的“黄砖路”上。它会出现在那些复杂、分散、充满人工流程的行业深处。
那里没有那么多聚光灯,但有更真实的客户需求,也有更长期的护城河。
本文来自微信公众号“硅基观察Pro”,作者:阿奇,36氪经授权发布。
发布时间:2026-05-28 21:16