今天钉钉发布了悟空,我也是第一时间试用了一下,想聊聊几句。
OpenClaw 火了之后,国内大厂跟进的速度很快,以 BAT 为代表。
字节的火山引擎做了 ArkClaw,本质是把 OpenClaw 搬到云端,网页打开就能用;腾讯做了 WorkBuddy,自研一套桌面 Agent,3 月 12 号全量开放还打通了微信直连。两家的逻辑都很清晰:先让个人用户用起来,门槛越低越好,跑起来再说。
而悟空不是这个思路。
我翻了一圈资料,发现悟空做了这么几件事:
- 四层 Skill 体系(钉钉原生的、阿里集团商业操作系统的、企业私有的、开源兼容的)
- Skill 全生命周期管理(从创建到审核到发布到下架到监控)
- 一套从零写的 AI 原生文件系统叫 RealDoc
- 一个塞了 1 块 PC 主板加 5 块手机主板的专用硬件 Realbox。
说实话,第一反应是俩字:太重。
先说我的疑虑。
OpenClaw 全球爆发也就这几个月的事,大多数企业连 Agent 到底能干嘛都还没搞明白,在这个时间点这么大力推,是不是有点不合时宜?
像悟空推的是双层安全规则体系、独立沙箱、三级网络管控、全链路审计日志。甚至细到群聊场景里,悟空的数据权限取「用户权限」和「提问人权限」的交集——哪怕悟空理论上能访问某些数据,提问的人没权限,它也不返回。
这些功能每一条拿出来都是对的。甚至可以说是必要的。
但问题在于:这是现在企业最急迫的需求吗?
打个不太恰当的比方。智能手机刚出来的时候,你不先卖手机,先卖 MDM(移动设备管理)。逻辑上完全说得通,但市场还没走到那一步。大部分中小企业老板对 Agent 的理解可能还停留在「帮我写个周报」的阶段,你跟他讲全链路审计和风险熔断,他大概率会问一句:这跟我有什么关系?
钉钉在国内 SaaS 平台从来都是以比较能做落地的决策著称的,为什么这一次反而不太一样了?
另外,从路径看,的确是在模仿 Anthropic 走企业级路线。而 Claude 走出了 Claude Code 的路线,悟空走的是什么路线呢?
用户到底是谁。
悟空的定位写的是「中小企业、企业开发者、行业客户」。但看它展示的核心能力——四层 Skill 体系、全生命周期管理、集群部署、多人共用 Realbox——全部指向中大型组织。
有意思的是,悟空同时推了一个叫 OPT(One Person Team,一人团队)的概念,感觉是在响应国家的 OPC(One Person Company)的号召。覆盖十个行业:一人电商、跨境电商、知识博主、一人门店、一人律师团队、一人设计团队、一人制造团队、一人财务团队、一人猎头团队、一人开发团队。
这中间的挑战就很大了。
一边是企业级架构——权限管控、集群部署、操作审计;一边是超级个体——一个人运营一家电商,一个人管一家门店。这两类人的需求差距实在太大了。
拿「一人门店」这个场景来说。素材里有个案例叫杭工匠车身修复,开在停车场三楼,线下自然客流几乎为零,全靠线上引流活。这个老板需要的是什么?大概就是帮我在小红书上自动回评论、自动发爆款笔记、别让咨询消息过夜。
他需要全生命周期 Skill 管理吗?需要企业级权限管控吗?估计不需要。他需要的是五分钟上手,立刻见效。
目前悟空的企业级架构和 OPT 超级个体之间,还少了一个清晰的分层入口。轻量用户怎么进来?重度用户怎么升级?这条路径现在还不够清晰。
不过上面说了这么多疑虑和挑战,有一件事改变了我的看法。
悟空整场发布里有一个看似不太重要的信息,但我觉得是最硬核的东西——钉钉全产品 CLI 化。
CLI 是最近科技领域非常关注的一个产品形态,它很可能会在一段时间后替代掉图形界面。像我近期用 Claude Code 和 Codex 就非常过瘾,他们不光能解决代码的问题,其实是解决了让大模型长出手脚的问题,也是 OpenClaw 的精神父亲。
钉钉把过去 11 年做的所有产品——AI 表格、AI 听记、视频会议、文档、知识库、审批、OA,还有各类 SaaS 应用——全部重写为 CLI(命令行接口),AI 可以理解、调用、操作钉钉的产品能力。
注意,这不是「在钉钉上面加了一个 AI 助手」。官方自己说的原话是:这不是在老产品上加 AI 功能,而是为 AI 造了一套原生的操作语言。
这件事为什么重要?因为它回答了一个根本性的问题:Agent 操作企业软件的方式到底应该是什么。
OpenClaw 和市面上绝大多数 Agent 的方式是屏幕操作——AI 看着你的电脑屏幕,模拟鼠标键盘点来点去。正如之前豆包手机所面临的问题一样(豆包手机是靠屏幕不断的截图来实现的),这种方式的上限是低的:慢、不稳定、容易出错,复杂的企业级权限更是处理不了。
悟空的方式是原生调用——AI 通过 CLI 直接操作钉钉的审批链、数据表、日程系统、通讯录。
前者像是雇了个实习生坐在你电脑前帮你操作软件,后者则是给了一个懂行的专家直接接入了公司的业务系统。这完全不是一个量级的事情。
而且 CLI 化还有一个更深远的可能:
因为每一个钉钉功能都变成了标准化的命令行接口,意味着未来任何第三方 Agent 都可以调用这些能力。钉钉不只是在做一个 Agent 产品,它在把自己变成所有 Agent 的企业级技能包和武器库。
当然,要打一个大大的问号。11 年的产品线,CLI 化到底完成到了什么程度?是全量覆盖,还是重点场景的 demo?这个问题的答案,决定了上面这段话是预言还是吹牛。
但至少方向上,这是我目前看到的大厂做 Agent 里最有结构性壁垒的一步棋。
除了 CLI 化,还有两个被忽视的细节。
第一个是 RealDoc。
解决的是一个所有 Agent 用户都遇到过的痛点:
当前所有 AI Agent 操作文件的方式极其原始,改文档里一个词,AI 得先把整篇文档读进来,改完再整篇写回去。像是改书里一个错别字,却要把整本书抄一遍。官方给了一个案例的数据:有用户实测制作一个 PPT,消耗了 2.7 亿 Token,约 500 美金。
RealDoc 让 AI 可以按行号定位、按关键词锚点、用正则表达式批量匹配,只动需要动的地方。每步操作自动保存快照,改坏了一条命令回退到任意版本。
这种「脏活」层面的创新很难体现在精彩的画面上,但极其实用。说明团队不是在画 PPT,是在解决 Agent 落地过程中那些真正恶心人的工程问题。
第二个是 AI IM 的升级。
过去用 Agent 的方式是「人找 AI」——打开悟空、输入指令、等结果、再搬回工作场景。中间有三层摩擦成本:切换、描述、搬运。
钉钉做的是在 IM 侧边栏嵌入一个 AI IDE,让悟空实时读取对话流、自动给出建议、直接执行任务。不是你问它答的 Copilot 模式,是主动发现任务并提建议的 Agent 模式。
这两个细节加在一起说明一件事:悟空不是在堆功能清单,是真的想过了用户体验。
回头再看悟空那些一开始觉得「太重」的设计,换个角度想想。
权限管控、操作审计、风险熔断、Skill 全生命周期管理——这些不是锦上添花的东西,是 Agent 进入企业场景的必答题。只不过,大多数人还没走到需要答题的阶段。
OpenClaw 爆发后的几个月里发生了什么?龙虾删邮件、敏感数据被 AI 读取、文件散落在本地虚拟机无人管控、员工离职一键删除企业资产。这些不是假设性风险,是真实发生过的事情。AI 有了操控电脑的能力,安全不是「有没有」的问题,是「敢不敢放进企业」的问题。
从这个角度看,悟空从第一天把安全建进架构里而不是事后打补丁,就不是过度设计,而是唯一正确的做法。安全一直是红线,相当于企业的地基。
再说生态位。阿里集团旗下淘宝、天猫、支付宝、阿里云的商家服务能力正在以 Skill 形式逐步接入悟空。一个跨境电商用户通过悟空,未来可以在一个平台里完成「亚马逊选品→1688 找同款→供应商沟通→商品名优化→TikTok 视频营销」的完整链路。这不是创业公司能拼凑出来的能力密度。
悟空赌的不是「现在企业需要 Agent」。它赌的是「当企业需要 Agent 的时候,需要的一定是这种形态」。
说了这么多,最后聊聊「跟我们有什么关系」。
对大多数个人用户来说,今天下载了悟空,也许还不是能兴奋地干拔一个业务的时刻。OPT 十大行业方案里的一人门店、一人电商听起来很诱人,但上手体验到底如何,也还需要验证。
但如果你是这么几类人,可以现在就认真看一眼:
- 中小企业主,已经在让员工用 Agent 处理工作,但担心数据安全和管控的
- 开发者,想找一个能把 Skill 快速商业化变现的平台
- 钉钉生态里的 ISV 或 SaaS 合作伙伴,在考虑下一步怎么接 AI 能力的
悟空不完美。时机可能偏早,功能架构也许还比较粗糙。但它做了一件大多数在追热点的产品没做的事——不是在简单地关注「怎么让更多人先用起来」,而是在问「当企业真正需要 Agent 的时候,它们需要什么」。
在一个所有人都在比谁跑得快的赛道里,有人愿意停下来回答一个更难的问题。我倾向于觉得,这件事本身值得被认真对待。
先说这么多。希望对各位有启发。
本文来自微信公众号 “刘言飞语”(ID:liufeinotes),作者:刘飞Lufy,36氪经授权发布。
发布时间:2026-03-17 20:03