深圳具身智能行业又诞生一家新独角兽。
6月30日,跨维智能宣布完成B轮融资,此轮融资金额10亿元,投后估值超百亿元,后续将启动IPO。
从投资方阵容看,本轮融资国资色彩颇为浓厚:深创投、贵阳数字经济基金连续两轮重仓,前海母基金、蓝思科技、工银资本、恒健资产、诸瑞资本新进入局,南山战新投、成都科创投、四川院士基金等老股东继续跟投。
值得一提的是,股东名单中还有蓝思科技董事长周群飞的身影,这也是她首次个人出资一家具身智能企业。在此之前,蓝思科技曾是跨维智能的客户之一。
跨维智能官宣融资的前一天,两家深圳具身智能公司——自变量机器人、智平方同时被曝估值突破200亿元。其中,自变量两个月内完成四轮融资并交割,股东包括字节跳动、小米、美团等。智平方则新增近50亿元融资。几乎同时,极佳视界、千寻智能等公司也密集完成多轮融资。
短短数月,具身智能赛道密集涌现出多家估值超百亿的独角兽。据IT桔子统计,2026年上半年流入具身智能与机器人领域的资金超过460亿元,但七成集中在前20家企业手中,马太效应已经相当明显。
跨维智能也挤进了这一轮融资潮的头部阵营。这是一家创立于2021年的公司,创始人为香港中文大学(深圳)终身教授贾奎。贾奎此前一直从事科研工作,研究方向集中在三维空间里的AI应用,而跨维智能也是国内最早将AI应用到三维空间的团队之一。这也间接决定了跨维的技术路线:用合成数据和物理仿真去训练机器人,再把模型部署到真实场景里赚钱。
这在当时并不是一种主流判断。过去行业里更多人相信,靠堆叠真机遥操数据就能喂出一个通用的机器人大脑。但贾奎提到,一名遥操作员一天能采集的数据在100到150条左右,按这个效率,想要覆盖具身智能所需的语义泛化能力,理论上需要10万年。
当真机数据的效率瓶颈浮现,仿真合成数据路线的价值反而被重新审视,这也是产业界正在形成的共识。
跨维智能跑通了从生成仿真数据、训练模型到部署真机的一整套流程,由自研的DexVerse™具身智能引擎支撑。贾奎介绍,这套体系能把机器人新场景的研发周期压缩90%:一项泛智能制造场景下的新任务,从造数据到训模型到能上线工作,6到8小时内即可完成;一项人形机器人商业服务任务,从立项到落地一般可在几天内搞定。
今年具身智能行业最热闹的话题之一,是继VLA(视觉-语言-动作模型)之后,几乎所有头部公司都着重讲世界模型的故事,跨维也是其中之一。
贾奎的判断是,VLA本质上是一种“Shortcut Learning(捷径学习)”:机器人看到画面、接收语言指令,直接输出动作,跳过了对场景背后物理规律的理解。在大量真机数据的验证下,也没发现这种端到端的建模方式在泛化能力上效率低下,遇到没见过的物体、环境或干扰,模型就容易失效。
但对于世界模型,行业也并不是一味追捧。智平方创始人郭彦东就曾提到,当下被广泛讨论的世界模型本质上并不是物理规律驱动,而是靠海量数据训练出来的。当数据足够多,模型就知道水杯会下落,但这不是物理规律的总结,而是大数据学习的结果。
跨维智能近期发布的Dexterity-BEV,是其在世界模型上落地的具体方案。它借用的是自动驾驶领域已经验证成熟的BEV(Bird's-Eye View,鸟瞰视角)方法,把来自多个摄像头、多种传感器的原始观测数据,统一压缩进一个可直接调用的物理坐标系,让系统从在三维空间里理解世界,自动驾驶行业正是靠这一步完成了技术跃迁。
跨维智能希望把这套逻辑搬到机器人身上:把视觉输入、机器人关节状态、末端执行器的目标动作,统一对齐到同一个BEV坐标系中,从而解决不同机器人本体和操作者采集数据天然不互通的问题。并且,跨维的差异化在于,在架构设计阶段就把三维空间的几何约束和运动规律嵌入模型结构,并不是完全靠大数据堆积。
Dexterity-BEV发布一周后,阿里巴巴发布的世界模型Qwen-RobotWorld,也是类似的逻辑。当端到端VLA建模在泛化场景中遇到瓶颈时,业界正在从不同角度探索更接近物理规律的表征,试图为机器人真正理解世界找到某种共识。
商业化层面,跨维智能的打法是两条腿走路:一是用模型能力赋能第三方机械臂或机器人,切入智能制造领域的分拣、装配、插拔等任务,这也是目前商业化最成熟的业务;二是用自己的人形机器人DexForce W1系列切入需要人机交互的商业服务场景,比如咖啡制作、智慧零售和文旅导览。今年五一假期,跨维智能在十几家门店里录得单店超10万元的最高营收。
跨维智能机器人服务小站 图片来源:跨维智能
截至目前,跨维智能已落地50多个细分行业,2026年上半年人形机器人出货量在数百台级别,这个数据才行业中尚处第二梯队。但贾奎透露,2025年跨维智能实现了超亿级规模营收,2026年预计营收会同比翻三倍。
收费模式上,贾奎还提出了一种设想,参照大语言模型按token调用付费的逻辑,未来按机器人实际消耗的算力和数据量收费,而非单纯卖硬件本体。不过,目前按这种逻辑落地的案例仍然有限,硬件依然是主要的收费载体。但他也认为,一旦后续token消耗能为客户创造增量价值,具身厂商就可以从中进一步获益,届时前期硬件购买的重要性就会下降。
这或许是具身智能厂商新的想象空间。
本文来自“界面新闻”,记者:陆柯言,编辑:刘方远,36氪经授权发布。
发布时间:2026-07-01 21:10