AI视频从Demo到商用交付,可灵如何拿下全球创意市场?

规则的改变,总是静悄悄的。

2026年的初夏,两件事在戛纳同步发生。

一方面,全球创意工业完成了一次不动声色的范式切换。戛纳狮子国际创意节首次将AI Craft体系化写入评审结构,横跨Film Craft、Digital Craft、Industry Craft多个维度。AI第一次被放进“创意工艺”的评价框架,而非一个谈论性质的新事物。而这个子赛道里,两部由可灵AI参与制作的广告作品斩获奖项。

另一方面,稍前些的戛纳国际电影节的主题论坛里,来自中、美、韩三国导演围绕可灵AI在真实影视工作流中的应用,分享了从好莱坞工业级剧集、纯AI院线电影与AI动画长片等等不同维度里的落地路径。

过去两年,AI视频模型的迭代速度极快。但技术端的狂飙和产业端的采纳之间,始终存在温差。

现在,温差正在被弥合。

在戛纳发生的事件,分别来自两个更难被说服的系统。一个是全球广告创意工业的评价标准,一个是专业影视工业的生产现场。

可以发现,AI视频正在经历一条清晰的验证链。在大众端产品化下沉之外,还需要迎接全球顶级创意殿堂的评审体系认可,与广告和影视工业的规模化采纳。

从这个角度看,可灵AI恰好是少数完整跨越了这三道门槛的模型。截至2026年6月,可灵全球用户突破1亿,覆盖224个国家和地区,ARR接近5亿美元,一年增长近400%。而在这些数字背后,是AI视频的商业化,已经开始被真实用户、真实项目和真实收入共同验证。

由此,一个足够有说服力的样本,出现了。

AI在场,戛纳金狮奖评审席上的迁移

可灵AI参与并获奖的两部作品,《L’Ultimo Uomo Reale》获Classic单元Film银奖及Craft单元Film Craft铜奖;

rame class="entity-iframe" style="height:250px;width:450px;" data-type="video" data-id="3879697753616392" scrolling="no" frameborder="0"> rame>

《Lorem Ipsum》获Classic单元Film铜奖。

rame class="entity-iframe" style="height:250px;width:450px;" data-type="video" data-id="3879701441769729" scrolling="no" frameborder="0"> rame>

《The Last Real Man》的客户是The RealReal,美国头部的二手奢侈品电商平台,主打就是它的核心价值,保真。

这支愚人节广告的主线,是一个充满虚构与复制品的世界里,一位试图寻找“真实”主人公的故事。全片绝大部分镜头由可灵AI生成,甚至号称最后一个真实男人的主角,也是由AI生成的。唯一的实拍素材是那只包。

创意的精巧之处在于套嵌。品牌需要传递的是“真实”,制作方式却是“生成”。全片看起来无比逼真,但当观众意识到一切由AI制作,“何为真实”这个品牌命题反而被二次激活。那只实拍的包,成了AI世界里唯一真实的锚点。这本身就是The RealReal品牌命题的实体化表达,AI生成的世界越完整,它的真实感反而越突出。

而另一方面,《Lorem Ipsum》的本意,是设计软件与网站搭建里常见的无意义拉丁语占位文本。Purga Films以此概念为起点,套用日本武士、西部牛仔、黑帮三种经典类型片的视觉语法,制作的内容尽管全程都是无意义的台词,但依旧能让观众读出完整的情绪和叙事。

这不是一个实拍后AI修饰的项目。在导演的手笔下,AI被精确调度,重现出三种类型片里的视觉符号系统。那些服装、光影、构图、人物姿态、动作节奏,那些曾经需要复杂流程的质感,被压缩成了一种更灵活高效的流程。

AI,不只是辅助性的工具了。它可以是创意语言,可以是被精准调度的核心生产力。

两部作品一个来自德国,一个来自阿根廷,评判来自全球评审团。这个地理分布本身也是一个事实,可灵AI为代表的AI视频技术,在全球行业中的存在,已经不是被讨论的外来者,而是在场的参与者。

Lipstick Film创始人Sebastian Strasser的判断十分精准。“AI不会取代导演,它只是拿走了所有不去认真执导的借口。”

戛纳创意节纳入AI Craft体系的意义也正在这里。它没有简单宣布AI的胜利,而是把AI纳入了一套更严苛的创意秩序。AI进入创意工业,不再只是少数人的实验,也不再只是技术公司的能力展示。它开始被最高级别的评审体系,当作一种可以被衡量的创作工艺。

跨过商业交付的门槛

评审体系的认可,解决了是否能被专业标准衡量。而对广告和影视行业来说,更现实的问题是,如何迈过商业交付的惊险一跃。

创意工业对新技术从不缺少兴趣。过去两年,几乎所有广告公司、影视工作室、导演和创作者,都在试用不同的AI视频工具。但尝试探索和商业交付之间,还有着明显门槛。

以广告行业为例,此前对AI视频不能说排斥,但态度相对保守。这的确有其客观原因。早期的AI视频技术,生产的内容往往角色跨镜头一致性不足,输出不可复现,后期修正成本甚至高过重拍。

这是商业交付的实际需要。只要这些问题没有解决,AI就无法真正成为核心生产力。而可灵AI被广告行业普遍接纳,甚至成为获奖产品核心技术支撑的内核,就是面向实际交付场景的能力叙事。

规模化的原生4k输出,足够有质感的画面,能够精准调控的生成,连贯的角色……这一点,在《The Last Real Man》与《Lorem Ipsum》的质量呈现和获奖认证里,有了十足的证明。

不止国外。此前美团愚人节广告《麻烦死了》,就是由创作者@希希叔叔通过可灵AI完成交付的。在他看来,商业项目最怕不确定性,而可灵AI已经实现了角色的一致性,能够保证品牌人物的连续叙述,分镜级可控让生成从“抽卡”式的运气操作变成可预期的生产。稳定,又有原生4K级质感的产出,节省了大量时间。整支TVC的交付,仅用了两周。如果按照传统方式,通常需要四到六周。

希希叔叔的专访中曾经提到,制作《麻烦死了》,真正用于AI生成关键镜头和动态小样的时间只占一部分,更多时间被放在前期创意定调和后期精修上。创作者的精力,完全被释放出来,可以回到创意本身。

WPP旗下全球最大创意公司VML的中国区CEO Kevin Zhu也很认可这一点。“往往只需两三次提示词调整,就能得到高度精准的画面。”

可灵让LOGO、字体、包装等品牌视觉资产始终保持稳定,是前提。而合伙伙伴级的效率提升,这直接带来创意决策方式的改变。“过去只能死磕1个创意方向,现在可以同时跑通5条不同的创意支线,最终择优录取。”

当然,广告行业的商业交付,是相对短周期、短片长的。而在影视行业里,AI视频能否完成长剧集甚至好莱坞工业标准下,对连续性、稳定性和协作效率的长期要求?

戛纳国际电影节现场论坛上,三位导演的回答自然是肯定的。其中就包括好莱坞导演Jon Erwin。

戛纳电影节现场

他执导的Amazon Prime剧集《大卫王朝》(House of David),第一季全球观看量4400万,美国区Prime Video排名第一。而在这一季里,也使用了很多可灵AI生成的镜头。

而在第二季,可灵AI生成镜头的数量增加了近6倍,达到了400组。制作团队用一整季确认了AI在连续性、稳定性和工业标准上的可靠性,然后做出了规模化采纳的判断。一个制作体系对工具的信任,比一个导演的个人偏好,分量重得多。

Erwin的另一部作品《古老故事:摩西》(The Old Stories: Moses),其在曼哈顿海滩的LED虚拟影棚里,以实拍与AI虚拟制作并行的方式,用一周完成原需六个月筹备的三集迷你剧拍摄。

这种混合制片模式的变化,也传导到了演员现场。奥斯卡影帝本·金斯利第一次进入AI生成场景表演时曾说,自己一度分不清真实搭建的场景在哪里结束,电脑生成的世界又从哪里开始,“整个过渡毫无痕迹”。

AI生成环境不再只是后期画面,而开始成为演员可以进入、相信,并据此完成表演的现场。

效率飞升的秘密,是演员拍摄和视效生成几乎同步在进行。曾经数周时间才能制作完成的红海水体与巨浪特效,在可灵AI的加持下,生产甚至不需要一小时。

“我认为我们行业更大的就业威胁,其实是制作成本太高、周期太长。”在好莱坞弥漫着“AI摧毁就业”焦虑的空气里,Jon Erwin在《洛杉矶时报》的专访中,给出了一个相反的结论。“AI可以用3到5倍的速度完成这些工作,成本不到30%。我实际上把这套工具看作行业就业问题的解药。”甚至于,他直接表示,如果不用AI,《摩西》根本不会被制作出来。

一项技术,如果能让原本不存在的项目变得可行,它在产业中的角色就不再是优化,而是前提。

这一点,国内也不乏案例。此前拿下白玉兰奖的年度爆剧《太平年》中,也有许多可灵AI参与的镜头。比如乌鸦食腐肉的名场面,成本不到传统方案的1%。据公开报道显示,AI覆盖了该剧集30%-40%的制作环节。

制作团队时光坐标的创始人陈奕,甚至在可灵AI上搭建了一套贯穿48集的专属工作流,实现了前期影像分类、数字资产积累、统一风格管理,让质感和角色形象在全剧生命周期内可持续复用。

这些商业交付的场景里,AI的产出,已经慢慢从单个爆款镜头里脱离,而进入到实际的工作流中,把原本昂贵、漫长、不可控的影像生产,变成更确定、更连续的过程。

戛纳评审席给出的,是创意秩序里的信号。广告和影视制作现场给出的,则是商业秩序里的信号。前者说明AI视频已经可以被评价,后者说明AI视频正在被依赖,而非谁替代谁的零和博弈。

专业生产与大众表达,基础设施的多种形态

AI视频可以进入更复杂的生产系统,这并不意味着它的价值只属于片场、广告公司和影视工作室。

创意秩序和商业秩序,是专业体系内部的事。但一项技术的最终目的,永远是在大众端沉淀为一种日常能力。

专业创作者是最能感知这种外溢的群体。截至2026年6月,可灵AI全球用户已突破1亿,其中专业创作者比例不低,覆盖影视、短剧、广告、游戏、自媒体。这些人中很大一部分嵌在各类studio的组织结构里,覆盖导演、制片、视效、设计师、剪辑师等等各类职业。

他们的日常选择会沿着组织脉络向上与向下传导。向上传导很好理解,当一个视效师持续用可灵交付项目,他所在的整条制作线会跟着迁移。与之对应的,向下则是这些专业创作者生产的内容模式或者生成技巧,被下放到大众维度。

大众在社交媒体的场域中,产生内容消费,甚至通过AI的原生能力直接参与。

一个鲜明的例子就是,在今年5月全球爆火的“棒球现场特效”。从韩国棒球赛看台开始,直接蔓延到了世界杯现场。大量用户制作自己“被摄像机捕捉到”的特效视频,传播迅速席卷全球。

Sensor Tower的数据里,呈现出一条清晰的链条。5月12日,可灵AI单日下载量达96.9万,较月初增长约649%;日活从66.3万升至148.9万;单日收入从14.1万美元升至31.9万美元。

在此之前,2025年底,可灵2.6上线的“动作控制”也掀起过一轮大众热潮。用户只需要上传参考动作和目标形象,就能获得一段包含运镜的最长30秒视频。那些跳着舞的猫猫狗狗们,迅速成为千万级播放的爆款。用户也的确愿意为此付费。数据显示,可灵AI的付费用户单月暴涨350%。

两次出圈的节奏和形态截然不同,但共同特征是,大众维度的内容创造、消费形成了回环。可灵AI提供的,显然并非一次性的猎奇体验,而是一种可以反复使用的创作能力,一种内容基建。用户留下来,是因为有东西可做。

更安静的大众渗透,发生在硬件终端。荣耀600系列搭载可灵O3模型,用户上传一张图就能一键生成动态视频。理想汽车智能座舱、小米手机背屏里的动态壁纸,也均由可灵驱动。

一个数据是,可灵AI的全球API用户半年内从3万增至5万,增速仍在加快。越来越多的企业和开发者,正在把可灵的能力嵌入自己的产品和服务。

AI视频,正在切实成为某种基础设施。而可灵AI在这个过程中的位置,也因此发生了变化。更准确地说,它开始出现在影像生产的不同入口处:向上嵌入专业评审体系和工业工作流,向下沉入大众内容消费,向外接入硬件终端与第三方产品。

这些同步发生的事实,勾勒出的不只是可灵AI的增长轨迹。更像是一个个切面,让人看见新的内容生产标准如何围绕它,在不同层级里被建立起来。

评审体系的认可,说明AI视频已经可以被专业创意秩序评价;商业交付的实践,说明它可以被广告和影视工业依赖;大众端的渗透,说明它正在变成普通用户也能调用的日常能力。三件事同时成立,才构成一个完整的产业叙事。

这是一个关键的身位切换。毕竟,应用的竞争在于用户量,基建的竞争在于嵌入深度。

接下来,AI视频行业的分野会越来越清楚。单次生成的惊艳感会迅速贬值,真正稀缺的是一种可长期调用、可持续复用、可进入交易关系的生产能力。

可灵AI的样本价值正在这里。它把模型能力从“效果”推进到“资产”。它连接的不是某一种场景,而是从专业工艺、商业交付到大众日常的整条迁移路径。

一个新的标准,往往就诞生在这种迁移里。

发布时间:2026-07-03 22:20