胡泳:故事机器、AI 短剧与文化工业的算法化

短短时间,短剧为何两次变身?

短剧是很新兴的东西,但在中国这个加速社会当中,越新的东西,就越会被更新的东西挑战。比如短剧刚出来是想收费的,但很快就被免费短剧拖进了另一片海洋。 

短剧初期是奔着高客单价的直接付费去的,通过几十集连续不断的高能反转和“充值解锁”机制,企图复制网文的变现路径。然而,互联网内容行业的流量法则很快就打破了这一设想。 

“免费短剧+广告”模式的崛起,通过极致的低门槛迅速做大了用户盘子。平台不再依赖单一用户的单次充值,而是将海量流量变现,形成了更大的商业闭环。 

对于平台来讲,这是一种天然的打法。在一个由短视频平台主导的注意力市场中,用户已经习惯了免费获取内容,并且平台算法更倾向于推动能够迅速获得点击、停留和分享的数据型内容,而非高门槛的付费内容。相比于向少数用户收取较高费用,通过广告投流吸引海量用户,再依靠规模化流量实现变现,往往是更符合平台生态的一条道路。 

这是短剧行业底层逻辑的第一次改变:它不再是网文的影视化版本,而逐渐演变成短视频生态中的一种内容产品。内容价值的衡量标准,也从单个用户愿意支付多少钱,转向能够吸引多少用户停留、点击和转发。 

在这样的背景下,剧情节奏被进一步压缩,反转频率不断提高,人物关系越来越极端,因为所有创作都在服务一个核心目标——争夺用户有限的注意力。

如此一来,整个短剧市场必然泥沙俱下,所以出现所谓“短剧精品化”的声浪。当“前3秒抓人、30秒反转、1分钟留存”成为行业共识时,创作者自然会不断强化那些最容易刺激情绪反馈的元素:身份逆袭、阶层跨越、复仇打脸、极端冲突、强烈反差。 

同时,为了承接短剧庞大的制作需求,全国多地纷纷将短剧产业视为新的文化经济增长点。从横店到郑州,从西安到成都,各类短剧拍摄基地、产业园区和扶持政策相继出台。地方政府希望借助短剧产业链带动影视拍摄、场地租赁、服化道服务、后期制作以及就业市场的发展,而大量真人短剧团队也确实推动了相关产业的繁荣。在短剧高速增长时期,这种模式形成了一套围绕“真人拍摄”展开的完整地方产业生态。 

可是,在人工智能强劲发展的影响下,AI短剧异军突起,短剧行业的底层逻辑正在发生第二次改变。这次改变又意味着什么呢?

从影视工业到软件工业:AI驱动的深度洗牌

根据中国网络视听协会发布的最新数据显示,2026年第一季度,中国全行业上线微短剧约12.8万部,其中,AI微短剧约为12.2万部,占比超过95%,已成为绝对的产能主力。 

主流的短剧平台,现已经“AI生成剧为主、真人剧为辅”了。这是重要的风向标。 

首先我们可以把AI微短剧主要分为两大类:AI漫剧 (或动画剧) :画面偏向二次元、动漫或风格化画风,适合夸张幻想和世界观的表达。AI仿真人剧 (亦称AI真人剧) :画面中的人物高度逼真,由AIGC技术生成并演绎,外观、光影及动作均向真人实拍靠拢。 

这并非因为动漫天然比真人更适合短剧,可能仅仅是因为AI目前更擅长生成动漫而非真人。现阶段AI在生成静态画面方面已经取得了相当成熟的效果,但在真人表演的真实性、动作连贯性、时序一致性、光影逻辑、口型同步以及复杂情绪表达等方面仍存在明显局限。尤其是当镜头涉及人物近景、细微表情变化或多人互动时,AI生成内容往往容易出现动作僵硬、表情失真、“恐怖谷效应”等问题,难以达到观众对于真人影视作品的期待。而一旦出现偏差,就会迅速破坏观众的沉浸体验。 

正因如此,今天讨论AI漫剧对真人剧的冲击时,需要认识到一个前提:两者之间并不是完全同质的竞争关系。前者之所以能够迅速崛起,很大程度上依赖于其风格化表达对于技术缺陷的包容。一旦未来AI能够稳定生成高质量仿真人表演,行业格局或许还会迎来新一轮变化。 

但不管怎样,受AI短剧的挤压以及平台政策的调整,传统真人实拍剧的上新量和热度发生了显著的结构性退潮。纯真人实拍剧的开机量同比锐减。据报道,2026年一季度全国短剧开机量同比下跌约75%。除横店外,郑州、西安白鹿原等拍摄基地同样出现剧组减少、棚内空置的情况,很多中小团队开始批量转向AI漫剧、AI仿真人短剧。 

AI短剧冲击的并不仅仅是真人剧创作者,也包括围绕真人拍摄建立起来的地方产业布局。过去几年短剧基地建设的逻辑,是把短剧视为一种影视工业;而AI漫剧的发展则在把部分内容生产转变为一种软件工业。微短剧赛道正经历一场由AI技术驱动的深度洗牌。 

上述短剧行业底层逻辑的两次转变是彼此相连的。中国的文化产品,早已大多不是内容竞争而是流量竞争了。也正是在流量竞争下,AI漫剧获得了迅速发展的机会。由于其生产成本远低于真人剧,更新速度远高于传统制作团队,它天然更适应以算法推荐和流量竞争为核心的内容市场。当内容供给无限增长时,真正昂贵的已经不再是生产能力,而是获取注意力的能力。因此,短剧从付费模式转向广告模式的过程,不仅改变了行业的商业结构,也为后来AI漫剧的爆发埋下了伏笔。 

“AI艺人库”风波折射的长视频困局

但凡洗牌就会造成震荡与恐慌。这突出反映在一个事件上:2026年4月由爱奇艺搅动的“AI艺人库”风波。 

4月20日,“2026爱奇艺世界大会”发布AI艺人库计划,宣布已有100多名艺人入驻爱奇艺的AI艺人库。CEO龚宇在演讲中提到,实拍不会消失,但“完全100%真实的、物理的一些作品,会不会过多少年以后,被命名为世界文化遗产,变成非遗 (非物质文化遗产) ?” 

同时他指出,传统影视拍摄中,演员常需连续工作几个月,日均工作时长多达十多小时,几乎没有个人生活空间;而AI技术的应用,能让演员的年产量从4部提升至14部,同时获得更多休息。随后,爱奇艺宣布,上百位明星入驻旗下平台“纳逗Pro”的AI艺人库。 

下午,随着社交媒体的耸动传播,“爱奇艺疯了”的词条冲上微博热搜,相关演员纷纷发微博澄清“没有签过与AI相关的授权”。随后,爱奇艺发微博解释,入驻“纳逗pro”平台仅代表有合作意向。 

影视行业不景气,当AI提供了降本增效的可能时,正在亏损的平台不可能拒绝。也有人说,用明星IP来绑定核心资源,这是传统娱乐产业的玩法,今天已经行不通了。仔细听龚宇的话外音,他想说的就是,一旦有了AI,剧组就不再需要为艺人的档期和天价片酬埋单。 

这是从成本入手,来看现在长视频之难以为继。微短剧是短视频生态的一种,而短视频对长视频的冲击其实比许多人想象得更加严峻。过去十多年,长视频行业建立在一个基本假设之上:用户愿意花费大量时间观看长内容,并通过会员订阅为优质内容付费。 

然而,随着短视频平台的崛起,这一前提正在被持续削弱。如今无论是综艺、电视剧还是影视剪辑,大量内容消费实际上发生在短视频平台上。对于许多用户而言,他们并不是通过长视频平台完整观看一部作品,而是通过短视频切片、剧情解说和高光片段完成内容消费。换言之,长视频生产的内容价值,越来越多地在短视频平台上被释放和消耗。这个直接体现在,如今长视频内容的VV (视频播放量) 与热度,相当大比例来自于短视频的二次创作与宣发。 

与此同时,用户行为也发生了深刻变化。移动互联网早期,长视频平台拥有相对稳定的用户时长和较高的用户黏性;而今天,无论是手机端DAU (日活跃用户) 还是MAU (月活跃用户) 的增长空间都已明显收窄,部分平台甚至面临萎缩压力。用户总时长并未无限增长,而是在短视频、直播、游戏、社交媒体等多种娱乐形态之间被重新分配。在这种情况下,长视频平台不仅难以获得新增用户,甚至连维持原有用户的观看时长都变得越来越困难。 

更棘手的是,长视频行业的成本结构却几乎没有发生根本变化。一部头部电视剧动辄数亿元投资,生产周期数年之久;大型综艺需要持续投入场地、嘉宾和制作费用;版权采购同样是一笔巨额开支。无论用户是否增长,这些成本都必须提前投入。从商业模式来看,会员订阅原本被视为行业最稳定的收入来源,但随着用户付费意愿趋于饱和,会员增长逐渐触及天花板,加价空间也十分有限。 

此外,长视频还面临诸多不确定性,随便什么原因就可能播不出来或者延播,而播出周期一般3个月,之后剩余价值就基本为零。长视频平台实际上陷入了一种典型的高固定成本、低增长空间的经营困境。过去依靠规模扩张可以摊薄成本,但当用户增长放缓之后,高昂的制作费用便开始直接侵蚀利润空间。哪怕是一部热度很高的剧,可能单剧的ROI都惨不忍睹。 

所以龚宇有苦难言的实际上是长视频的商业模式问题,他太需要AI助力来吸引资本输血了,只是用跟行业说的故事捅了大众的马蜂窝。AI艺人库引发了大众对AI演员的强烈反感和抵制,在微博上也出现了对AI脸已经产生“生理性厌恶”的帖子。 

其中一个原因当然是AI生成剧产量过大,导致“撞脸”、“偷脸”肆虐。对此在业内还有个恐怖的行话,叫“拼尸块”,指的是把若干真人演员的脸混合起来使用。AI短剧购买普通人肖像权是新出现的灰色产业,已形成了一条完整的“收脸”链条。AI剧中的侵权行为,除却抄袭剧本、盗用音乐,现在还出现了无授权换脸。 

眼下AI短剧的主角基本上都基于视频大模型生成的标准脸,因为标准脸不会撞脸明星。但大模型中的无版权脸样本不多,导致如今短剧中的人脸看起来千篇一律。 

所以,AI漫剧碾压真人剧,但它需要真人的脸。这就把短剧中的表演首先推上了前台。 

表演被推到前台:当演员从肉身变成数据

传统意义上的演员,是一种高度依赖身体的媒介形式。表演不仅是台词与表情的组合,更是时间、情境与偶然性的综合产物:同一场戏在不同状态下可能产生细微但关键的差异,失误、停顿、情绪波动构成了表演的真实质感。换言之,表演之所以动人,并不在于完美再现,而在于其不可完全控制与不可重复的特性。

而AI演员的出现,则将表演从身体媒介转化为数据媒介。演技本来是演员台下十年功练出来的,现在只是参数优化的结果;角色是可以被调用、拼接与再生产的模型资产。在这一转变中,表演失去了作为“事件”的属性,转而成为一套标准化的生产流程。 

对观众而言,观看演员表演的感知有几个层次,首先是真实性。现在AI的技术还达不到完全真实,我们假定将来AI技术能达到让人类的感官区分不了真假,那人们可能会觉得AI演员跟真人表演者也没什么差别。我们不能以感知的真实性为理由反对AI演员。 

进一步,我们看表演的时候,一定会产生情感反应,我们会笑、会哭,看惊悚片会高度紧张。这些东西能不能被复制?如果AI演员的表演不仅表面像,而且真的能把人的情绪表达得非常饱满,让观众也同样产生强烈的情感共鸣,那么人类可能更没有什么理由拒绝AI演员。很简单,我们看很多动漫形象,明明知道是假的,不是照样投入很多情感吗?人的共情机制不会因为不是真人就不共情,从即时感知的角度,观众的情感反应可能与看真人表演时非常相似。 

不过我认为再往上推,看法可能就会出现微妙的差异。人类的感知有一阶、二阶。比如忽然意识到表演整个是虚拟的,演员的肉身并不在场,自己在看一堆被模型或数据弄出来的东西,这时有可能在理性层面产生距离感,或者在情绪上加入审美与哲学的维度,而非纯粹的情感代入。 

演员的肉身在场,不仅是感官刺激,更承载着努力、风险、脆弱和人性本身。这些不可复制的意义可能影响我们的情感反应。当肉身消失,观众可能会产生一种微妙的“缺席感”,即便情绪被技术精确触发,也可能缺少那种对人性的直接认同。 

发生这类知觉的前提,是一个核心的东西:肉身。你自己就是个肉身。不管多么喜欢技术,你是个肉身。你之所以以前钟情于真人表演,是因为意识到演员通过身体训练、反复排练、心理和情绪投入,把个人的痛苦、喜悦、恐惧、脆弱都凝聚在表演中。你的认同是肉身与肉身的认同。 

电影《黑天鹅》当中,芭蕾舞剧女主角 (娜塔莉·波特曼饰) 为了演绎白天鹅、黑天鹅,为了做完美的舞者,投入了极大的心力,遭受了严酷的磨练,最终失常了。你看的时候会惊心动魄,这种东西紧紧抓住你,让你觉得片子好。这里还有人的情感的复杂性:人永远是恐惧中还有希望,爱中一定有嫉妒。不清楚AI算法对多种情绪的叠加能在多大程度上完美演绎这种复杂性。 

当然,现在观众心态在变化,可能越来越强调颜值高、流量高,不管演技好不好。相信颜值、流量的观众会不会毫不犹豫地接受AI演员?或者AI native一代是不是天然就会接受AI演员?我觉得很难讲。没有办法预测AI演员会不会被大面积接受,但有一点可以确定:如果它们被大规模接受,证明人类的审美能力和情感丰富性在下降。 

文本层、制作层与文化的算法化

全世界所有的AI输出严格来讲都没有版权,通过AI生成的任何东西直接进入公域,因为无法追溯作者身份。这是全世界的问题,因为版权体系总体上是工业时代、印刷时代的产物,虽然经过电子媒介的冲击做了各种调整,但现在更大的一波冲击来了。 

文化工业的很多东西现在都处于动荡状态。如果你去看戏剧艺术,看到的是现场舞台,看电影、电视剧,看到的是拍摄现场被拍出来的东西。但演出绝不是只有你看到的这一点。演出需要编剧、导演、演员、摄影、制片等共同完成制作,最前台才是表演。我们看到娜塔莉·波特曼精湛的表演,被她迷住了,但看不到后面的东西。 

后面的东西是文本和制作,是结构性的、稳定的。但表演是不稳定的、高度变动的、稍纵即逝的。我们现在争议AI演员,只是在争议最前端这一部分,但更关键的是后面的文本层与制作层。注意我在这里说的文本与制作的稳定性,是就构成剧场演出的三个不同体系而言的,这三个体系分别是:文本、制作与表演。相对于表演的变动性,前两者是稳定的。但在文化动荡之际,旧有的文本层和制作层会被打破,要在这两方面建立新的存在和符号系统。 

就文本层来说,AI短剧试图自动化叙事生产。AI短剧可以被视为生成式AI进入文化工业的第一个大规模商业实验场。它生产的不再是文本、图片或视频,而是人类最古老的文化商品之一——故事。过去,叙事一直被视为一种高度依赖人类创造力的活动。从神话、史诗到小说、电影,故事的构思、人物的塑造、情节的推进,都被认为是人类想象力和经验积累的产物。而AI短剧的出现,则意味着叙事开始被拆解成一系列可分析、可预测、可生成的语言模式。并且,由于短剧本身就已经高度类型化和公式化,霸总、逆袭、复仇、甜宠等成熟赛道积累了大量相似的叙事结构,使得故事生产在某种程度上,天然具备了被算法学习和复制的条件。 

就制作层来说,与真人短剧高度依赖摄影棚、外景地、演员和现场制作不同,AI短剧的大部分生产流程都发生在电脑和云端。过去需要几十人的摄制组、数周甚至数月完成的制作周期,如今可能由几个人在更短时间内完成。内容形态的变化的背后是生产要素的转移。短剧产业早期竞争的是编剧、演员和拍摄能力;中期竞争的是投流能力和用户获取能力;而今天越来越多的竞争开始围绕模型能力、工作流效率和内容生成速度展开。 

成本下降是真实的。根据行业数据与券商研报,传统漫剧单分钟成本通常在2000至5000元;而大型传统动画的制作成本则高达每分钟1万至10万元不等。漫剧应用生成式AI技术后,单分钟成本可降至1000至2500元,成本实现 50%的直接降幅。 

如果推动整个短剧流程都向AI发展,比如AI写本子、AI当导演、AI制作,全部实现AI化,按照现在AI的能力,是可以做到的,质量高低是另一回事。问题在于,作为观众,你接受全AI流程的东西吗?如果接受,那这就是一个媒介转型问题,是文化算法化的问题。 

文化应该算法化吗?

按照现在的发展趋势,首先长视频在与短视频的较量中是注定落败没有优势。两者之间的竞争,表面上看是内容形式的竞争,实际上是两种成本体系和商业模式之间的竞争。 

对照AI短剧与真人短剧的发展也是如此。真人短剧所依赖的演员、场景和拍摄周期开始成为成本负担,而能够快速生成海量内容的AI短剧,则天然符合免费时代的商业逻辑。 

其实就是看谁工业化更彻底。相对短视频,长视频不够标准化和工业化;而相对AI短剧,真人短剧在成本和效率上输给了AI驱动的生产模式。 

如今AI短剧试图将角色、场景、配音乃至部分叙事过程转化为模型调用和算法生成。文化产品第一次开始像软件一样被生产和迭代。文化工业在此不只是规模扩张,而是进入一种更彻底的算法化阶段。 

我们可能需要在一个更大的范畴内考量这个事情,比如人类的经验到底该如何生成、如何感知、如何理解?这不能简单视为技术替代,它涉及到媒介转型,在更大意义上涉及到我们的文化往哪发展——我们的文化应该算法化,还是应该反对算法化? 

AI短剧不仅改变了影视制作行业,也可能再次颠覆整个注意力经济。那些需要长时间沉浸、耐心等待与复杂体悟的经验,逐渐失去文化上的优势地位。取代它们的,是一套由即时反馈、情绪按摩与碎片化消费构成的全新感知引擎。这种感知模式的转向,本质上是“深度注意力” (排他性的沉浸) 向“超注意力” (游移的、多任务并行的感知) 的转向,它标志着人类精神生活从“耕作模式”进入了“采摘模式”

胡泳 北京大学新闻与传播学院教授

本文来自微信公众号 “腾讯研究院”(ID:cyberlawrc),作者:胡泳,36氪经授权发布。

发布时间:2026-06-25 22:00