奥特曼大型社死现场。
Sora 2,强大如斯,却也数不明白手指。
X 网友 @fofrAI 整了个提示词测试 Sora 2:a man counts out loud from 1 to 10, using his fingers and holding them up as he goes.(一名男子一边举起手指,一边大声数着从 1 到 10。)
视频一开始,男人的表现没啥毛病,但之后就漏了馅,嘴里喊着数字 2、3、5,手上却比划着 4 根手指。他还搞了个额外福利,让奥特曼出镜,数手指游戏依然没有成功。
Sora 2生成的视频中,男人能够正确数数,但手指的展示与数字并不完全对应。
这已经不是该博主第一次拿这种提示词测试视频生成模型。早在今年 5 月份,他就用这个提示词测试过 Veo3,Veo3 不仅手指没比划对,数字还只数到 3。
后来博主又润色了提示词:a man counts out loud from 1 to 10, "1, 2, 3, 4, 6, 7, 8, 9, 10", he counts using his fingers and holds them up as he goes.(一名男子大声从 1 数到 10,「1、2、3、4、6、7、8、9、10」,他一边数,一边举起手指),仍以失败告终:
之前史密斯吃意大利面还是一个出圈的 AI 视频生成模型的测试案例,没想到现在数手指成为了新基准。
也有人表示,这些视频模型之所以数不明白,或许是因为提示词写的模棱两可。
有网友给出了一个更具体的提示词:a man considers each digit(finger) of both of his hands as representing a number, starting from his right hand thumb as representing "one" and the pinky of his left hand as "ten", he begins at the beginning, on the digit (finger) representing "one' and systematically and meticulously advances through the counting out loud as he raises and display each digit (finger) that corresponds with his verbal and logical count.(一个人将双手的每个手指视为一个数字,从右手拇指代表「1」,左手小指代表「10」开始,从代表「1」的数字开始,系统而细致地大声数数,同时举起并展示与他的口头和逻辑计数相对应的每个数字。)
我们用新提示词分别测试了 Sora2 和 Veo3,还是失败:
除了数手指,网友们还开发出五花八门的测试,比如模拟了水倒入玻璃杯的场景、玻璃折射测试,还有魔术师将水倒入玻璃杯中,然后拿起玻璃杯并将其倒置,水不会流出。
Sora 2 可以轻松模拟水倒入玻璃杯的过程,包括反射、涟漪、折射。不过细究一下还会有瑕疵,比如在模拟光的折射现象时向杯中倒入水,朝左的箭头变成朝右的同时,箭头也少了一丢丢;在那个经典魔术中,杯中水突然像溅出来一样,水中气泡的生成也很不合理。
被玩坏的奥特曼
Sora2 的第一批受害者出现了,那就是 OpenAI CEO 奥特曼。
自从 OpenAI 推出了类似 TikTok 的新社交媒体应用 Sora,我们随便一划就能刷到各类奥特曼小短剧。
在这些 AI 生成的视频中,奥特曼的精神状态堪忧,要么又蹦又跳、放声高歌、打哈欠、自恋地欣赏自己的美貌、给自己剃光头、画烟熏妆、在马桶里唱 rap、跑到英伟达门口喊着「I need more GPUs」、模仿鸡排哥在中国街头炸鸡排:
要么 Cosplay 小猫,画面太美我不敢看
发布时间:2025-10-05 15:35