GPT-5.6,将于下周发布?
就在昨天,网友们激动发现:Codex应用的底层代码中惊现GPT-5.6 Sol、Terra和Luna三大子模型标识。
更令人期待的是,一个全新的「速度拨盘」功能也出现在代码中。
这暗示着,用户可以根据需求在速度和质量之间自由调节,这无疑将给大家带来前所未有的控制体验。
根据爆料,OpenAI已经在内部定下了死命令:GPT-5.6发布的目标窗口直指下周二(7月7日)至7月9日。
为什么是7月7日?因为这一天,恰好是Claude Fable 5特定限额方案失效的真空期。
这是一场精准计算到小时的商业围猎。
最近,Anthropic因为一系列骚操作逼疯无数开发者,谷歌Gemini 3.5 Pro被迫紧急「回炉重造」,OpenAI就趁着这个时机,准备出手抄底了!
「说实话,OpenAI就像没事人一样,悄悄地把模型名称塞进死代码里,好像我们不会注意到似的。」一位网友这样打趣道。
自从GPT-5.6限量发布后,极客们就紧盯着OpenAI的每一个前端更新。
终于,在最近一次Codex应用的合并中,有人发现了GPT-5.6的踪迹。
还有网友放出了短视频,虽然目前由于后端接口限制无法成功调用模型,但前端的弹出窗口里,三大模型的样式和全新的「速度选择器」已经清晰可见。
并且,代码中还隐约出现了 「Sol Ultra」 的字样。业内猜测,Sol Ultra将是直接对标竞品顶级旗舰的王牌,在性能上与Fable 5不相上下,但价格要亲民得多。
除了这三大模型,代码还透露了一个关键信息:备受期待的「实时语音支持」目前仍处于开发阶段,大概率无法下周直接上线。
虽然大部分人还没用上,但个别拿到内测权限的玩家,已经分享出了GPT-5.6在实际工程环境中的对比评测。
结果就是四个字——降维打击。
回合一:效率与理解的极限拉扯
海外技术博主 Shivam 分享了他使用 GPT-5.6-terra 和 Fable 5 解决同一个复杂技术Prompt的体验。
Fable-5在100%的5小时会话限制下开始。这个模型疯狂地在后台「Think」,一直硬生生烧掉了21%的额度限制,最后给出的回应,居然是反问了一堆交叉问题,让他去重新确认要解决的技术细节。
同样的任务,GPT-5.6-terra仅仅消耗了13%的额度,响应速度快得惊人。
它没有说废话,而是直接高效率地列出了解决问题的几种不同方法和架构路径,并迅速开始执行。
Shivam直言:在用Fable的时候,我满脑子都在想它会不会突然降级到Opus 4.8;而GPT-5.6-terra的干脆,让我极度舒适。
回合二:WebGL前端硬核小游戏「盲测」
Oracle总监Gilson Melo,则给 GPT-5.6 High 和 Fable 5 High 出了一道硬核考题:
在单个HTML文件中,从头开始构建一个功能齐全的基于浏览器的游戏(使用WebGL或HTML5 Canvas)。游戏必须具备实时刚体物理、重力和用户控制的桨叶/飞船机制。写出完整的CSS、JS和HTML,不许省略任何逻辑,必须支持鼠标拖拽实时响应物理反馈。
这道题非常考验模型处理极致细节、长代码不缩水以及底层物理公式的计算能力。
两个模型在工作流中表现出不同的策略。
Fable 5 High的表现令人惊艳,它极其自信地一键到底,生成了整款游戏的全部代码。
而GPT-5.6 High在生成过程中非常人性化地暂停了两次 ,主动向开发者询问并澄清了两个最终关键决策。
更绝的是,在没有被要求的情况下,它自作主张地为游戏加上了音效。
最终结果显示,GPT-5.6 High在整体的游戏体验、物理碰撞的平滑度以及细节的稳健性上,拿下了更扎实的分数。
总之,两位测试者都认为,GPT-5.6在效率和响应风格上更胜一筹,特别是在处理复杂任务时的清晰度和速度上。
从这个结果看,非常有必要期待一波下一周GPT-5.6的上线了。
如果说模型泄露是意外,那发布时间绝对是深思熟虑的布局。
OpenAI计划于7月7日重磅发布GPT-5.6,正好卡在Claude用户失去Fable 5访问权限的这一天。
最近Claude流失了不少用户,OpenAI瞅准机会,准备全部接盘。
一位知情人士透露:「GPT-5.6的使用额度限制将大幅放宽,比Fable 5更慷慨。更严格的安全护栏也已在逐步推出,但不会像Fable那样激进到影响正常使用。」
对比下来,Anthropic最近的民怨声很大。
Claude Fable 5虽然刚刚回归,已经引发了用户的强烈不满。
随便问几个问题,Fable 5就会降级到Opus 4.8.
生物医药工程师Derya Unutmaz试图让Fable 5解释「人类」这个词。
只打了「Explain human」,模型思考了几秒后就弹出「Switched to Opus 4.8」的卡片,因为Fable 5的安全机制判定这条消息里有需要拦截的内容。
更滑稽的是,半导体分析师Dylan Patel问了一个极其简单的问题:「raspberry这个单词里有几个字母r?」
这个问题同样被拦截了,界面弹出「Chat paused」,说明Fable 5的安全机制会拦截大多数网络安全或生物学话题。
另外,Opus 4.8最近的幻觉问题也非常严重,甚至自己的对话中会出现别人的信息。
这种用户体验的断崖式下跌,恰恰为OpenAI创造了最佳的抢人窗口。
而且,GPT-5.6也很可能更具成本优势。
爆料显示,GPT-5.6 Sol将比Fable 5便宜两倍以上,因为它的token效率更高。但关键是,它的性能是否足以与Fable 5相提并论?
有人预测,Sol Ultra应该可以与Fable 5相媲美,同时比Fable 5更便宜。如果这一预测成真,OpenAI将在性价比上完胜对手。
最后,给所有准备重回Codex的硬核开发者们同步一个「薅羊毛/避坑」指南。
根据Reflection CTO的深度挖掘,如果你之前在Codex里攒下了4次速率限制重置额度,请立刻检查你的账户后台。
OpenAI的官方底层规则显示,这些重置额度的有效期只有30天。如果你第一笔额度是在6月11日或12日前后到账的,那么在7月12日左右,它们就会开始成批过期!
如果你想知道自己的精确过期时间,可以让Codex调用你的ChatGPT token,去请求这个后端API: GET https://chatgpt.com/backend-api/wham/rate-limit-reset-credits。
你将会收到类似如下的JSON响应:
如果GPT-5.6真在下周二准时解禁,你将只有短短4到5天的时间去消耗手里的第一次重置额度。
下周二,OpenAI大概率会再送大家一次全新的Reset。所以,这几天赶紧把手里的老额度用在刀刃上吧。
GPT-5.6,下周见!
参考资料:
https://x.com/testingcatalog/status/2073049917266821338https://x.com/synthwavedd/status/2073084352251232435
https://x.com/ShivamS1123/status/2072664629445275897
https://x.com/gmelo33/status/2072822933194437035
编辑:Aeneas
本文来自微信公众号“新智元”,作者:ASI启示录,36氪经授权发布。
发布时间:2026-07-04 17:00