Odaily专访余弦:Anthropic核弹级新模型泄漏,如何影响加密安全攻防?

一起意外的数据泄露事件,让世界提前知道了 Anthropic 接下来将要发布的核弹级产品。

《财富》上周四报道表示,Claude 背后的 AI 开发公司 Anthropic 正在训练了一款名为 Mythos 的新模型(内部代号疑似为 Capybara),而该公司在内部将其描述为“迄今为止所开发的最强大的 AI 模型”。审查过相关材料的网络安全研究人员透露,该模型是在一篇遗留在未受保护、可公开搜索的数据缓存中的博客文章草稿(现已不可访问)中发现的,而 Anthropic 则在《财富》询问之后证实了该模型的存在。

Anthropic 方面将 Capybara 描述为一个新的模型层级,相较于 Claude 当前最强大的模型层级 Opus 4.6,Capybara 在软件编码、学术推理和网络安全等测试中得分大幅提高。

早在去年 12 月,Anthropic 便曾做过一场利用 AI 去自主攻击加密货币智能合约的测试,结果证明了可盈利、可复用的 AI 自主攻击在技术上已然可行 —— 详见《成功模拟盗窃460万美元,AI已经学会自主攻击智能合约了》(https://www.odaily.news/zh-CN/post/5207914)。

如今,随着更强大且有着网络安全特化能力的新模型问世,加密货币的安全攻防形势将会出现哪些变化?为了更透彻地解答这些问题,Odaily 星球日报特意邀请到了业界安全专家、慢雾创始人余弦(X:@evilcos)来为大家解惑。

AI 的安全威胁,比你想象中来得更快

在对话的一开始,余弦便直接表示,业内的许多人还在把 AI 的安全威胁视作“未来时”,但现实进度可能会比行业想象得更快一些 —— AI 对加密安全的影响,不是即将到来,而是早已开始发生。在他看来,AI 对于加密货币安全的影响路径主要有两大类。

第一类是攻击者主动利用 AI 作恶。这既包括过去两年间已在加密行业内泛滥的社交工程攻击,即通过深度伪造视频、伪造音频在社交媒体上发起远程诈骗;也包括更偏“技术流”的直接攻击方案,即基于公开漏洞样本、真实攻击案例以及利用细节,借助 AI 去训练漏洞发现、漏洞利用的方法论 —— 这不仅限于智能合约领域,任何能够基于历史经验进行训练与实操的安全环节,都可能成为 AI 的用武之地。

第二类风险当下相对容易被忽视,但却更值得行业警惕 —— 项目方自己在用 AI 开发,却把新的安全问题一起带进了系统。随着 AI 编程能力的不断升级,从改进生产力的角度来看,越来越多的项目方开始依赖于 Vibe-Coding 进行代码编写。效率的提升确实肉眼可见,可副作用也同样明显,AI 难免会出现“幻觉”,它可能因为依赖污染、错误安装包、错误代码库引用等问题,把隐患直接写进生产环境。

这并非危言耸听。今年 2 月,借贷协议 Moonwell 便因预言机喂价公式错误而被盗 178 万美元,而导致公式错误的直接原因便是该项目依赖 Claude Opus 4.6 编写了存在漏洞的代码,cbETH 的价格被错误设置为 1.12 美元,而当时的实际价格应为约 2200 美元。

在 AI 全方位重塑世界的当下,它不仅仅是黑客手里的武器,同样也可能成为项目方自己“埋雷”的工具。

哪些项目最容易成为 AI 时代的猎物?

如果说 AI 已经进入攻防双方,那么接下来的问题就很现实,谁更容易中枪?

余弦的判断很直接,资金量大的项目,永远是最优先的目标。加密行业的特殊性在于,协议之上会直接承载真金白银,且由于去中心化的理念,合约资金状况对外界往往也是透明的。对于攻击者而言,投入和产出比始终是第一原则,因此只要协议上的 TVL 足够大,它天然就会进入重点打击名单,必然会被攻击者持续性研究、扫描与突破。

除去大资金项目外,另一类高危目标,是刚上线不久、漏洞又比较明显的新项目。 此类项目的资金规模虽然有限,却经常成为“抢跑式攻击”的牺牲品。因为在 AI 的加持下,批量扫描、自动识别、自动利用的链路已经越来越成熟,一些新项目在刚上线不久、资金规模还没完全做大之前,就可能因为明显甚至低级的漏洞,被多支攻击队伍同时盯上。此时比的不是谁更聪明,而是谁更快。谁先下手,谁就可能先拿到收益。

余弦特别提到,还有一类项目同样值得警惕 —— 即那些运行时间很久、已经让市场产生“应该没问题了”错觉的老牌协议。最典型的例子便是去年老牌协议 Balancer 的“翻车”(可参阅:《老牌DeFi沦陷:Balancer V2合约漏洞,超1.1亿美元资产被盗》(https://www.odaily.news/zh-CN/post/5207269)),很多老牌项目已无事运营多年,也做过了多轮审计,团队和用户都容易形成一种“系统已经足够安全”的惯性认知。但现实却是,越是这种“默认安全”的协议,越可能成为某些攻击团伙长期研究、战略性突破的对象,一旦项目方响应变慢、治理流程冗长,甚至恰逢团队休假、注意力下降,被利用后的损失反而可能更加惨重。

项目方及用户,分别该如何布防?

在对话中,余弦反复强调的一点是,项目方应该更主动地拥抱 AI。原因很简单,外部的攻击者都在用 AI 武装自己,而你如果还停留在“只靠传统人工审计、系统跑了很久应该没事”的思路里,本质上就是在打一场信息差极大的战争。

从生产力发展的角度来看,“用 AI 去写代码”是必然趋势,但问题在于,你不能只想着享受 AI 带来的效率提升,却不愿建立与之匹配的安全流程 —— 越是在研发流程中深度引入 AI,越要在上线前建立更严格的交叉审查与人工把关机制,比如使用多个 AI 模型进行交叉检验,或是让真正有安全经验、懂工程可靠性的角色参与最终审核。

说白了,就是“别躺平,要勤快一点”。尤其是那些 TVL 已经很高、协议里沉淀着大量用户资金的项目,更应该主动把当前最强的模型能力、安全团队能力结合起来,围绕现有系统重新做一轮安全策略升级。哪怕不是完全依赖 AI,也至少应该理解你的对手正在用什么工具,你自己又该如何应对。这件事在用户认知方面也会是加分项。一个愿意公开拥抱 AI 安全升级、并持续进行风险复检的项目,至少会让市场知道,它没有把历史成绩当作可以偷懒的资本。

相较于还有能力构建体系、投入预算、升级流程的项目方,普通用户在 AI 安全攻防升级面前,处境其实更被动。余弦就此直言道:“对于绝大多数散户来说,这件事(保护自己)确实很难。”

真正有能力在风险发生时快速反应并止损的,往往不是普通意义上的散户,而是那些本身就具备较强信息获取与链上操作能力的人。他们可能已经构建了自己的监控与预警机制,甚至会借助 AI 来自动接收攻击提示。一旦某个池子、某个协议出现异常,就能第一时间撤资、转移仓位,从而完成一定程度的止损,更激进一点的,甚至还能在安全事件爆发时,顺着市场情绪操作获利。

但这类人本质上已经不是普通用户,而是加密语境里的“科学家”。对于更多缺乏监控能力、反应速度和专业判断的用户来说,一旦真正的攻击发生,他们往往就是最末端的买单者。

现实确实很残酷,AI 时代不会自动带来更公平的安全环境,反而可能进一步放大专业用户与普通用户之间的信息差、工具差和反应速度差。站在普通用户的角度,能做的事情可能只有尽量降低自己暴露在高风险协议中的时间与仓位,减少对复杂交互的盲目信任,并对“看起来已经很安全”的叙事保持基本怀疑。

更强大的模型来了,会带来更大的威胁吗?

这是本次采访中最有意思的一个问题。直觉上看,一个在编码、推理、网络安全方面都更强的模型,如果真的落地,似乎只会让潜在攻击者变得更加危险。但余弦的回答却是,这反而是一件好事。

在余弦看来,行业现在最大的误区,是把这类威胁理解为“未来可能发生”。但现实是,很多更强的能力其实当下就已经存在,只是外界看不见(比如 Mythos 这次也是意外才被公众知晓),或者那些真正有能力的团队比市场想象中更低调。

换言之,Mythos 等更强大模型的出现未必意味着风险从零到一地诞生,而是让行业更清楚地意识到,原来很多原本只停留在想象中的攻击能力,现实里早就已经有人在研究、验证,甚至使用。余弦在采访中提到,从漏洞发现到漏洞利用,这本来就是两个不同阶段,而围绕这两件事,顶级模型公司和一些更垂直、更低调的团队(比如会有团队针对智能合约安全对 AI 进行满血版的私有化训练),很可能都已经积累了相当多的成果。

在余弦的逻辑里,更强模型不是单纯的坏消息,而是一场更彻底的筛选机制。如果某个项目连 AI 带来的挑战都无法承受,那么它本身可能就不应该在未来继续成长,因为 AI 会越来越公平地暴露那些原本被侥幸、惯性和信息不对称掩盖的问题。真正能留下来的项目,不是“暂时没被打到”的项目,而是“即使在 AI 时代也经得起打”的项目。

这意味着,AI 对加密行业的影响更像是一次加速出清。漏洞会被更快发现,风险会被更早暴露,攻击也会变得更高频。那些安全能力薄弱、流程粗糙、响应迟缓的项目,未来只会被淘汰得更快。

从长期来看,这未必是坏事。因为 AI 在放大攻击面的同时,也在抬高整个行业的生存标准。它会倒逼项目方升级研发流程、安全体系和响应机制,也会推动行业彻底走出“野蛮生长”的时代。

本文来自微信公众号 “Odaily”(ID:o-daily),作者:Azuma,36氪经授权发布。

发布时间:2026-03-30 20:43