
Snowglobe:为您的AI进行仿真 – 在上线前测试和验证AI智能体
了解Snowglobe的仿真引擎如何通过模拟真实用户交互,帮助您在上线前测试AI智能体、聊天机器人和生成式AI系统,并发现潜在故障点。...
Anthropic 刚刚推出了 Project Glasswing——一项将全球最大的科技公司与一个足以发现数十年来隐藏在关键软件中漏洞的 AI 模型结合在一起的网络安全计划。该模型已经发现了数千个零日漏洞,包括每个主要操作系统和网络浏览器中的缺陷。
这不是一次产品发布,也不是一个新的 API 功能。这是一项协调性的防御行动,建立在一个前提之上:AI 驱动的网络攻击即将到来,最好的防御就是先发现漏洞。
Project Glasswing 是 Anthropic 于 2026 年 4 月 7 日发起的一项跨行业网络安全计划。其核心使命是:利用 AI 在攻击者利用之前发现并修补关键软件基础设施中的漏洞。
该计划由 Claude Mythos Preview 驱动,这是 Anthropic 最先进的未发布前沿模型。与之前的 Claude 模型不同,Mythos 在漏洞发现和漏洞利用开发方面具有涌现能力,代表了质的飞跃——这并非来自专门的安全训练,而是源于代码推理能力的全面提升。
Anthropic 的论点很直接:AI 模型在发现和利用软件漏洞方面已达到超越大多数人类的能力水平。随着这些能力的扩散,恶意攻击者将不可避免地获得相应工具。由此带来的后果——对经济、公共安全和国家安全而言——可能是严重的。Project Glasswing 就是先发制人的应对之策:以同样的力量进行防御。
结果令人震撼。Claude Mythos Preview 已经发现了数千个零日漏洞——这些缺陷已经存在多年甚至数十年而未被发现:
| 漏洞 | 软件 | 存在时间 | 详情 |
|---|---|---|---|
| SACK 实现中的有符号整数溢出 | OpenBSD | 27 年 | 网络栈漏洞 |
| 通过切片哨兵冲突实现的 H.264 编解码器漏洞利用 | FFmpeg | 16 年 | 媒体处理漏洞 |
| 客户端到宿主机的内存损坏 | 生产级内存安全 VMM | — | 虚拟机逃逸 |
| 多个漏洞 | 所有主要操作系统和网络浏览器 | 不等 | 覆盖完整技术栈 |
它不仅能发现漏洞——还能开发可用的漏洞利用程序:
已发现漏洞中不到 1% 已被修补。Anthropic 使用 90+45 天的负责任披露时间表和 SHA-3 承诺哈希来证明拥有漏洞详情而不泄露内容。
Claude Mythos Preview 不仅仅是渐进式的改进——它代表了代码安全分析能力的飞跃。
| 基准测试 | Mythos Preview | Opus 4.6 | 差值 |
|---|---|---|---|
| CyberGym(漏洞分析) | 83.1% | 66.6% | +16.5 |
| SWE-bench Pro | 77.8% | 53.4% | +24.4 |
| SWE-bench Verified | 93.9% | 80.8% | +13.1 |
| BrowseComp | 86.9% | 83.7% | +3.2 |
| GPQA Diamond(科学推理) | 94.6% | 91.3% | +3.3 |
| Humanity’s Last Exam(无工具) | 56.8% | 40.0% | +16.8 |
| Humanity’s Last Exam(有工具) | 64.7% | 53.1% | +11.6 |
安全能力差距十分显著。在一项包含 7,000 个入口点的 OSS-Fuzz 语料库测试中,Mythos 在 1-2 级别实现了 595 次崩溃,其中 10 次完整控制流劫持。针对 Firefox 147 的 JavaScript 引擎,它开发了 181 个可用的漏洞利用——而 Opus 4.6 仅有 2 个。
Anthropic 的红队指出,“Opus 4.6 在自主漏洞利用开发方面的成功率接近 0%。“Mythos 的这些能力并非来自专门的安全训练——而是源于代码推理能力的全面提升。这正是它既强大又令人担忧的原因。
该模型在一个智能体脚手架中运行:
这不是一个静态扫描器。它是一个自主智能体,能够推理代码行为、区分预期功能与实际功能,并识别诸如身份验证绕过等逻辑漏洞——而不仅仅是内存损坏模式。
Project Glasswing 不是一个通用开发工具。访问权限被刻意限制:
Amazon Web Services、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA 和 Palo Alto Networks。
另有约 40 家负责关键软件基础设施的组织也获得了访问权限。
如果您维护的公共代码库拥有 5,000+ GitHub 星标或 每月 1M+ NPM 下载量,可以通过 Claude for Open Source 计划申请。
这是个人开发者最可行的参与途径。该计划专门为开源项目的安全分析提供 Claude 访问权限。
即将推出的 Cyber Verification Program 将允许合法的安全专业人员申请访问。具体细节尚未公布,但可能需要专业资质或组织隶属关系。
Claude Mythos Preview 可通过 Amazon Bedrock 的受限研究预览获取,配备企业级安全控制——客户管理加密、VPC 隔离和详细日志记录。
研究预览结束后,API 定价为每百万输入/输出 token $25 / $125,可通过 Claude API、Amazon Bedrock、Google Vertex AI 和 Microsoft Foundry 访问。
即使您没有 Project Glasswing 的直接访问权限,其影响也是深远的:
您的依赖项将变得更安全。 Project Glasswing 正在扫描一切软件的基础——操作系统、浏览器、媒体编解码器、网络栈、虚拟机管理程序。由该计划产生的补丁将提升整个生态系统的安全性。
漏洞格局正在改变。 AI 现在可以发现数十年人工审查都遗漏的漏洞。这提高了"安全代码"的标准,加速了已知漏洞类别被发现和修补的时间线。
AI 驱动的安全工具即将到来。 Mythos 今天在受限环境中所能做到的,其他模型将在未来几年逐步接近。具备安全意识的开发实践和工具将成为基本要求。
开源获得了不成比例的收益。 Anthropic 已承诺通过 Linux Foundation 向 Alpha-Omega 和 OpenSSF 捐赠 250 万美元,另向 Apache Software Foundation 捐赠 150 万美元。加上为参与者提供的 1 亿美元模型使用额度,这是对开源安全的重大投资。
并非所有人都持乐观态度。社区反应褒贬不一:
选择性访问的担忧。 批评者认为,将访问权限限制在大型科技公司会造成不对称——大型组织获得更好的安全保障,而较小的项目和公司则被排除在外。有人认为这与 Anthropic 的公益公司地位相矛盾。
安全问题。 在发布如此强大的模型之前,24 小时的内部审查是否足够?Anthropic 辩称他们已经准备了数月,但压缩的公开时间线引发了审视。
营销质疑。 一些观察者质疑这是否部分是在 Anthropic 潜在 IPO 之前的营销行为,将公司定位为强大 AI 的负责任管理者。
“做也不是,不做也不是"的困境。 无论是广泛发布模型还是限制发布都有弊端。广泛发布可能赋能攻击者。限制发布可能造成永久的安全鸿沟。没有完美的答案。
Anthropic 计划最终将 Project Glasswing 的治理移交给"一个独立的第三方机构”,协调跨私营和公共部门的网络安全项目。
以下是目前可行的参与途径:
| 途径 | 要求 | 如何申请 |
|---|---|---|
| Claude for Open Source | 5,000+ GitHub 星标或 1M+ NPM 下载量 | 在此申请 |
| Cyber Verification Program | 安全专业人员资质 | 即将推出 |
| 企业(Amazon Bedrock) | 企业协议 | 通过 AWS |
| 首批合作伙伴 | 关键基础设施组织 | 仅限邀请 |
对于大多数开发者来说,Claude for Open Source 计划是最现实的入口。如果您维护的项目符合条件,请立即申请——该计划为您的代码库安全分析提供 Claude 访问权限。
Project Glasswing 是迄今为止最具雄心的 AI 驱动网络安全计划。它将一个能够自主发现数十年前零日漏洞的 AI 模型与负责全球最关键软件的组织结合在一起。
受限访问模式虽有争议但可以说是必要的——使 Mythos 成为卓越防御者的同样能力,在错误的人手中也会使其成为卓越的攻击者。目前,其收益通过协调披露和修补流向整个生态系统。
对于开发者来说,要点很实际:您软件的依赖项即将接受前所未有的安全审查。Mythos 今天发现的漏洞将在未来几个月内成为补丁。保持依赖项更新,关注安全公告,如果您维护符合条件的开源项目,请申请 Claude for Open Source 计划。
AI 驱动的漏洞发现时代已经到来。Project Glasswing 是第一次确保防御者先行动起来的协调尝试。
Viktor Zeman 是 QualityUnit 的共同所有人。即使在领导公司 20 年后,他仍然主要是一名软件工程师,专注于人工智能、程序化 SEO 和后端开发。他参与了众多项目,包括 LiveAgent、PostAffiliatePro、FlowHunt、UrlsLab 等等。


了解Snowglobe的仿真引擎如何通过模拟真实用户交互,帮助您在上线前测试AI智能体、聊天机器人和生成式AI系统,并发现潜在故障点。...

深入探讨Anthropic联合创始人Jack Clark对AI安全的担忧、大语言模型中的情境感知,以及正在塑造通用人工智能未来的监管格局。...

随着AI模型的商品化和开源替代品拉平竞争门槛,OpenAI的5000亿美元估值正面临质疑。了解为什么Anthropic以企业为先的战略正在超越OpenAI,成为构建可持续AI商业护城河的赢家。...