Stark retweetet

Anthropic 发布全球最强AI模型
但是你用不到...
Anthropic 今天发布的新一代前沿模型,也是目前最强模型:Claude Mythos Preview。
各项跑分全面碾压上一代 Opus 4.6...
但跟你想的不一样,这个模型目前不会公开上线。
为什么不公开发布?因为实在过于强大!
Anthropic 选择了一种完全不同的发布方式: 只给少数合作伙伴用,而且只用来做一件事,找漏洞。
Anthropic 的说法是:这个模型的能力太强了,强到需要先让防守方准备好,再考虑广泛发布。
具体有多强?
过去几周,Anthropic 用 Mythos Preview 扫描了主要操作系统和浏览器的代码,发现了数千个零日漏洞,绝大多数是高危和严重级别。超过 99% 还没被修补。198 份经人类审查的报告中,89% 的严重性评估被确认准确。
Anthropic 安全研究员:"I found more bugs in the last couple of weeks than I found in the rest of my life combined."(我过去几周发现的漏洞比我这辈子加起来都多。)
三个最有冲击力的案例:
- 在 OpenBSD 里找到一个 27 年没被发现的漏洞,这个漏洞允许攻击者远程连接就能让整台机器崩溃。要知道,OpenBSD以安全著称,被誉为"世界上最安全的操作系统之一",为全球防火墙和关键基础设施提供保护。27年来,无数安全专家审查过这些代码,自动化测试工具跑了数百万次,但都没发现这个漏洞。
- 在 FFmpeg 里找到一个 16 年的漏洞。自动化测试工具在那行代码上跑了 500 万次,从来没抓到过
- 在 Linux 内核里自主发现并串联了多个漏洞,从普通用户权限一路提权到完全控制整台机器
这些漏洞几乎全部是模型自主发现的,没有人类引导。
Anthropic CEO Dario Amanei 表示:
"We haven't trained it specifically to be good at cyber. We trained it to be good at code, but as a side effect of being good at code, it's also good at cyber."(我们没有专门训练它做网络安全方面的事情。我们只是训练它写代码,但写代码的副产物是,它在网络安全方面上也很强。我在过去几周发现的漏洞比我一生中发现的都多。)
一个写代码的"副产物",找到了 OpenBSD 里藏了 27 年的漏洞,强到 Anthropic 自己都不敢直接放出来。
中文



























