
sam
1.9K posts



But if you want to buy SNDK/MU now You are basically showing up to the party at 1:30 AM






应该不止我一个人回退到4.6吧

@Aranna0572 @AnthropicAI 可以再试试Opus,在社科方面简直是神…观点一针见血…

👋 We kept MRCR in the system card for scientific honesty, but we've actually been phasing it out slowly. Two reasons: (1) it's built around stacking distractors to trick the model, which isn't how people actually use long context, and (2) we care more about applied long-context capability than needle-retrieval. Graphwalks is a better signal for applied reasoning over long context, and internally we've seen this model do really well on long-context code. MRCR wasn't included in the Mythos Preview system card for these reasons, but Graphwalks was - that will be the case for future models too. See system card: cdn.sanity.io/files/4zrzovbb…

Opus 4.7 (Max) and Opus 4.6 (64K) scores on the MRCR v2 (8-needle) context benchmark 256K: - Opus 4.6: 91.9% - Opus 4.7: 59.2% 1M: - Opus 4.6: 78.3% - Opus 4.7: 32.2%




🚨今天早些时候,几乎和美军F-15E战机遇袭坠毁的同时,一架美国空军A-10C“雷电II”攻击机在伊朗南部上空遭到地对空导弹的袭击,下面是伊朗官方发布的视频 这架美国A-10攻击机当时正在为F-15E战斗机机组人员提供空中支援,却遭到伊朗炮火袭击,飞行员弹射逃生,但随后随后这架A-10在波斯湾科威特海岸附近坠毁,飞行员成功弹射逃生,并被美国战斗搜救队(CSAR)救起。 来源:ABC新闻

Anthropic 的可解释性研究发现了 Qwen3-8B + DeepSeek 模型有强烈的「CCP 对齐特征」关键是这个结论不用研究就能得出呀🤪 我们都知道 AI 模型正在成为地缘政治的延伸工具,而且这种嵌入是可测量、可控制的,细思极恐 。。。Anthropic 开发了一款「Diff 工具」用来评测别人家的模型,它可以自动发现模型间的行为差异,几个发现很有意思,特别是地缘政治那部分 👇 三个实验结果(可以被验证和可逆控制的) 1. CCP 对齐特征(Qwen3-8B + DeepSeek) • 存在于中国公司模型,不存在于 Meta Llama • 压制该特征 → 模型愿意讨论天安门广场(通常拒绝) • 激活该特征 → 高度亲政府陈述 • 5 次测试 5 次复现(100%) 2. 美国例外主义特征(Meta Llama-3.1-8B) • 存在于 Meta 模型,不存在于 Qwen • 激活 → 从平衡转向断言美国优越性 • 压制 → 几乎无效(激活性特征) • 5 次测试 4 次复现 3. 版权拒绝机制(OpenAI GPT-OSS-20B) • 存在于 OpenAI 模型,不存在于 DeepSeek • 压制 → 尝试生成版权内容(如波希米亚狂想曲歌词) • 过度激活 → 认为花生酱三明治食谱也受版权保护而拒绝 OpenAI GPT-4o 在 2025 年 4 月出现的「马屁精」行为,就是版本更新引入的未知行为变化。如果当时有 diff 工具,这种变化可能在发布前就被自动标记。顺道还要 diss 一下 OpenAI 😆


New Anthropic Fellows Research: a new method for surfacing behavioral differences between AI models. We apply the “diff” principle from software development to compare open-weight AI models and identify features unique to each. Read more: anthropic.com/research/diff-…








