Post

🕵️ EL DETALLE:
Anthropic usó Opus 4.7 para probar los safeguards de ciberseguridad que van a usar en Mythos.
O sea: Opus 4.7 es el conejillo de indias de las defensas contra el modelo que puede hackear cualquier sistema del mundo.
Si los safeguards funcionan aquí, los van a escalar a Mythos.
Si no funcionan... ya veremos.
Español

📊 LO QUE DICEN LOS QUE YA LO PROBARON:
• Cursor: 70% vs 58% de Opus 4.6 en coding
• Rakuten: 3x más tareas resueltas en producción
• CodeRabbit: +10% de recall en code review
• XBOW: 98.5% vs 54.5% en visión de alta resolución
Ese último número es absurdo.
De 54% a 98% en visión. En una sola versión.
Español

⚡ LO QUE NADIE ESPERABA:
• Nuevo nivel de esfuerzo xhigh — entre high y max
• Imágenes hasta 2,576 píxeles — 3x más que antes
• /ultrareview en Claude Code — revisión profunda de PRs con un comando
• Memoria entre sesiones — recuerda contexto entre conversaciones largas
El /ultrareview en particular va a cambiar cómo hacen code review los equipos que usan Claude Code.
Español

💀 EL DATO QUE ANTHROPIC PUSO EN LETRA CHIQUITA:
El nuevo tokenizer de Opus 4.7 puede procesar el mismo input en 1.0–1.35x más tokens.
O sea: mismo texto, potencialmente más caro.
"Los usuarios pueden controlar el uso de tokens ajustando el nivel de esfuerzo."
Traducción: si no lo configuras bien, tu factura sube.
Español