Claude Fable 5: qué es el modelo más potente de Anthropic y cómo se mide con Opus 4.8 y GPT-5.5
- Victorino Rodríguez
- hace 4 días
- 7 min de lectura

Un equipo de ingeniería de Stripe tenía una migración que daba pereza solo de mirarla: 50 millones de líneas de código. El tipo de tarea que un equipo entero arrastra durante meses. La hicieron en un día. No con más gente: con un modelo orquestando el trabajo de punta a punta mientras los ingenieros miraban. El caso lo cuenta la propia Anthropic en la presentación del modelo que ha lanzado hoy.
Ese modelo se llama Claude Fable 5, y es noticia por dos motivos a la vez: es lo más potente que Anthropic ha puesto nunca a disposición del público, y es la primera versión utilizable de su familia más capaz —la que tenían guardada bajo siete llaves— que por fin sale a la calle.
Vamos al grano. Hoy, 9 de junio de 2026, Anthropic ha hecho dos anuncios. Uno es Claude Fable 5, que puedes usar ya. El otro es Claude Mythos 5, el mismo modelo por dentro pero sin frenos, reservado a un puñado de socios bajo programa de acceso restringido. Fable es Mythos con salvaguardas. Y entender eso es entender por qué este lanzamiento es distinto a un upgrade normal.
No es un modelo más rápido o un poco mejor. Es el primero de una clase que Anthropic consideraba demasiado peligrosa para soltar.
En Aimoova llevamos meses usando Opus 4.8 y GPT-5.5 a diario para trabajo real de clientes. Así que cuando aparece algo que dice ser mejor que los dos, lo primero que hacemos es desconfiar y mirar los números. Aquí los tienes, sin humo, y al final te decimos cuándo merece la pena pagar por Fable 5 y cuándo no.
Qué es exactamente Fable 5 (y por qué la palabra "Mythos" importa)
A principios de año, los modelos Mythos de Anthropic montaron ruido en el mundo de la ciberseguridad por su capacidad sobrehumana para encontrar y explotar vulnerabilidades. Eran tan capaces que la empresa no los lanzó al público. Fable 5 es la respuesta a la pregunta "¿cómo soltamos esa potencia sin soltar lo peligroso?".
La jugada es de ingeniería de seguridad, no de marketing. Fable usa el mismo modelo base que Mythos 5, pero con salvaguardas que bloquean las peticiones de alto riesgo y las desvían a Claude Opus 4.8 para que las conteste él. Cubren tres áreas: ciberseguridad ofensiva, biología y química, y "destilación" (impedir que alguien extraiga la capacidad del modelo para entrenar un competidor).
Lo importante para una empresa normal es el dato de cuánto molesta eso en la práctica: según Anthropic, más del 95% de las sesiones de Fable no tienen ningún desvío. O sea, salvo que trabajes en seguridad ofensiva o en un laboratorio, no vas a notar el freno. Y el rigor del filtro no es de boquilla: Anthropic dice que en más de 1.000 horas de pruebas con un programa externo de recompensas no apareció ningún jailbreak universal. Por dejarlo claro también en lo que toca a privacidad: el tráfico de la clase Mythos tiene retención de 30 días y no se usa para entrenar.
Los números: dónde Fable 5 se separa de verdad
Anthropic lo resume sin rodeos: "las capacidades de Fable superan las de cualquier modelo que hayamos puesto a disposición general". Es estado del arte en casi todos los benchmarks que ha probado. Pero un titular así no se cree: hay que mirar dónde.
Lo más demoledor está en programación sobre código real, que es lo que mueve dinero de verdad. En FrontierCode Diamond, el benchmark de coding más duro de Cognition, Fable 5 marca 29,3% — frente al 13,4% de Opus 4.8 y el 5,7% de GPT-5.5. No es una mejora del 5%: es más del doble que el siguiente modelo de Anthropic y más de cinco veces GPT-5.5. En SWE-bench, los trackers de benchmarks colocan a Fable en torno al 95% en la versión Verified y al 80% en la versión Pro (la difícil), donde Opus 4.8 se queda en 69,2% y GPT-5.5 en 58,6%.
Y luego está lo que no sale en una tabla:
Software a escala absurda. El caso de Stripe —migración de 50 millones de líneas en un día contra dos meses a mano— no es una demo de juguete. Es el tipo de trabajo de "limpieza técnica" que ninguna empresa quiere abordar porque sale carísimo en horas.
Visión, de verdad. Fable es estado del arte en tareas de visión: extrae cifras exactas de figuras científicas detalladas y es capaz de reconstruir el código de una web a partir solo de capturas de pantalla. Como anécdota reveladora, completó el videojuego Pokémon FireRed usando solo visión, sin las muletas que necesitaban los modelos anteriores.
Memoria y tareas largas. Se mantiene enfocado a lo largo de millones de tokens en tareas que duran horas, y mejora sus propias respuestas usando notas que va dejando. En una prueba con el juego Slay the Spire, darle memoria persistente en archivos le mejoró el rendimiento tres veces más que a Opus 4.8.
Eficiencia de razonamiento. En un problema de física, Fable 5 llegó al resultado en 36 horas usando un tercio de los tokens de razonamiento que necesitó GPT-5.5, que tardó cuatro días.
En el terreno financiero y de análisis, Anthropic afirma que Fable saca la puntuación más alta de cualquier modelo en el Hebbia Finance Benchmark y que es el primero en superar el 90% en su benchmark interno de analítica, diez puntos por encima de Opus. Clientes como Cursor hablan de "una clase de problemas de largo recorrido que estaban fuera del alcance", y Sequoia lo deja en una frase: "el razonamiento es un claro paso por delante de Opus 4.8".
Aquí los tienes lado a lado:
Criterio | Claude Fable 5 | Claude Opus 4.8 | GPT-5.5 |
|---|---|---|---|
Lanzamiento | 9 jun 2026 | 28 may 2026 | 23 abr 2026 |
FrontierCode Diamond (coding difícil) | 29,3% | 13,4% | 5,7% |
SWE-bench Pro (código real) | ~80% | 69,2% | 58,6% |
SWE-bench Verified | ~95% | 88,6% | — |
Contexto (entrada / salida) | 1M / 128K | 1M / 128K | ~1M |
Precio estándar (in / out por M) | 10 $ / 50 $ | 5 $ / 25 $ | 5 $ / 30 $ |
Precio batch (in / out) | 5 $ / 25 $ | ≈ tarifa | ≈ tarifa |
Salvaguardas | Desvía a Opus 4.8 (<5% sesiones) | Modelo de respaldo | Filtros de OpenAI |
Mejor encaje | Lo más difícil y de alto valor | Trabajo autónomo diario | Asistente de plantilla |
El aviso honesto: Fable 5 cuesta el doble y no es gratis para siempre
Aquí es donde tenemos que frenar el entusiasmo, porque es justo lo que te diríamos en una reunión.
Fable 5 cuesta el doble que Opus 4.8: 10 $ por millón de tokens de entrada y 50 $ por millón de salida, frente a los 5 $/25 $ de Opus. Para la mayoría del trabajo cotidiano de una empresa —redactar, resumir, responder, clasificar— eso es pagar de más por una potencia que no vas a aprovechar. La opción inteligente para volumen es su modo por lotes (batch), a 5 $/25 $, cuando la tarea no necesita respuesta inmediata.
Y un detalle de calendario que conviene tener clarísimo antes de montar nada encima: del 9 al 22 de junio, Fable 5 viene incluido sin coste extra en los planes Pro, Max, Team y Enterprise. A partir del 23 de junio, sale de esos planes y pasa a consumir créditos de uso. Si pruebas estos días y te enamoras, que no te pille por sorpresa la factura de la semana que viene. No construyas un flujo de producción dando por hecho que es gratis.
Tercer matiz, el de las salvaguardas: para casi todos no se notan, pero si tu negocio es seguridad ofensiva, investigación biológica o química, este es literalmente el modelo que te va a decir que no (y te contestará Opus 4.8 en su lugar). Saberlo de antemano evita frustraciones.
Y la pizca de sal de siempre con los benchmarks: las comparaciones no son perfectamente equivalentes —cada fabricante mide con su andamiaje, sus niveles de esfuerzo y sus herramientas—, y tanto Anthropic como OpenAI siguen siendo opacos en arquitectura y cómputo. Las cifras de SWE-bench de Fable salen de trackers de benchmarks, no de una tabla oficial de Anthropic, así que tómalas como orientación, no como dogma. La dirección está clara; el decimal, no tanto.
Disponibilidad: dónde puedes meterlo hoy
Práctico y a menudo más decisivo que un benchmark. Fable 5 está disponible en todas las plataformas de Claude desde hoy, y también en AWS Bedrock con las salvaguardas de serie. La ventana es de 1M de tokens de contexto con hasta 128K de salida. Mythos 5, el hermano sin frenos, queda restringido a socios del programa Glasswing (y, próximamente, a investigadores de biología bajo acceso de confianza).
Para comparar: Opus 4.8 sigue siendo el caballo de batalla disponible en Pro, Max, Team, Enterprise, la API, Claude Code, Bedrock, Vertex AI, Foundry y GitHub Copilot. Y GPT-5.5 vive dentro de ChatGPT en sus tres sabores (Instant, Thinking, Pro) y en la API.
Qué hacemos con esto: cuándo Fable, cuándo Opus, cuándo GPT
Te lo damos sin rodeos, que es como nos gustaría que nos lo dieran a nosotros.
Para lo más difícil y caro de hacer a mano — Fable 5. Migraciones gigantes, refactors que llevan meses aparcados, investigación técnica de largo recorrido, tareas de visión complejas, problemas que mezclan razonamiento profundo con muchas horas de trabajo autónomo. Aquí el sobreprecio se paga solo: una migración de dos meses resuelta en un día sale baratísima aunque el token cueste el doble.
Para el trabajo autónomo serio del día a día — Opus 4.8. Coding sobre código real, automatizaciones largas, orquestación multi-agente y construcción de herramientas internas a precio sensato (5 $/25 $, sin recargo hasta 1M de tokens). Es el modelo que pones a trabajar en producción sin pensar en la factura. Y resulta que es, literalmente, la red de seguridad de Fable: cuando Fable desvía algo, lo contesta Opus.
Para el asistente de toda la plantilla — GPT-5.5. Como modelo diario integrado en ChatGPT, con baja fricción para que cualquiera del equipo lo use sin elegir nada, sigue siendo la opción de menos resistencia para el uso no técnico.
Y si nos preguntas qué hace la mayoría de empresas sensatas: usar varios y enrutar por tarea. No hay un único ganador sobre el que estandarizar. La jugada es mandar lo simple al modelo barato, reservar Opus 4.8 para el trabajo autónomo de producción, y sacar a Fable 5 solo para el problema gordo que justifica su precio. No es indecisión: es arquitectura, y es la diferencia entre una factura de IA predecible y un susto a fin de mes.
Llevamos tiempo ayudando a empresas a elegir y combinar estos modelos según la tarea: cuál pones a redactar correos, cuál pones a migrar un sistema entero, y dónde trazas la línea para que pagar el doble por Fable 5 tenga sentido —o no lo tenga—. Si quieres una segunda opinión sobre qué encaja con tu operación, la tuya, con tus procesos y tu equipo y no la del benchmark, escríbenos. Una conversación honesta, sin propuesta de 40 páginas ni venta agresiva.
Fuentes: Anthropic — Claude Fable 5 y Mythos 5 · TechCrunch · VentureBeat · AWS · benchmarks vía BenchLM y llm-stats.