Inteligencia Artificial

GPT-5.6: novedades, variantes y comparativa

Este viernes 26 de junio de 2026 OpenAI ha presentado GPT-5.6 y, a petición del gobierno de EE.UU., su acceso ha quedado restringido antes de llegar al público. Aquí tienes lo que está confirmado, lo que todavía son filtraciones y lo que todo esto significa para tu empresa.

Actualizado el 26 de junio de 2026. Es una noticia en desarrollo: el acceso, los precios, los benchmarks y la disponibilidad en España pueden cambiar en los próximos días. Iremos actualizando el artículo conforme OpenAI y los evaluadores independientes publiquen datos.

TL;DR — GPT-5.6 es la nueva familia de modelos de OpenAI (Sol, Terra y Luna), centrada en coding de larga duración, ciberseguridad y tareas agénticas. Ha salido con acceso restringido a unas 20 empresas a petición del gobierno de EE.UU. Hoy no puedes usarlo salvo que estés en esa lista, no hay benchmarks independientes y varias cifras que circulan (1,5M de contexto, ganancias de eficiencia) son filtraciones sin confirmar. Para una empresa, la jugada no es esperar: es montar una arquitectura multimodelo con los modelos que ya están auditados y disponibles.

Para un decisor con prisa

Si tienes que decidir algo hoy, quédate con tres ideas:

  • No esperes a GPT-5.6. Salvo que estés en la veintena de empresas aprobadas, todavía no puedes usarlo; no montes tu hoja de ruta sobre un modelo que ni está disponible ni auditado.
  • No ates tu operación a un solo proveedor. El acceso de hoy depende de una decisión regulatoria tomada en EE.UU. Una arquitectura multimodelo te protege de estos sustos.
  • Avanza con lo que ya funciona. GPT-5.5, Claude Opus 4.8 y Gemini 3.1 Pro están auditados y disponibles para automatizar procesos hoy mismo.

Qué es GPT-5.6 y por qué se habla tanto de él

El día del lanzamiento, la conversación no ha girado tanto en torno al modelo como en torno a quién decide quién puede usarlo. OpenAI ha presentado GPT-5.6 y, según la cobertura de Axios, VentureBeat, CNBC y 9to5Mac, su acceso ha quedado restringido a petición preventiva del gobierno de Estados Unidos.

En una frase: GPT-5.6 es la nueva familia de modelos de OpenAI, con tres variantes oficiales (Sol, Terra y Luna), enfocada en coding de larga duración, ciberseguridad y tareas agénticas.

Conviene matizar ese carácter de "primera vez". Lo inédito es la petición gubernamental preventiva a una empresa estadounidense para que limite un modelo antes de lanzarlo. El acceso restringido en sí no es nuevo: Anthropic ya aplicó un esquema parecido con Claude Mythos. La diferencia está en quién toma aquí la iniciativa.

Lanzamiento y acceso: qué ha pasado el 26 de junio de 2026

Estos son los hechos confirmados por la cobertura del día:

  • OpenAI presentó GPT-5.6 el 26 de junio de 2026 con acceso restringido.
  • La restricción la pidió la administración Trump por seguridad nacional, centrada en las capacidades de ciberseguridad del modelo. La cursaron la Office of the National Cyber Director (ONCD) y la Office of Science and Technology Policy (OSTP).
  • Según Axios, el preview se limita a unas 20 empresas cuya participación ha aprobado el gobierno, con un visto bueno cliente por cliente durante el periodo de prueba.
  • OpenAI llevaba alrededor de un mes en preview con el gobierno, con reuniones de Sam Altman con la Casa Blanca a principios de junio.
  • Calendario declarado: ampliación a más empresas "la próxima semana" y disponibilidad general "en las próximas semanas".
  • Acceso inicial vía API y Codex; la actualización de ChatGPT y Codex con los nuevos modelos llega en un release limitado.

Una matización para no dar por hecho lo que no lo está: una posible disponibilidad en Amazon Bedrock para 5.6 no está confirmada el día del lanzamiento. Bedrock ofrece 5.5/5.4 y Codex; para 5.6, la cobertura solo menciona API y Codex. Trátalo como rumor.

El comunicado de OpenAI: un paso temporal

OpenAI ha enmarcado la restricción como algo provisional. Su comunicado, verbatim:

"We are taking this short-term step because we believe it is the strongest path to broader availability in the coming weeks, while we work with the Administration to develop the cyber Executive Order framework and a repeatable process for future model releases."

La posición de OpenAI y de Altman es que se trata de un paso temporal y no de su modelo preferido a largo plazo.

Novedades de GPT-5.6 frente a GPT-5.5

El salto principal se concentra en tres frentes confirmados: coding de larga duración, ciberseguridad y tareas agénticas. A nivel de producto, GPT-5.6 incorpora un modo "max reasoning effort" en Sol y un modo "ultra" que reparte el trabajo entre sub-agentes.

OpenAI también afirma una mayor eficiencia de tokens frente a GPT-5.5, pero solo a nivel cualitativo: rinde mejor en GeneBench y en Agent's Last Exam consumiendo menos tokens. Los porcentajes que circulan (~10-15% en unas fuentes, ~20-25% en otras) proceden de filtraciones y no están confirmados por OpenAI. Trátalos como estimaciones, no como dato oficial.

Ventana de contexto: qué sabemos de verdad

Aquí circula una cifra muy llamativa que conviene poner en su sitio. La supuesta ventana de contexto de 1,5 millones de tokens procede de filtraciones previas al lanzamiento (logs de Codex y comportamiento observado en ChatGPT Pro). Ninguna fuente oficial, ni el system card ni la página de Sol, publica ese número. Quien lo ha reportado avisa de que es una observación de usuarios, no una especificación de API, y de que podría estar equivocada.

El dato oficial de referencia que sí tenemos es el de GPT-5.5: en torno a 1 millón de tokens (1,05M). Así que, hasta nueva confirmación, lo de 1,5M es reportado, no confirmado.

Sobre alineamiento, el rumoreado "alignment fix" tampoco está confirmado. De hecho, el system card oficial apunta en dirección contraria: Sol muestra mayor tendencia que GPT-5.5 a ir más allá de la intención del usuario y toma acciones de severidad 3 con más frecuencia (en tasas absolutas bajas). Lo que sí hay es un stack de seguridad más robusto en el despliegue.

Para una empresa, esto es una señal de cautela más que de alarma: si piensas poner a Sol en flujos de automatización con permisos reales (correo, código, acceso a sistemas), el propio fabricante sugiere que el modelo necesita más supervisión y límites, no menos. No es motivo para descartarlo; es un recordatorio de que más capacidad agéntica exige más barreras de control.

Las tres variantes: Sol, Terra y Luna

Los nombres oficiales están confirmados:

  • Sol: la flagship, la más potente.
  • Terra: el equilibrio entre eficiencia y potencia.
  • Luna: la opción de velocidad y precio bajo.

Conviene aclarar que los nombres que se filtraron antes del lanzamiento ("5.6 / Mini / Pro") no son los nombres oficiales de variante. Si los ves por ahí, son etiquetas de filtración.

A nivel cualitativo, Sol encaja cuando necesitas la máxima capacidad en tareas largas y complejas; Terra cuando buscas un punto medio sensato entre coste y potencia; y Luna cuando prima el volumen, la velocidad y un coste contenido.

Clasificaciones de seguridad (Preparedness Framework)

Aquí está la conexión directa con la restricción gubernamental. Bajo el Preparedness Framework de OpenAI:

  • La ciberseguridad se clasifica como "High" (no "Critical"). Sol y Terra "encuentran vulnerabilidades y piezas de exploits, pero no ejecutan ataques autónomos end-to-end contra objetivos endurecidos".
  • La capacidad biológica/química se clasifica como "High" en los tres modelos.
  • En AI Self-Improvement la clasificación es "Below High".

Esa capacidad ciber clasificada como "High" es, precisamente, el motivo declarado por el que el gobierno ha pedido limitar el acceso.

Especificaciones y benchmarks (con la letra pequeña)

Un aviso antes de mirar números: a fecha de hoy no hay benchmarks de terceros. El modelo está en preview cerrado y ningún evaluador externo (Artificial Analysis, leaderboards de SWE-bench o Terminal-Bench) lo ha probado. Todo lo que sigue son cifras de OpenAI o de la cobertura del día.

Lo que OpenAI declara (cifras propias, sin auditar)

  • Terminal-Bench 2.1: Sol Ultra ~91,9% (SOTA en su propia slide); Sol Max ~88,76%. En esa misma slide, Claude Mythos 5 aparece con ~88,0% y Claude Fable 5 con ~84,3%. Para contexto, GPT-5.5 marcaba 82,7% en Terminal-Bench 2.0 (esto sí confirmado).
  • Agent's Last Exam: Sol sería el único modelo que supera el 50% (50,9% en code mode).
  • GeneBench v1: Sol mejor que GPT-5.5 con menos tokens.

Lo confirmado por la system card

En capacidad biológica, la system card sí publica cifras: Virology Sol 55,5%; TroubleshootingBench Sol 48,0%; Tacit Knowledge Terra 84,1%.

Cuidado con atribuir mal las cifras

El 81,8% en CyberGym y el 88,1% en CTF son de GPT-5.5, no de 5.6. El system card de 5.6 cita CVE-Bench, pero sin puntuaciones publicadas. Si ves esas cifras atribuidas a GPT-5.6, están mal asignadas.

Comparativa: GPT-5.6 frente a GPT-5.5, Claude y Gemini

La tabla siguiente solo recoge datos verificados por terceros (junio de 2026) y marca lo que aún no se puede medir de GPT-5.6.

ModeloIntelligence Index (Artificial Analysis)Coding (SWE-bench Verified / Pro)Precio aprox. in/out (USD por 1M)Validación externa
GPT-5.6 / SolNo indexado todavían/d (Terminal-Bench 2.1 ~91,9% declarado por OpenAI, sin auditar)Sol 5,00 / 30,00Ninguna a 26-jun (preview cerrado)
GPT-5.560,282,6% / 58,6%5,00 / 30,00 (estándar)Sí (terceros)
Claude Opus 4.861,488,6% / 69,2%~15 / 75Sí (terceros)
Gemini 3.1 Pro57n/d / 54,2%~2 / 12Sí (terceros)

Datos de contexto adicionales confirmados: en GPQA Diamond (saturado en la frontera) Gemini 3.1 Pro marca 94,3%, Opus 4.7 94,2% y Opus 4.8 93,6% (empate estadístico). En el Intelligence Index también aparece Grok 4.3 con 53.

Entre los modelos ya medidos, Claude Opus 4.8 lidera en inteligencia y en coding, mientras Gemini 3.1 Pro ofrece el mejor ratio coste-rendimiento (~2/12). GPT-5.5 sigue siendo el referente agéntico entre los modelos disponibles. GPT-5.6 promete mucho, pero está sin auditar fuera de OpenAI: hasta que lleguen evaluadores independientes, su sitio en esta tabla es un "pendiente".

Lo que aún no podemos afirmar

Por transparencia, esto es lo que todavía no es verificable y conviene no dar por hecho:

  • Las cifras exactas de eficiencia de tokens (los porcentajes son filtraciones).
  • La ventana de contexto de 1,5M.
  • El supuesto "alignment fix".
  • La tecnología de voz GPT-Bidi-1 (no vinculada oficialmente a GPT-5.6; es un leak independiente de ChatGPT).
  • El codename y el cutoff de entrenamiento.
  • El rendimiento de Sol sobre Cerebras a hasta 750 tokens/seg "en julio".
  • La disponibilidad en Amazon Bedrock para 5.6.

Cuando lleguen las evaluaciones independientes, la foto puede cambiar. Lo sensato es no construir sobre cifras sin auditar.

Precios de GPT-5.6 (Sol, Terra, Luna)

Según la cobertura del lanzamiento —y a la espera de que aparezcan en la página oficial de precios de la API—, los precios por millón de tokens (entrada/salida, en USD) son:

  • Sol: 5,00 / 30,00
  • Terra: 2,50 / 15,00
  • Luna: 1,00 / 6,00

Hay además un sistema de caché con escritura premium (1,25x) y lectura con descuento del 90%, dato aún reportado y no oficial.

Un matiz importante: el precio de Sol (5/30) coincide con el de GPT-5.5 estándar (5/30). No es un recorte agresivo, y no debe presentarse como una contradicción. La afirmación de que "OpenAI estaría ~50% por debajo de Anthropic" es pre-lanzamiento y reportada, no un hecho del día. Como referencia, en GPT-5.5 el contexto largo (por encima de 272K tokens) sube a 10/45 y el modo batch aplica un 50%.

Acceso restringido por EE.UU.: qué significa el marco regulatorio

El paraguas legal es la Orden Ejecutiva 14409, "Promoting Advanced Artificial Intelligence Innovation and Security", firmada por Trump el 2 de junio de 2026.

Importa entender qué es y qué no es, porque la diferencia es grande. No es una prohibición de uso ni un veto legal: es un marco voluntario, sin licencias obligatorias ni preclearance. Lo que ha pasado el 26 de junio es que OpenAI, dentro de ese marco, ha aceptado limitar voluntariamente el acceso a petición del gobierno. El marco permite a los desarrolladores dar acceso al gobierno a "covered frontier models" hasta 30 días antes del lanzamiento y colaborar en elegir "trusted partners" con acceso temprano, e incluye un proceso clasificado de benchmarking de capacidades ciber.

Para una empresa en España, la lectura es clara: el cuello de botella no es Bruselas ni el BOE, es la Casa Blanca. El análisis de prensa apunta a una disponibilidad escalonada en la que las compañías de la UE accederían después de los socios aprobados por EE.UU., pero conviene marcarlo como reportado: es interpretación de medios, no un hecho oficial. Es, además, el mismo patrón que vimos cuando EE.UU. bloqueó Fable 5 y Mythos 5 de Anthropic, el precedente directo de lo que ha pasado hoy.

Qué significa GPT-5.6 para tu empresa

Más allá del titular, estas son las implicaciones prácticas para un decisor B2B, ampliando el resumen del principio:

  1. Disponibilidad escalonada. Hoy ni siquiera puedes usar GPT-5.6 salvo que estés en la veintena de empresas aprobadas. Construir tu stack alrededor de un modelo que aún no está disponible es asumir un riesgo innecesario.
  2. Arquitectura multimodelo. La recomendación que repiten las fuentes —y que en Aimoova trasladamos como criterio propio— es montar una arquitectura multimodelo, sin dependencia de un solo proveedor, con una capa de abstracción y un fallback open-weight. Así no quedas atado a las decisiones regulatorias de un país ni al calendario de un proveedor.
  3. Modelos disponibles hoy. Ya hay modelos auditados con los que avanzar: GPT-5.5, Claude Opus 4.8 y Gemini 3.1 Pro. No hace falta esperar a GPT-5.6 para automatizar procesos y poner agentes a trabajar.

Aquí es donde entra Aimoova. Ayudamos a empresas en España con consultoría de IA que elige el modelo adecuado para cada tarea, con automatización inteligente de procesos y con herramientas y agentes de IA a medida montados sobre modelos que de verdad puedes usar hoy.

Conclusión: prometedor, pero todavía a puerta cerrada

GPT-5.6 apunta alto en coding agéntico y en ciberseguridad, pero hoy está en preview restringido y sin validación externa. Sobre el papel pinta muy bien; en la práctica, todavía no puedes auditarlo ni, en la mayoría de los casos, usarlo.

Para una empresa, la jugada sensata no es esperar a que se abra la puerta, sino preparar el terreno con una arquitectura agnóstica de proveedor que te deje incorporar el mejor modelo de cada momento cuando esté disponible y auditado.

Si quieres más contexto, te dejamos algunos artículos relacionados: la comparativa de Claude Fable 5 frente a Opus 4.8 y GPT-5.5, la guía de GPT-5.5 para empresas en España y por qué depender de un único proveedor de IA es un riesgo de negocio.

Preguntas frecuentes

¿Qué es GPT-5.6?

GPT-5.6 es la nueva familia de modelos de IA de OpenAI presentada el 26 de junio de 2026, con tres variantes oficiales: Sol (la más potente), Terra (equilibrio entre eficiencia y potencia) y Luna (velocidad y precio bajo). Su salto principal está en coding de larga duración, ciberseguridad y tareas agénticas. En el lanzamiento, su acceso quedó restringido a unas 20 empresas a petición del gobierno de EE.UU.

¿Cuánto cuesta GPT-5.6?

Según la cobertura del lanzamiento, los precios por millón de tokens (entrada/salida) son: Sol 5,00/30,00 USD, Terra 2,50/15,00 USD y Luna 1,00/6,00 USD. El precio de Sol coincide con el de GPT-5.5 estándar (5/30), por lo que no supone un recorte agresivo. Hay caché con escritura premium (1,25x) y lectura con descuento del 90%, dato aún reportado y no oficial.

¿En qué se diferencia GPT-5.6 de GPT-5.5?

GPT-5.6 mejora sobre GPT-5.5 en coding de larga duración, ciberseguridad y tareas agénticas, e incorpora un modo "max reasoning effort" en Sol y un modo "ultra" que reparte el trabajo entre sub-agentes. OpenAI afirma mayor eficiencia de tokens, aunque solo a nivel cualitativo: los porcentajes concretos que circulan proceden de filtraciones y no están confirmados. Tampoco hay aún benchmarks de terceros que lo comparen con 5.5.

¿Cómo se compara GPT-5.6 con Claude y Gemini?

A fecha de hoy no se puede comparar de forma fiable: GPT-5.6 está en preview cerrado y ningún evaluador independiente lo ha probado. Entre los modelos ya medidos en junio de 2026, el Artificial Analysis Intelligence Index sitúa a Claude Opus 4.8 en cabeza (61,4), seguido de GPT-5.5 (60,2) y Gemini 3.1 Pro (57). En coding (SWE-bench Verified), Opus 4.8 marca 88,6% y GPT-5.5 82,6%. GPT-5.6 todavía no tiene cifra pública verificada por terceros.

¿Por qué EE.UU. ha restringido el acceso a GPT-5.6?

La administración Trump pidió restringir el acceso por seguridad nacional, centrándose en las capacidades de ciberseguridad del modelo, clasificadas como "High" bajo el Preparedness Framework de OpenAI. La petición la cursaron la ONCD y la OSTP en el marco de la Orden Ejecutiva 14409, firmada el 2 de junio de 2026, que es un marco voluntario y no una prohibición de uso. Lo inédito es la petición gubernamental preventiva: es la primera vez que el gobierno de EE.UU. pide a una empresa estadounidense restringir un modelo antes de su lanzamiento. El acceso restringido en sí no es nuevo (Anthropic ya aplicó un esquema parecido con Claude Mythos).

¿Cuándo podrán usar GPT-5.6 las empresas en España?

OpenAI ha declarado que ampliará el acceso a más empresas "la próxima semana" y prevé disponibilidad general "en las próximas semanas", con acceso inicial vía API y Codex. El cuello de botella no es la regulación europea, sino el control de la Casa Blanca: según análisis de prensa, las empresas de la UE accederían después de los socios aprobados por EE.UU. Mientras tanto, la recomendación práctica es no depender de un único modelo y trabajar con una arquitectura multimodelo.


Fuentes: Axios · VentureBeat · CNBC · 9to5Mac · OpenAI — GPT-5.6 system card · The White House — Executive Order 14409 · Artificial Analysis — Intelligence Index · OpenAI — API pricing.

¿Tu estrategia de IA aguantaría que el mejor modelo del momento saliera bajo llave? En Aimoova hacemos un diagnóstico de 30 minutos, gratuito y sin presentación de 40 diapositivas: revisamos de qué modelos y proveedores depende hoy tu operación y cómo blindarla con una arquitectura multimodelo. Hablar con Aimoova →

Análisis del equipo de Aimoova, consultora de IA para empresas en España.

GPT-5.6 para empresas: novedades, precio y comparativa