OpenAI lanza la API de GPT-4.1: ventana de contexto de un millón de tokens y recortes de precio sacuden el juego

OpenAI acaba de lanzar lo que podría ser su actualización más grande hasta ahora, haciendo GPT-4.1 disponible para todos los desarrolladores a través de su API hoy. Después de meses de anticipación y algunos retrasos reportados, la potencia de AI ha cumplido las promesas del CEO Sam Altman mientras aborda dos puntos de dolor que han frustrado durante mucho tiempo a los desarrolladores: limitaciones de contexto y altos costos.

El hito del millón de tokens

¿La función principal? La masiva ventana de contexto de 1,000,000 de tokens de GPT-4.1. Para poner eso en perspectiva, podrías alimentar el texto completo de “Guerra y Paz” de Tolstói en un solo prompt y aún tener espacio de sobra.

“GPT-4.1 fue específicamente entrenado para mantener atención confiable a través de su longitud de contexto completa sin perder rastro de la información”, explicó un portavoz de OpenAI.

Las pruebas tempranas sugieren que el modelo funciona admirablemente con documentos extensos, aunque hay un detalle: la precisión comienza a degradarse en longitudes extremas, cayendo de aproximadamente 84% a 8K tokens a alrededor de 50% en la capacidad completa de 1M tokens. Aún así, es territorio impresionante en el que pocos otros AI principales se han aventurado.

Tres modelos, tres puntos de precio

Rompiendo con la tradición, OpenAI está lanzando tres variantes distintas:

GPT-4.1 (base): El modelo insignia empujando los límites de lo que AI puede hacer
GPT-4.1 mini: Una oferta equilibrada que mantiene el contexto de 1M tokens a un precio más accesible
GPT-4.1 nano: El primer modelo “nano” de OpenAI, priorizando velocidad y costo-efectividad

Las tres variantes soportan capacidades multimodales (aceptando tanto entradas de texto como de imagen). OpenAI afirma que las capacidades de comprensión de imagen de GPT-4.1 a menudo superan al GPT-4 original en benchmarks de visión.

¿Son reales estos recortes de precio?

Quizás el aspecto más sorprendente es la estrategia de precios agresiva de OpenAI. GPT-4.1 cuesta aproximadamente 26% menos que GPT-4o para consultas medianas:

Modelo	Entrada	Salida
GPT-4.1 (base)	$2.00/M tokens	$8.00/M tokens
GPT-4.1 mini	$0.40/M tokens	$1.60/M tokens
GPT-4.1 nano	$0.10/M tokens	$0.40/M tokens

La compañía también ha aumentado su descuento de almacenamiento en caché de prompts a 75% y ofrece una reducción adicional del 50% para solicitudes de API por lotes.

Rendimiento que hace que los desarrolladores presten atención

Más allá de las funciones principales llamativas, GPT-4.1 entrega mejoras sustanciales en varias áreas clave:

Destreza en codificación: Una mejora de 21.4 puntos porcentuales en la prueba de codificación SWE-Bench Verified en comparación con GPT-4o
Seguimiento de instrucciones: Una ganancia de 10.5 puntos en el benchmark MultiChallenge de Scale AI
Base de conocimiento: Datos de entrenamiento actualizados hasta junio de 2024

“Hemos optimizado GPT-4.1 basándonos en retroalimentación del mundo real”, señaló un representante de OpenAI. “Aborda muchos de los ‘cortes de papel’ que los desarrolladores experimentaron con modelos anteriores.”

¿Dónde está ChatGPT en todo esto?

Notablemente ausente del anuncio de hoy está la integración con el producto de cara al consumidor de OpenAI. La compañía confirmó que en el lanzamiento, GPT-4.1 es “solo para API y aún no está en ChatGPT”, con integración al producto de consumo esperada más adelante.

Este enfoque escalonado tiene sentido dadas las precauciones previas de Altman sobre posibles retrasos debido a problemas de capacidad de GPU.

Retroalimentación de desarrolladores

La retroalimentación temprana de desarrolladores ha sido en gran medida positiva, con entusiasmo particular alrededor de la ventana de contexto expandida y las capacidades de codificación mejoradas. “El llamado a funciones es mucho más confiable ahora”, escribió un desarrollador. “Realmente sigue el esquema que le doy sin salirse del guion.”

Pero no todos están completamente convencidos. Algunos han expresado escepticismo sobre la utilidad práctica del contexto completo de 1M tokens, notando la degradación del rendimiento en longitudes extremas. Otros han expresado frustración con el corte de conocimiento de junio de 2024.

Qué sigue

GPT-4.1 representa un hito significativo en el viaje de OpenAI hacia lo que un portavoz describió como un AI de “ingeniero de software agéntico”. Con su uso mejorado de herramientas, capacidades de llamado a funciones y habilidades de razonamiento, el modelo está posicionado para servir como la columna vertebral de agentes AI cada vez más sofisticados.

A medida que las capacidades de AI continúan avanzando a velocidad vertiginosa, GPT-4.1 se establece como la nueva oferta insignia de OpenAI: más inteligente, más flexible y más accesible que nunca. El listón de lo que esperamos de AI acaba de elevarse de nuevo.