OpenAI lança a API de GPT-4.1: janela de contexto de um milhão de tokens e cortes de preço sacodem o jogo

OpenAI acabou de lançar o que pode ser sua maior atualização até agora, tornando GPT-4.1 disponível para todos os desenvolvedores através de sua API hoje. Após meses de antecipação e alguns atrasos reportados, a potência de IA cumpriu as promessas do CEO Sam Altman enquanto aborda dois pontos de dor que frustraram durante muito tempo os desenvolvedores: limitações de contexto e altos custos.

O marco do milhão de tokens

A função principal? A massiva janela de contexto de 1.000.000 de tokens de GPT-4.1. Para colocar isso em perspectiva, você poderia alimentar o texto completo de “Guerra e Paz” de Tolstói em um único prompt e ainda ter espaço de sobra.

“GPT-4.1 foi especificamente treinado para manter atenção confiável através de seu comprimento de contexto completo sem perder rastro da informação”, explicou um porta-voz da OpenAI.

Os testes precoces sugerem que o modelo funciona admiravelmente com documentos extensos, embora haja um detalhe: a precisão começa a degradar-se em comprimentos extremos, caindo de aproximadamente 84% a 8K tokens a cerca de 50% na capacidade completa de 1M tokens. Ainda assim, é território impressionante no qual poucos outros IA principais se aventuraram.

Três modelos, três pontos de preço

Rompendo com a tradição, OpenAI está lançando três variantes distintas:

GPT-4.1 (base): O modelo insignia empurrando os limites do que IA pode fazer
GPT-4.1 mini: Uma oferta equilibrada que mantém o contexto de 1M tokens a um preço mais acessível
GPT-4.1 nano: O primeiro modelo “nano” da OpenAI, priorizando velocidade e custo-benefício

As três variantes suportam capacidades multimodais (aceitando tanto entradas de texto quanto de imagem). OpenAI afirma que as capacidades de compreensão de imagem de GPT-4.1 frequentemente superam ao GPT-4 original em benchmarks de visão.

São reais esses cortes de preço?

Talvez o aspecto mais surpreendente seja a estratégia de preços agressiva da OpenAI. GPT-4.1 custa aproximadamente 26% menos que GPT-4o para consultas medianas:

Modelo	Entrada	Saída
GPT-4.1 (base)	$2.00/M tokens	$8.00/M tokens
GPT-4.1 mini	$0.40/M tokens	$1.60/M tokens
GPT-4.1 nano	$0.10/M tokens	$0.40/M tokens

A companhia também aumentou seu desconto de armazenamento em cache de prompts a 75% e oferece uma redução adicional de 50% para solicitações de API por lotes.

Desempenho que faz os desenvolvedores prestarem atenção

Além das funções principais chamativas, GPT-4.1 entrega melhorias substanciais em várias áreas-chave:

Destreza em codificação: Uma melhoria de 21.4 pontos percentuais no teste de codificação SWE-Bench Verified em comparação com GPT-4o
Seguimento de instruções: Um ganho de 10.5 pontos no benchmark MultiChallenge de Scale AI
Base de conhecimento: Dados de treinamento atualizados até junho de 2024

“Otimizamos GPT-4.1 baseando-nos em retroalimentação do mundo real”, assinalou um representante da OpenAI. “Aborda muitos dos ‘cortes de papel’ que os desenvolvedores experimentaram com modelos anteriores.”

Onde está ChatGPT em tudo isso?

Notavelmente ausente do anúncio de hoje está a integração com o produto de cara ao consumidor da OpenAI. A companhia confirmou que no lançamento, GPT-4.1 é “apenas para API e ainda não está em ChatGPT”, com integração ao produto de consumo esperada mais adiante.

Esta abordagem escalonada faz sentido dadas as precauções prévias de Altman sobre possíveis atrasos devido a problemas de capacidade de GPU.

Retroalimentação de desenvolvedores

A retroalimentação precoce de desenvolvedores tem sido em grande medida positiva, com entusiasmo particular ao redor da janela de contexto expandida e as capacidades de codificação melhoradas. “O chamado a funções é muito mais confiável agora”, escreveu um desenvolvedor. “Realmente segue o esquema que lhe dou sem sair do roteiro.”

Mas nem todos estão completamente convencidos. Alguns expressaram ceticismo sobre a utilidade prática do contexto completo de 1M tokens, notando a degradação do desempenho em comprimentos extremos. Outros expressaram frustração com o corte de conhecimento de junho de 2024.

O que vem a seguir

GPT-4.1 representa um marco significativo na jornada da OpenAI em direção ao que um porta-voz descreveu como uma IA de “engenheiro de software agêntico”. Com seu uso melhorado de ferramentas, capacidades de chamado a funções e habilidades de raciocínio, o modelo está posicionado para servir como a coluna vertebral de agentes IA cada vez mais sofisticados.

À medida que as capacidades de IA continuam avançando a velocidade vertiginosa, GPT-4.1 se estabelece como a nova oferta insignia da OpenAI: mais inteligente, mais flexível e mais acessível que nunca. A barra do que esperamos de IA acabou de elevar-se de novo.