Construindo mais com GPT-5.1-Codex-Max

19 de Novembro, 2025

Construindo mais com GPT-5.1-Codex-Max (via) Logo após o lançamento do Gemini 3 Pro de ontem, vem um novo modelo da OpenAI chamado GPT-5.1-Codex-Max.

(Lembra quando o GPT-5 deveria trazer uma nova era de nomes de modelos menos confusos? Isso não durou!)

Atualmente, está disponível apenas por meio do agente de codificação Codex CLI, onde é o novo modelo padrão:

A partir de hoje, o GPT‑5.1-Codex-Max substituirá o GPT‑5.1-Codex como modelo padrão nas superfícies do Codex. Ao contrário do GPT‑5.1, que é um modelo de uso geral, recomendamos o uso do GPT‑5.1-Codex-Max e da família de modelos Codex apenas para tarefas de codificação de agente em ambientes Codex ou semelhantes ao Codex.

Ainda não está disponível por meio da API, mas deverá estar em breve.

O momento deste lançamento é interessante, visto que o Gemini 3 Pro parece ter superado quase todos os benchmarks ontem. É uma reminiscência do período de 2024, quando a OpenAI fazia consistentemente grandes anúncios que coincidiam com os lançamentos do Gemini.

A pontuação SWE-Bench Verified auto-relatada pela OpenAI é particularmente notável: 76,5% para o nível de pensamento “alto” e 77,9% para o novo “xhigh”. Esse foi o único benchmark em que o Gemini 3 Pro foi superado por Claude Sonnet 4.5 – o Gemini 3 Pro obteve 76,2% e o Sonnet 4.5 obteve 77,2%. OpenAI agora tem o modelo de pontuação mais alta por um total de 0,7 ponto percentual!

Eles também relatam uma pontuação de 58,1% no Terminal Bench 2.0, superando os 54,2% do Gemini 3 Pro (e os 42,8% do Sonnet 4.5).

A parte mais intrigante deste anúncio diz respeito à abordagem do modelo para problemas de contexto longo:

GPT‑5.1-Codex-Max foi desenvolvido para trabalhos detalhados e de longa duração. É o nosso primeiro modelo treinado nativamente para operar em múltiplas janelas de contexto por meio de um processo chamado compactaçãotrabalhando de forma coerente em milhões de tokens em uma única tarefa. (…)

A compactação permite que o GPT‑5.1-Codex-Max conclua tarefas que anteriormente teriam falhado devido aos limites da janela de contexto, como refatoradores complexos e loops de agente de longa execução, eliminando seu histórico e preservando o contexto mais importante em longos horizontes. Em aplicativos Codex, o GPT‑5.1-Codex-Max compacta automaticamente sua sessão quando se aproxima do limite da janela de contexto, fornecendo uma nova janela de contexto. Ele repete esse processo até que a tarefa seja concluída.

Há muita confusão no Hacker News sobre o que isso realmente significa. Claude Code já faz uma versão de compactação, resumindo automaticamente os turnos anteriores quando o contexto acaba. Isso significa apenas que o Codex-Max é melhor nesse processo?

Pedi para desenhar alguns pelicanos digitando “Gerar um SVG de um pelicano andando de bicicleta” diretamente na ferramenta Codex CLI. Aqui está o nível de pensamento médio:

Uma ilustração em estilo plano mostra um pássaro branco, de corpo redondo e bico laranja pedalando uma bicicleta de moldura vermelha com finas rodas pretas ao longo de uma praia arenosa, com um oceano azul calmo e céu claro ao fundo.

E aqui está o nível de pensamento “xhigh”:

Um pássaro branco rechonchudo com bico laranja e pequenos olhos pretos agacha-se em uma bicicleta azul com rodas escuras enormes, mostrado correndo para frente com linhas de movimento contra um céu azul gradiente suave.

Eu também tentei xhigh no prompt de teste mais longo do pelican, que saiu assim:

Construindo mais com GPT-5.1-Codex-Max

Também hoje: GPT-5.1 Pro está sendo lançado hoje para todos os usuários Pro. De acordo com as notas de lançamento do ChatGPT:

O GPT-5.1 Pro está sendo lançado hoje para todos os usuários do ChatGPT Pro e está disponível no seletor de modelos. O GPT-5 Pro permanecerá disponível como modelo legado por 90 dias antes de ser retirado.

Esse é um ciclo de descontinuação bastante rápido para o modelo GPT-5 Pro lançado há apenas três meses.

Source link

Barbro, de Copenhague, estreia “What Men Do”, um balanço folk indie suavemente latente sobre desaprendizado e resistência silenciosa
11 de Dezembro, 2025

O folk indie lento de Barbro, “What Men Do”, é uma canção vulnerável e silenciosamente radical sobre desaprender o comportamento herdado e as maneiras invisíveis pelas quais a resistência começa. Transmissão: “O que os homens fazem” – Barbro Sfumaça, silêncio e algo fervendo logo abaixo da superfície – uma tensão que você sente, mais do…

Veja Mais Barbro, de Copenhague, estreia “What Men Do”, um balanço folk indie suavemente latente sobre desaprendizado e resistência silenciosa
10 erros de jardinagem no final da temporada a serem evitados este mês
13 de Novembro, 2025

À medida que a temporada de jardinagem termina, é fácil ignorar algumas tarefas cruciais que podem afetar a saúde das suas plantas durante os meses mais frios. Novembro traz desafios únicos e garantir que o seu jardim esteja devidamente preparado para o inverno é a chave para uma primavera de sucesso. Evitar erros comuns, como…

Veja Mais 10 erros de jardinagem no final da temporada a serem evitados este mês
Mueller, do Google, avalia o debate entre SEO e GEO
7 de Janeiro, 2026

O defensor da pesquisa do Google, John Mueller, diz que as empresas que dependem do tráfego de referência devem pensar em como as ferramentas de IA se encaixam no cenário. Mueller respondeu a um tópico do Reddit perguntando se o SEO ainda é suficiente ou se os profissionais precisam começar a considerar GEO, um termo…

Veja Mais Mueller, do Google, avalia o debate entre SEO e GEO
Codifique projetos de pesquisa com agentes de codificação assíncrona como Claude Code e Codex
8 de Novembro, 2025

Codifique projetos de pesquisa com agentes de codificação assíncrona como Claude Code e Codex 6 de novembro de 2025 Tenho experimentado recentemente um padrão de uso de LLM que está funcionando muito bem: tarefas de pesquisa de código assíncrono. Escolha uma questão de pesquisa, crie um agente de codificação assíncrona e deixe-o ir, execute alguns…

Veja Mais Codifique projetos de pesquisa com agentes de codificação assíncrona como Claude Code e Codex
‘The Life of a Showgirl’ é Taylor Swift para ela mais ambiciosa – e mais assombrosa
7 de Outubro, 2025

Taylor Swift retorna alegremente apaixonado e cauteloso de glamour em seu decadente álbum de estúdio do décimo segundo, ‘The Life of a Showgirl’. No entanto, mesmo no seu melhor, ela fica aquém de entregar algo além de planicidade criativa. Stream: ‘The Life of a Showgirl’ – Taylor Swift TAylor Swift fez tudo. Ela encantou…

Veja Mais ‘The Life of a Showgirl’ é Taylor Swift para ela mais ambiciosa – e mais assombrosa
50 Cent declara “RIP NYC” após a vitória de Mamdani – Mamdani bate palmas em grande estilo
8 de Novembro, 2025

Mamdani não se incomodou com as críticas. Rachel Kiley Postado em 7 de novembro de 2025, 13h CST O recém-eleito prefeito de Nova York, Zohran Mamdani, tem algo a dizer a 50 Cent depois que o rapper expressou seu descontentamento com os resultados da eleição desta semana. Vídeo em destaque 50 Cent deixou claro já…

Veja Mais 50 Cent declara “RIP NYC” após a vitória de Mamdani – Mamdani bate palmas em grande estilo

Postagens Similares

Deixe um comentário Cancelar resposta