OpenAI declara ‘Code Red’ para melhorar o ChatGPT em resposta ao Google
O CEO da OpenAI, Sam Altman, declarou um “código vermelho” para concentrar os recursos da empresa na melhoria do ChatGPT, de acordo com um memorando interno relatado pelo The Wall Street Journal e The Information.
O memorando sinaliza a resposta da OpenAI à crescente concorrência do Google, cujo modelo Gemini 3 superou o ChatGPT em vários testes de benchmark desde o lançamento no mês passado, de acordo com dados de avaliação do próprio Google e tabelas de classificação de terceiros.
O que há de novo
Altman disse aos funcionários que a experiência diária do ChatGPT precisa de melhorias. As áreas específicas incluem recursos de personalização, velocidade e confiabilidade de resposta e a capacidade do chatbot de responder a uma gama mais ampla de perguntas.
A empresa utiliza um sistema codificado por cores para indicar os níveis de prioridade. Este esforço foi elevado para “código vermelho”, acima da designação anterior de “código laranja” para melhorias no ChatGPT.
Espera-se que um novo modelo de raciocínio seja lançado na próxima semana, de acordo com o memorando, embora a OpenAI não o tenha anunciado publicamente.
Produtos atrasados
Como resultado, diversas iniciativas de produtos estão sendo adiadas.
A integração de publicidade, que a OpenAI vinha testando nas versões beta do aplicativo ChatGPT, está agora suspensa, de acordo com o The Information. Os agentes de IA projetados para compras e cuidados de saúde também estão atrasados, juntamente com melhorias no ChatGPT Pulse.
Altman incentivou transferências temporárias de equipes para apoiar o desenvolvimento do ChatGPT e estabeleceu ligações diárias para os responsáveis pelas melhorias.
Contexto Competitivo
Do lado técnico, o Gemini 3 do Google e modelos relacionados obtiveram pontuações fortes em benchmarks de raciocínio. O Google afirma que o Gemini 3 Deep Think supera as versões anteriores no Humanity’s Last Exam, um benchmark de nível de fronteira criado por pesquisadores de segurança de IA e outros testes difíceis. Esses resultados são refletidos na própria página de benchmark Gemini 3 Pro do Google e em tabelas de classificação independentes que acompanham o desempenho do modelo.
A OpenAI ainda não divulgou dados de benchmark públicos comparáveis para seu próximo modelo de raciocínio, portanto, as comparações dependem dos resultados atuais do GPT 5, e não do próximo sistema mencionado no memorando.
O Google também continua investindo em ferramentas generativas de imagem, como os geradores de imagem Nano Banana e Nano Banana Pro, que acompanham o Gemini 3 como parte de uma linha mais ampla de produtos de IA.
Contexto de referência
O Último Exame da Humanidade pretende ser um sucessor mais difícil de benchmarks saturados como o MMLU. É mantido pelo Center for AI Safety and Scale AI, com uma visão geral disponível no site do projeto e resultados monitorados por vários placares, incluindo o placar oficial da Scale e painéis de terceiros, como Análise Artificial.
A documentação de benchmark Gemini 3 Pro do Google lista uma pontuação mais alta no Último Exame da Humanidade do que vários modelos concorrentes, incluindo GPT 5. Essa é a base para relatar que o Gemini 3 “superou” o ChatGPT nesse benchmark específico.
A OpenAI publicou resultados sólidos em outros benchmarks de raciocínio para sua série GPT 5, mas o memorando parece estar reagindo a esta recente onda de dados de desempenho do Gemini 3, em vez de a um único teste.
Contexto de tráfego e uso
Apesar da pressão técnica, a OpenAI ainda tem uma grande liderança no uso de assistentes.
Em uma postagem recente no LinkedIn, o chefe do ChatGPT, Nick Turley, disse que o ChatGPT é o “assistente de IA nº 1 em todo o mundo”, responsável por “cerca de 70% do uso do assistente” e cerca de “10% da atividade de pesquisa”. Você pode ler seus comentários completos aqui.
Relatórios separados de meios de comunicação, incluindo o Financial Times, indicam que o OpenAI tem mais de 800 milhões de usuários semanais, a maioria deles no nível gratuito, enquanto a base de usuários do Gemini tem crescido rapidamente a partir de um ponto de partida inferior.
O memorando de Altman reconhece o progresso recente do Google e alerta sobre “ventos econômicos temporários contrários”, ao mesmo tempo que diz que a OpenAI está “se recuperando rapidamente”.
Um manual familiar
A designação “código vermelho” ecoa a resposta do próprio Google ao ChatGPT há vários anos.
A administração do Google declarou um “código vermelho” após o lançamento viral do ChatGPT. O CEO Sundar Pichai redirecionou equipes de Pesquisa, Confiança e Segurança do Google e outros departamentos para se concentrar no desenvolvimento de produtos de IA.
Essa urgência levou ao desenvolvimento acelerado dos produtos de IA do Google, culminando no lançamento do Bard no início de 2023 e na sua subsequente evolução para Gemini.
Agora os papéis se inverteram. O investimento sustentado do Google em infraestrutura de IA produziu um modelo com pontuação superior ao ChatGPT em vários benchmarks de alto perfil, levando a OpenAI a adotar uma estrutura semelhante de resposta a crises para seu principal produto.
Resposta da Empresa
Nick Turley, chefe do ChatGPT da OpenAI, abordou o cenário competitivo em postagens recentes no LinkedIn e X, onde descreveu o ChatGPT como o principal assistente de IA em todo o mundo.
“Novos produtos são lançados toda semana, o que é ótimo”, escreveu ele em um dos posts, dizendo que a concorrência leva a OpenAI a se mover mais rápido e continuar melhorando o ChatGPT.
Ele acrescentou que o foco da OpenAI é tornar o ChatGPT “mais capaz”, ao mesmo tempo que expande o acesso e o torna “mais intuitivo e pessoal”.
A OpenAI não comentou publicamente sobre o memorando vazado.
Olhando para o futuro
O lançamento do novo modelo de raciocínio da OpenAI fornecerá a primeira indicação de como a empresa está executando a diretriz de Altman. O atraso dos agentes de publicidade e IA sugere que a qualidade do ChatGPT se tornou a prioridade singular da empresa no curto prazo, pelo menos internamente.
Para profissionais de marketing e profissionais de SEO, o impacto mais imediato provavelmente será sobre como o ChatGPT lida com consultas complexas, tarefas de pesquisa e perguntas de acompanhamento assim que o novo modelo estiver no ar. Quaisquer mudanças mensuráveis na qualidade, velocidade ou personalização das respostas serão importantes para serem observadas junto com os lançamentos contínuos do Gemini 3 do Google.
Imagem em destaque: Mijansk786/Shutterstock
