A pesquisa ChatGPT frequentemente muda para o inglês em consultas fan-out: relatório
Quando o ChatGPT Search cria uma resposta, ele pode gerar consultas na web em segundo plano para encontrar fontes. Um novo relatório da empresa de análise de pesquisa de IA Peec AI descobriu que uma grande parte dessas consultas em segundo plano é executada em inglês, mesmo quando o prompt original estava em outro idioma.
A Peec AI analisou mais de 10 milhões de prompts e 20 milhões de consultas distribuídas a partir dos dados de sua plataforma. Em todos os prompts analisados em idiomas diferentes do inglês, a empresa relata que 43% das etapas de distribuição foram conduzidas em inglês.
O que são consultas fan-out
A documentação do ChatGPT Search da OpenAI descreve consultas de distribuição. Quando um usuário faz uma pergunta, o ChatGPT Search “normalmente reescreve sua consulta em uma ou mais consultas direcionadas” e as envia para parceiros de pesquisa. Depois de analisar os resultados iniciais, “a pesquisa do ChatGPT pode enviar consultas adicionais e mais específicas a outros provedores de pesquisa”.
Peec AI refere-se a essas subconsultas reescritas como “fan-outs”. O relatório da empresa rastreou quais idiomas o ChatGPT usou ao gerá-los.
A documentação da OpenAI não descreve como o idioma é escolhido para consultas reescritas.
O que Peec AI encontrou
Peec AI filtrou seus dados para incluir apenas casos em que a localização do IP correspondesse ao idioma do prompt. Prompts em polonês de endereços IP poloneses, prompts em alemão de IPs alemães e prompts em espanhol de IPs espanhóis. Sinais mistos, como prompts em alemão de endereços IP do Reino Unido, foram excluídos.
Os dados filtrados mostraram que 78% das execuções de prompts em idiomas diferentes do inglês incluíam pelo menos uma consulta de fan-out em inglês.
As solicitações em turco incluíam fan-outs em inglês com mais frequência, com 94%. As solicitações em espanhol foram as mais baixas, 66%. Nenhum idioma diferente do inglês no conjunto de dados do Peec AI caiu abaixo de 60%.
Os dados da Peec AI mostraram um padrão consistente entre idiomas. O ChatGPT normalmente inicia suas consultas de distribuição no idioma do prompt e, em seguida, adiciona consultas no idioma inglês à medida que cria a resposta.
Exemplos do relatório
A postagem no blog da Peec AI incluiu vários exemplos que mostram como o padrão pode funcionar na prática.
Quando solicitado em polonês a partir de um endereço IP polonês sobre os melhores portais de leilão, o ChatGPT omitiu ou enterrou o Allegro.pl em favor do eBay e de outras plataformas globais. Peec AI descreve Allegro como a plataforma de comércio eletrônico dominante na Polônia.
Quando questionado em alemão sobre empresas de software alemãs, a Peec AI relatou que a resposta não listou nenhuma empresa alemã. Quando questionados em espanhol sobre marcas de cosméticos, nenhuma marca espanhola apareceu.
No exemplo dos cosméticos espanhóis, a Peec AI mostrou as consultas reais de distribuição do ChatGPT. O primeiro foi executado em inglês. O segundo foi executado em espanhol, mas adicionou a palavra “globales” (global), um qualificador que o prompt original nunca usou. O sistema parece ter interpretado uma solicitação em espanhol de um endereço IP espanhol como uma solicitação para marcas globais.
Estes são exemplos individuais dos testes do Peec AI, não necessariamente representativos de todo o comportamento do ChatGPT Search.
Por que isso é importante
As equipes de SEO e de conteúdo que operam em mercados não ingleses podem enfrentar uma desvantagem na seleção de fontes do ChatGPT, que pode não ser mapeada de forma clara para os sinais de classificação tradicionais. Nos exemplos da Peec AI, consultas de distribuição em inglês trouxeram à tona fontes em inglês que favoreciam marcas globais em detrimento de concorrentes locais.
Há mais de um ano que cobrimos os padrões de citação do ChatGPT, desde o relatório do SE Ranking sobre fatores de citação até as descobertas de precisão de atribuição do Tow Center. Esses relatórios anteriores mostraram quais sinais predizem se uma fonte será citada. Os dados da Peec AI sugerem que a linguagem da consulta de fundo pode filtrar quais fontes são consideradas, antes que os sinais de citação entrem em ação.
Notas Metodológicas
Peec AI é um fornecedor no espaço de análise de pesquisa de IA. A documentação da empresa descreve seu método de coleta de dados como a execução diária de prompts definidos pelo cliente por meio da automação do navegador, interagindo com plataformas de IA por meio de suas interfaces web em vez de APIs. Os 10 milhões de solicitações neste relatório vieram da plataforma Peec AI, e não de um painel de sessões ChatGPT de consumidores.
O relatório não detalhou a composição desses prompts, quais categorias ou setores eles abrangem ou quão representativos são dos padrões mais amplos de uso do ChatGPT.
Tomek Rudzki, autor do relatório, é apresentado pela Peec AI como “GEO Expert” em seu blog. Ele é um conhecido profissional técnico de SEO que falou na BrightonSEO e SMX Munique e contribuiu para publicações como Moz.
Olhando para o futuro
Os documentos públicos do ChatGPT Search da OpenAI descrevem a reescrita de consultas e consultas de acompanhamento, mas não explicam como o idioma é escolhido para essas consultas. Ainda não está claro se o padrão de distribuição em inglês que a Peec AI identificou é uma escolha de design intencional ou um comportamento emergente do sistema.
O relatório levanta uma questão que vale a pena monitorizar. A construção de conteúdo em inglês se tornará parte das estratégias de otimização de pesquisa de IA ou as plataformas de pesquisa de IA ajustarão sua seleção de fontes para melhor refletir os mercados locais?
Imagem em destaque: arda savasciogullari/Shutterstock
