Google Ads usando novo modelo de IA para capturar anunciantes fraudulentos -

O Google publicou um artigo de pesquisa sobre um novo modelo de IA para detectar fraudes no sistema Google Ads, que é uma grande melhoria em relação ao que eles usavam anteriormente. O interessante é que o documento de investigação, datado de 31 de dezembro de 2025, diz que a nova IA é implementada, resultando numa melhoria na taxa de deteção de mais de 40 pontos percentuais e alcançando 99,8% de precisão em políticas específicas.

ALF: Modelo de base grande do anunciante

A nova IA é chamada ALF (Advertiser Large Foundation Model), cujos detalhes foram publicados em 31 de dezembro de 2025. ALF é um modelo multimodal de grande base que analisa texto, imagens e vídeo, juntamente com fatores como idade da conta, detalhes de faturamento e métricas históricas de desempenho.

Os pesquisadores explicam que muitos desses fatores isoladamente não sinalizarão uma conta como potencialmente problemática, mas que a comparação de todos esses fatores juntos fornece uma melhor compreensão do comportamento e da intenção do anunciante.

Eles escrevem:

“Um desafio central neste ecossistema é compreender de forma precisa e eficiente a intenção e o comportamento do anunciante. Esse entendimento é fundamental para diversas aplicações importantes, incluindo a correspondência de usuários com anúncios e a identificação de fraudes e violações de políticas.

Enfrentar esse desafio requer uma abordagem holística, processando diversos tipos de dados, incluindo informações estruturadas da conta (por exemplo, idade da conta, detalhes de cobrança), ativos criativos de anúncios multimodais (texto, imagens, vídeos) e conteúdo da página de destino.

Por exemplo, um anunciante pode ter uma conta criada recentemente, ter anúncios gráficos e de texto de uma grande marca bem conhecida e ter tido um pagamento com cartão de crédito recusado uma vez. Embora cada elemento possa existir inocentemente isoladamente, a combinação sugere fortemente uma operação fraudulenta.”

Os pesquisadores abordam três desafios que os sistemas anteriores não conseguiram superar:

1. Dados heterogêneos e de alta dimensão
Dados heterogêneos referem-se ao fato de que os dados do anunciante vêm em vários formatos, não apenas em um tipo. Isso inclui dados estruturados, como idade da conta e tipo de faturamento, e dados não estruturados, como ativos criativos, como imagens, texto e vídeo. Dados de alta dimensão referem-se às centenas ou milhares de pontos de dados associados a cada anunciante, fazendo com que a representação matemática de cada um se torne altamente dimensional, o que apresenta desafios para os modelos convencionais.

2. Conjuntos ilimitados de ativos criativos
Os anunciantes poderiam ter milhares de ativos criativos, como imagens, e ocultar um ou dois ativos maliciosos entre milhares de ativos inocentes. Este cenário sobrecarregou o sistema anterior.

3. Confiabilidade e confiabilidade no mundo real
O sistema precisa ser capaz de gerar pontuações confiáveis de que uma empresa tem intenções maliciosas porque, de outra forma, um falso positivo afetaria um anunciante inocente. Deve-se esperar que o sistema funcione sem a necessidade de reajustá-lo constantemente para detectar erros.

Privacidade e Segurança

Embora a ALF analise sinais sensíveis como histórico de cobrança e detalhes da conta, os pesquisadores enfatizam que o sistema foi projetado com rigorosas proteções de privacidade. Antes que a IA processe qualquer dado, todas as informações de identificação pessoal (PII) são eliminadas. Isso garante que o modelo identifique riscos com base em padrões comportamentais e não em dados pessoais confidenciais.

O molho secreto: como ele detecta valores discrepantes

O modelo também usa uma técnica chamada “Atenção entre amostras” para melhorar suas habilidades de detecção. Em vez de analisar um único anunciante no vácuo, a ALF analisa “grandes lotes de anunciantes” para comparar suas interações entre si. Isso permite que a IA aprenda como é a atividade normal em todo o ecossistema e torne-a mais precisa na detecção de valores discrepantes suspeitos que não se enquadram no comportamento normal.

Alf supera benchmarks de produção

Os pesquisadores explicam que seus testes mostram que o ALF supera uma linha de base de produção altamente ajustada:

“Nossos experimentos mostram que o ALF supera significativamente uma linha de base de produção altamente ajustada, ao mesmo tempo em que apresenta um forte desempenho em benchmarks públicos. Na produção, o ALF proporciona ganhos substanciais e simultâneos em precisão e recall, aumentando o recall em mais de 40 pontos percentuais em uma política crítica e aumentando a precisão para 99,8% em outra.”

Este resultado demonstra que o ALF pode proporcionar ganhos mensuráveis através de múltiplos critérios de avaliação sob condições reais de produção do mundo real, em vez de apenas em ambientes off-line ou de benchmarking.

Em outros lugares, eles mencionam compensações em termos de velocidade:

“A eficácia desta abordagem foi validada em relação a uma linha de base de produção excepcionalmente forte, resultado de uma extensa pesquisa em várias arquiteturas e hiperparâmetros, incluindo DNNs, conjuntos, GBDTs e regressão logística com exploração cruzada de recursos.

Embora a latência do ALF seja maior devido ao tamanho maior do modelo, ela permanece dentro da faixa aceitável para nosso ambiente de produção e pode ser otimizada ainda mais usando aceleradores de hardware. Experimentos mostram que o ALF supera significativamente a linha de base nas principais tarefas de detecção de riscos, um aumento de desempenho impulsionado por sua capacidade única de modelar holisticamente incorporações de conteúdo, que arquiteturas mais simples tiveram dificuldade em aproveitar. Essa compensação é justificada por sua implantação bem-sucedida, onde o ALF atende milhões de solicitações diariamente.”

A latência refere-se à quantidade de tempo que o sistema leva para produzir uma resposta após receber uma solicitação, e os dados do pesquisador mostram que, embora o ALF aumente esse tempo de resposta em relação à linha de base, a latência permanece aceitável para uso em produção e já está operando em escala, ao mesmo tempo em que oferece um desempenho de detecção de fraude substancialmente melhor.

Detecção de fraude aprimorada

Os pesquisadores dizem que o ALF agora está implantado no sistema de segurança do Google Ads para identificar anunciantes que violam as políticas do Google Ads. Não há indicação de que o sistema esteja sendo usado em outro lugar, como na Pesquisa ou nos Perfis de Empresas do Google. Mas disseram que o trabalho futuro poderia concentrar-se em factores baseados no tempo (“dinâmica temporal”) para detectar padrões em evolução. Eles também indicaram que poderia ser útil para modelagem de público e otimização criativa.

Leia a versão original em PDF do artigo de pesquisa:

ALF: Grande modelo de base do anunciante para compreensão multimodal do anunciante

Imagem em destaque por Shutterstock/Login

Source link