Pesquisa do Google Central APAC 2025: tudo do dia 2

Pesquisa do Google Central APAC 2025: tudo do dia 2


O segundo dia da APAC 2025 ao vivo do Google Search Central começou com um breve empate com o mergulho profundo do dia anterior em rastejamento, antes de se mover diretamente para a indexação.

Cherry Prommawin abriu, passando -nos como o Google analisa o HTML e destaca os estágios principais na indexação:

  1. HTML Parsing
  2. Renderização e execução de JavaScript
  3. Desduplicação
  4. Extração de recursos
  5. Extração de sinal

Isso definiu o tema para o resto do dia.

Cherry observou que o Google primeiro normaliza o HTML bruto em um DOM, depois procura elementos de cabeçalho e navegação e determina qual seção mantém o conteúdo principal. Durante esse processo, ele também extrai elementos como Rel = canônico, hreflang, links e âncoras e tags de meta-robôs.

“Não há preferência entre sites responsivos e sites dinâmicos/adaptativos. O Google não tenta detectar isso e não tem uma ponderação preferencial”.
Cherry Prommawin

Os links permanecem centrais para a estrutura da Web, tanto para descoberta quanto para classificação:

“Os links ainda são uma parte importante da Internet e usados para descobrir novas páginas e determinar a estrutura do site, e nós as usamos para a classificação”.
Cherry Prommawin

Controlando a indexação com regras de robôs

Gary Illyes esclareceu onde as tags robots.txt e robots -meta se encaixam no fluxo:

  • robots.txt Controla o que os rastreadores podem buscar.
  • Tags de meta robô Controle como esses dados buscados são usados a jusante.

Ele destacou várias diretivas menos conhecidas:

  • nenhum – equivalente a noindex,nofollow combinado em uma única regra. Existe um benefício para isso? Embora funcionalmente idêntico, o uso de uma diretiva em vez de dois pode simplificar o gerenciamento de tags.
  • NOTRANSLATE – Se definido, o Chrome não se oferecerá mais para traduzir a página.
  • NoimageIndex – também se aplica a ativos de vídeo.
  • Indisponível depois – Apesar de ter sido introduzido por engenheiros que seguiram em frente, ele ainda funciona. Isso pode ser útil para depreciar as postagens sensíveis ao tempo, como ofertas e promoções de tempo limitado, para que elas não persistam nos recursos de IA do Google e correm o risco de usuários enganosos ou prejudicar a percepção da marca.

Entendendo o que está em uma página

Gary Illyes enfatizou que o conteúdo principal, conforme definido pelas diretrizes de avaliador de qualidade do Google, é o elemento mais crítico na rastreamento e indexação. Pode ser texto, imagens, vídeos ou recursos ricos, como calculadoras.

Ele mostrou como mudar um tópico para a área de conteúdo principal pode aumentar as classificações.

Em um exemplo, mover referências a “Hugo 7” de uma barra lateral para o conteúdo central (principal) levou a um aumento mensurável na visibilidade.

“Se você deseja classificar para certas coisas, coloque essas palavras e tópicos em lugares importantes (na página)
Gary Illyes

Tokenização para pesquisa

Você não pode despejar HTML bruto em um índice pesquisável em escala. O Google divide -o em “Tokens”, palavras ou frases individuais e armazena aquelas em seu índice. O primeiro sistema de segmentação HTML remonta ao escritório de engenharia de Tóquio de 2001 do Google, e os mesmos métodos de tokenização alimentam seus produtos de IA, desde “Por que reinventar a roda”.

Quando o conteúdo principal é fino ou baixo, o que o Google marca como um “404 suave”, é sinalizado com uma anotação central para mostrar que essa deficiência está no coração da página, não apenas em uma seção periférica.

Manuseio de duplicação da web

Imagem do autor, julho de 2025

Cherry Prommawin explicou a desduplicação em três áreas de foco:

  1. Clustering – Usando redirecionamentos, similaridade de conteúdo e Rel = Canonical to Group Duplicate Pages.
  2. Verificações de conteúdo – As somas de cheques que ignoram o caldeira e capturam muitas páginas de erro macio. Observe que erros suaves podem reduzir um cluster inteiro.
  3. Localização – Quando as páginas diferem apenas por localidade (por exemplo, via geografirects), Hreflang as preenche sem penalidade.

Ela contrastou redirecionamentos permanentes versus temporários: ambos desempenham um papel no rastreamento e no agrupamento, mas apenas os redirecionamentos permanentes influenciam que o URL é escolhido como o canônico do cluster.

O Google prioriza o risco de seqüestro primeiro, a experiência do usuário em segundo e os sinais do proprietário do site (como o seu rel = canônico) em terceiro ao selecionar o URL representativo.

Geotarginging

O geotarging permite que você sinalize para pesquisar no Google para qual país ou região seu conteúdo é mais relevante e funciona de maneira diferente da segmentação simples de idiomas. A Cherry Prommawin enfatizou que você não precisa ocultar conteúdo duplicado em dois sites específicos do país, Hreflang lidará com essas alternativas para você.

Imagem do autor, julho de 2025

Se você servir o conteúdo duplicado em vários URLs regionais sem localização, corre o risco de confundir rastreadores e usuários. Para o Geotarget de maneira eficaz, verifique se cada versão possui conteúdo único e localizado, adaptado ao seu público específico.

Os principais sinais de geotaragem geotaringing que o Google usa são:

  1. Domínio de nível superior do país (CCTLD) – Domínios como .sg ou .au indicam o país -alvo.
  2. Anotações de Hreflang – Usar Tags, cabeçalhos HTTP ou entradas do sitemap para declarar alternativas de idioma e regional.
  3. Localização do servidor – O endereço IP ou o local de hospedagem do seu servidor pode atuar como uma dica geográfica.
  4. Sinais locais adicionaiscomo Idioma e moeda na página, links de outros sites regionais e sinais do perfil de negócios local, todos reforçam sua região de destino.

Ao combinar esses sinais com conteúdo genuinamente localizado, você ajuda o Google a servir a versão certa do seu site para os usuários certos – e evite as armadilhas de clusters de conteúdo de duplicado não intencionais.

Dados estruturados e mídia

Gary Illyes introduziu a fase de extração de recursos, que é executada após a desduplicação e é computacionalmente cara. Começa com o HTML e inicia a indexação de mídia assíncrona separada para imagens e vídeos.

Se o seu HTML estiver no índice, mas sua mídia não é, isso significa simplesmente que o pipeline de mídia ainda está funcionando.

As sessões nesta faixa incluíram:

  • Dados estruturados com William Prabowo
  • Usando imagens com Ian Huang
  • Envolver usuários com vídeo com William Prabowo

P&R toca -se sobre esquema

A marcação de esquema pode ajudar o Google a entender as relações entre as entidades e ativar os recursos orientados a LLM. Mas o esquema excessivo ou redundante adiciona apenas a página inchaço e não possui benefícios adicionais de classificação.

E o esquema não é usado como parte do processo de classificação.

Cálculo de sinais

Durante a extração de sinal, também parte da indexação, o Google calcula uma mistura de:

  • Sinais indiretos (links, menções por outras páginas)
  • Sinais diretos (palavras e canais na página)
Imagem do autor, julho de 2025

Gary confirmou que o Google ainda usa o PageRank internamente. Não é o algoritmo exato do White Paper de 1996, mas possui o mesmo nome.

Manuseio de spam

Os sistemas do Google identificam cerca de 40 bilhões de páginas de spam todos os dias, alimentadas pelo seu “Spambrain” baseado em LLM.

Imagem do autor, julho de 2025

Além disso, Gary enfatizou que o EEAT não é um sinal de indexação ou classificação. É um princípio explicativo, não uma métrica calculada.

Decidindo o que é indexado

A seleção do índice se resume à qualidade, definida como uma combinação de confiabilidade e utilidade para os usuários finais. As páginas são retiradas do índice para sinais negativos claros:

  • noindex diretivas
  • Conteúdo expirado ou limitado de tempo
  • 404s macios e duplicatas escorregadias
  • Violações puras de spam ou políticas

Se uma página foi rastejada, mas não indexada, o remédio é melhorar a qualidade do conteúdo. A ligação interna pode ajudar, mas apenas na medida em que torna a página genuinamente mais útil – o objetivo do Google é recompensar melhorias focadas no usuário, não a manipulação de sinalização.

O Google não se importa se suas imagens são geradas pela IA

As imagens geradas pela IA tornaram-se comuns em fluxos de trabalho de marketing, educação e design. Esses visuais são produzidos por modelos de aprendizado profundo treinados em enormes coleções de imagens.

Durante a sessão, Huang descreveu que o Google não se importa se suas imagens são geradas por IA ou seres humanos, desde que transmitam com precisão e eficácia as informações ou contem a história que você pretende.

Enquanto as imagens forem compreensíveis, suas origens de IA são irrelevantes. O objetivo principal é a comunicação eficaz com seu público.

Huang destacou um exemplo de uma imagem de IA usada pela equipe do Google durante o primeiro dia da conferência que, em inspeção estreita, tem alguns erros visuais, mas como um “suporte”, seu trabalho era representar uma linha do tempo e não era o conteúdo principal do slide, para que esses erros não importassem.

Imagem do autor, julho de 2025

Podemos adotar uma abordagem semelhante ao uso de imagens geradas pela IA. Se a imagem transmitir a mensagem e não for o conteúdo principal da página, pequenos problemas não levarão à penalização, nem usarão imagens geradas por IA em geral.

As imagens devem passar por uma rápida revisão humana para identificar erros óbvios, o que pode impedir erros de produção. A supervisão contínua permanece essencial para manter a confiança em seus visuais e proteger a integridade da sua marca.

A API do Google Trends anunciou

Finalmente, Daniel Waisberg e Hadas Jacobi revelaram a nova API do Google Trends (Alpha). Os principais recursos da nova API incluirão:

  • Dados de juros de pesquisa em escala consistentemente que não recalibram quando você altera as consultas.
  • Uma janela rolante de cinco anos, atualizada até 48 horas atrás, para comparações sazonais e históricas.
  • Agregação de tempo flexível (semanalmente, mensalmente, anualmente).
  • Quebras de região e sub -região.

Isso abre um mundo de análise de tendências programáticas com métricas confiáveis e comparáveis ao longo do tempo.

Isso termina o segundo dia. Amanhã, temos cobertura do último dia no terceiro dia no Google Search Central Live, com mais notícias e insights de última hora.

Mais recursos:


Imagem em destaque: Dan Taylor/Salt.agency



Source link

Postagens Similares

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *