Um Sitemap XML ou HTML é melhor para SEO?
Nesta edição do Ask An SEO, analisamos um ponto comum de confusão para proprietários de sites e SEOs técnicos:
Preciso de um mapa do site XML e de um HTML, e qual é melhor usar para SEO?
Pode ser um pouco confuso saber se é melhor usar um mapa do site XML ou HTML para o seu site. Em alguns casos, nenhum dos dois é necessário e, em alguns, ambos são úteis. Vamos mergulhar no que eles são, o que fazem e quando usá-los.
O que é um mapa do site XML?
Um mapa do site XML é essencialmente uma lista de URLs para páginas e arquivos do seu site que você deseja que os bots de pesquisa possam encontrar e rastrear. Você também pode usar o mapa do site XML para detalhar informações sobre os arquivos, como a duração do tempo de execução do arquivo de vídeo especificado ou a data de publicação de um artigo.
É usado principalmente para bots. Há poucos motivos pelos quais você desejaria que um visitante humano usasse um mapa do site XML. Bem, a menos que estejam depurando um problema de SEO!
Para que é usado o Sitemap XML?
O objetivo do mapa do site XML é ajudar os bots de pesquisa a entender quais páginas do seu site devem ser rastreadas, além de fornecer informações extras sobre essas páginas.
O mapa do site XML pode ajudar os bots a identificar páginas do site que, de outra forma, seriam difíceis de encontrar. Podem ser páginas órfãs, aquelas com poucos links internos ou até mesmo páginas que foram alteradas recentemente e que você pode querer encorajar os bots a rastrear novamente.
Melhores práticas para Sitemaps XML
A maioria dos bots de pesquisa entenderá sitemaps XML que seguem o protocolo sitemaps.org. Este protocolo define a localização necessária do mapa do site XML em um site, o esquema que ele precisa usar para ser compreendido pelos bots e como provar a propriedade de domínios na instância de referências entre domínios.
Normalmente, há um limite para o tamanho que um mapa do site XML pode ter e ainda ser analisado pelos bots de pesquisa. Isso significa que ao construir um mapa do site XML, você deve garantir que ele tenha menos de 50 MB descompactado e não mais que 50.000 URLs. Se o seu site for maior, você pode precisar de vários sitemaps XML para cobrir todos os URLs. Nesse caso, você pode usar um arquivo de índice de sitemap para ajudar a organizar seus sitemaps em um único local.
Como o objetivo do mapa do site XML normalmente é ajudar os bots a encontrar suas páginas rastreáveis e indexáveis, geralmente é necessário garantir que as referências de arquivo que ele contém levam a URLs com 200 códigos de resposta do servidor. Na maioria dos casos, os URLs devem ser a versão canônica e não conter nenhuma restrição de rastreamento ou índice.
Coisas a ter em conta com Sitemaps XML
Pode haver bons motivos para ir contra as “melhores práticas” para mapas de sites XML. Por exemplo, se você estiver instigando muitos redirecionamentos, poderá incluir os URLs antigos em um mapa do site XML, mesmo que eles retornem um código de resposta do servidor 301. Adicionar um novo mapa do site XML contendo esses URLs alterados pode encorajar os bots a rastreá-los novamente e capturar os redirecionamentos mais cedo do que se eles simplesmente os encontrassem por meio do rastreamento do site. Este é especialmente o caso se você se deu ao trabalho de remover links para redirecionamentos 301 no próprio site.
O que é um mapa do site HTML?
O mapa do site HTML é um conjunto de links para páginas do seu site. Geralmente é vinculado a algum lugar do site, como o rodapé, que é facilmente acessado pelos usuários caso o procurem especificamente. No entanto, não faz parte da navegação principal do site, mas sim como um acompanhamento da mesma.
Para que serve um Sitemap HTML?
A ideia do mapa do site HTML é servir como um guia para a navegação. Se um usuário estiver com dificuldade para encontrar uma página do seu site por meio dos principais elementos de navegação ou pesquisa, ele poderá acessar o mapa do site HTML e encontrar links para as páginas mais importantes do seu site. Se o seu site não for tão grande, você poderá incluir links para todas as páginas do site.
O mapa do site HTML tem dupla função. Não só funciona como uma meganavegação para humanos, mas também pode ajudar os bots a encontrar páginas. Como os bots seguirão links em um site (desde que sejam seguiveis), isso pode ajudá-los a encontrar páginas que de outra forma não estão vinculadas ou que estão mal vinculadas ao site.
Melhores práticas para Sitemaps HTML
Ao contrário do mapa do site XML, não existe um formato específico que um mapa do site HTML precise seguir. Como o nome sugere, tende a ser uma página HTML simples que contém hiperlinks para as páginas que você deseja que os usuários encontrem.
Para torná-lo utilizável também para bots, é importante que os links sejam seguiveis, ou seja, não possuam o atributo nofollow. Também é prudente garantir que os URLs aos quais eles vinculam não sejam proibidos no robots.txt. Não causará problemas sérios se os links não puderem ser seguidos por bots; apenas impede que o mapa do site seja útil para bots.
Coisas a ter em conta com Sitemaps HTML
A maioria dos usuários não irá para o mapa do site HTML como sua primeira parada em um site. É importante perceber que se um usuário acessa o mapa do site HTML para encontrar uma página, isso sugere que sua navegação principal no site falhou. Realmente deveria ser visto como um último recurso para apoiar a navegação.
Qual é melhor usar para SEO?
Então, o que é mais importante para SEO? Bem, nenhum dos dois. Ou seja, realmente depende do seu site e de suas necessidades.
Por exemplo, um site pequeno com menos de 20 páginas pode não precisar de um mapa do site XML ou de um mapa do site HTML. Nesse caso, se todas as páginas estiverem bem vinculadas a partir do sistema de navegação principal, há grandes chances de que os usuários e os bots de pesquisa consigam encontrar facilmente cada uma das páginas do site sem a ajuda adicional dos mapas do site.
No entanto, se o seu site tiver milhões de páginas e um sistema de navegação principal que enterre links em vários submenus, um mapa do site XML e um mapa do site HTML podem ser úteis.
Ambos atendem a propósitos e públicos diferentes.
Quando usar o Sitemap XML
Na prática, ter um mapa do site XML, ou vários, pode ajudar a combater problemas de rastreamento. Ele fornece uma lista clara de todas as páginas que você deseja que um bot de pesquisa rastreie e indexe. Um mapa do site XML também pode ser muito útil para depurar problemas de rastreamento, pois ao carregá-lo no Google Search Console, você receberá um alerta se houver problemas com ele ou com os URLs que ele contém. Ele pode permitir que você restrinja o status de indexação de URLs no mapa do site XML. Isso pode ser muito útil para grandes sites com milhões de páginas.
Essencialmente, não há realmente uma razão para não usar um mapa do site XML, além do tempo e do custo de criá-los e mantê-los. Muitos sistemas de gerenciamento de conteúdo os geram automaticamente, o que pode eliminar alguns problemas.
Na verdade, se você pode ter um mapa do site XML, você também pode. Se, no entanto, for muito caro ou exigir muitos recursos do desenvolvedor, não é crítico se o seu site for bastante pequeno e os mecanismos de pesquisa já fizerem um bom trabalho de rastreamento e indexação.
Quando usar o Sitemap HTML
O mapa do site HTML é mais útil quando a navegação de um site não é muito intuitiva ou a funcionalidade de pesquisa não é abrangente. Ele serve como uma barreira para garantir que os usuários possam encontrar páginas profundamente enterradas. Um mapa do site HTML é particularmente útil para sites maiores que possuem uma estrutura de links internos mais complicada. Também pode mostrar bem o relacionamento entre diferentes páginas, dependendo da estrutura do mapa do site. No geral, é útil tanto para usuários quanto para bots, mas só é realmente necessário quando o site está sofrendo de problemas arquitetônicos ou é excessivamente grande.
Portanto, em resumo, não existe resposta certa ou errada para a qual é mais importante. É, no entanto, muito dependente do seu site. No geral, não há mal nenhum em incluir ambos, mas pode não ser crítico fazê-lo.
Mais recursos:
Imagem destacada: Paulo Bobita/Search Engine Journal
