O Google diz que poderia fazer sentido usar o cabeçalho NoIndex com llms.txt

O Google diz que poderia fazer sentido usar o cabeçalho NoIndex com llms.txt


John Mueller, do Google, respondeu a uma pergunta sobre o LLMS.txt relacionado ao conteúdo duplicado, afirmando que não faz sentido que isso seria visto como conteúdo duplicado, mas ele também afirmou que poderia fazer sentido tomar medidas para evitar a indexação.

Llms.txt

O LLMS.txt é uma proposta para criar um novo padrão de formato de conteúdo que os grandes modelos de idiomas possam usar para recuperar o conteúdo principal de uma página da Web sem ter que lidar com outros dados que não sejam de conteúdo, como publicidade, navegação e qualquer outra coisa que não seja o conteúdo principal. Ele oferece aos editores da Web a capacidade de fornecer uma versão com curadoria e formatada por marcação do conteúdo mais importante. O arquivo llms.txt fica no nível raiz de um site (exemplo.com/llms.txt).

Ao contrário de algumas reivindicações feitas sobre llms.txt, não é de forma semelhante ao robots.txt. O objetivo do robots.txt é controlar o comportamento do robô, enquanto o objetivo do llms.txt é fornecer conteúdo a grandes modelos de idiomas.

O Google View llms.txt como conteúdo duplicado?

Alguém no Bluesky perguntou se o llms.txt poderia ser visto pelo Google como conteúdo duplicado, o que é uma boa pergunta. Pode acontecer que alguém fora do site possa vincular o llms.txt e que o Google possa começar a aparecer esse conteúdo em vez ou além do conteúdo HTML.

Esta é a pergunta feita:

“Os arquivos do Google View LLMs.txt como conteúdo duplicado? Parece rígido pescoço para fazê -lo, já que eles sabem que não é e para que serve.

Devo adicionar um cabeçalho “noindex” para llms.txt para o googlebot? “

John Mueller respondeu:

“Seria apenas conteúdo duplicado se o conteúdo fosse o mesmo que uma página HTML, o que não faria sentido (assumindo que o próprio arquivo fosse útil).

Dito isto, o uso do Noindex poderia fazer sentido, pois os sites poderiam vincular -se a ele e, de outra forma, poderia se tornar indexado, o que seria estranho para os usuários. ”

Noindex para llms.txt

Usar um cabeçalho noindex para o llms.txt é uma boa ideia, pois impedirá que o conteúdo insira o índice do Google. Usar um robots.txt para bloquear o Google não é necessário, pois isso apenas impedirá o Google de rastejar o arquivo que impedirá que ele veja o NoIndex.

Imagem em destaque de shutterstock/krakenimages.com



Source link

Postagens Similares

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *