Maneiras especializadas de impedir que o Google indexe seu site WordPress

Publicados: 2022-12-21

Todo mundo sabe que o Google é o principal mecanismo de pesquisa. Mas há momentos em que você não deseja que seu site WordPress apareça nos resultados de pesquisa do Google.

Então, como evitar que o Google indexe uma página? Bem, existem diferentes maneiras de fazer isso. Mas nem todas as formas são adequadas para todos os sites. Qual método você escolherá dependerá de seus objetivos específicos. Nesta postagem do blog, exploraremos como impedir que o Google indexe uma página da Web, bem como seu site. Mas antes de conhecer os métodos, também é preciso entender porque as pessoas querem fazer.

Às vezes, os profissionais de marketing ou proprietários de sites obtêm tráfego orgânico em páginas que não precisam ser visitadas com frequência . Por exemplo, página de agradecimento, página de cancelamento e outras páginas menos importantes. Infelizmente, destrói um alvo específico e confunde o sistema de rastreamento. Portanto, será benéfico se você impedir que o Google veja essas páginas. Ou simplesmente desindexá-los é recomendado.

Além disso, bloquear caminhos de indexação para páginas da Web específicas pode melhorar o SEO de um site. Se você obtiver mais tráfego nas páginas principais, isso aumentará a classificação do site.

Esconder conteúdo
1 Métodos para impedir que o Google indexe seu site WordPress
1.1 Editando o arquivo Robots.TXT
1.2 Aplicação das Ferramentas do Google para webmasters
1.3 Aplicando Noindex
1.3.1 Metatag
1.3.2 Cabeçalho HTTP X-Robots-Tag
1.4 Parar manualmente no painel
1.5 Uma maneira parcialmente eficaz - não usar um mapa do site ou impedir que o Google o indexe
2 Como você pode reindexar seu site?
3 palavras finais

Métodos para impedir que o Google indexe seu site WordPress

Você pode encontrar métodos populares e específicos para impedir que o Google indexe um site WordPress. A primeira e essencial tarefa é encontrar páginas da web que não sejam importantes. Sim, ocasionalmente incluímos vários tipos de páginas para organizar ou projetar nosso site. Mas nem todos eles realmente precisam de tráfego de pesquisa, como discutimos antes.

Impedir que o Google indexe seu site

Portanto, antes de aprender as maneiras de impedir que o Google indexe um WordPress, liste as páginas. Isso o ajudará a impedir que o mecanismo de pesquisa indexe temporariamente essas páginas. E, claro, você pode organizá-los posteriormente de acordo com a necessidade. Agora, vamos aprender quais técnicas você deve seguir para controlar a indexação do site.

Editando o arquivo Robots.TXT

A edição do arquivo robots.txt ajuda a ocultar as páginas da web dos mecanismos de pesquisa. Ou, aqueles que usam um serviço de hospedagem para manter um site podem pedir para modificá-lo. É um arquivo de texto simples que suporta o padrão de exclusão de robôs. Você pode encontrar um arquivo robots.txt no domínio raiz do seu site. Você também pode editar esse arquivo sozinho e dar permissão ou bloquear qualquer rastreador para listar seu domínio ou subdomínio.

Para aplicar esta técnica: faça o download de uma cópia do arquivo robots.txt, edite-o e faça o upload novamente para o domínio raiz . O arquivo pode conter uma ou mais instruções. Por exemplo, você pode impedir que o agente do Google rastreie qualquer URL usando isso,

 User-agent: Googlebot Disallow: /nogooglebot/

Dessa forma, você também pode impedir que outros agentes indexem uma página e um site também. Lembre-se, você deve criar o arquivo chamado robots.txt. E seu site deve ter apenas um arquivo robots.txt. Existem algumas outras regras também; você pode conferir os detalhes aqui.

NOTA: Lembre-se de que você não deve usar as tags Disallow e Noindex juntas em um arquivo robots.txt.

Aplicando as Ferramentas do Google para webmasters

Este sistema suporta o bloqueio de uma página ou URL por um período fixo. As pessoas o conhecem como um Google Search Console também ajuda a manter um site em muitos aspectos. Você pode impedir facilmente que o Google indexe seu site usando a ferramenta de remoção de URLs. Para aplicar o método, verifique os itens abaixo:

  • Verifique se o seu URL está colocado na propriedade do Search Console.
  • Escolha Ocultar temporariamente e adicione o URL da página.
  • Em seguida, selecione Limpar URL do cache e remova-o da Pesquisa. Você pode copiar e colar o URL da página facilmente. Mas, às vezes, alguns URLs de páginas aninhadas podem confundir o processo. Por exemplo, URLs de várias postagens podem apontar para a mesma página como
 http://www.example.com/greenery/thread/007 http://www.example.com/greenery/post/156 http://www.example.com/greenery/thread/007?post=156

A solução é que você precisa enviar solicitações extras de remoção. Para cada conteúdo que você visualizar, você enviará uma solicitação de remoção.

NOTA: Não se esqueça que é um método de bloqueio de página temporário. Dura apenas cerca de seis meses.

Aplicando Noindex

Você pode aplicar esse método de duas maneiras . Primeiro, aprenda a implementação abaixo e selecione qualquer método de acordo com sua conveniência.

Metatag

Há também duas maneiras de usar uma meta tag. Para impedir que a maioria dos mecanismos de pesquisa indexe uma página, basta colocar a seguinte metatag na parte <head> da sua página.

 <meta name="robots" content="noindex">

E se você deseja impedir que apenas os rastreadores da Web do Google indexem uma página, use-

 <meta name="googlebot" content="noindex">

Além disso, você pode impedir que uma página seja listada adicionando uma meta tag nofollow . É bastante simples especificar o link-

 <a href="example.html" rel="nofollow" />

Além disso, você pode adicioná-lo a todas as páginas para impedir que o Google indexe seu site.

 <meta name="googlebot" content="noindex, nofollow">

Cabeçalho HTTP X-Robots-Tag

Esta é uma forma alternativa de usar meta tags. Você pode selecionar uma meta tag ou esta X-Robots-Tag. Você pode escolher um X-Robots-Tag para qualquer URL para funcionar como uma instrução de cabeçalho HTTP. Usando esse método simples, você pode impedir que o Google indexe arquivos não HTML. Arquivos de imagens, vídeos, PDFs, etc., não são arquivos HTML. Uma diretiva de metatag de robôs funciona da mesma forma para um X-Robots-Tag também. Um cabeçalho HTTP X-Robots-Tag pode ter noindex ou nenhuma instrução, ficando assim,

 HTTP/1.1 200 OK Date: Wed, 14 August 2022 20:42:40 GMT (…) X-Robots-Tag: noindex (…)

Se você não deseja que o Google gere uma página em cache, aplique este código noarchive X-Robots-Tag com um unavailable_after X-Robots-Tag.

 HTTP/1.1 200 OK Date: Wed, 14 August 2022 20:42:40 GMT (…) X-Robots-Tag: noarchive X-Robots-Tag: unavailable_after: 25 Jun 2010 15:00:00 PST (…)

Novamente, você pode colocar condições em um conjunto de X-Robots-Tag para tornar uma página visível. E pode funcionar para diferentes mecanismos de pesquisa.

Parar manualmente no painel

Muitas pessoas não sabem que impedir que os mecanismos de pesquisa classifiquem um site também é possível no painel do WordPress. Talvez muitos de vocês vejam a opção, mas não saibam exatamente sua finalidade. Por exemplo, se seu site é novo, você tem muitas tarefas de última hora para concluir e precisa de tempo. Você não vai querer que os mecanismos de pesquisa listem esse site nesse caso. Portanto, este método é adequado para você.

Acesse seu painel: Configurações → Leitura → Localizar Visibilidade do mecanismo de pesquisa → Marque a caixa de seleção

Você pode parar de indexar o seu site no painel do WordPress.

Essa pequena tarefa pode manter seu conteúdo privado. Na verdade, ele modifica o arquivo robots.txt e, às vezes, adiciona uma metatag relacionada ao cabeçalho. Assim, marcar a caixa impede que o Google identifique o site.

OBSERVAÇÃO: as pessoas geralmente se esquecem de desmarcar a caixa quando colocam o site no ar. Deixar a caixa desmarcada por mais tempo tornará o site invisível para o Google e nunca será classificado.

Uma maneira parcialmente eficaz - não usar um mapa do site ou impedir que o Google o indexe

Um mapa do site ajuda o Googlebot a identificar páginas e classificar o site WordPress. Ele contém todas as URLs das páginas de um site. Além disso, no processo de rastreamento do mecanismo de pesquisa, os sitemaps ajudam a encontrar novas páginas. Portanto, um mecanismo de pesquisa tem poucas chances de perder algum conteúdo. Se você deseja que os mecanismos de pesquisa ignorem seu novo site por algum tempo, não adicione um XML_sitemap.

No entanto, os sitemaps não garantem que o Google sempre indexe todas as páginas. Depende de várias outras coisas também. Mas você pode desacelerar o processo de indexação do mecanismo de pesquisa não usando um mapa do site.

Novamente, se você já incluiu um ou mais XML_sitemaps, pode impedir que o Google indexe os arquivos. Você pode usar um plugin e também editar o arquivo .htaccess do seu site.

Usando um plug-in para impedir a indexação do mapa do site do Google - Existem diferentes plug-ins para SEO hoje. Alguns têm opções de indexação de sitemap, como Yoast SEO, Rank Math e outros. Se o seu site tiver um plug-in de SEO, você pode procurar a opção e desligá-la. Veja o exemplo abaixo,

Você pode usar um plug-in para impedir que o Google indexe seu site.

Editando o arquivo .htaccess para impedir a indexação do mapa do site do Google- Você só precisa adicionar um X-Robots-Tag às respostas HTTP do seu site através dos arquivos de configuração. Você pode usar X-Robots-Tag: noindex para interromper a indexação do mapa do site pelo Google.

Para um arquivo de mapa do site, o código é,

 <IfModule mod_rewrite.c> <Files sitemap.xml> Header set X-Robots-Tag "noindex" </Files> </IfModule>

Para mais de um arquivo de sitemap, o código é,

 <IfModule mod_rewrite.c> <Files ~ "^(sitemap1|sitemap2|sitemap3)\\.xml$"> Header set X-Robots-Tag "noindex" </Files> </IfModule>

Agora, o Google ou outros mecanismos de pesquisa não encontrarão o XML_sitemaps e o indexarão. Como um mapa do site possui URLs de todas as páginas da Web, ocultá-lo dos mecanismos de pesquisa ajudará a não indexar o site.

Faça a manutenção regular do site implementando o redirecionamento 307 no site WordPress!

Como você pode reindexar seu site?

A reindexação é importante para classificar seu site WordPress no Google.

Bem, você não pode ignorar a importância da classificação do Google de um site WordPress. Você tem que promover seu site e atrair novo tráfego. Então, depois de terminar as tarefas restantes de construção do site e bloquear o Google para indexar certas páginas da web, você precisa trabalhar em SEO. E um bom SEO significa indexar e reindexar as páginas da web.

  1. Desmarque a caixa Visibilidade do mecanismo de pesquisa em seu painel
  2. Verifique o diretório raiz do site se você adicionou por engano qualquer comando Noindex e bloco Robots.txt a qualquer página importante.
  3. Se você conscientemente adicionou instruções aos bots para não indexar conteúdo ou página e agora deseja reindexar, repita o número dois com cuidado.
  4. Adicione um XML_sitemap ao seu site WordPress.
  5. Se você estiver usando um plug-in para impedir que o Google indexe seu sitemap, desinstale-o ou ative apenas a opção de indexação XML_sitemap .
  6. O Google Search Console possui uma ferramenta de inspeção de URL. Você pode gerar um relatório de URL geral usando-o para verificar o que o Google vê. Aqui, você pode inspecionar um URL específico, também enviar um URL e solicitar um índice ao Google.
  7. Por fim, faça SEO regular e bom para suas páginas reindexadas e aumente o tráfego geral do seu site.

Você sabe por que as pessoas às vezes precisam excluir o título de uma página?

Veja aqui Removendo o título da página no WordPress

palavras de acabamento

Estas são algumas maneiras de impedir que o Google indexe seu site. Selecione seu método com sabedoria e aplique-o ao seu site WordPress. No entanto, geralmente, os proprietários de sites lutam para indexar seus sites. As pessoas não entendem que muito SEO é ruim e não devem exagerar. Muitas pessoas nem sabem a importância e os motivos para desindexar uma página. O fato real é que você deve impedir que os mecanismos de pesquisa indexem seu site às vezes para obter mais tráfego. No entanto, este artigo é sobre indexação, desindexação e reindexação de páginas da web. Espero que você aprenda os fatos principais e os aplique de acordo.