Des moyens d'experts pour empêcher Google d'indexer votre site WordPress
Publié: 2022-12-21Tout le monde sait que Google est le premier moteur de recherche. Mais il y a des moments où vous ne voulez pas que votre site WordPress apparaisse dans les résultats de recherche de Google.
Alors, comment empêcher Google d'indexer une page ? Eh bien, il existe différentes façons de le faire. Mais tous les moyens ne conviennent pas à tous les sites Web. La méthode que vous choisirez dépendra de vos objectifs spécifiques. Dans cet article de blog, nous verrons comment empêcher Google d'indexer une page Web ainsi que votre site Web. Mais avant de connaître les méthodes, il faut aussi comprendre pourquoi les gens veulent le faire.
Parfois, les spécialistes du marketing ou les propriétaires de sites Web obtiennent du trafic organique sur des pages qui n'ont pas besoin d'être visitées fréquemment . Par exemple, la page de remerciement, la page d'annulation et d'autres pages moins importantes. Malheureusement, il détruit une cible particulière et confond le système de suivi. Il sera donc avantageux que vous empêchiez Google de voir ces pages. Ou simplement les désindexer est recommandé.
En outre, le blocage des chemins d'indexation pour des pages Web spécifiques peut améliorer le référencement d'un site. Si vous obtenez plus de trafic sur les pages principales, cela augmentera le classement du site.
Méthodes pour empêcher Google d'indexer votre site WordPress
Vous pouvez trouver des méthodes populaires et spécifiques pour empêcher Google d'indexer un site Web WordPress. La première tâche essentielle est de trouver des pages Web qui ne sont pas importantes. Oui, nous incluons de temps à autre divers types de pages pour organiser ou concevoir notre site Web. Mais, tous n'ont pas réellement besoin de trafic de recherche, comme nous en avons discuté précédemment.
Donc, avant d'apprendre les moyens d'empêcher Google d'indexer un WordPress, listez les pages. Cela vous aidera à empêcher le moteur de recherche d'indexer temporairement ces pages. Et bien sûr, vous pourrez ensuite les organiser selon vos besoins. Voyons maintenant quelles techniques vous devez suivre pour contrôler l'indexation des sites Web.
Modification du fichier Robots.Txt
La modification du fichier robots.txt permet de masquer les pages Web des moteurs de recherche. Ou, ceux qui utilisent un service d'hébergement pour maintenir un site peuvent leur demander de le modifier. Il s'agit d'un fichier texte brut qui prend en charge la norme d'exclusion des robots. Vous pouvez trouver un fichier robots.txt dans le domaine racine de votre site. Vous pouvez également modifier ce fichier par vous-même et autoriser ou bloquer tout robot d'exploration pour répertorier votre domaine ou sous-domaine.
Pour appliquer cette technique : téléchargez une copie de votre fichier robots.txt, modifiez-le, puis importez-le à nouveau dans le domaine racine . Le fichier peut contenir une ou plusieurs instructions. Par exemple, vous pouvez empêcher l'agent Google d'explorer n'importe quelle URL en utilisant ceci,
User-agent: Googlebot Disallow: /nogooglebot/
De cette façon, vous pouvez également empêcher d'autres agents d'indexer une page et un site Web également. N'oubliez pas que vous devez créer le fichier nommé robots.txt. Et votre site ne doit avoir qu'un seul fichier robots.txt. Il existe également d'autres règles; vous pouvez vérifier les détails ici.
REMARQUE : N'oubliez pas que vous ne devez pas utiliser les balises Disallow et Noindex ensemble dans un fichier robots.txt.
Application des outils Google pour les webmasters
Ce système prend en charge le blocage d'une page ou d'une URL pendant une période déterminée. Les gens le savent car une console de recherche Google aide également à maintenir un site à bien des égards. Vous pouvez facilement empêcher Google d'indexer votre site à l'aide de son outil de suppression d'URL. Pour appliquer la méthode, vérifiez les éléments ci-dessous :
- Vérifiez que votre URL est placée dans la propriété Search Console.
- Choisissez Masquer temporairement et ajoutez l'URL de la page.
- Ensuite, sélectionnez Effacer l'URL du cache et supprimez-la de la recherche. Vous pouvez facilement copier et coller l'URL de la page. Mais, parfois, certaines URL de page imbriquées peuvent confondre le processus. Par exemple, les URL de plusieurs messages peuvent pointer vers la même page comme-
http://www.example.com/greenery/thread/007 http://www.example.com/greenery/post/156 http://www.example.com/greenery/thread/007?post=156
La solution est que vous devez soumettre des demandes de suppression supplémentaires. Pour chaque contenu que vous voyez, vous soumettez une demande de suppression.
REMARQUE : N'oubliez pas qu'il s'agit d'une méthode de blocage de page temporaire. Cela ne dure que six mois environ.
Appliquer Noindex
Vous pouvez appliquer cette méthode de deux manières . Tout d'abord, apprenez la mise en œuvre ci-dessous et sélectionnez n'importe quelle méthode selon votre convenance.
Balise méta
Il existe également deux façons d'utiliser une balise META. Pour empêcher la plupart des moteurs de recherche d'indexer une page, insérez simplement la balise META suivante dans la partie <head> de votre page.
<meta name="robots" content="noindex">
Et si vous souhaitez empêcher uniquement les robots d'indexation Google d'indexer une page, utilisez-
<meta name="googlebot" content="noindex">
De plus, vous pouvez empêcher une page d'être listée en ajoutant une balise meta nofollow . Il est assez simple de spécifier le lien-
<a href="example.html" rel="nofollow" />
De plus, vous pouvez l'ajouter à toutes les pages pour empêcher Google d'indexer votre site.
<meta name="googlebot" content="noindex, nofollow">
En-tête HTTP X-Robots-Tag
Il s'agit d'une autre façon d'utiliser les balises META. Vous pouvez sélectionner une balise meta ou cette X-Robots-Tag. Vous pouvez choisir un X-Robots-Tag pour que n'importe quelle URL fonctionne comme une instruction d'en-tête HTTP. En utilisant cette méthode simple, vous pouvez empêcher Google d'indexer des fichiers non HTML. Les fichiers d'images, de vidéos, de PDF, etc., sont des fichiers non HTML. Une directive de balise meta robots fonctionne de la même manière pour un X-Robots-Tag également. Un en-tête HTTP X-Robots-Tag peut avoir aucune instruction ou aucune instruction, ressemblant à ceci,
HTTP/1.1 200 OK Date: Wed, 14 August 2022 20:42:40 GMT (…) X-Robots-Tag: noindex (…)
Si vous ne voulez pas que Google génère une page en cache, appliquez ce code noarchive X-Robots-Tag avec un unavailable_after X-Robots-Tag.
HTTP/1.1 200 OK Date: Wed, 14 August 2022 20:42:40 GMT (…) X-Robots-Tag: noarchive X-Robots-Tag: unavailable_after: 25 Jun 2010 15:00:00 PST (…)
Encore une fois, vous pouvez mettre des conditions à un ensemble de X-Robots-Tag pour rendre une page visible. Et cela peut fonctionner pour différents moteurs de recherche.
Arrêter manuellement à partir du tableau de bord
Beaucoup de gens ne savent pas qu'empêcher les moteurs de recherche de classer un site est également possible depuis le tableau de bord WordPress. Peut-être que beaucoup d'entre vous voient l'option mais ne connaissent pas exactement son objectif. Par exemple, si votre site Web est nouveau, vous avez beaucoup de tâches de dernière minute à terminer et vous avez besoin de temps. Vous ne voudrez pas que les moteurs de recherche répertorient ce site dans ce cas. Alors, cette méthode vous convient.
Accédez à votre tableau de bord : Paramètres → Lecture → Rechercher Visibilité du moteur de recherche → Cochez la case
Cette petite tâche peut garder votre contenu privé. Il modifie en fait le fichier robots.txt et ajoute parfois une balise méta associée à l'en-tête. Ainsi, cocher la case empêche Google d'identifier le site.
REMARQUE : Les utilisateurs oublient souvent de décocher la case lorsqu'ils mettent le site en ligne. Si vous ne cochez pas la case plus longtemps, le site sera invisible pour Google et il ne sera jamais classé.
Un moyen partiellement efficace - ne pas utiliser de sitemap ou empêcher Google de l'indexer
Un sitemap aide Googlebot à identifier les pages et à classer le site WordPress. Il contient toutes les URL des pages d'un site. De plus, dans le processus d'exploration des moteurs de recherche, les sitemaps aident à trouver de nouvelles pages. Ainsi, un moteur de recherche a peu de chances de manquer du contenu. Si vous souhaitez que les moteurs de recherche ignorent votre nouveau site pendant un certain temps, n'ajoutez pas de XML_sitemap.
Cependant, les sitemaps ne garantissent pas que Google indexera toujours toutes les pages. Cela dépend de diverses autres choses aussi. Cependant, vous pouvez ralentir le processus d'indexation des moteurs de recherche en n'utilisant pas de sitemap.
Encore une fois, si vous avez déjà inclus un ou plusieurs XML_sitemaps, vous pouvez empêcher Google d'indexer les fichiers. Vous pouvez utiliser un plugin et également modifier le fichier .htaccess de votre site.
Utilisation d'un plugin pour empêcher Google d'indexer le sitemap - Il existe aujourd'hui différents plugins pour le référencement. Certains ont des options d'indexation de sitemap comme Yoast SEO, Rank Math et autres. Si votre site a un plugin SEO, vous pouvez rechercher l'option et la désactiver. Voir l'exemple ci-dessous,
Modification du fichier .htaccess pour empêcher Google d'indexer le sitemap - Il vous suffit d'ajouter un X-Robots-Tag aux réponses HTTP de votre site via les fichiers de configuration. Vous pouvez utiliser X-Robots-Tag: noindex pour empêcher Google d'indexer le sitemap.
Pour un fichier sitemap, le code est,
<IfModule mod_rewrite.c> <Files sitemap.xml> Header set X-Robots-Tag "noindex" </Files> </IfModule>
Pour plus d'un fichier sitemap, le code est,
<IfModule mod_rewrite.c> <Files ~ "^(sitemap1|sitemap2|sitemap3)\\.xml$"> Header set X-Robots-Tag "noindex" </Files> </IfModule>
Désormais, Google ou d'autres moteurs de recherche ne trouveront pas les XML_sitemaps et ne les indexeront pas. Étant donné qu'un sitemap contient les URL de toutes les pages Web, le cacher des moteurs de recherche aidera à ne pas indexer le site Web.
Effectuez une maintenance régulière du site Web en implémentant la redirection 307 sur le site Web WordPress !
Comment ré-indexer votre site Web ?
Eh bien, vous ne pouvez pas ignorer l'importance du classement Google d'un site WordPress. Vous devez promouvoir votre site et attirer de nouveaux visiteurs. Ainsi, après avoir terminé les tâches de création de sites Web restantes et bloqué Google pour indexer certaines pages Web, vous devez travailler sur le référencement. Et un bon référencement signifie indexer et réindexer les pages Web.
- Décochez la case Visibilité du moteur de recherche de votre tableau de bord
- Vérifiez le répertoire racine du site si vous avez ajouté par erreur une commande Noindex et un bloc Robots.txt à une page importante.
- Si vous avez consciemment ajouté des instructions aux bots pour ne pas indexer le contenu ou la page et que vous souhaitez maintenant réindexer, répétez attentivement le numéro deux.
- Ajoutez un XML_sitemap à votre site Web WordPress.
- Si vous utilisez un plug-in pour empêcher Google d'indexer votre sitemap, désinstallez-le ou activez uniquement l'option d'indexation XML_sitemap .
- Google Search Console dispose d'un outil d'inspection d'URL. Vous pouvez générer un rapport d'URL global en l'utilisant pour vérifier ce que Google voit. Ici, vous pouvez inspecter une URL spécifique, soumettre également une URL et demander un index à Google.
- Enfin, faites un référencement régulier et bon pour vos pages réindexées et augmentez le trafic global de votre site Web.
Savez-vous pourquoi les gens ont parfois besoin de supprimer un titre de page ?
Regardez ici Suppression du titre de la page dans WordPress
Mots de finition
Voici quelques moyens d'empêcher Google d'indexer votre site. Sélectionnez judicieusement votre méthode et appliquez-la à votre site WordPress. Cependant, généralement, les propriétaires de sites Web ont du mal à indexer leurs sites. Les gens ne comprennent pas que trop de référencement est mauvais, et ils ne doivent pas en faire trop. Beaucoup de gens ne connaissent même pas l'importance et les raisons de désindexer une page. Le fait est que vous devez parfois empêcher les moteurs de recherche d'indexer votre site pour obtenir plus de trafic. Cependant, cet article concerne l'indexation, la désindexation et la réindexation des pages Web. J'espère que vous apprendrez les principaux faits et que vous les appliquerez en conséquence.