Formas expertas de evitar que Google indexe su sitio de WordPress

Publicado: 2022-12-21

Todo el mundo sabe que Google es el motor de búsqueda líder. Pero hay ocasiones en las que no desea que su sitio de WordPress aparezca en los resultados de búsqueda de Google.

Entonces, ¿cómo evitar que Google indexe una página? Bueno, hay diferentes maneras de hacerlo. Pero no todas las formas son adecuadas para todos los sitios web. El método que elija dependerá de sus objetivos específicos. En esta publicación de blog, exploraremos cómo evitar que Google indexe una página web además de su sitio web. Pero antes de conocer los métodos, también es necesario entender por qué la gente quiere hacerlo.

A veces, los vendedores o propietarios de sitios web obtienen tráfico orgánico en páginas que no necesitan ser visitadas con frecuencia . Por ejemplo, la página de agradecimiento, la página de cancelación y otras páginas menos importantes. Desafortunadamente, destruye un objetivo en particular y confunde el sistema de seguimiento. Por lo tanto, será beneficioso si bloquea a Google para que no vea estas páginas. O simplemente se recomienda desindexarlos.

Además, el bloqueo de rutas de indexación para páginas web específicas puede mejorar el SEO de un sitio. Si obtiene más tráfico en las páginas principales, entonces aumentará la clasificación del sitio.

ocultar contenido
1 métodos para evitar que Google indexe su sitio de WordPress
1.1 Editando el archivo Robots.Txt
1.2 Aplicación de las Herramientas para webmasters de Google
1.3 Aplicando Noindex
1.3.1 Metaetiqueta
1.3.2 Encabezado HTTP de la etiqueta X-Robots
1.4 Detener manualmente desde el panel
1.5 Una forma parcialmente efectiva: no usar un mapa del sitio o evitar que Google lo indexe
2 ¿Cómo puede volver a indexar su sitio web?
3 palabras finales

Métodos para evitar que Google indexe su sitio de WordPress

Puede encontrar métodos populares y específicos para evitar que Google indexe un sitio web de WordPress. La primera y fundamental tarea es encontrar páginas web que no sean importantes. Sí, incluimos varios tipos de páginas de vez en cuando para organizar o diseñar nuestro sitio web. Pero, no todos ellos realmente necesitan tráfico de búsqueda, como discutimos antes.

Evite que Google indexe su sitio

Entonces, antes de aprender las formas de evitar que Google indexe un WordPress, enumere las páginas. Le ayudará a evitar que el motor de búsqueda indexe temporalmente esas páginas. Y, por supuesto, luego puede organizarlos según la necesidad. Ahora, aprendamos qué técnicas debe seguir para controlar la indexación del sitio web.

Editando el archivo Robots.Txt

La edición del archivo robots.txt ayuda a ocultar las páginas web de los motores de búsqueda. O bien, aquellos que usan un servicio de alojamiento para mantener un sitio pueden pedirles que lo modifiquen. Es un archivo de texto sin formato compatible con el estándar de exclusión de robots. Puede encontrar un archivo robots.txt en el dominio raíz de su sitio. También puede editar este archivo usted mismo y otorgar permiso o bloquear cualquier rastreador para enumerar su dominio o subdominio.

Para aplicar esta técnica: descargue una copia de su archivo robots.txt, edítelo y luego súbalo nuevamente al dominio raíz . El archivo puede contener una o más instrucciones. Por ejemplo, puede impedir que el agente de Google rastree cualquier URL usando esto,

 User-agent: Googlebot Disallow: /nogooglebot/

De esta manera, también puede evitar que otros agentes indexen una página y un sitio web. Recuerda, tienes que crear el archivo llamado robots.txt. Y su sitio debe tener solo un archivo robots.txt. También hay algunas otras reglas; Puedes consultar los detalles aquí.

NOTA: Recuerde que no debe usar las etiquetas Disallow y Noindex juntas en un archivo robots.txt.

Aplicación de las herramientas para webmasters de Google

Este sistema admite el bloqueo de una página o URL por un período fijo. La gente lo conoce como una consola de búsqueda de Google que también ayuda a mantener un sitio en muchos aspectos. Puede evitar fácilmente que Google indexe su sitio utilizando su herramienta de eliminación de URL. Para aplicar el método, verifique lo siguiente:

  • Compruebe que su URL se coloca en la propiedad de Search Console.
  • Elija Ocultar temporalmente y agregue la URL de la página.
  • A continuación, seleccione Borrar URL del caché y elimínelo de la Búsqueda. Puede copiar y pegar la URL de la página fácilmente. Pero, a veces, algunas URL de páginas anidadas pueden confundir el proceso. Por ejemplo, las URL de varias publicaciones pueden apuntar a la misma página como:
 http://www.example.com/greenery/thread/007 http://www.example.com/greenery/post/156 http://www.example.com/greenery/thread/007?post=156

La solución es que debe enviar solicitudes de eliminación adicionales. Por cada contenido que vea, enviará una solicitud de eliminación.

NOTA: No olvide que es un método de bloqueo de página temporal. Solo dura unos seis meses.

Aplicando Noindex

Puede aplicar este método de dos maneras . Primero, aprenda la implementación a continuación y seleccione cualquier método según su conveniencia.

Metaetiqueta

También hay dos formas de usar una metaetiqueta. Para evitar que la mayoría de los motores de búsqueda indexen una página, simplemente coloque la siguiente metaetiqueta en la parte <head> de su página:

 <meta name="robots" content="noindex">

Y si desea evitar que solo los rastreadores web de Google indexen una página, use-

 <meta name="googlebot" content="noindex">

Además, puede evitar que una página aparezca en la lista agregando una metaetiqueta nofollow . Es bastante simple especificar el vínculo.

 <a href="example.html" rel="nofollow" />

Además, puede agregarlo a todas las páginas para evitar que Google indexe su sitio.

 <meta name="googlebot" content="noindex, nofollow">

Encabezado HTTP X-Robots-Tag

Esta es una forma alternativa de usar metaetiquetas. Puede seleccionar una etiqueta meta o esta etiqueta X-Robots. Puede elegir una etiqueta X-Robots para que cualquier URL funcione como una instrucción de encabezado HTTP. Usando este método simple, puede bloquear a Google para que no indexe archivos que no sean html. Los archivos de imágenes, videos, PDF, etc., son archivos que no son HTML. Una directiva de metaetiqueta de robots funciona igual para una etiqueta X-Robots. Un encabezado HTTP X-Robots-Tag puede no tener índice o ninguna instrucción, luciendo así,

 HTTP/1.1 200 OK Date: Wed, 14 August 2022 20:42:40 GMT (…) X-Robots-Tag: noindex (…)

Si no desea que Google genere una página en caché, aplique este código noarchive X-Robots-Tag con una etiqueta X-Robots-undisponible_después.

 HTTP/1.1 200 OK Date: Wed, 14 August 2022 20:42:40 GMT (…) X-Robots-Tag: noarchive X-Robots-Tag: unavailable_after: 25 Jun 2010 15:00:00 PST (…)

Nuevamente, puede poner condiciones a un conjunto de X-Robots-Tag para hacer que una página sea visible. Y puede funcionar para diferentes motores de búsqueda.

Detener manualmente desde el panel

Mucha gente no sabe que evitar que los motores de búsqueda clasifiquen un sitio también es posible desde el panel de control de WordPress. Tal vez, muchos de ustedes vean la opción pero no sepan exactamente su propósito. Por ejemplo, si su sitio web es nuevo, tiene muchas tareas de última hora para terminar y necesita tiempo. En este caso, no querrá que los motores de búsqueda incluyan ese sitio. Por lo tanto, este método es adecuado para usted.

Accede a tu panel de control: Configuración → Lectura → Buscar Visibilidad del motor de búsqueda → Hacer Check marca la casilla

Puede detener la indexación de su sitio por parte de Google desde su panel de control de WordPress.

Esta pequeña tarea puede mantener tu contenido privado. En realidad, modifica el archivo robots.txt y, a veces, agrega una metaetiqueta relacionada al encabezado. Por lo tanto, marcar la casilla evita que Google identifique el sitio.

NOTA: Las personas a menudo se olvidan de desmarcar la casilla cuando activan el sitio. Dejar la casilla sin marcar durante más tiempo hará que el sitio sea invisible para Google y nunca se clasificará.

Una forma parcialmente efectiva: no usar un mapa del sitio o evitar que Google lo indexe

Un mapa del sitio ayuda a Googlebot a identificar páginas y clasificar el sitio web de WordPress. Contiene todas las URL de las páginas de un sitio. Además, en el proceso de rastreo del motor de búsqueda, los mapas de sitio ayudan a encontrar nuevas páginas. Por lo tanto, un motor de búsqueda tiene pocas posibilidades de perder contenido. Si desea que los motores de búsqueda pasen por alto su nuevo sitio durante algún tiempo, no agregue un XML_sitemap.

Sin embargo, los sitemaps no garantizan que Google indexe siempre todas las páginas. Depende de varias otras cosas también. Sin embargo, puede ralentizar el proceso de indexación del motor de búsqueda al no utilizar un mapa del sitio.

Nuevamente, si ya ha incluido uno o más XML_sitemaps, puede evitar que Google indexe los archivos. Puede usar un complemento y también editar el archivo .htaccess de su sitio.

Uso de un complemento para evitar que Google indexe el mapa del sitio: hoy en día existen diferentes complementos para SEO. Algunos tienen opciones de indexación de mapas de sitios como Yoast SEO, Rank Math y otros. Si su sitio tiene un complemento SEO, puede buscar la opción y desactivarlo. Vea el ejemplo a continuación,

Puede usar un complemento para evitar que Google indexe su sitio.

Edición del archivo .htaccess para evitar que Google indexe el mapa del sitio : solo tiene que agregar una etiqueta X-Robots a las respuestas HTTP de su sitio a través de los archivos de configuración. Puede usar X-Robots-Tag: noindex para evitar que Google indexe el mapa del sitio.

Para un archivo de mapa del sitio, el código es,

 <IfModule mod_rewrite.c> <Files sitemap.xml> Header set X-Robots-Tag "noindex" </Files> </IfModule>

Para más de un archivo de mapa del sitio, el código es,

 <IfModule mod_rewrite.c> <Files ~ "^(sitemap1|sitemap2|sitemap3)\\.xml$"> Header set X-Robots-Tag "noindex" </Files> </IfModule>

Ahora, Google u otros motores de búsqueda no encontrarán los XML_sitemaps ni los indexarán. Dado que un mapa del sitio tiene URL de todas las páginas web, ocultarlo de los motores de búsqueda ayudará a no indexar el sitio web.

¡Haga un mantenimiento regular del sitio web implementando la redirección 307 en el sitio web de WordPress!

¿Cómo puede volver a indexar su sitio web?

La reindexación es importante para clasificar su sitio de WordPress en Google.

Bueno, no puedes ignorar la importancia del ranking de Google de un sitio de WordPress. Tienes que promocionar tu sitio y atraer nuevo tráfico. Entonces, después de terminar las tareas sobrantes de creación de sitios web y bloquear a Google para indexar ciertas páginas web, debe trabajar en SEO. Y un buen SEO significa indexar y reindexar las páginas web.

  1. Desmarque la casilla Visibilidad del motor de búsqueda desde su tablero
  2. Verifique el directorio raíz del sitio si agregó por error algún comando Noindex y el bloque Robots.txt a cualquier página importante.
  3. Si agregó conscientemente instrucciones a los bots para no indexar el contenido o la página y ahora desea volver a indexar, repita el número dos con cuidado.
  4. Agregue un XML_sitemap a su sitio web de WordPress.
  5. Si está utilizando un complemento para evitar que Google indexe su mapa del sitio, desinstálelo o active solo la opción de indexación XML_sitemap .
  6. Google Search Console tiene una herramienta de inspección de URL. Puede generar un informe general de URL utilizándolo para verificar lo que ve Google. Aquí, puede inspeccionar una URL específica, también enviar una URL y solicitar un índice a Google.
  7. Finalmente, haga un buen SEO regular para sus páginas reindexadas y aumente el tráfico general de su sitio web.

¿Sabes por qué las personas a veces necesitan eliminar el título de una página?

Mire aquí Eliminar el título de la página en WordPress

palabras de acabado

Estas son algunas formas de evitar que Google indexe su sitio. Seleccione su método sabiamente y aplíquelo a su sitio de WordPress. Sin embargo, en general, los propietarios de sitios web tienen dificultades para indexar sus sitios. La gente no entiende que demasiado SEO es malo, y no deben exagerar. Mucha gente ni siquiera sabe la importancia y las razones para desindexar una página. El hecho real es que debe evitar que los motores de búsqueda indexen su sitio a veces para obtener más tráfico. Sin embargo, este artículo trata sobre la indexación, desindexación y reindexación de páginas web. Espero que aprenda los hechos principales y los aplique en consecuencia.