Modi esperti per impedire a Google di indicizzare il tuo sito WordPress
Pubblicato: 2022-12-21Tutti sanno che Google è il principale motore di ricerca. Ma ci sono momenti in cui non vuoi che il tuo sito WordPress venga visualizzato nei risultati di ricerca di Google.
Quindi, come impedire a Google di indicizzare una pagina? Bene, ci sono diversi modi per farlo. Ma non tutti i modi sono adatti a tutti i siti web. Il metodo che scegli dipenderà dai tuoi obiettivi specifici. In questo post del blog, esploreremo come impedire a Google di indicizzare una pagina web e il tuo sito web. Ma prima di conoscere i metodi, bisogna anche capire perché le persone vogliono farlo.
A volte gli operatori di marketing o i proprietari di siti Web ottengono traffico organico su pagine che non devono essere visitate frequentemente . Ad esempio, la pagina di ringraziamento, la pagina Annulla e altre pagine meno importanti. Sfortunatamente, distrugge un particolare obiettivo e confonde il sistema di tracciamento. Quindi, sarà vantaggioso impedire a Google di vedere queste pagine. Oppure si consiglia semplicemente di deindizzarli.
Inoltre, il blocco dei percorsi di indicizzazione per pagine Web specifiche può migliorare la SEO di un sito. Se ottieni più traffico sulle pagine principali, aumenterà il ranking del sito.
Metodi per impedire a Google di indicizzare il tuo sito WordPress
Puoi trovare metodi popolari e specifici per impedire a Google di indicizzare un sito Web WordPress. Il primo ed essenziale compito è trovare pagine web che non sono importanti. Sì, di tanto in tanto includiamo vari tipi di pagine per organizzare o progettare il nostro sito web. Ma non tutti hanno effettivamente bisogno di traffico di ricerca, come abbiamo discusso in precedenza.
Quindi, prima di imparare i modi per impedire a Google di indicizzare un WordPress, elenca le pagine. Ti aiuterà a impedire al motore di ricerca di indicizzare temporaneamente quelle pagine. E, naturalmente, puoi sistemarli in seguito secondo necessità. Ora impariamo quali tecniche dovresti seguire per controllare l'indicizzazione del sito web.
Modifica del file Robots.Txt
La modifica del file robots.txt aiuta a nascondere le pagine web dai motori di ricerca. Oppure, chi utilizza un servizio di hosting per mantenere un sito può chiedergli di modificarlo. È un file di testo semplice che supporta Robots Exclusion Standard. Puoi trovare un file robots.txt nel dominio principale del tuo sito. Puoi anche modificare questo file da solo e autorizzare o bloccare qualsiasi crawler per elencare il tuo dominio o sottodominio.
Per applicare questa tecnica: scarica una copia del file robots.txt, modificalo e caricalo nuovamente nel dominio principale . Il file può contenere una o più istruzioni. Ad esempio, puoi impedire all'agente di Google di eseguire la scansione di qualsiasi URL utilizzando questo,
User-agent: Googlebot Disallow: /nogooglebot/
In questo modo, puoi anche impedire ad altri agenti di indicizzare una pagina e anche un sito web. Ricorda, devi creare il file chiamato robots.txt. E il tuo sito deve avere un solo file robots.txt. Ci sono anche altre regole; puoi controllare i dettagli qui.
NOTA: Ricorda che non dovresti usare i tag Disallow e Noindex insieme in un file robots.txt.
Applicazione di Google Webmaster Tools
Questo sistema supporta il blocco di una pagina o di un URL per un periodo fisso. Le persone lo sanno come Google Search Console aiuta anche a mantenere un sito in molti aspetti. Puoi facilmente impedire a Google di indicizzare il tuo sito utilizzando il suo strumento di rimozione degli URL. Per applicare il metodo, controlla quanto segue:
- Controlla che il tuo URL sia inserito nella proprietà di Search Console.
- Scegli Nascondi temporaneamente e aggiungi l'URL della pagina.
- Successivamente, seleziona Cancella URL dalla cache e rimuovilo dalla ricerca. Puoi copiare e incollare facilmente l'URL della pagina. Ma, a volte, alcuni URL di pagine nidificate possono confondere il processo. Ad esempio, gli URL di diversi post possono puntare alla stessa pagina come-
http://www.example.com/greenery/thread/007 http://www.example.com/greenery/post/156 http://www.example.com/greenery/thread/007?post=156
La soluzione è che devi inviare ulteriori richieste di rimozione. Per ogni contenuto visualizzato, invierai una richiesta di rimozione.
NOTA: non dimenticare che si tratta di un metodo di blocco temporaneo della pagina. Dura solo circa sei mesi.
Applicazione di Noindex
È possibile applicare questo metodo in due modi . Innanzitutto, impara l'implementazione di seguito e seleziona qualsiasi metodo in base alla tua convenienza.
Metatag
Esistono anche due modi per utilizzare un meta tag. Per impedire alla maggior parte dei motori di ricerca di indicizzare una pagina, basta inserire il seguente meta tag nella parte <head> della pagina:
<meta name="robots" content="noindex">
E se desideri impedire solo ai web crawler di Google di indicizzare una pagina, utilizza-
<meta name="googlebot" content="noindex">
Inoltre, puoi impedire che una pagina venga elencata aggiungendo un meta tag nofollow . È abbastanza semplice specificare il collegamento-
<a href="example.html" rel="nofollow" />
Inoltre, puoi aggiungerlo a tutte le pagine per impedire a Google di indicizzare il tuo sito.
<meta name="googlebot" content="noindex, nofollow">
Intestazione HTTP X-Robots-Tag
Questo è un modo alternativo di utilizzare i meta tag. Puoi selezionare un meta tag o questo X-Robots-Tag. Puoi scegliere un X-Robots-Tag affinché qualsiasi URL funzioni come istruzione di un'intestazione HTTP. Utilizzando questo semplice metodo, puoi effettivamente impedire a Google di indicizzare file non html. I file di immagini, video, PDF, ecc. sono file non HTML. Una direttiva di meta tag robots funziona allo stesso modo anche per un X-Robots-Tag. Un'intestazione HTTP X-Robots-Tag può avere istruzioni noindex o nessuna , simile a questa,
HTTP/1.1 200 OK Date: Wed, 14 August 2022 20:42:40 GMT (…) X-Robots-Tag: noindex (…)
Se non desideri che Google generi una pagina memorizzata nella cache, applica questo codice noarchive X-Robots-Tag con un unavailable_after X-Robots-Tag.
HTTP/1.1 200 OK Date: Wed, 14 August 2022 20:42:40 GMT (…) X-Robots-Tag: noarchive X-Robots-Tag: unavailable_after: 25 Jun 2010 15:00:00 PST (…)
Ancora una volta, puoi mettere le condizioni a un set di X-Robots-Tag per rendere visibile una pagina. E può funzionare per diversi motori di ricerca.
Interrompi manualmente dalla dashboard
Molte persone non sanno che impedire ai motori di ricerca di classificare un sito è possibile anche dalla dashboard di WordPress. Forse molti di voi vedono l'opzione ma non ne conoscono esattamente lo scopo. Ad esempio, se il tuo sito Web è nuovo, hai molte attività dell'ultimo minuto da completare e hai bisogno di tempo. In questo caso non vorrai che i motori di ricerca elenchino quel sito. Quindi, questo metodo è adatto a te.
Accedi alla tua dashboard: Impostazioni → Lettura → Trova Visibilità motore di ricerca → Sì Seleziona la casella
Questa piccola attività può mantenere privati i tuoi contenuti. In realtà modifica il file robots.txt e talvolta aggiunge un meta tag correlato all'intestazione. Pertanto, la selezione della casella impedisce a Google di identificare il sito.
NOTA: le persone spesso dimenticano di deselezionare la casella quando portano il sito in diretta. Lasciare la casella deselezionata per un tempo più lungo renderà il sito invisibile a Google e non si classificherà mai.
Un modo parzialmente efficace: non utilizzare una mappa del sito o impedire a Google di indicizzarla
Una mappa del sito aiuta Googlebot a identificare le pagine e classificare il sito web di WordPress. Contiene tutti gli URL delle pagine di un sito. Inoltre, nel processo di scansione dei motori di ricerca, le sitemap aiutano a trovare nuove pagine. Quindi, un motore di ricerca ha una bassa possibilità di perdere qualsiasi contenuto. Se desideri che i motori di ricerca trascurino il tuo nuovo sito per un po' di tempo, non aggiungere una XML_sitemap.
Tuttavia, le mappe dei siti non garantiscono che Google indicizzerà sempre tutte le pagine. Dipende anche da varie altre cose. Tuttavia, puoi rallentare il processo di indicizzazione dei motori di ricerca non utilizzando una mappa del sito.
Ancora una volta, se hai già incluso una o più XML_sitemap, puoi impedire a Google di indicizzare i file. Puoi utilizzare un plug-in e anche modificare il file .htaccess del tuo sito.
Utilizzo di un plug-in per impedire l'indicizzazione della mappa del sito di Google: oggi esistono diversi plug-in per la SEO. Alcuni hanno opzioni di indicizzazione della mappa del sito come Yoast SEO, Rank Math e altri. Se il tuo sito ha un plug-in SEO, puoi cercare l'opzione e disattivarla. Vedi l'esempio qui sotto,
Modifica del file .htaccess per impedire l'indicizzazione della mappa del sito da parte di Google: devi solo aggiungere un X-Robots-Tag alle risposte HTTP del tuo sito attraverso i file di configurazione. Puoi utilizzare X-Robots-Tag: noindex per impedire a Google di indicizzare la mappa del sito.
Per un file Sitemap, il codice è,
<IfModule mod_rewrite.c> <Files sitemap.xml> Header set X-Robots-Tag "noindex" </Files> </IfModule>
Per più di un file Sitemap, il codice è,
<IfModule mod_rewrite.c> <Files ~ "^(sitemap1|sitemap2|sitemap3)\\.xml$"> Header set X-Robots-Tag "noindex" </Files> </IfModule>
Ora, Google o altri motori di ricerca non troveranno XML_sitemaps e non lo indicizzeranno. Poiché una mappa del sito contiene gli URL di tutte le pagine Web, nasconderla ai motori di ricerca aiuterà a non indicizzare il sito Web.
Esegui la manutenzione regolare del sito Web implementando il reindirizzamento 307 sul sito Web WordPress!
Come puoi reindicizzare il tuo sito web?
Bene, non puoi ignorare l'importanza del posizionamento di Google di un sito WordPress. Devi promuovere il tuo sito e attirare nuovo traffico. Quindi, dopo aver terminato le attività di creazione di siti Web rimanenti e aver bloccato Google per indicizzare determinate pagine Web, è necessario lavorare sulla SEO. E una buona SEO significa indicizzare e reindicizzare le pagine web.
- Deseleziona la casella Visibilità sui motori di ricerca dalla dashboard
- Controlla la directory principale del sito se hai erroneamente aggiunto un comando Noindex e un blocco Robots.txt a una pagina importante.
- Se hai aggiunto consapevolmente istruzioni ai robot per non indicizzare il contenuto o la pagina e ora desideri reindicizzare, ripeti attentamente il numero due.
- Aggiungi una XML_sitemap al tuo sito Web WordPress.
- Se stai utilizzando un plug-in per impedire a Google di indicizzare la tua mappa del sito, disinstallalo o attiva solo l'opzione di indicizzazione XML_sitemap .
- Google Search Console ha uno strumento di ispezione degli URL. Puoi generare un rapporto URL complessivo utilizzandolo per verificare ciò che Google vede. Qui puoi ispezionare un URL specifico, anche inviare un URL e richiedere un indice a Google.
- Infine, fai una SEO regolare e buona per le tue pagine reindicizzate e aumenta il traffico complessivo per il tuo sito web.
Sai perché le persone a volte hanno bisogno di eliminare il titolo di una pagina?
Guarda qui Rimozione del titolo della pagina in WordPress
Parole finali
Questi sono alcuni modi per impedire a Google di indicizzare il tuo sito. Seleziona saggiamente il tuo metodo e applicalo al tuo sito WordPress. Tuttavia, in genere, i proprietari di siti Web faticano a indicizzare i propri siti. Le persone non capiscono che troppa SEO fa male e non devono esagerare. Molte persone non conoscono nemmeno l'importanza e le ragioni per la deindicizzazione di una pagina. Il fatto è che a volte dovresti impedire ai motori di ricerca di indicizzare il tuo sito per ottenere più traffico. Tuttavia, questo articolo riguarda l'indicizzazione, la deindicizzazione e la reindicizzazione delle pagine web. Spero che imparerai i fatti principali e li applicherai di conseguenza.