Errori 404 vs errori Soft 404: differenze e soluzioni

Pubblicato: 2023-01-17

Cosa sono gli errori HTTP?

Gli errori HTTP sono codici restituiti da un server Web a un client (come un browser Web) per indicare che qualcosa è andato storto con una richiesta (un errore 404 è uno di questi). Il client riceve questo codice e messaggio di errore in risposta a una richiesta HTTP effettuata al server.

Gli errori HTTP sono raggruppati in classi, con ciascuna classe rappresentata da un intervallo specifico di numeri. Le classi più comuni di errori HTTP sono:

  • 1xx (Informativo): la richiesta è stata ricevuta e il processo continua
  • 2xx (riuscito): la richiesta è stata ricevuta, compresa e accettata correttamente
  • 3xx (reindirizzamento): sono necessarie ulteriori azioni per completare la richiesta
  • 4xx (errore client): la richiesta contiene una sintassi errata o non può essere soddisfatta dal server
  • 5xx (errore del server): il server non è riuscito a soddisfare una richiesta valida

Ogni errore ha un codice e un messaggio specifici per aiutare a diagnosticare e risolvere il problema. Ad esempio, l'errore HTTP più comune è l'errore 404 Not Found, che indica che la risorsa richiesta non è stata trovata sul server.

È importante notare che gli errori HTTP non sono limitati ai browser Web, qualsiasi applicazione che comunica tramite HTTP può riscontrare errori.

Che cosa significa un "codice di risposta 404"?

Un codice di risposta 404, noto anche come errore "404 Not Found", indica che il server non è riuscito a trovare la risorsa richiesta. Ciò può verificarsi per una serie di motivi, ad esempio quando un utente tenta di accedere a una pagina che è stata eliminata o spostata o quando l'utente digita un URL errato.

L'errore 404 è un errore lato client, il che significa che il problema riguarda la richiesta dell'utente e non il server. Il server è in grado di comprendere la richiesta effettuata dal client, ma non è in grado di individuare la risorsa richiesta.

Quando un utente incontra un errore 404, in genere visualizzerà un messaggio nel proprio browser Web che dice "404 non trovato" o "L'URL richiesto non è stato trovato su questo server". Inoltre, l'utente può anche vedere una pagina di errore personalizzata che l'amministratore del sito web ha impostato.

È importante notare che un errore 404 non indica che il server è inattivo o che c'è un problema con il sito web. Significa semplicemente che il server non è stato in grado di trovare la risorsa richiesta. Se sei il proprietario del sito web, dovresti controllare l'URL o i collegamenti per assicurarti che siano corretti e funzionino correttamente.

Cosa può causare una "Pagina 404 non trovata"?

Esistono diverse potenziali cause di un errore 404 "Pagina non trovata", tra cui:

  1. Digitazione dell'URL errato: questa è una causa comune di errori 404, in particolare quando un utente digita manualmente l'URL per accedere a una pagina specifica.
  2. Collegamenti interrotti: un collegamento interrotto è un collegamento su un sito Web che non punta più a una risorsa valida. Ciò può accadere se la risorsa è stata spostata o eliminata o se il collegamento è stato digitato in modo errato.
  3. Pagine Web spostate o eliminate: se una pagina Web è stata spostata o eliminata, qualsiasi collegamento che punta a quella pagina genererà un errore 404.
  4. Riprogettazione del sito Web: se un sito Web è stato sottoposto a una riprogettazione, gli URL di determinate pagine potrebbero essere cambiati. Tutti i vecchi collegamenti che puntano ai vecchi URL genereranno un errore 404.
  5. Server configurati in modo errato: se il server non è configurato correttamente, potrebbe restituire un errore 404 anche se la risorsa richiesta esiste.
  6. Errori di memorizzazione nella cache: se il browser di un utente ha memorizzato nella cache una vecchia versione di una pagina Web, potrebbe visualizzare un errore 404 anche se la pagina è attualmente disponibile sul sito Web.
  7. Riscrittura dell'URL: se un sito Web utilizza la riscrittura dell'URL, potrebbe restituire un errore 404 se l'URL riscritto non è configurato correttamente.
  8. File .htaccess configurato in modo errato: il file .htaccess è un file di configurazione utilizzato dai server Web Apache. Se non è configurato correttamente, può causare errori 404.

È importante notare che alcune di queste cause potrebbero essere fuori dal controllo del proprietario del sito Web, ma alcune di esse possono essere risolte dal proprietario del sito Web controllando l'URL, i collegamenti o configurando correttamente il server.

Che cos'è un errore Soft 404?

Un errore soft 404 è un tipo di errore che si verifica quando un server restituisce un codice di stato HTTP "200 OK", ma il contenuto della pagina è in realtà una pagina "404 Not Found" o una pagina senza contenuto utile. In altre parole, si verifica un errore soft 404 quando un server restituisce una pagina che sembra una pagina valida ma non contiene le informazioni o le risorse previste.

La differenza principale tra un errore 404 soft e un errore 404 tradizionale è che il primo restituisce un codice di stato "200 OK", mentre il secondo restituisce un codice di stato "404 Not Found". Questo può creare confusione sia per gli utenti che per i motori di ricerca, poiché il server indica che la pagina è valida quando in realtà non lo è.

Cosa può causare un errore Soft 404?

Un errore soft 404 può essere causato da diversi fattori, alcuni dei quali includono:

  1. Pagine di errore personalizzate: un sito Web può avere una pagina di errore personalizzata che restituisce un codice di stato "200 OK", ma non contiene le informazioni o le risorse previste. Ad esempio, la pagina di errore personalizzata potrebbe semplicemente riportare "404 non trovato" ma non fornire una funzione di ricerca o un collegamento alla home page.
  2. Reindirizzamenti configurati in modo errato: un sito Web potrebbe disporre di un reindirizzamento che invia gli utenti a una pagina diversa quando non viene trovata una risorsa richiesta. Tuttavia, se il reindirizzamento non è configurato correttamente, potrebbe restituire un codice di stato "200 OK" invece di un codice di stato "404 Not Found".
  3. Generazione dinamica di contenuti: i siti Web che generano contenuti in modo dinamico in base all'input dell'utente (ad es. una funzione di ricerca) possono restituire un codice di stato "200 OK" ma non gestire correttamente le risorse mancanti, generando un errore soft 404.
  4. Impostazioni del server configurate in modo errato: un sito Web potrebbe avere impostazioni del server configurate in modo errato che impediscono al server di restituire un codice di stato "404 Not Found" quando viene richiesta una risorsa mancante.
  5. Codice di monitoraggio dell'analisi dei siti Web: alcuni codici di monitoraggio dell'analisi dei siti Web ignorano il codice di stato HTTP e monitorano invece solo le pagine visualizzate, il che potrebbe portare a un errore soft 404.
  6. File .htaccess configurato in modo errato: il file .htaccess è un file di configurazione utilizzato dai server Web Apache. Se non è configurato correttamente, può causare errori soft 404.

Perché l'errore Soft 404 è problematico?

Gli errori soft 404 possono essere problematici per diversi motivi:

  • Possono confondere gli utenti, poiché potrebbero non rendersi conto che la pagina che stanno visualizzando non è quella che si aspettavano.
  • Possono avere un impatto negativo sul posizionamento nei motori di ricerca, poiché i motori di ricerca potrebbero non essere in grado di determinare con precisione la pertinenza della pagina.
  • Possono anche portare a problemi con l'analisi dei siti Web, poiché potrebbe essere difficile determinare quanti errori 404 effettivi si verificano sul sito.

Per evitare errori soft 404, i proprietari di siti Web devono assicurarsi che le loro pagine di errore personalizzate restituiscano un codice di stato "404 non trovato" e contengano informazioni utili per l'utente, come una funzione di ricerca o un collegamento alla home page. Inoltre, i proprietari di siti Web devono assicurarsi che i loro reindirizzamenti siano configurati correttamente e che eventuali script o plug-in utilizzati sul sito gestiscano correttamente le risorse mancanti.

Soft 404 a causa di errori di codifica?

Sì, gli errori di codifica possono causare errori soft 404.

Ad esempio, se un sito Web ha una pagina dinamica che genera contenuto in base all'input dell'utente (come una funzione di ricerca) e il codice che genera il contenuto non gestisce correttamente le risorse mancanti, potrebbe invece restituire un codice di stato "200 OK" di un codice di stato "404 Not Found". Ciò può causare un errore soft 404, in cui il server indica che la pagina è valida, ma la pagina non contiene le informazioni o le risorse previste.

Un altro esempio è quando un sito Web utilizza uno script o un plug-in che genera una pagina di errore personalizzata in caso di errore 404. Se lo script o il plug-in non è configurato correttamente, potrebbe restituire un codice di stato "200 OK" invece di un codice di stato "404 Not Found".

Inoltre, se il sito Web utilizza la riscrittura dell'URL e il codice di riscrittura non è configurato correttamente, potrebbe restituire un codice di stato "200 OK" per pagine inesistenti invece di un codice di stato "404 non trovato".

È importante notare che gli errori soft 404 causati da errori di codifica possono essere risolti identificando e risolvendo il problema di codifica specifico che causa il problema. I proprietari di siti Web dovrebbero testare regolarmente le proprie pagine e script per assicurarsi che stiano gestendo correttamente le risorse mancanti e restituendo il codice di stato appropriato.

Come riconoscere le pagine di errore 404?

Esistono diversi modi per riconoscere le pagine di errore 404:

  1. Codice di stato HTTP: una pagina di errore 404 restituirà un codice di stato HTTP di "404 non trovato" o "410 andato" per indicare che la pagina non è stata trovata.
  2. Messaggio di errore: la pagina in genere visualizza un messaggio di errore come "404 non trovato" o "L'URL richiesto non è stato trovato su questo server".
  3. Pagina di errore personalizzata: alcuni siti Web dispongono di pagine di errore personalizzate progettate per avere un aspetto simile al resto del sito Web, ma contengono un messaggio di errore.
  4. Contenuto della pagina: in caso di soft 404, la pagina potrebbe non avere alcun contenuto utile, solo un messaggio che la pagina non è stata trovata o una casella di ricerca.
  5. Messaggio di errore del browser Web: alcuni browser Web visualizzano il proprio messaggio di errore quando si verifica un errore 404, ad esempio "Impossibile trovare questa pagina" o "Impossibile trovare la risorsa richiesta".
  6. Strumenti per i webmaster: puoi utilizzare strumenti per i webmaster come Google Search Console per tenere traccia degli errori 404 sul tuo sito web.

Vale la pena notare che non tutte le pagine di errore 404 avranno lo stesso aspetto, poiché i proprietari di siti Web possono personalizzare le loro pagine di errore in modo che corrispondano all'aspetto del loro sito Web. Tuttavia, indipendentemente dall'aspetto della pagina di errore, restituirà sempre un codice di stato "404 Not Found" o "410 Gone".

Rapporti da Google Search Console

Gli URL di errore 404 su un sito Web sono elencati nel rapporto sulla copertura.

Google Search Console to fix 404 error

Mentre Google esegue la scansione di tutte le pagine che riesce a individuare, la Search Console segnalerà 404 pagine. Questo può includere backlink a pagine del tuo sito web che non sono più presenti da altri siti web.

statistiche di Google

Per impostazione predefinita, Google Analytics non include un rapporto sulle pagine mancanti. Tuttavia, ci sono altri modi per rintracciarli. In un report personalizzato, ad esempio, puoi separare le pagine i cui titoli di pagina includono l'errore 404 – Pagina non trovata.

La creazione di categorie di contenuti personalizzate e l'aggiunta di tutte le pagine 404 è un'altra tecnica per rilevare le pagine orfane in Google Analytics.

Sito: comando di ricerca operatore

Il sito: la query di ricerca non può essere utilizzata per individuare i problemi 404 poiché Google non indicizza le pagine 404 o soft 404. Trovare pagine web su un sito che hanno una particolare frase chiave nel loro testo è facile con il sito di Google: operatore di ricerca.

La risorsa più affidabile per compilare un elenco di soft 404 e standard 404 è la Search Console di Google. Le risposte all'errore 404 possono essere trovate utilizzando i registri degli errori del traffico del sito web.

Altri software di analisi dei backlink

Ulteriore assistenza può essere fornita da strumenti di analisi dei backlink come Majestic, Ahrefs, Moz Open Site Explorer, Sistrix, Semrush, LinkResearchTools e CognitiveSEO.

Un elenco dei backlink che puntano al tuo dominio verrà spesso esportato da questi programmi. È quindi possibile esaminare tutte le pagine collegate e cercare gli errori 404 da lì.

Come correggere gli errori Soft 404?

La correzione degli errori soft 404 può comportare diversi passaggi, a seconda della causa dell'errore:

  1. Pagine di errore personalizzate: se un sito Web ha una pagina di errore personalizzata che restituisce un codice di stato "200 OK", ma non contiene le informazioni o le risorse previste, il proprietario del sito Web deve assicurarsi che la pagina di errore personalizzata restituisca uno stato "404 non trovato" codice e contiene informazioni utili per l'utente, come una funzione di ricerca o un collegamento alla home page.
  2. Reindirizzamenti configurati in modo errato: se un sito Web dispone di un reindirizzamento che invia gli utenti a una pagina diversa quando non viene trovata una risorsa richiesta, ma il reindirizzamento non è configurato correttamente, il proprietario del sito Web deve assicurarsi che il reindirizzamento sia configurato per restituire un "404 Codice di stato "Non trovato".
  3. Generazione di contenuti dinamici: se un sito web genera contenuti in modo dinamico in base all'input dell'utente (ad es. una funzione di ricerca) e il codice che genera i contenuti non gestisce correttamente le risorse mancanti, il proprietario del sito web deve assicurarsi che il codice gestisca correttamente le risorse mancanti e restituendo un codice di stato "404 Not Found".
  4. Impostazioni del server configurate in modo errato: se un sito Web ha impostazioni del server configurate in modo errato che impediscono al server di restituire un codice di stato "404 Not Found" quando viene richiesta una risorsa mancante, il proprietario del sito Web deve assicurarsi che le impostazioni del server siano configurate correttamente.
  5. File .htaccess configurato in modo errato: il file .htaccess è un file di configurazione utilizzato dai server Web Apache. Se non è configurato correttamente, può causare errori soft 404. Il proprietario del sito Web dovrebbe controllare il file .htaccess e correggere eventuali problemi.
  6. Monitorare e testare regolarmente: monitorare e testare regolarmente il sito Web per errori soft 404, utilizzando strumenti come Google Search Console o strumenti per i Webmaster o utilizzando i log degli errori del traffico del sito Web può aiutarti a identificare l'errore e correggerlo.

È importante notare che i passaggi esatti necessari per correggere un errore soft 404 dipenderanno dalla causa specifica dell'errore e dall'architettura del sito web. Potrebbero essere necessari alcuni tentativi ed errori per trovare la causa principale del problema e implementare la soluzione appropriata.

Conclusione

Quando si tratta di errori 404, è importante tenere presente che se le pagine sono effettivamente sparite, non c'è nulla che possa essere fatto per correggerle. In questo caso, una risposta 404 è una risposta accettabile alle richieste di pagine che non esistono. Tuttavia, se le pagine sono presenti ma su un URL diverso, è necessario correggere il problema. Questo può essere fatto reindirizzando un collegamento interrotto all'URL corretto, aggiungendo una pagina persa o reindirizzando il vecchio URL alla nuova pagina che ne ha preso il posto.

Gli errori soft 404 sono causati da un problema che deve essere identificato e corretto. Mantenere le massime prestazioni di un sito Web richiede la comprensione dei vari errori 404 e la capacità di identificarli e risolverli.