Erreurs 404 vs erreurs Soft 404 : différences et solutions
Publié: 2023-01-17Qu'est-ce qu'une erreur HTTP ?
Les erreurs HTTP sont des codes renvoyés par un serveur Web à un client (tel qu'un navigateur Web) pour indiquer que quelque chose s'est mal passé avec une requête (une erreur 404 en fait partie). Le client reçoit ce code d'erreur et ce message en réponse à une requête HTTP qu'il a faite au serveur.
Les erreurs HTTP sont regroupées en classes, chaque classe étant représentée par une plage de nombres spécifique. Les classes d'erreurs HTTP les plus courantes sont :
- 1xx (Informationnel) : la demande a été reçue et le processus se poursuit
- 2xx (réussi) : la demande a été reçue, comprise et acceptée avec succès
- 3xx (redirection) : une action supplémentaire doit être entreprise afin de traiter la demande
- 4xx (erreur client) : la requête contient une mauvaise syntaxe ou ne peut pas être satisfaite par le serveur
- 5xx (Erreur de serveur) : Le serveur n'a pas réussi à répondre à une demande valide
Chaque erreur a un code et un message spécifiques pour aider à diagnostiquer et résoudre le problème. Par exemple, l'erreur HTTP la plus courante est l'erreur 404 Not Found, qui indique que la ressource demandée est introuvable sur le serveur.
Il est important de noter que les erreurs HTTP ne se limitent pas aux navigateurs Web, toute application qui communique via HTTP peut rencontrer des erreurs.
Que signifie un « code de réponse 404 » ?
Un code de réponse 404, également connu sous le nom d'erreur "404 Not Found", indique que le serveur n'a pas pu trouver la ressource demandée. Cela peut se produire pour diverses raisons, par exemple lorsqu'un utilisateur tente d'accéder à une page qui a été supprimée ou déplacée, ou lorsqu'il saisit une URL incorrecte.
L'erreur 404 est une erreur côté client, ce qui signifie que le problème vient de la demande de l'utilisateur et non du serveur. Le serveur est capable de comprendre la requête faite par le client, mais il est incapable de localiser la ressource demandée.
Lorsqu'un utilisateur rencontre une erreur 404, il voit généralement un message dans son navigateur Web indiquant "404 Not Found" ou "L'URL demandée n'a pas été trouvée sur ce serveur". De plus, l'utilisateur peut également voir une page d'erreur personnalisée que l'administrateur du site Web a configurée.
Il est important de noter qu'une erreur 404 n'indique pas que le serveur est en panne ou qu'il y a un problème avec le site Web. Cela signifie simplement que le serveur n'a pas pu trouver la ressource demandée. Si vous êtes le propriétaire du site Web, vous devez vérifier l'URL ou les liens pour vous assurer qu'ils sont corrects et fonctionnent correctement.
Qu'est-ce qui peut causer une "page 404 introuvable" ?
Il existe plusieurs causes potentielles d'une erreur 404 "Page introuvable", notamment :
- Saisie de la mauvaise URL : il s'agit d'une cause fréquente d'erreurs 404, en particulier lorsqu'un utilisateur saisit manuellement l'URL pour accéder à une page spécifique.
- Liens brisés : Un lien brisé est un lien sur un site Web qui ne pointe plus vers une ressource valide. Cela peut se produire si la ressource a été déplacée ou supprimée, ou si le lien a été saisi de manière incorrecte.
- Pages Web déplacées ou supprimées : si une page Web a été déplacée ou supprimée, tout lien pointant vers cette page entraînera une erreur 404.
- Refonte du site Web : si un site Web a subi une refonte, les URL de certaines pages peuvent avoir changé. Tout ancien lien pointant vers les anciennes URL entraînera une erreur 404.
- Serveurs mal configurés : Si le serveur n'est pas configuré correctement, il peut renvoyer une erreur 404 même si la ressource demandée existe.
- Erreurs de mise en cache : si le navigateur d'un utilisateur a mis en cache une ancienne version d'une page Web, il peut voir une erreur 404 même si la page est actuellement disponible sur le site Web.
- Réécriture d'URL : si un site Web utilise la réécriture d'URL, il peut renvoyer une erreur 404 si l'URL réécrite n'est pas configurée correctement.
- Fichier .htaccess mal configuré : Le fichier .htaccess est un fichier de configuration utilisé par les serveurs Web Apache. S'il n'est pas configuré correctement, cela peut provoquer des erreurs 404.
Il est important de noter que certaines de ces causes peuvent échapper au contrôle du propriétaire du site Web, mais certaines d'entre elles peuvent être résolues par le propriétaire du site Web en vérifiant l'URL, les liens ou en configurant correctement le serveur.
Qu'est-ce qu'une erreur Soft 404 ?
Une erreur 404 logicielle est un type d'erreur qui se produit lorsqu'un serveur renvoie un code d'état HTTP "200 OK", mais le contenu de la page est en fait une page "404 Not Found" ou une page sans contenu utile. En d'autres termes, une erreur logicielle 404 se produit lorsqu'un serveur renvoie une page qui ressemble à une page valide mais qui ne contient pas les informations ou les ressources attendues.
La principale différence entre une erreur 404 logicielle et une erreur 404 traditionnelle est que la première renvoie un code d'état "200 OK", tandis que la seconde renvoie un code d'état "404 Not Found". Cela peut être déroutant pour les utilisateurs et les moteurs de recherche, car le serveur indique que la page est valide alors qu'en fait elle ne l'est pas.
Qu'est-ce qui peut provoquer une erreur Soft 404 ?
Une erreur logicielle 404 peut être causée par plusieurs facteurs, dont certains incluent :
- Pages d'erreur personnalisées : un site Web peut avoir une page d'erreur personnalisée qui renvoie un code d'état "200 OK", mais ne contient pas les informations ou les ressources attendues. Par exemple, la page d'erreur personnalisée peut simplement indiquer "404 Not Found" mais ne pas fournir de fonction de recherche ni de lien vers la page d'accueil.
- Redirections mal configurées : un site Web peut avoir une redirection en place qui envoie les utilisateurs vers une autre page lorsqu'une ressource demandée est introuvable. Cependant, si la redirection n'est pas configurée correctement, elle peut renvoyer un code d'état "200 OK" au lieu d'un code d'état "404 Not Found".
- Génération de contenu dynamique : les sites Web qui génèrent du contenu de manière dynamique en fonction de l'entrée de l'utilisateur (par exemple, une fonction de recherche) peuvent renvoyer un code d'état "200 OK" mais ne gèrent pas correctement les ressources manquantes, ce qui entraîne une erreur logicielle 404.
- Paramètres de serveur mal configurés : un site Web peut avoir des paramètres de serveur mal configurés qui empêchent le serveur de renvoyer un code d'état "404 introuvable" lorsqu'une ressource manquante est demandée.
- Code de suivi d'analyse de site Web : certains codes de suivi d'analyse de site Web ignorent le code d'état HTTP et ne suivent à la place que les pages consultées, ce qui peut entraîner une erreur 404 logicielle.
- Fichier .htaccess mal configuré : Le fichier .htaccess est un fichier de configuration utilisé par les serveurs Web Apache. S'il n'est pas configuré correctement, cela peut provoquer des erreurs logicielles 404.
Pourquoi l'erreur Soft 404 est-elle problématique ?
Les erreurs Soft 404 peuvent être problématiques pour plusieurs raisons :
- Ils peuvent dérouter les utilisateurs, car ils peuvent ne pas se rendre compte que la page qu'ils consultent n'est pas celle qu'ils attendaient.
- Ils peuvent avoir un impact négatif sur le classement des moteurs de recherche, car les moteurs de recherche peuvent ne pas être en mesure de déterminer avec précision la pertinence de la page.
- Ils peuvent également entraîner des problèmes d'analyse de site Web, car il peut être difficile de déterminer le nombre d'erreurs 404 réelles qui se produisent sur le site.
Pour éviter les erreurs 404 logicielles, les propriétaires de sites Web doivent s'assurer que leurs pages d'erreur personnalisées renvoient un code d'état « 404 introuvable » et contiennent des informations utiles pour l'utilisateur, telles qu'une fonction de recherche ou un lien vers la page d'accueil. De plus, les propriétaires de sites Web doivent s'assurer que leurs redirections sont correctement configurées et que tous les scripts ou plugins utilisés sur le site gèrent correctement les ressources manquantes.
Soft 404 à cause d'erreurs de codage ?
Oui, les erreurs de codage peuvent provoquer des erreurs logicielles 404.
Par exemple, si un site Web a une page dynamique qui génère du contenu en fonction de l'entrée de l'utilisateur (comme une fonction de recherche) et que le code qui génère le contenu ne gère pas correctement les ressources manquantes, il peut renvoyer un code d'état "200 OK" à la place. d'un code d'état "404 Not Found". Cela peut entraîner une erreur logicielle 404, où le serveur indique que la page est valide, mais la page ne contient pas les informations ou les ressources attendues.
Un autre exemple est lorsqu'un site Web utilise un script ou un plugin qui génère une page d'erreur personnalisée en cas d'erreur 404. Si ce script ou plugin n'est pas configuré correctement, il peut renvoyer un code d'état "200 OK" au lieu d'un code d'état "404 Not Found".
De plus, si le site Web utilise la réécriture d'URL et que le code de réécriture n'est pas configuré correctement, il peut renvoyer un code d'état "200 OK" pour les pages inexistantes au lieu d'un code d'état "404 Not Found".
Il est important de noter que les erreurs logicielles 404 causées par des erreurs de codage peuvent être résolues en identifiant et en corrigeant le problème de codage spécifique à l'origine du problème. Les propriétaires de sites Web doivent tester régulièrement leurs pages et leurs scripts pour s'assurer qu'ils gèrent correctement les ressources manquantes et qu'ils renvoient le code d'état approprié.
Comment reconnaître les pages d'erreur 404 ?
Il existe plusieurs façons de reconnaître les pages d'erreur 404 :
- Code d'état HTTP : Une page d'erreur 404 renverra un code d'état HTTP "404 Not Found" ou "410 Gone" pour indiquer que la page est introuvable.
- Message d'erreur : la page affichera généralement un message d'erreur tel que "404 Not Found" ou "L'URL demandée n'a pas été trouvée sur ce serveur".
- Page d'erreur personnalisée : Certains sites Web ont des pages d'erreur personnalisées qui sont conçues pour ressembler au reste du site Web, mais qui contiennent un message d'erreur.
- Contenu de la page : en cas de soft 404, la page peut ne pas avoir de contenu utile, juste un message indiquant que la page n'est pas trouvée, ou un champ de recherche.
- Message d'erreur du navigateur Web : certains navigateurs Web affichent leur propre message d'erreur lorsqu'une erreur 404 se produit, telle que "Cette page est introuvable" ou "La ressource demandée est introuvable".
- Outils pour les webmasters : vous pouvez utiliser des outils pour les webmasters tels que Google Search Console pour suivre les erreurs 404 sur votre site Web.
Il convient de noter que toutes les pages d'erreur 404 n'auront pas la même apparence, car les propriétaires de sites Web peuvent personnaliser leurs pages d'erreur pour qu'elles correspondent à l'apparence de leur site Web. Cependant, quelle que soit l'apparence de la page d'erreur, elle renverra toujours un code d'état "404 Not Found" ou "410 Gone".
Rapports de la console de recherche Google
Les URL d'erreur 404 sur un site Web sont répertoriées dans le rapport de couverture.
Comme Google explore toutes les pages qu'il peut localiser, la Search Console rapportera 404 pages. Cela peut inclure des backlinks vers des pages de votre site Web qui ne sont plus présentes sur d'autres sites Web.
Google Analytics
Par défaut, Google Analytics n'inclut pas de rapport de page manquante. Cependant, il existe d'autres moyens de les suivre. Dans un rapport personnalisé, vous pouvez, par exemple, séparer les pages dont les titres de page incluent l'erreur 404 - Page introuvable.
Créer des catégories de contenu personnalisées et y ajouter les 404 pages est une autre technique pour détecter les pages orphelines dans Google Analytics.
Site : commande de recherche d'opérateur
Le site : la requête de recherche ne peut pas être utilisée pour localiser les problèmes 404 car Google n'indexe pas les pages 404 ou soft 404. Trouver des pages Web sur un site qui ont une phrase clé particulière dans leur texte est facile avec le site de Google : opérateur de recherche.
La ressource la plus fiable pour compiler une liste de soft 404 et de 404 standard est la Search Console de Google. Les réponses aux erreurs 404 peuvent être trouvées à l'aide des journaux d'erreurs de trafic du site Web.
Autres logiciels d'analyse de backlinks
Une assistance supplémentaire peut être fournie par des outils d'analyse de backlinks tels que Majestic, Ahrefs, Moz Open Site Explorer, Sistrix, Semrush, LinkResearchTools et CognitiveSEO.
Une liste des backlinks pointant vers votre domaine sera souvent exportée par ces programmes. Vous pouvez ensuite examiner toutes les pages liées et rechercher les erreurs 404 à partir de là.
Comment réparer les erreurs Soft 404 ?
La correction des erreurs logicielles 404 peut impliquer plusieurs étapes, selon la cause de l'erreur :
- Pages d'erreur personnalisées : si un site Web a une page d'erreur personnalisée qui renvoie un code d'état "200 OK", mais ne contient pas les informations ou les ressources attendues, le propriétaire du site Web doit s'assurer que la page d'erreur personnalisée renvoie un état "404 Not Found". code et contient des informations utiles pour l'utilisateur, telles qu'une fonction de recherche ou un lien vers la page d'accueil.
- Redirections mal configurées : si un site Web a mis en place une redirection qui envoie les utilisateurs vers une autre page lorsqu'une ressource demandée n'est pas trouvée, mais que la redirection n'est pas configurée correctement, le propriétaire du site Web doit s'assurer que la redirection est configurée pour renvoyer un "404". Code d'état introuvable.
- Génération de contenu dynamique : si un site Web génère du contenu de manière dynamique en fonction de l'entrée de l'utilisateur (par exemple, une fonction de recherche) et que le code qui génère le contenu ne gère pas correctement les ressources manquantes, le propriétaire du site Web doit s'assurer que le code gère correctement les ressources manquantes, et renvoyant un code d'état « 404 introuvable ».
- Paramètres de serveur mal configurés : si un site Web a des paramètres de serveur mal configurés qui empêchent le serveur de renvoyer un code d'état « 404 introuvable » lorsqu'une ressource manquante est demandée, le propriétaire du site Web doit s'assurer que les paramètres du serveur sont correctement configurés.
- Fichier .htaccess mal configuré : Le fichier .htaccess est un fichier de configuration utilisé par les serveurs Web Apache. S'il n'est pas configuré correctement, cela peut provoquer des erreurs logicielles 404. Le propriétaire du site Web doit vérifier le fichier .htaccess et corriger tout problème.
- Surveillez et testez régulièrement : surveiller et tester régulièrement le site Web pour détecter les erreurs 404 logicielles, en utilisant des outils tels que Google Search Console ou les outils Webmaster ou en utilisant les journaux d'erreurs de trafic du site Web peut vous aider à identifier l'erreur et à la corriger.
Il est important de noter que les étapes exactes nécessaires pour corriger une erreur logicielle 404 dépendront de la cause spécifique de l'erreur et de l'architecture du site Web. Cela peut prendre quelques essais et erreurs pour trouver la cause première du problème et mettre en œuvre la solution appropriée.
Conclusion
En ce qui concerne les erreurs 404, il est important de garder à l'esprit que si les pages ont réellement disparu, rien ne peut être fait pour les corriger. Dans ce cas, une réponse 404 est une réponse acceptable aux demandes de pages qui n'existent pas. Cependant, si les pages sont présentes mais sur une URL différente, cela doit être corrigé. Cela peut être fait en redirigeant un lien brisé vers l'URL correcte, en ajoutant une page qui a été perdue ou en redirigeant l'ancienne URL vers la nouvelle page qui a pris sa place.
Les erreurs Soft 404 sont causées par un problème qui doit être identifié et corrigé. Le maintien des meilleures performances d'un site Web nécessite une compréhension des différentes erreurs 404 et la capacité de les identifier et de les résoudre.