Que sont les Soft 404 et comment les corriger

Publié: 2022-10-19


Graphique qui dit : "Qu'est-ce que les soft 404 et comment les réparer."

Avez-vous déjà atterri sur une page Web uniquement pour voir un gros message d'erreur servant d'impasse à votre lecture ? En tant qu'utilisateur, il vous reste peu de direction et fermez l'onglet. En tant que propriétaire du site Web, il y a de mauvaises nouvelles partout. Bien que ces pages aient un but, elles peuvent nuire à votre site Web si elles sont mal utilisées.

Un exemple d'erreur "page introuvable" utilisée dans le mauvais contexte est une erreur soft 404. Ceux-ci peuvent faire des ravages sur votre classement dans les moteurs de recherche, le trafic de votre site Web et même votre crédibilité.

Ci-dessous, je définirai ce qu'est une erreur 404 logicielle et couvrirai la différence entre les erreurs 404 normales (ou matérielles). Ensuite, je vous expliquerai comment trouver ces erreurs et les résoudre.

Que sont les erreurs Soft 404 ?

Les erreurs logicielles 404 sont des pages qui renvoient un code d'erreur "introuvable" (404), mais le contenu de la page n'est pas réellement manquant. La page peut être vide ou contenir une partie du contenu d'autres pages du site. Les Soft 404 peuvent être causés par des fautes d'orthographe dans les URL, par des liens obsolètes ou par des problèmes avec le serveur.

Lorsqu'il s'agit d'une erreur 404 logicielle, l'erreur est transmise aux visiteurs du site Web, mais pas aux robots d'exploration de Google. Cela signifie que les pages continuent d'être explorées et indexées sur les pages de résultats des moteurs de recherche (SERP).

Un soft 404 n'est pas un statut officiel ; c'est plutôt celui que Google crée pour vous alerter. Cela signifie que Google et les autres moteurs de recherche continuent d'explorer ces pages Web jusqu'à ce que vous agissiez.

Quelle est la différence entre les erreurs (Hard) 404 et Soft 404 ?

La différence entre les erreurs 404 matérielles et les erreurs 404 logicielles est le statut qu'elles affichent aux moteurs de recherche.

Avec une erreur 404 matérielle, le code d'erreur 404 est renvoyé aux visiteurs de la page et aux moteurs de recherche. Cela indique à la fois que la page n'existe pas. Voici un exemple d'erreur 404 matérielle du site de vêtements ModCloth :

Capture d'écran de la page 404 de Modcloth pour les erreurs 404 logicielles.

Avec une erreur soft 404, le code d'erreur 404 est affiché aux visiteurs mais pas aux moteurs de recherche.

Au lieu de cela, ils verront un statut 200 OK qui leur donnera le feu vert pour ramper. Donc, si vous voyez des erreurs 404 logicielles dans votre console de recherche Google, cela signifie que certaines pages de votre site peuvent renvoyer des erreurs 404 même si elles existent réellement.

Les erreurs Soft 404 peuvent-elles avoir un impact sur le classement de mon site ?

La reponse courte est oui; Les erreurs logicielles 404 peuvent avoir un impact sur le classement de votre site Web sur les SERP. Pour comprendre pourquoi, vous devez comprendre comment Google explore un site Web.

Pour éviter de surcharger le serveur d'un site Web et réduire la charge de travail des robots d'exploration, Google utilise ce qu'on appelle un budget d'exploration pour déterminer combien et à quelle fréquence explorer un site. Un budget de crawl est le nombre de pages que Googlebot va crawler sur votre site lors de chaque visite. Le budget de crawl est composé du taux de crawl et de la demande de crawl.

Selon Google, les définitions sont les suivantes :

  • Le taux d'exploration est le nombre de requêtes par seconde que Googlebot effectue sur votre site lorsqu'il l'explore.
  • La demande de crawl correspond à combien Google veut explorer votre site en fonction de sa popularité, depuis combien de temps il n'a pas exploré, etc.

Lorsque vous avez un grand nombre d'erreurs 404 logicielles sur votre site Web, vous utilisez une part considérable de votre budget de crawl. Cela signifie que moins de vos pages existantes sont explorées, ce qui entraîne des classements moins nombreux et moins bons dans les SERP.

Pensez-y de cette façon : si votre site compte 100 pages, mais que Google détermine que votre budget d'exploration est de 70, Google n'explorera que 70 % de vos pages. Si 10 pages sont des erreurs 404 logicielles, il y a un risque que certaines ou toutes ces pages tombent dans le budget de crawl de 70. Ainsi, vous perdez les moteurs de recherche qui explorent des pages précieuses.

Quels problèmes les Soft 404 peuvent-ils causer ?

Outre les classements inférieurs dans les SERP, d'autres problèmes sont associés aux erreurs 404 logicielles sur votre site Web.

Par exemple, si Googlebot explore une page avec une erreur 404 logicielle et constate que le contenu de la page n'est pas réellement manquant, il peut supposer que votre site contient de fausses erreurs 404. Cela pourrait conduire à ce que votre site soit pénalisé par Google.

L'un des plus gros problèmes est une mauvaise expérience utilisateur. Étant donné que les URL 404 logicielles apparaissent toujours dans les résultats de recherche, les utilisateurs peuvent être dirigés vers des pages inexistantes.

Si un utilisateur clique sur un lien vers une page qui renvoie une erreur logicielle 404, il peut supposer que la page n'existe pas et quitter votre site. Cela peut nuire au taux de rebond de votre site et inciter les utilisateurs à passer moins de temps sur votre site.

Il peut également y avoir des implications pour les performances et les opérations du site Web.

Bien que les pages d'erreur 404 n'occupent pas autant d'espace sur le serveur que les pages avec du contenu, elles consomment tout de même de la bande passante. Si Google et d'autres moteurs de recherche dirigent le trafic vers une page inexistante, vous continuez à recevoir des visites, ce qui peut ralentir la vitesse et les performances du site Web.

Comment trouver (et corriger) les erreurs Soft 404

Étant donné que les erreurs logicielles 404 ne sont pas un statut officiel, elles ne sont pas aussi évidentes pour les propriétaires de sites Web.

C'est là qu'un outil comme Google Search Console entre en jeu. Selon Google, la Search Console "vous aide à mesurer le trafic et les performances de recherche de votre site, à résoudre les problèmes et à faire briller votre site dans les résultats de recherche Google".

Un problème que la Search Console peut vous aider à résoudre est celui des erreurs 404 logicielles.

1. Trouver les erreurs Soft 404 dans Google Search Console

Pour utiliser Google Search Console, créez un compte et connectez votre domaine. C'est un processus simple qui ne prend que quelques minutes.

Une fois connecté et que la Search Console a eu le temps de collecter des informations, vous trouverez des erreurs soft 404 dans Google Search Console sous Couverture :

Une capture d'écran de la recherche d'erreurs soft 404 dans Google Search Console.

Il peut s'afficher de deux manières : comme une erreur ou comme exclu (comme indiqué ci-dessus).

Les soft 404 qui apparaissent avec un statut d'erreur dans Google Search Console sont ce que vous voulez cibler en premier. Ceux avec un statut exclu doivent toujours être adressés, mais Google a cessé d'explorer ces pages pour une raison ou une autre.

Si vous ne voyez pas d'erreurs 404 logicielles dans Google Search Console, vous pouvez également utiliser un robot comme Screaming Frog pour explorer votre site et rechercher les pages qui renvoient des erreurs 404. Allez simplement dans l'onglet "Codes de réponse" et recherchez toutes les pages qui renvoient des erreurs 404.

2. Si la page n'existe pas : configurez une erreur 404 ou 410 appropriée

Si l'erreur logicielle 404 que vous avez reçue est réelle, configurez une erreur 404 (introuvable) ou 410 (contenu supprimé) appropriée sur le serveur. Cela garantit que les visiteurs du site Web et les robots d'exploration voient la bonne erreur.

Existe-t-il une différence entre les codes d'erreur 404 et 410 en ce qui concerne les moteurs de recherche ?

Selon John Mueller de Google, pas vraiment. Ces deux codes d'erreur indiquent à Google d'arrêter d'indexer l'URL, ce qui est le résultat souhaité dans les deux cas.

La plupart des systèmes de gestion de contenu (CMS) ont des pages d'erreur 404 et 410 intégrées. Pour tirer le meilleur parti de vos 404 pages, je vous recommande d'ajouter quelques articles de blog connexes ou de fournir une fonction ou un outil de recherche.

Sur mon site, par exemple, les utilisateurs peuvent analyser le référencement de leur site Web à partir de ma page 404 :

Capture d'écran d'une page d'erreur 404 sur la page Web de Neil Patel.

Si votre CMS n'en propose pas, vous devrez configurer votre serveur et concevoir la page vous-même ou avec l'aide d'un développeur de site Web.

Bien qu'une page d'erreur 404 personnalisée puisse prendre du temps et de l'argent, c'est aussi une excellente opportunité de marque.

3. Si la page existe : améliorez le contenu et réindexez-la

Google est bon pour trouver les erreurs 404 logicielles, mais ce n'est pas parfait. Il peut signaler à tort une page comme un soft 404, même si le contenu existe sur la page.

Cela se produit généralement lorsque le contenu est court ou non pertinent.

En supposant que la page soit nécessaire, vous souhaiterez étoffer le contenu pour vous assurer qu'il ne soit pas confondu avec un soft 404. Cela ne signifie pas utiliser du duvet ou du remplissage, mais un contenu pertinent et engageant qui améliore la qualité de votre site Web.

Si votre page Web doit être volumineuse, envisagez d'ajouter des images, des graphiques et des diagrammes, ainsi que du contenu basé sur les données que vous pouvez sauvegarder avec des références externes. Ceux-ci confèrent de la crédibilité à votre site Web, ce qui est particulièrement important si la page renvoyait une erreur 404 logicielle. La détection d'erreurs 404 peut être bénéfique à la fois pour les côtés back-end et front-face de votre site Web et pour l'expérience utilisateur.

4. Si la page a été déplacée : configurez une redirection 301

Lorsque vous combinez des pages de contenu ou déplacez du contenu, il est important de configurer une redirection dès que possible. Sinon, les visiteurs de votre site Web peuvent être dirigés vers une page 404.

Si cela entraîne des erreurs logicielles 404, vous serez heureux de savoir que la solution est simple. Il vous suffit de configurer une redirection 301 permanente vers la nouvelle page de votre site Web.

La majorité des CMS ont un outil de redirection intégré. Entrez simplement l'ancienne URL et la nouvelle, et le trafic est automatiquement redirigé. Ce guide vous guide dans la configuration des redirections sur WordPress.

Une fois configurée, la redirection est communiquée aux robots des moteurs de recherche afin qu'ils explorent les bonnes pages.

FAQ

Que sont les erreurs logicielles 404 ?

Les erreurs Soft 404 sont des erreurs de « page introuvable » qui n'ont pas été correctement communiquées aux robots d'exploration des moteurs de recherche. L'erreur s'affiche correctement pour les visiteurs du site Web, mais pas pour explorer les robots, ce qui signifie qu'ils continuent d'explorer ces pages, perdant du temps et des ressources.

Qu'est-ce qui cause un soft 404 ?

Il y a plusieurs choses qui peuvent provoquer une erreur logicielle 404. La raison la plus courante est que la page a été déplacée vers un nouvel emplacement et qu'aucune redirection n'a été configurée. D'autres causes courantes incluent un contenu médiocre sur la page et des pages qui renvoient des erreurs 404 même si elles existent réellement.

La correction des erreurs soft 404 augmentera-t-elle le trafic de mon site Web ?

Lorsque les erreurs soft 404 sont résolues, les crawl bots peuvent se concentrer sur un plus grand pourcentage de vos pages de contenu actives. En conséquence, plus de contenu apparaît dans les SERP. En théorie, cela peut augmenter le trafic sur le site Web.

Quelle est la différence entre les erreurs 404 normales et les erreurs 404 logicielles ?

La différence entre une erreur 404 normale et une erreur 404 logicielle est ce qui est communiqué aux robots d'exploration des moteurs de recherche. Avec un 404 normal, le serveur du site Web transmet l'erreur 404 au robot d'exploration. Avec un soft 404, le serveur du site Web délivre un statut 200 OK, ce qui signifie que les bots continuent à explorer la page.

Google va-t-il me pénaliser pour les erreurs soft 404 ?

Il n'y a pas de pénalité officielle pour les erreurs 404 logicielles, bien qu'il y ait des conséquences naturelles si les erreurs ne sont pas résolues. Ceux-ci incluent une visibilité réduite sur les pages de résultats des moteurs de recherche et une mauvaise expérience utilisateur.

Le fait d'avoir des 404 affecte-t-il le référencement ?

Les erreurs 404 peuvent nuire au classement de votre site si elles ne sont pas correctement gérées. Si Googlebot explore une page avec une erreur 404, il peut supposer que la page n'existe pas et arrêter l'exploration de votre site. Par conséquent, vos pages les plus importantes peuvent ne pas être explorées aussi souvent qu'elles le devraient, ce qui peut nuire au classement de votre site.

De plus, si les utilisateurs cliquent sur un lien vers une page qui renvoie une erreur 404, ils peuvent supposer que la page n'existe pas et quitter votre site. Cela peut nuire au taux de rebond de votre site et inciter les utilisateurs à passer moins de temps sur votre site, ce qui peut avoir un impact négatif sur le classement de votre site.

Pour éviter ces problèmes, assurez-vous de configurer une erreur 404 ou 410 appropriée si une page n'existe pas, et assurez-vous de configurer une redirection 301 si une page a été déplacée.

De plus, assurez-vous que toutes vos pages ont un bon contenu qui correspond à ce que les utilisateurs recherchent. Vous pouvez effectuer des audits SEO techniques tout au long de l'année pour vous assurer que vos pages sont à la hauteur. En suivant ces étapes, vous pouvez vous assurer que le classement de votre site n'est pas affecté par des erreurs 404 logicielles.

Comment corriger les erreurs soft 404 ?

Si la page n'existe pas réellement, la création d'une page 404 personnalisée ou d'une erreur 410 vous aidera. Une erreur 404 indique aux utilisateurs que la page qu'ils recherchent n'existe pas, tandis qu'une erreur 410 indique aux utilisateurs que la page a été définitivement supprimée.

Pour configurer une erreur 404 ou 410, vous devez ajouter un fichier "404.html" ou "410.html" à votre site.

Si la page existe mais renvoie une erreur 404 logicielle, vous devrez améliorer le contenu de la page, puis la réindexer. Cela peut être fait en ajoutant du contenu plus pertinent à la page ou en améliorant le titre de la page et les balises META.

Si la page a été déplacée vers un nouvel emplacement, vous devrez configurer une redirection 301. Une redirection 301 indique aux utilisateurs que la page a été définitivement déplacée vers un nouvel emplacement. Pour mettre en place une redirection 301, vous devrez ajouter un fichier "301.html" à votre site.

Conclusion

Lorsqu'une page est supprimée de votre site Web, il existe des moyens appropriés de signaler cette suppression aux visiteurs du site Web et aux robots d'exploration des moteurs de recherche.

La méthode la plus courante consiste à configurer une page d'erreur 404. Si elle n'est pas configurée correctement, cependant, l'erreur 404 peut ne pas être communiquée aux robots d'exploration. Ainsi, une erreur logicielle 404 se produit.

Bien qu'une erreur 404 logicielle puisse entraîner des problèmes de classement des moteurs de recherche ainsi que d'expérience utilisateur, elle est facile à trouver et à résoudre.

Selon les circonstances, vous pouvez configurer un 404 permanent, configurer une redirection 301 ou améliorer le contenu de la page et le réindexer. Ces correctifs ne prennent que quelques minutes, mais peuvent avoir un impact significatif sur les performances du site Web.

À quand remonte la dernière fois que vous avez vérifié les erreurs logicielles 404 ?

Consultation avec Neil Patel

Découvrez comment mon agence peut générer des quantités massives de trafic vers votre site Web

  • SEO - débloquez des quantités massives de trafic SEO. Voir les vrais résultats.
  • Marketing de contenu - notre équipe crée un contenu épique qui sera partagé, obtiendra des liens et attirera du trafic.
  • Médias payants - stratégies payantes efficaces avec un retour sur investissement clair.

Réserver un appel