Błędy 404 a miękkie błędy 404: różnice i rozwiązania

Opublikowany: 2023-01-17

Czym są błędy HTTP?

Błędy HTTP to kody zwracane przez serwer WWW do klienta (takiego jak przeglądarka internetowa) w celu wskazania, że ​​coś poszło nie tak z żądaniem (jednym z nich jest błąd 404). Klient otrzymuje ten kod błędu i komunikat w odpowiedzi na żądanie HTTP wysłane do serwera.

Błędy HTTP są pogrupowane w klasy, a każda klasa jest reprezentowana przez określony zakres liczb. Najczęstsze klasy błędów HTTP to:

  • 1xx (Informacyjny): Odebrano żądanie i trwa proces
  • 2xx (powodzenie): żądanie zostało pomyślnie odebrane, zrozumiane i zaakceptowane
  • 3xx (Przekierowanie): Należy podjąć dalsze działania w celu zrealizowania żądania
  • 4xx (Błąd klienta): Żądanie zawiera złą składnię lub nie może zostać zrealizowane przez serwer
  • 5xx (błąd serwera): serwer nie zrealizował prawidłowego żądania

Każdy błąd ma określony kod i komunikat, które pomagają zdiagnozować i rozwiązać problem. Na przykład najczęstszym błędem HTTP jest błąd 404 Not Found, który wskazuje, że żądanego zasobu nie można znaleźć na serwerze.

Należy zauważyć, że błędy HTTP nie ograniczają się do przeglądarek internetowych, każda aplikacja komunikująca się przez HTTP może napotkać błędy.

Co oznacza „Kod odpowiedzi 404”?

Kod odpowiedzi 404, znany również jako błąd „404 Not Found”, oznacza, że ​​serwer nie mógł znaleźć żądanego zasobu. Może się to zdarzyć z różnych powodów, na przykład gdy użytkownik próbuje uzyskać dostęp do strony, która została usunięta lub przeniesiona, lub gdy użytkownik wpisze nieprawidłowy adres URL.

Błąd 404 jest błędem po stronie klienta, co oznacza, że ​​problem dotyczy żądania użytkownika, a nie serwera. Serwer jest w stanie zrozumieć żądanie klienta, ale nie może zlokalizować żądanego zasobu.

Gdy użytkownik napotka błąd 404, zazwyczaj zobaczy w przeglądarce komunikat „404 nie znaleziono” lub „Żądany adres URL nie został znaleziony na tym serwerze”. Dodatkowo użytkownik może zobaczyć niestandardową stronę błędu, którą skonfigurował administrator serwisu.

Należy zauważyć, że błąd 404 nie oznacza, że ​​serwer jest wyłączony lub że wystąpił problem ze stroną internetową. Oznacza to po prostu, że serwer nie mógł znaleźć żądanego zasobu. Jeśli jesteś właścicielem witryny, powinieneś sprawdzić adres URL lub linki, aby upewnić się, że są poprawne i działają poprawnie.

Co może powodować komunikat „404 Nie znaleziono strony”?

Istnieje kilka potencjalnych przyczyn błędu 404 „Nie znaleziono strony”, w tym:

  1. Wpisywanie nieprawidłowego adresu URL: Jest to częsta przyczyna błędów 404, zwłaszcza gdy użytkownik ręcznie wpisuje adres URL, aby uzyskać dostęp do określonej strony.
  2. Zepsute linki: Zepsuty link to link w witrynie, który nie wskazuje już prawidłowego zasobu. Może się to zdarzyć, jeśli zasób został przeniesiony lub usunięty albo jeśli link został wpisany niepoprawnie.
  3. Przeniesione lub usunięte strony internetowe: jeśli strona internetowa została przeniesiona lub usunięta, wszelkie linki prowadzące do tej strony spowodują błąd 404.
  4. Przeprojektowanie witryny: jeśli witryna została przeprojektowana, adresy URL niektórych stron mogły ulec zmianie. Wszelkie stare linki wskazujące na stare adresy URL spowodują błąd 404.
  5. Niepoprawnie skonfigurowane serwery: Jeśli serwer nie jest poprawnie skonfigurowany, może zwrócić błąd 404, nawet jeśli żądany zasób istnieje.
  6. Buforowanie błędów: jeśli przeglądarka użytkownika zapisała w pamięci podręcznej starą wersję strony internetowej, może zobaczyć błąd 404, nawet jeśli strona jest obecnie dostępna w witrynie.
  7. Przepisywanie adresów URL: jeśli witryna korzysta z przepisywania adresów URL, może zwrócić błąd 404, jeśli przepisany adres URL nie jest poprawnie skonfigurowany.
  8. Nieprawidłowo skonfigurowany plik .htaccess: Plik .htaccess jest plikiem konfiguracyjnym używanym przez serwery WWW Apache. Jeśli nie jest poprawnie skonfigurowany, może powodować błędy 404.

Należy zauważyć, że niektóre z tych przyczyn mogą być poza kontrolą właściciela witryny, ale niektóre z nich może naprawić właściciel witryny, sprawdzając adres URL, linki lub odpowiednio konfigurując serwer.

Co to jest miękki błąd 404?

Miękki błąd 404 to rodzaj błędu, który występuje, gdy serwer zwraca kod stanu HTTP „200 OK”, ale zawartość strony jest w rzeczywistości stroną „404 Not Found” lub stroną bez przydatnej treści. Innymi słowy, pozorny błąd 404 występuje, gdy serwer zwraca stronę, która wygląda jak prawidłowa strona, ale nie zawiera oczekiwanych informacji ani zasobów.

Główna różnica między miękkim błędem 404 a tradycyjnym błędem 404 polega na tym, że pierwszy zwraca kod stanu „200 OK”, a drugi zwraca kod stanu „404 nie znaleziono”. Może to być mylące zarówno dla użytkowników, jak i wyszukiwarek, ponieważ serwer wskazuje, że strona jest prawidłowa, podczas gdy w rzeczywistości tak nie jest.

Co może spowodować miękki błąd 404?

Miękki błąd 404 może być spowodowany kilkoma czynnikami, z których niektóre obejmują:

  1. Niestandardowe strony błędów: Witryna internetowa może mieć niestandardową stronę błędu, która zwraca kod stanu „200 OK”, ale nie zawiera oczekiwanych informacji ani zasobów. Na przykład niestandardowa strona błędu może zawierać po prostu informację „404 nie znaleziono”, ale nie udostępniać funkcji wyszukiwania ani łącza do strony głównej.
  2. Nieprawidłowo skonfigurowane przekierowania: Witryna może mieć przekierowanie, które odsyła użytkowników do innej strony, gdy żądany zasób nie zostanie znaleziony. Jeśli jednak przekierowanie nie zostanie poprawnie skonfigurowane, może zwrócić kod stanu „200 OK” zamiast kodu stanu „404 Nie znaleziono”.
  3. Dynamiczne generowanie treści: Witryny, które generują treści dynamicznie na podstawie danych wprowadzanych przez użytkownika (np. funkcja wyszukiwania), mogą zwracać kod stanu „200 OK”, ale nie obsługiwać prawidłowo brakujących zasobów, co skutkuje pozornym błędem 404.
  4. Nieprawidłowo skonfigurowane ustawienia serwera: Witryna internetowa może mieć nieprawidłowo skonfigurowane ustawienia serwera, które uniemożliwiają serwerowi zwrócenie kodu stanu „404 Nie znaleziono”, gdy zażądano brakującego zasobu.
  5. Kod śledzenia analizy witryny: niektóre kody śledzenia analizy witryny ignorują kod stanu HTTP i zamiast tego śledzą tylko przeglądane strony, co może prowadzić do pozornego błędu 404.
  6. Nieprawidłowo skonfigurowany plik .htaccess: Plik .htaccess jest plikiem konfiguracyjnym używanym przez serwery WWW Apache. Jeśli nie jest poprawnie skonfigurowany, może powodować miękkie błędy 404.

Dlaczego błąd Soft 404 jest problematyczny?

Miękkie błędy 404 mogą być problematyczne z kilku powodów:

  • Mogą wprowadzać użytkowników w błąd, ponieważ mogą nie zdawać sobie sprawy, że przeglądana przez nich strona nie jest stroną, której oczekiwali.
  • Mogą one negatywnie wpłynąć na rankingi wyszukiwarek, ponieważ wyszukiwarki mogą nie być w stanie dokładnie określić trafności strony.
  • Mogą również prowadzić do problemów z analityką witryny, ponieważ ustalenie, ile rzeczywistych błędów 404 występuje w witrynie, może być trudne.

Aby zapobiec pozornym błędom 404, właściciele witryn powinni upewnić się, że ich niestandardowe strony błędów zwracają kod stanu „404 nie znaleziono” i zawierają informacje przydatne dla użytkownika, takie jak funkcja wyszukiwania lub link do strony głównej. Ponadto właściciele witryn powinni upewnić się, że ich przekierowania są poprawnie skonfigurowane oraz że wszelkie skrypty lub wtyczki używane w witrynie prawidłowo obsługują brakujące zasoby.

Miękki 404 z powodu błędów kodowania?

Tak, błędy kodowania mogą powodować pozorne błędy 404.

Na przykład, jeśli witryna internetowa zawiera stronę dynamiczną, która generuje treści na podstawie danych wprowadzanych przez użytkownika (takich jak funkcja wyszukiwania), a kod generujący treść nie obsługuje poprawnie brakujących zasobów, może zamiast tego zwrócić kod stanu „200 OK”. kodu stanu „404 Nie znaleziono”. Może to spowodować pozorny błąd 404, w przypadku którego serwer wskazuje, że strona jest poprawna, ale nie zawiera oczekiwanych informacji lub zasobów.

Innym przykładem jest sytuacja, gdy witryna korzysta ze skryptu lub wtyczki, która generuje niestandardową stronę błędu w przypadku błędu 404. Jeśli ten skrypt lub wtyczka nie jest poprawnie skonfigurowana, może zwrócić kod stanu „200 OK” zamiast kodu stanu „404 Nie znaleziono”.

Ponadto, jeśli witryna korzysta z przepisywania adresów URL, a kod przepisywania nie jest poprawnie skonfigurowany, może zwrócić kod stanu „200 OK” dla nieistniejących stron zamiast kodu stanu „404 Nie znaleziono”.

Należy pamiętać, że pozorne błędy 404 spowodowane błędami kodowania można rozwiązać, identyfikując i naprawiając konkretny problem z kodowaniem, który jest przyczyną problemu. Właściciele witryn powinni regularnie testować swoje strony i skrypty, aby upewnić się, że prawidłowo obsługują brakujące zasoby i zwracają odpowiedni kod stanu.

Jak rozpoznać strony błędów 404?

Istnieje kilka sposobów rozpoznawania stron błędów 404:

  1. Kod stanu HTTP: strona błędu 404 zwróci kod stanu HTTP „404 nie znaleziono” lub „410 nie ma”, aby wskazać, że nie można znaleźć strony.
  2. Komunikat o błędzie: strona zazwyczaj wyświetla komunikat o błędzie, taki jak „404 nie znaleziono” lub „Żądany adres URL nie został znaleziony na tym serwerze”.
  3. Niestandardowa strona błędu: niektóre witryny mają niestandardowe strony błędów, które mają wyglądać podobnie do reszty witryny, ale zawierają komunikat o błędzie.
  4. Zawartość strony: W przypadku miękkiego błędu 404 strona może nie zawierać żadnych przydatnych treści, a jedynie komunikat, że strona nie została znaleziona lub pole wyszukiwania.
  5. Komunikat o błędzie przeglądarki internetowej: Niektóre przeglądarki internetowe wyświetlają własny komunikat o błędzie, gdy wystąpi błąd 404, na przykład „Nie można znaleźć tej strony” lub „Nie można znaleźć żądanego zasobu”.
  6. Narzędzia dla webmasterów: możesz użyć narzędzi dla webmasterów, takich jak Google Search Console, aby śledzić błędy 404 w swojej witrynie.

Warto zauważyć, że nie wszystkie strony błędów 404 będą wyglądać tak samo, ponieważ właściciele witryn mogą dostosować strony błędów, aby pasowały do ​​wyglądu i stylu ich witryny. Jednak niezależnie od wyglądu strony błędu zawsze zwróci kod stanu „404 Not Found” lub „410 Gone”.

Raporty z Google Search Console

Adresy URL błędów 404 w witrynie są wymienione w raporcie Zasięg.

Google Search Console to fix 404 error

Gdy Google indeksuje wszystkie strony, które może zlokalizować, Search Console zgłosi 404 strony. Może to obejmować linki zwrotne do stron w Twojej witrynie, które nie są już obecne w innych witrynach.

Google Analytics

Domyślnie Google Analytics nie uwzględnia raportu o brakującej stronie. Istnieją jednak inne sposoby ich śledzenia. W raporcie niestandardowym możesz na przykład wydzielić strony, których tytuły zawierają Błąd 404 – Nie znaleziono strony.

Tworzenie niestandardowych kategorii treści i dodawanie do nich wszystkich stron 404 to kolejna technika wykrywania osieroconych stron w Google Analytics.

Witryna: Polecenie wyszukiwania operatorów

Witryna: zapytanie wyszukiwania nie może być użyte do zlokalizowania problemów 404, ponieważ Google nie indeksuje stron 404 ani fałszywych stron 404. Znalezienie stron internetowych w witrynie, które mają określone wyrażenie kluczowe w tekście, jest łatwe dzięki operatorowi wyszukiwania witryny Google.

Najbardziej niezawodnym źródłem do tworzenia listy miękkich i standardowych 404 jest Google Search Console. Odpowiedzi na błędy 404 można znaleźć za pomocą dzienników błędów ruchu w witrynie.

Inne oprogramowanie do analizy linków zwrotnych

Dodatkową pomoc mogą zapewnić narzędzia do analizy linków zwrotnych, takie jak Majestic, Ahrefs, Moz Open Site Explorer, Sistrix, Semrush, LinkResearchTools i CognitiveSEO.

Programy te często eksportują listę linków zwrotnych prowadzących do Twojej domeny. Następnie możesz sprawdzić wszystkie połączone strony i wyszukać stamtąd błędy 404.

Jak naprawić miękkie błędy 404?

Naprawa miękkich błędów 404 może obejmować kilka kroków, w zależności od przyczyny błędu:

  1. Niestandardowe strony błędów: jeśli witryna zawiera niestandardową stronę błędów, która zwraca kod stanu „200 OK”, ale nie zawiera oczekiwanych informacji ani zasobów, właściciel witryny powinien upewnić się, że niestandardowa strona błędów zwraca stan „404 Nie znaleziono” kod i zawiera przydatne informacje dla użytkownika, takie jak funkcja wyszukiwania lub link do strony głównej.
  2. Nieprawidłowo skonfigurowane przekierowania: jeśli witryna internetowa ma przekierowanie, które odsyła użytkowników do innej strony, gdy żądany zasób nie zostanie znaleziony, ale przekierowanie nie jest skonfigurowane poprawnie, właściciel witryny powinien upewnić się, że przekierowanie jest skonfigurowane tak, aby zwracało błąd „404 Nie znaleziono” kodu stanu.
  3. Dynamiczne generowanie treści: jeśli witryna internetowa generuje treści dynamicznie na podstawie danych wprowadzanych przez użytkownika (np. funkcja wyszukiwania), a kod generujący treść nie obsługuje prawidłowo brakujących zasobów, właściciel witryny powinien upewnić się, że kod prawidłowo obsługuje brakujące zasoby oraz zwracając kod stanu „404 Nie znaleziono”.
  4. Nieprawidłowo skonfigurowane ustawienia serwera: jeśli witryna internetowa ma nieprawidłowo skonfigurowane ustawienia serwera, które uniemożliwiają serwerowi zwrócenie kodu stanu „404 Nie znaleziono”, gdy żądany jest brakujący zasób, właściciel witryny powinien upewnić się, że ustawienia serwera są skonfigurowane poprawnie.
  5. Nieprawidłowo skonfigurowany plik .htaccess: Plik .htaccess jest plikiem konfiguracyjnym używanym przez serwery WWW Apache. Jeśli nie jest poprawnie skonfigurowany, może powodować miękkie błędy 404. Właściciel witryny powinien sprawdzić plik .htaccess i poprawić ewentualne błędy.
  6. Regularnie monitoruj i testuj: Regularne monitorowanie i testowanie witryny pod kątem pozornych błędów 404, korzystanie z narzędzi takich jak Google Search Console lub Narzędzia dla webmasterów lub korzystanie z dzienników błędów ruchu w witrynie może pomóc w zidentyfikowaniu błędu i naprawieniu go.

Należy pamiętać, że dokładne kroki potrzebne do naprawienia pozornego błędu 404 będą zależeć od konkretnej przyczyny błędu i architektury witryny. Znalezienie pierwotnej przyczyny problemu i wdrożenie odpowiedniego rozwiązania może zająć trochę prób i błędów.

Wniosek

Jeśli chodzi o błędy 404, należy pamiętać, że jeśli strony faktycznie zniknęły, nie można nic zrobić, aby je naprawić. W takim przypadku odpowiedź 404 jest akceptowalną odpowiedzią na prośby o strony, które nie istnieją. Jeśli jednak strony są obecne, ale pod innym adresem URL, należy to naprawić. Można to zrobić, przekierowując uszkodzony link do prawidłowego adresu URL, dodając utraconą stronę lub przekierowując stary adres URL na nową stronę, która zajęła jego miejsce.

Miękkie błędy 404 są spowodowane przez problem, który należy zidentyfikować i naprawić. Utrzymanie najwyższej wydajności strony internetowej wymaga zrozumienia różnych błędów 404 oraz umiejętności ich identyfikowania i rozwiązywania.