Jak zapobiegać skrobaniu treści w witrynie WordPress (5 sposobów)

Opublikowany: 2023-07-27


Jako właściciel witryny może być frustrujące poświęcanie czasu i wysiłku na tworzenie świetnych treści tylko po to, by ktoś przyszedł i ukradł. Dlatego bardzo ważne jest, aby podjąć kroki zapobiegające scrapingowi treści w Twojej witrynie. ‍

Możesz na przykład wprowadzić zmiany w swoim kanale RSS lub wyświetlić informację o prawach autorskich. Możesz też dodać wiele linków wewnętrznych, aby zniechęcić boty i oszustów do podnoszenia Twoich materiałów.

Wprowadzenie do scrapingu treści

Zgarnianie treści ma miejsce, gdy użytkownik kradnie treść z Twojej witryny i publikuje ją ponownie na własną rękę. Zwykle odbywa się to automatycznie za pomocą kanału RSS Twojej witryny, ale można to również zrobić ręcznie, używając funkcji kopiowania i wklejania. Można kopiować wszelkiego rodzaju treści, w tym tekst, obrazy i filmy.

Zwykle złodziej po prostu wyświetla Twoje treści na swojej stronie internetowej, tak jakby były to ich własne oryginalne materiały. Czasami użytkownik może dodać link z powrotem do Twojej witryny. Ponieważ jednak nadal używają Twoich treści bez Twojej zgody, może to być równie frustrujące.

To także nielegalne. Skrobanie treści stanowi naruszenie praw autorskich i praw własności intelektualnej, a winowajcy mogą zostać pozwani przez oryginalnego twórcę.

Istnieje wiele powodów, dla których scrapery decydują się na kradzież treści. Na przykład firma lub osoba fizyczna może próbować ustanowić autorytet w określonej dziedzinie, wypełniając swoją witrynę informacjami wysokiej jakości.

Aby jednak zaoszczędzić czas, mogą usunąć pomysły lub całe akapity z Twojej witryny. Mogą też umieszczać reklamy w Twoich treściach, aby zarabiać na swojej witrynie internetowej za pomocą Twoich materiałów.

Alternatywnie, marketingowcy stowarzyszeni mogą pozyskiwać ruch organiczny za pośrednictwem wyszukiwarek, wykorzystując Twoje treści. Następnie mogą przyciągnąć dużą pulę potencjalnych klientów do sprzedaży lub promocji swoich produktów stowarzyszonych ️.

Jak zapobiegać skrobaniu treści w witrynie WordPress

Teraz, gdy wiesz już trochę więcej o zbieraniu treści, przyjrzyjmy się pięciu sposobom zapobiegania skrobaniu treści w WordPress:

  1. Wyświetl informację o prawach autorskich
  2. Wprowadź zmiany w swoim kanale RSS
  3. Zablokuj adres IP scrapera
  4. Chroń swoje obrazy
  5. Dodaj wiele linków wewnętrznych

1. Wyświetl informację o prawach autorskich

Prawa autorskie chronią Twoje prawa własności intelektualnej, w tym nazwę marki, logo i inne treści. Dlatego też, gdy scraper dopuszcza się kradzieży treści w Twojej witrynie, w rzeczywistości łamie prawo.

Chociaż może to nie odstraszyć wyspecjalizowanych skrobaków, możesz umieścić informację o prawach autorskich na swojej stronie internetowej. Niezależnie od tego praktyka jest nadal nielegalna. Jednak w ten sposób możesz jasno powiedzieć, że użytkownicy nie mogą korzystać z Twoich treści bez pozwolenia.

Dobrym pomysłem jest dodanie informacji o prawach autorskich do stopki witryny. Możesz też dodać link do pełnych warunków:

Witryna Starbucks wykorzystuje informację o prawach autorskich, aby zapobiec pobieraniu treści.

Stopka to doskonałe miejsce na informację o prawach autorskich, ponieważ będzie wyświetlana na wszystkich Twoich stronach internetowych.

Co więcej, informacja o prawach autorskich może się przydać, jeśli musisz złożyć skargę DMCA w celu eskalacji problemu. Jeśli chcesz pójść o krok dalej, złóż wniosek o rejestrację praw autorskich. Możesz jednak potrzebować pomocy prawnej, ponieważ jest to dość skomplikowany proces.

Jak wspomnieliśmy wcześniej, jeśli scraper automatycznie kradnie Twoje treści, polega na kanale RSS Twojej witryny. Dlatego dobrym pomysłem jest wprowadzenie niewielkiej zmiany w swoim kanale, aby zapobiec skrobaniu treści w WordPress.

Najprostszą zmianą do wprowadzenia jest dodanie podsumowania każdego posta w kanale RSS zamiast dołączania pełnej treści. W tym przypadku skrobak może skopiować tylko fragment postu i metadane, takie jak data i autor.

Aby skonfigurować to w WordPress, po prostu przejdź do Ustawienia > Czytanie z pulpitu nawigacyjnego. Przewiń, aż zobaczysz Dla każdego posta w kanale dołącz i wybierz Fragment :

Wyświetl kanał RSS jako fragmenty.

Następnie kliknij Zapisz zmiany , aby zaktualizować swoją witrynę.

3. Zablokuj adres IP skrobaka

Jednym z najłatwiejszych sposobów zapobiegania zbieraniu treści w Twojej witrynie jest po prostu zablokowanie złośliwego adresu IP. Wtyczka bezpieczeństwa, taka jak zapora sieciowa (WAF), zrobi to automatycznie.

WAF działa poprzez monitorowanie całego ruchu przychodzącego do Twojej witryny. Następnie rozpozna i zablokuje każdy adres IP, który uzna za zagrożenie bezpieczeństwa.

Co więcej, istnieje wiele bezpłatnych opcji, takich jak Sucuri i Wordfence na początek:

Możesz jednak ręcznie zablokować adres IP skrobaka, jeśli jesteś bardziej doświadczonym użytkownikiem. Możesz to zrobić za pomocą nieprzetworzonych dzienników dostępu z pulpitu nawigacyjnego cPanel. Lub możesz uzyskać dostęp do pliku .htaccess za pośrednictwem Menedżera plików lub FTP.

Po zlokalizowaniu i otwarciu pliku .htaccess po prostu dodaj następujący wiersz kodu, zastępując cyfry adresem IP, który chcesz zablokować:

 Deny from 111.222.333.444.

Aby zablokować wiele adresów IP, wpisz je w tym samym wierszu pliku, ale oddziel je spacjami.

Zachowaj jednak ostrożność podczas wykonywania tej operacji. Zawsze dobrze jest mieć kopię zapasową plików . htaccess na wypadek zablokowania sobie dostępu do własnej witryny.

4. Chroń swoje zdjęcia (wyłącz hotlinkowanie i dodaj znaki wodne)

Chociaż tekst można pobrać z Twojej witryny, obrazy mogą być również kierowane. Dlatego możesz wyłączyć hotlinkowanie i dodać znaki wodne do swoich obrazów, aby zapobiec skrobaniu treści w witrynie WordPress.

Hotlinkowanie ma miejsce, gdy użytkownik wyświetla twoje obrazy na swojej stronie internetowej, ale ładuje obraz z twojego serwera. W związku z tym zwiększa wykorzystanie przepustowości, ponieważ wykorzystuje zasoby serwera do wyświetlenia obrazu.

Aby ręcznie wyłączyć hotlinkowanie, musisz uzyskać dostęp do pliku .htaccess za pośrednictwem Menedżera plików lub FTP. Następnie wklej następujący kod do pliku:

 /* Prevent image hotlinking in WordPress */ RewriteCond %HTTP_REFERER !^$ RewriteCond %HTTP_REFERER !^http(s)?://(www.)?yourwebsite.com [NC] RewriteCond %HTTP_REFERER !^http(s)?://(www.)?google.com [NC] RewriteCond %HTTP_REFERER !^http(s)?://(www.)?facebook.com [NC] RewriteCond %HTTP_REFERER !^http(s)?://(www.)?twitter.com [NC] RewriteCond %HTTP_REFERER !^http(s)?://(www.)?other-websites-go-here.com [NC] RewriteRule .(jpg|jpeg|png|gif)$ - [F]

Ten kod uniemożliwia jakiejkolwiek stronie internetowej (innej niż Google, Facebook, Twitter i Twoja własna strona) korzystanie z Twoich zdjęć. Ponadto możesz dodawać lub usuwać formaty plików z ostatniego wiersza, aby określić, do których obrazów zastosować ochronę przed hotlinkami.

Teraz możesz również oznaczyć swoje obrazy WordPress znakiem wodnym, aby zapobiec kradzieży treści w Twojej witrynie. Pamiętaj, że spowoduje to lekkie zaciemnienie obrazów, ponieważ znak wodny będzie kolidował z obrazem:

iStock znaki wodne na obrazach, aby zapobiec skrobaniu treści.

Image Watermark to darmowa wtyczka WordPress, która automatycznie dodaje znaki wodne do nowych przesyłanych obrazów. Tymczasem umożliwia masowe umieszczanie znaku wodnego na istniejących obrazach w witrynie.

Dodanie znaków wodnych może stanowić przeszkodę dla potencjalnych złodziei. Skrobacze mogą dwa razy pomyśleć przed użyciem twoich zdjęć na swoich stronach internetowych, ponieważ byłoby całkiem jasne, że obrazy należą do kogoś innego.

5. Dodaj wiele linków wewnętrznych

Ostateczną strategią zapobiegania skrobaniu treści w WordPress jest dodanie wielu wewnętrznych linków do twoich postów. Zamiast utrudniać zeskrobywanie treści, zapewnia to, że jeśli treść zostanie zeskrobana, nadal będziesz czerpać korzyści z tego aktu.

Na przykład wszystkie wewnętrzne linki w Twoich postach przyniosą Ci cenne linki zwrotne ze strony skrobaka. A ponieważ linki zwrotne są kluczowym elementem każdej wysokiej jakości strategii SEO, jest to łatwy sposób na zwiększenie pozycji w rankingu wyszukiwania.

Co więcej, linki wewnętrzne umożliwiają przekierowanie ruchu z witryny skrobaka na własną. Następnie możesz upewnić się, że odwiedzający pozostaną w Twojej witrynie, publikując wysokiej jakości materiały, zapewniając szybki czas ładowania i wdrażając łatwą nawigację w witrynie.

Wniosek

Skrobanie treści jest nie tylko frustrujące, ale także nielegalne, ponieważ wiąże się z kradzieżą Twojej własności intelektualnej przez innych. Na szczęście istnieją pewne techniki, które mogą zniechęcić ludzi do kopiowania Twojego tekstu, obrazów i filmów.

Podsumowując, oto pięć strategii zapobiegania skrobaniu treści w WordPress:

  1. Wyświetl informację o prawach autorskich.
  2. Wprowadź zmiany w swoim kanale RSS.
  3. Zablokuj adres IP scrapera.
  4. Chroń swoje zdjęcia (wyłącz hotlinkowanie i dodaj znaki wodne).
  5. Dodaj wiele linków wewnętrznych.

Czy masz jakieś pytania dotyczące praw autorskich lub praktyk związanych ze zbieraniem treści? Daj nam znać w sekcji komentarzy poniżej!