So verhindern Sie Content Scraping auf einer WordPress-Site (5 Möglichkeiten)

Veröffentlicht: 2023-07-27


Als Website-Besitzer kann es frustrierend sein, Zeit und Mühe in die Erstellung großartiger Inhalte zu investieren, nur um dann festzustellen, dass jemand vorbeikommt und sie stiehlt. Daher ist es sehr wichtig, Maßnahmen zu ergreifen, um Content Scraping auf Ihrer Website zu verhindern. ‍

Sie können beispielsweise Änderungen an Ihrem RSS-Feed vornehmen oder einen Copyright-Hinweis anzeigen. Oder Sie fügen viele interne Links hinzu, um Bots und Betrüger davon abzuhalten, Ihr Material zu stehlen.

Eine Einführung in das Content Scraping

Content Scraping liegt vor, wenn ein Benutzer Inhalte von Ihrer Website stiehlt und diese selbst erneut veröffentlicht. Während dies normalerweise automatisch über den RSS-Feed Ihrer Website erfolgt, kann es auch manuell durch Kopieren und Einfügen erfolgen. Es können alle Arten von Inhalten kopiert werden, darunter Texte, Bilder und Videos.

Normalerweise zeigt der Dieb Ihren Inhalt einfach auf seiner Website an, als wäre es sein eigenes Originalmaterial. Manchmal fügt der Benutzer einen Link zurück zu Ihrer Website hinzu. Da Ihre Inhalte jedoch immer noch ohne Ihre Zustimmung verwendet werden, kann dies genauso frustrierend sein.

Es ist auch illegal. Das Scraping von Inhalten stellt einen Verstoß gegen das Urheberrecht und geistige Eigentumsrechte dar und die Täter können vom ursprünglichen Ersteller verklagt werden.

Es gibt viele Gründe, warum sich Scraper dafür entscheiden, Inhalte zu stehlen. Beispielsweise kann ein Unternehmen oder eine Einzelperson versuchen, in einem bestimmten Bereich Autorität zu erlangen, indem sie ihre Website mit hochwertigen Informationen füllen.

Um Zeit zu sparen, können sie jedoch Ideen oder ganze Absätze von Ihrer eigenen Website übernehmen. Oder sie füllen Ihre Inhalte mit Anzeigen, um ihre eigene Website mit Ihrem Material zu monetarisieren.

Alternativ können Affiliate-Vermarkter durch die Nutzung Ihrer Inhalte organischen Traffic über Suchmaschinen gewinnen. Dann können sie einen großen Pool potenzieller Kunden gewinnen, um ihre Affiliate-Produkte zu verkaufen oder zu bewerben ️.

So verhindern Sie Content Scraping auf einer WordPress-Site

Nachdem Sie nun etwas mehr über Content Scraping wissen, werfen wir einen Blick auf fünf Möglichkeiten, um Content Scraping in WordPress zu verhindern:

  1. Zeigen Sie einen Urheberrechtshinweis an
  2. Nehmen Sie Änderungen an Ihrem RSS-Feed vor
  3. Blockieren Sie die IP-Adresse des Scrapers
  4. Schützen Sie Ihre Bilder
  5. Fügen Sie viele interne Links hinzu

1. Zeigen Sie einen Urheberrechtshinweis an

Urheberrechtsgesetze schützen Ihre geistigen Eigentumsrechte, einschließlich Ihres Markennamens, Ihres Logos und anderer Inhalte. Wenn also ein Scraper Inhalte auf Ihrer Website stiehlt, verstößt er tatsächlich gegen das Gesetz.

Auch wenn es engagierte Scraper möglicherweise nicht abschreckt, können Sie auf Ihrer Website einen Copyright-Hinweis anzeigen. Die Praxis ist trotzdem immer noch illegal. Auf diese Weise können Sie jedoch deutlich machen, dass Benutzer Ihre Inhalte nicht ohne Erlaubnis verwenden können.

Es empfiehlt sich, den Copyright-Hinweis in die Fußzeile Ihrer Website einzufügen. Oder Sie können einen Link zu Ihren vollständigen Geschäftsbedingungen hinzufügen:

Die Starbucks-Website verwendet einen Urheberrechtshinweis, um das Scraping von Inhalten zu verhindern.

Die Fußzeile ist ein großartiger Ort für Ihren Copyright-Hinweis, da er auf allen Ihren Webseiten angezeigt wird.

Darüber hinaus kann ein Urheberrechtshinweis nützlich sein, wenn Sie eine DMCA-Beschwerde einreichen müssen, um das Problem eskalieren zu lassen. Wenn Sie noch einen Schritt weiter gehen möchten, beantragen Sie die Registrierung des Urheberrechts. Möglicherweise benötigen Sie dabei jedoch rechtlichen Beistand, da es sich um einen recht kniffligen Prozess handelt.

Wie bereits erwähnt: Wenn ein Scraper Ihre Inhalte automatisch stiehlt, verlässt er sich auf den RSS-Feed Ihrer Website. Daher ist es eine gute Idee, eine kleine Änderung an Ihrem Feed vorzunehmen, um Content Scraping in WordPress zu verhindern.

Die einfachste Änderung besteht darin, eine Zusammenfassung jedes Beitrags in Ihrem RSS-Feed bereitzustellen, anstatt den vollständigen Inhalt einzuschließen. In diesem Fall kann der Scraper lediglich Ihren Beitragsauszug und Metadaten wie Datum und Autor kopieren.

Um dies in WordPress zu konfigurieren, gehen Sie einfach in Ihrem Dashboard zu Einstellungen > Lesen . Scrollen Sie, bis Sie „Für jeden Beitrag in einem Feed „Auszug einschließen“ sehen und wählen Sie „Auszug“ aus:

RSS-Feed als Auszüge anzeigen.

Klicken Sie dann auf „Änderungen speichern“ , um Ihre Website zu aktualisieren.

3. Blockieren Sie die IP-Adresse des Scrapers

Eine der einfachsten Möglichkeiten, Content Scraping auf Ihrer Website zu verhindern, besteht darin, einfach die bösartige IP-Adresse zu blockieren. Ein Sicherheits-Plugin wie eine Web Application Firewall (WAF) erledigt dies automatisch.

Eine WAF funktioniert, indem sie den gesamten eingehenden Datenverkehr auf Ihrer Website überwacht. Dann erkennt und blockiert es jede IP-Adresse, die es als Sicherheitsrisiko einstuft.

Besser noch, es gibt viele kostenlose Optionen wie Sucuri und Wordfence für den Einstieg:

Sie können die IP-Adresse eines Scrapers jedoch auch manuell blockieren, wenn Sie ein erfahrenerer Benutzer sind. Sie können dies entweder über die Raw-Zugriffsprotokolle Ihres cPanel-Dashboards tun. Alternativ können Sie über den Dateimanager oder FTP auf Ihre .htaccess- Datei zugreifen.

Sobald Sie die .htaccess- Datei gefunden und geöffnet haben, fügen Sie einfach die folgende Codezeile hinzu und ersetzen Sie die Zahlen durch die IP-Adresse, die Sie blockieren möchten:

 Deny from 111.222.333.444.

Um mehrere IP-Adressen zu blockieren, geben Sie diese in derselben Zeile der Datei ein, trennen Sie sie jedoch durch Leerzeichen.

Seien Sie jedoch vorsichtig, wenn Sie diesen Vorgang durchführen. Es ist immer eine gute Idee, ein Backup Ihrer . htaccess- Datei für den Fall, dass Sie sich den Zugriff auf Ihre eigene Website verweigern.

4. Schützen Sie Ihre Bilder (Hotlinking deaktivieren und Wasserzeichen hinzufügen)

Während Text von Ihrer Website übernommen werden kann, können auch Bilder gezielt eingesetzt werden. Daher können Sie Hotlinking deaktivieren und Ihren Bildern Wasserzeichen hinzufügen, um Content Scraping auf Ihrer WordPress-Site zu verhindern.

Hotlinking tritt auf, wenn ein Benutzer Ihre Bilder auf seiner eigenen Website anzeigt, das Bild jedoch von Ihrem Server lädt. Dadurch erhöht sich Ihre Bandbreitennutzung, da Ihre Serverressourcen für die Anzeige des Bildes genutzt werden.

Um Hotlinking manuell zu deaktivieren, müssen Sie über den Dateimanager oder FTP auf Ihre .htaccess- Datei zugreifen. Fügen Sie dann den folgenden Code in die Datei ein:

 /* Prevent image hotlinking in WordPress */ RewriteCond %HTTP_REFERER !^$ RewriteCond %HTTP_REFERER !^http(s)?://(www.)?yourwebsite.com [NC] RewriteCond %HTTP_REFERER !^http(s)?://(www.)?google.com [NC] RewriteCond %HTTP_REFERER !^http(s)?://(www.)?facebook.com [NC] RewriteCond %HTTP_REFERER !^http(s)?://(www.)?twitter.com [NC] RewriteCond %HTTP_REFERER !^http(s)?://(www.)?other-websites-go-here.com [NC] RewriteRule .(jpg|jpeg|png|gif)$ - [F]

Dieser Code verhindert, dass Websites (außer Google, Facebook, Twitter und Ihrer eigenen Website) Ihre Bilder verwenden. Darüber hinaus können Sie in der letzten Zeile Dateiformate hinzufügen oder entfernen, um zu bestimmen, auf welche Bilder die Hotlink-Prävention angewendet werden soll.

Jetzt können Sie Ihre WordPress-Bilder auch mit Wasserzeichen versehen, um den Diebstahl von Inhalten auf Ihrer Website zu verhindern. Beachten Sie, dass dadurch Ihre Bilder leicht verdeckt werden, da das Wasserzeichen das Bild beeinträchtigt:

iStock versieht Bilder mit Wasserzeichen, um Content Scraping zu verhindern.

Image Watermark ist ein kostenloses WordPress-Plugin, das neue Bilder, die Sie hochladen, automatisch mit einem Wasserzeichen versehen. In der Zwischenzeit können Sie vorhandene Bilder auf Ihrer Website in großen Mengen mit Wasserzeichen versehen.

Das Hinzufügen von Wasserzeichen kann für potenzielle Diebe ein Hindernis darstellen. Scraper denken möglicherweise zweimal darüber nach, Ihre Fotos auf ihren Websites zu verwenden, da ziemlich klar wäre, dass die Bilder jemand anderem gehören.

5. Fügen Sie viele interne Links hinzu

Die letzte Strategie, um Content Scraping in WordPress zu verhindern, besteht darin, Ihren Beiträgen viele interne Links hinzuzufügen. Anstatt das Scrapen Ihrer Inhalte zu erschweren, stellt dies sicher, dass Sie auch dann noch von der Aktion profitieren, wenn Inhalte gescrapt werden.

Beispielsweise erhalten Sie durch alle internen Links in Ihren Beiträgen wertvolle Backlinks von der Scraper-Website. Und da Backlinks ein wichtiger Bestandteil jeder hochwertigen SEO-Strategie sind, ist dies eine einfache Möglichkeit, Ihr Suchranking zu verbessern.

Darüber hinaus ermöglichen Ihnen interne Links, den Verkehr von der Website des Scrapers auf Ihre eigene umzuleiten. Anschließend können Sie sicherstellen, dass diese Besucher auf Ihrer Website bleiben, indem Sie hochwertiges Material veröffentlichen, schnelle Ladezeiten bieten und eine einfache Website-Navigation implementieren.

Abschluss

Content Scraping ist nicht nur frustrierend, sondern auch illegal, da es dazu führt, dass andere Ihr geistiges Eigentum stehlen. Glücklicherweise gibt es bestimmte Techniken, die Menschen davon abhalten können, Ihre Texte, Bilder und Videos zu kopieren.

Um es noch einmal zusammenzufassen: Hier sind fünf Strategien, um Content Scraping in WordPress zu verhindern:

  1. Zeigen Sie einen Urheberrechtshinweis an.
  2. Nehmen Sie Änderungen an Ihrem RSS-Feed vor.
  3. Blockieren Sie die IP-Adresse des Scrapers.
  4. Schützen Sie Ihre Bilder (deaktivieren Sie Hotlinking und fügen Sie Wasserzeichen hinzu).
  5. Fügen Sie viele interne Links hinzu.

Haben Sie Fragen zu Urheberrechtsgesetzen oder Content-Scraping-Praktiken? Lass es uns im Kommentarbereich unten wissen!