WordPress サイトでコンテンツのスクレイピングを防ぐ方法 (5 つの方法)

公開: 2023-07-27


Web サイトの所有者として、優れたコンテンツを作成するために時間と労力を費やしたのに、誰かがやって来てコンテンツを盗むだけになるのはイライラすることがあります。 したがって、サイトでのコンテンツのスクレイピングを防ぐ措置を講じることは非常に重要です。 ‍

たとえば、RSS フィードに変更を加えたり、著作権表示を表示したりできます。 あるいは、ボットや詐欺師が素材を持ち上げるのを防ぐために、内部リンクを多数追加することもできます。

コンテンツスクレイピングの概要

コンテンツ スクレイピングは、ユーザーがサイトからコンテンツを盗んで独自に再公開するときに発生します。 通常、これはサイトの RSS フィードを使用して自動的に行われますが、コピー アンド ペーストを使用して手動で実行することもできます。 テキスト、画像、ビデオなどあらゆる種類のコンテンツをコピーできます。

通常、窃盗犯はあなたのコンテンツを自分のオリジナル素材であるかのように Web サイトに表示するだけです。 場合によっては、ユーザーがサイトへのリンクを追加することがあります。 ただし、彼らは依然としてあなたのコンテンツをあなたの同意なしに使用しているため、これは同じくらいイライラする可能性があります。

それも違法です。 コンテンツのスクレイピングは著作権法および知的財産権の違反であり、犯人はオリジナルの作成者から訴訟を起こされる可能性があります。

スクレイパーがコンテンツを盗もうとする理由はたくさんあります。 たとえば、企業や個人は、自社のサイトに質の高い情報を掲載することで、特定の分野における権威を確立しようとする場合があります。

ただし、時間を節約するために、自分の Web サイトからアイデアや段落全体を引用する場合があります。 または、あなたの素材を使用して自分の Web サイトを収益化するために、あなたのコンテンツに広告を挿入する場合があります。

あるいは、アフィリエイト マーケティング担当者は、コンテンツを使用して検索エンジンを通じてオーガニック トラフィックを獲得できます。 そうすれば、アフィリエイト製品を販売または宣伝するための潜在的な顧客を大量に引き付けることができます ️。

WordPress サイトでのコンテンツのスクレイピングを防ぐ方法

コンテンツ スクレイピングについて少し理解できたところで、WordPress でコンテンツ スクレイピングを防ぐ 5 つの方法を見てみましょう。

  1. 著作権表示を表示する
  2. RSS フィードを変更する
  3. スクレイパーのIPアドレスをブロックする
  4. 画像を保護する
  5. 内部リンクをたくさん追加する

1. 著作権表示を表示する

著作権法は、ブランド名、ロゴ、その他のコンテンツを含む知的財産権を保護します。 したがって、スクレーパーがサイト上でコンテンツの盗難を行う場合、実際には法律に違反していることになります。

専用のスクレーパーを阻止することはできないかもしれませんが、Web サイトに著作権表示を表示することはできます。 いずれにせよ、この行為は依然として違法です。 ただし、この方法では、ユーザーが許可なくコンテンツを使用できないことを明確に示すことができます。

Web サイトのフッターに著作権表示を追加することをお勧めします。 または、完全な利用規約へのリンクを追加することもできます。

スターバックスの Web サイトでは、コンテンツのスクレイピングを防ぐために著作権表示を使用しています。

フッターはすべての Web ページに表示されるため、著作権表示に最適な場所です。

さらに、問題をエスカレーションするために DMCA の申し立てを提出する必要がある場合には、著作権表示が役立ちます。 さらに一歩進めたい場合は、著作権登録を申請してください。 ただし、これは非常に難しいプロセスであるため、法的支援が必要になる場合があります。

前に述べたように、スクレイパーがコンテンツを自動的に盗む場合、彼らはサイトの RSS フィードに依存します。 したがって、フィードに小さな変更を加えて、WordPress でのコンテンツのスクレイピングを防ぐことをお勧めします。

最も簡単な変更は、RSS フィードに全コンテンツを含めるのではなく、各投稿の概要を提供することです。 この場合、スクレイパーがコピーできるのは、投稿の抜粋と、日付や作成者などのメタデータだけです。

WordPress でこれを設定するには、ダッシュボードから[設定] > [読み取り]に移動するだけです。 「フィード内の各投稿には、抜粋を含めて選択します」が表示されるまでスクロールします。

RSSフィードを抜粋して表示します。

次に、 「変更を保存」をクリックしてサイトを更新します。

3. スクレイパーの IP アドレスをブロックする

サイトでのコンテンツのスクレイピングを防ぐ最も簡単な方法の 1 つは、悪意のある IP アドレスをブロックすることです。 Web アプリケーション ファイアウォール (WAF) などのセキュリティ プラグインは、これを自動的に実行します。

WAF は、Web サイトへのすべての受信トラフィックを監視することで機能します。 その後、セキュリティ リスクがあるとみなされる IP アドレスを認識してブロックします。

さらに良いことに、 SucuriWordfence など、始めるための無料オプションがたくさんあります。

ただし、経験豊富なユーザーであれば、スクレイパーの IP アドレスを手動でブロックすることもできます。 これは、cPanel ダッシュボードの Raw アクセス ログを介して行うことができます。 または、ファイル マネージャーまたは FTP を通じて.htaccessファイルにアクセスできます。

.htaccessファイルを見つけて開いたら、次のコード行を追加し、数字をブロックする IP アドレスに置き換えます。

 Deny from 111.222.333.444.

複数の IP アドレスをブロックするには、ファイルの同じ行にスペースで区切って入力します。

ただし、この操作を実行するときは注意してください。 のバックアップを作成しておくことをお勧めします。 自分のサイトへのアクセスをブロックした場合に備えて、 htaccessファイルを作成します。

4. 画像を保護します (ホットリンクを無効にし、透かしを追加します)。

テキストはサイトから取得できますが、画像もターゲットにすることができます。 したがって、ホットリンクを無効にし、画像に透かしを追加して、WordPress サイトでのコンテンツのスクレイピングを防ぐことができます。

ホットリンクは、ユーザーが自分の Web サイトに画像を表示し、その画像をサーバーから読み込むときに発生します。 そのため、画像を表示するためにサーバー リソースが使用されるため、帯域幅の使用量が増加します。

ホットリンクを手動で無効にするには、ファイル マネージャーまたは FTP 経由で.htaccessファイルにアクセスする必要があります。 次に、次のコードをファイルに貼り付けます。

 /* Prevent image hotlinking in WordPress */ RewriteCond %HTTP_REFERER !^$ RewriteCond %HTTP_REFERER !^http(s)?://(www.)?yourwebsite.com [NC] RewriteCond %HTTP_REFERER !^http(s)?://(www.)?google.com [NC] RewriteCond %HTTP_REFERER !^http(s)?://(www.)?facebook.com [NC] RewriteCond %HTTP_REFERER !^http(s)?://(www.)?twitter.com [NC] RewriteCond %HTTP_REFERER !^http(s)?://(www.)?other-websites-go-here.com [NC] RewriteRule .(jpg|jpeg|png|gif)$ - [F]

このコードにより、Web サイト (Google、Facebook、Twitter、および自分のサイト以外) が画像を使用できなくなります。 さらに、最後の行のファイル形式を追加または削除して、どの画像にホットリンク防止を適用するかを決定できます。

WordPress 画像に透かしを入れて、サイト上のコンテンツの盗難を防ぐこともできるようになりました。 透かしが画像の邪魔になるため、画像がわずかに見えにくくなることに注意してください。

iStockでは、コンテンツのスクレイピングを防ぐために画像に透かしを入れます。

Image Watermark は、アップロードする新しい画像に自動的に透かしを入れる無料の WordPress プラグインです。 一方、サイト上の既存の画像に一括して透かしを入れることができます。

透かしを追加すると、潜在的な窃盗犯にとって障害となる可能性があります。 画像が他人のものであることは明らかであるため、スクレイパーは自分のウェブサイトであなたの写真を使用することについてよく考えるかもしれません。

5. 内部リンクをたくさん追加する

WordPress でコンテンツのスクレイピングを防ぐ最後の戦略は、投稿に多くの内部リンクを追加することです。 これにより、コンテンツがスクレイピングされにくくなるのではなく、コンテンツがスクレイピングされた場合でも、その行為から引き続き利益が得られることが保証されます。

たとえば、投稿内のすべての内部リンクは、スクレーパーのサイトから貴重なバックリンクを獲得します。 また、バックリンクは質の高い SEO 戦略の重要な部分であるため、これは検索ランキングを高める簡単な方法です。

さらに、内部リンクを使用すると、スクレーパーのサイトから自分のサイトにトラフィックをそらすことができます。 次に、高品質の素材を公開し、読み込み時間を短縮し、Web サイトの簡単なナビゲーションを実装することで、これらの訪問者が Web サイトに留まるようにすることができます。

結論

コンテンツのスクレイピングはイライラするだけでなく、他人があなたの知的財産を盗むことになるため、違法でもあります。 幸いなことに、テキスト、画像、ビデオのコピーを阻止できる特定のテクニックがあります。

要約すると、WordPress でコンテンツのスクレイピングを防ぐための 5 つの戦略があります。

  1. 著作権表示を表示します。
  2. RSS フィードを変更します。
  3. スクレーパーの IP アドレスをブロックします。
  4. 画像を保護します (ホットリンクを無効にし、透かしを追加します)。
  5. 内部リンクをたくさん追加します。

著作権法やコンテンツスクレイピングの慣行について質問はありますか? 以下のコメントセクションでお知らせください。