WordPressでブログコンテンツのスクレイピングを防ぐ方法

公開: 2023-03-09


スパマーや詐欺師がコンテンツ スクレイパーを使用して WordPress ブログの投稿を盗むのを防ぐ方法をお探しですか?

ウェブサイトの所有者として、誰かがあなたのコンテンツを無断で盗み、それを収益化し、Google であなたを上回り、あなたの視聴者を盗んでいるのを見るのは非常に苛立たしいことです。

この記事では、ブログ コンテンツ スクレイピングとは何か、コンテンツ スクレイピングを削減および防止する方法、さらにはコンテンツ スクレイパーを自分の利益のために活用する方法についても説明します。

Beginner's Guide to Preventing Blog Content Scraping in WordPress

WordPressのブログコンテンツスクレイピングとは?

ブログ コンテンツのスクレイピングとは、コンテンツが多数のソースから取得され、別のサイトに再公開されることです。 通常、これはブログの RSS フィードを介して自動的に行われます。

残念ながら、この方法で WordPress ブログのコンテンツが盗まれるのは非常に簡単であり、非常に一般的です。 それがあなたに起こった場合、あなたはそれがどれほどストレスがたまり、イライラするかを理解しています.

書式設定、画像、動画などのコンテンツが単純にコピーされ、別の Web サイトに直接貼り付けられることがあります。

また、あなたのコンテンツは、あなたの許可なしに、帰属表示とあなたのウェブサイトへのリンクとともに再投稿されることがあります。 これは SEO に役立ちますが、元のコンテンツをサイトでのみホストしたい場合があります。

コンテンツ スクレイパーがコンテンツを盗むのはなぜですか?

一部のユーザーから、スクレイパーがコンテンツを盗む理由を尋ねられました。 通常、コンテンツの盗難の主な動機は、あなたの努力から利益を得ることです。

  • アフィリエイト手数料:不正なアフィリエイト マーケティング担当者は、ニッチな製品を宣伝するために、あなたのコンテンツを使用して、検索エンジンを通じてサイトにトラフィックを誘導する可能性があります。
  • リードジェネレーション:弁護士や不動産業者は、誰かにお金を払ってコンテンツを追加し、コミュニティでの権限を得ることができます。
  • 広告収入:ブログの所有者は、「コミュニティの利益のために」特定のニッチで知識のハブを作成するためにコンテンツをかき集め、サイトに広告を貼り付けることがあります。

コンテンツのスクレイピングを完全に防止することは可能ですか?

この記事では、コンテンツのスクレイピングを削減および防止するために実行できるいくつかの手順を紹介します。 しかし、残念ながら、断固とした泥棒を完全に止める方法はありません。

そのため、この記事の最後に、コンテンツ スクレイパーの活用方法に関するセクションを掲載します。 常に泥棒を止めることはできませんが、盗んだコンテンツを通じてトラフィックと収益を得ることができる場合があります。

誰かがあなたのコンテンツをスクレイピングしたことを発見したとき、あなたは何をすべきですか?

スクレイパーを完全に止めることはできないため、ある日、誰かがあなたのブログから盗んだコンテンツを使用していることに気付くかもしれません。 そんな時、どうしようか迷ってしまうかもしれません。

コンテンツスクレイパーに対処するときに人々が取るいくつかのアプローチを次に示します。

  • 何もしない:スクレイパーとの戦いに多くの時間を費やすことができるため、一部の人気ブロガーは何もしないことにします。 Google はすでに有名なサイトをオーソリティと見なしていますが、小規模なサイトには当てはまりません。 したがって、私たちの意見では、このアプローチが常に最善であるとは限りません。
  • 削除:スクレイパーに連絡して、コンテンツを削除するよう依頼します。 彼らが拒否した場合は、削除通知を提出します。 WordPress で盗まれたコンテンツを簡単に見つけて削除する方法については、ガイドをご覧ください。
  • 活用する:私たちはWPBeginnerからスクレイピングされたコンテンツを削除することに積極的に取り組んでいますが、トラフィックを獲得してスクレイパーからお金を稼ぐためにいくつかの手法も使用しています. 以下の「コンテンツ スクレイパーを活用する」セクションでその方法を学ぶことができます。

そうは言っても、WordPressでブログのスクレイピングを防ぐ方法を見てみましょう. これは包括的なガイドであるため、ナビゲーションを容易にするために目次を含めました。

1. ブログの名前とロゴの著作権または商標登録

商標および著作権法は、知的財産権、ブランド、およびビジネスを多くの法的課題から保護します。 これには、著作権で保護された素材またはブランド名とロゴの違法使用が含まれます。

ウェブサイトに著作権表示を明確に表示する必要があります。 コンテンツは自動的に著作権法の対象となりますが、通知を表示すると、コンテンツに著作権があり、保護された資産をビジネスに使用できないことがわかります。

Display a Copyright Notice on Your Website

たとえば、動的な日付を含む著作権表示を WordPress フッターに追加できます。 これにより、著作権通知が最新の状態に保たれます。

これにより、一部のユーザーが盗むのを思いとどまらせる可能性があります。 また、盗まれたコンテンツを削除するために停止通知書を送ったり、DCMA に苦情を申し立てたりする必要がある場合にも役立ちます。

著作権登録はオンラインで申請することもできます。 このプロセスは複雑になる可能性がありますが、幸いなことに、中小企業や個人を支援できる低コストの法律サービスがあります。

ブログの名前とロゴを商標および著作権で保護する方法については、ガイドをご覧ください。

ブログ コンテンツのスクレイピングは通常、ブログの RSS フィードを介して自動的に行われるため、フィードに加えることができるいくつかの役立つ変更を見てみましょう。

WordPress RSS フィードに投稿コンテンツ全体を含めないでください

コンテンツ全体ではなく、各投稿の要約のみを RSS フィードに含めることができます。 これには、抜粋と、日付、作成者、カテゴリなどの投稿メタデータが含まれます。

ブログ コミュニティでは、完全な RSS フィードと要約フィードのどちらを使用するかについて、確かに議論があります。 ここでは、要約のみを使用する利点の 1 つは、コンテンツのスクレイピングを防ぐのに役立つということを除いて、これについては触れません。

WordPress 管理パネルの[設定] » [閲覧]に移動して、設定を変更できます。 「抜粋」オプションを選択し、「変更を保存」ボタンをクリックする必要があります。

RSS Feeds Can Contain Full Text or an Excerpt of Each Post

これで、RSS フィードには記事の抜粋のみが表示されます。 誰かがあなたの RSS フィードからあなたのコンテンツを盗んでいる場合、彼らは投稿全体ではなく要約だけを取得します。

要約を微調整したい場合は、WordPress の抜粋をカスタマイズする方法に関するガイドをご覧ください。

スクレイピングを防ぐために RSS フィードを最適化する

あなたができる他の方法がありますWordPress RSS フィードを最適化して、コンテンツを保護し、より多くのバックリンクを取得し、Web トラフィックを増やします。 最良の方法の1つは、 投稿が RSS フィードに表示されるのを遅らせます。

利点は、投稿が RSS フィードに表示されるのを遅らせると、スクレイパーの Web サイトなどの他の場所に表示される前に、検索エンジンがコンテンツをクロールしてインデックスに登録する時間を与えることになります。 その後、検索エンジンはあなたのサイトをオーソリティとして認識します。

これを行うための最も安全で簡単な方法は、正しいカスタム コードを WordPress に自動的に追加するレシピがある WPCode を使用することです。

Add a snippet using WPCode

詳細な手順については、投稿が WordPress RSS フィードに表示されるのを遅らせる方法に関するガイドを参照してください。

3.トラックバックとピンバックを無効にする

ブログの初期には、ブログがリンクについて相互に通知する方法として、トラックバックとピンバックが導入されました。 誰かがあなたのブログの投稿にリンクすると、そのウェブサイトから自動的に ping が送信されます。

このピンバックは、ブログのコメント管理キューに、ウェブサイトへのリンクとともに表示されます。 あなたがそれを承認すると、彼らはあなたのサイトからバックリンクとメンションを受け取ります。

これにより、スパマーはサイトをスクレイピングしてトラックバックを送信するインセンティブを得ることができます。 幸いなことに、トラックバックとピンバックを無効にして、スクレイパーがコンテンツを盗む理由を 1 つ減らすことができます。

Disabling Trackbacks and Pingbacks in WordPress

詳細については、今後のすべての投稿でトラックバックを無効にするためのガイドをご覧ください。

また、既存の WordPress 投稿でトラックバックと ping を無効にする方法も学びたいと思うかもしれません。

4. スクレーパーによる WordPress ウェブサイトへのアクセスをブロックする

スクレイパーがあなたのコンテンツを盗むのを阻止する 1 つの方法は、あなたの Web サイトへのアクセスを奪うことです。 IP アドレスをブロックすることで手動でこれを行うことができますが、ほとんどのユーザーは、Web アプリケーション ファイアウォールなどのセキュリティ プラグインを使用する方が簡単です。

セキュリティ プラグインを使用してスクレーパーをブロックする (推奨)

スクレイパーを手動でブロックするのは難しく、多くの作業が必要です。 特に、世界中のさまざまなランダムな IP アドレスを使用して、多くのハッキングの試みや攻撃が行われているためです。 これらすべてのランダムな IP アドレスについていくことはほとんど不可能です。

そのため、WordFence や Securi などの Web アプリケーション ファイアウォール (WAF) が必要です。 これらは、Web サイトのトラフィックを監視し、WordPress サイトに到達する前に一般的なセキュリティの脅威をブロックすることで、Web サイトとすべての着信トラフィックの間のシールドとして機能します。

WPBeginner Web サイトでは、Sucuri を使用しています。 Web サイト アプリケーション ファイアウォールを使用して、このような攻撃から Web サイトを保護する Web サイト セキュリティ サービスです。

基本的に、すべての Web サイト トラフィックはセキュリティ サービスのサーバーを通過し、そこで疑わしいアクティビティがないか調べられます。 疑わしい IP アドレスが Web サイトに到達するのを自動的にブロックします。 Sucuri が 3 か月で 450,000 件の WordPress 攻撃をブロックした方法をご覧ください。

スクレイパーの IP アドレスを手動でブロックまたはリダイレクトする

上級ユーザーは、スクレイパーの IP アドレスを手動でブロックすることもできます。 これは手間がかかりますが、スクレイパーのアドレスを学習したら、そのアドレスを具体的にターゲットにすることができます。 Web 開発者の Jeff Star は、コンテンツ スクレイパーの処理方法について書いたときに、このアプローチを提案しています。

注: Web サイトのファイルにコードを追加することは危険な場合があります。 小さな間違いでも、サイトに重大なエラーが発生する可能性があります。 そのため、この方法は上級ユーザーにのみお勧めします。

WordPressホスティングアカウントのcPanelダッシュボードの「Raw Access Logs」にアクセスすると、スクレイパーのIPアドレスを見つけることができます. リクエスト数が異常に多い IP アドレスを探し、別のテキスト ファイルにコピーするなどして、それらを記録しておく必要があります。

Blocking the Scraper's IP Address

ヒント:自分自身、正当なユーザー、または検索エンジンが Web サイトにアクセスするのをブロックしてしまうことのないようにする必要があります。 疑わしい IP アドレスをコピーし、オンラインの IP ルックアップ ツールを使用して詳細を調べます。

IP アドレスがスクレイパーに属していることを確認したら、cPanel の「IP ブロッカー」ツールを使用するか、ルート .htaccess ファイルに次のようなコードを追加して、ブロックすることができます。

コード内の IP アドレスを、ブロックする IP アドレスに置き換えてください。 複数の IP アドレスをスペースで区切って同じ行に入力すると、複数の IP アドレスをブロックできます。

詳細な手順については、WordPress で IP アドレスをブロックする方法に関するガイドを参照してください。

Jeff は、単にスクレイパーをブロックする代わりに、ダミーの RSS フィードを送信することを提案しています。 Lorem Ipsum と迷惑な画像でいっぱいのフィードを作成したり、自分の Web サイトに直接送り返したりして、無限ループを引き起こし、サーバーをクラッシュさせることさえあります。

それらをダミー フィードにリダイレクトするには、次のようなコードを .htaccess ファイルに追加する必要があります。

RewriteCond %REMOTE_ADDR 123.456.789.
RewriteRule .* http://dummyfeed.com/feed [R,L]

5. WordPress での画像の盗難を防ぐ

保護する必要があるのは、書かれたコンテンツだけではありません。 WordPress での画像の盗難も防止する必要があります。

テキストと同様に、画像の盗用を完全に阻止する方法はありませんが、WordPress Web サイトでの画像の盗用を思いとどまらせる方法はたくさんあります。

たとえば、WordPress 画像のホットリンクを無効にすることができます。 これは、誰かがあなたのコンテンツをスクレイピングした場合、その画像がサイトに読み込まれないことを意味します.

また、サーバーの負荷と帯域幅の使用量を減らし、WordPress の速度とパフォーマンスを向上させます。

または、クレジットを表示する透かしを画像に追加することもできます。 これにより、スクレーパーがコンテンツを盗んだことが明らかになります.

WordPress での画像の盗難を防ぐ 4 つの方法に関するガイドで、これら 2 つの手法と画像を保護する他の方法を学ぶことができます。

6.コンテンツの手動コピーを思いとどまらせる

ほとんどのスクレイパーは自動ツールを使用しますが、一部のコンテンツ泥棒はコンテンツの全部または一部を手動でコピーしようとする場合があります。

これをより困難にする 1 つの方法は、テキストのコピーと貼り付けを防止することです。 これは、ウェブサイト上のテキストを選択しにくくすることで実現できます。

コンテンツの手動コピーを停止する方法については、WordPress でのテキストの選択とコピー/貼り付けを防止する方法に関するステップバイステップ ガイドを参照してください。

ただし、これでコンテンツが完全に保護されるわけではありません。 技術に精通したユーザーは、引き続きソース コードを表示したり、検査ツールを使用して必要なものをコピーしたりできます。 また、この方法はすべての Web ブラウザーで機能するとは限りません。

また、テキストをコピーするすべての人がコンテンツ泥棒になるわけではないことに注意してください。 たとえば、ソーシャル メディアで投稿を共有するために、タイトルをコピーしたい人がいるかもしれません。

そのため、サイトに本当に必要だと思われる場合にのみ、この方法を使用することをお勧めします。

7.コンテンツスクレイパーを活用する

ブログが大きくなるにつれて、すべてのコンテンツ スクレイパーを停止または追跡することはほとんど不可能になります。 引き続き DMCA の申し立てを送信します。 しかし、私たちのコンテンツを盗んでいるサイトが他にもたくさんあることを知っています。

代わりに、私たちのアプローチは、コンテンツ スケーパーを利用しようとすることです。 盗んだコンテンツからお金を稼いでいることや、スクレイパーの Web サイトから大量のトラフィックを受け取っていることは、それほど悪いことではありません。

スクレイパーからトラフィックとバックリンクを獲得するために内部リンクを習慣化する

SEO に関する究極のガイドでは、内部リンクを習慣化することをお勧めします。 ブログ投稿に他のコンテンツへのリンクを配置することで、ページビューを増やし、サイトの直帰率を下げることができます。

しかし、スクレイピングに関しては 2 つ目の利点があります。 内部リンクは、あなたのコンテンツを盗んでいる人々から貴重なバックリンクを得ることができます. Google などの検索エンジンはバックリンクをランキング シグナルとして使用するため、追加のバックリンクは SEO に役立ちます。

最後に、これらの内部リンクにより、スクレイパーの聴衆を盗むことができます. 才能のあるブロガーは興味深いキーワードにリンクを配置し、ユーザーがクリックしたくなるようにします。 スクレイパーの Web サイトへの訪問者もリンクをクリックし、自分の Web サイトに直接戻ります。

スクレイパーからお金を稼ぐためのアフィリエイトリンク付きの自動リンクキーワード

アフィリエイト マーケティングで Web サイトで収益を上げている場合は、RSS フィードで自動リンクを有効にすることをお勧めします。 これにより、RSS リーダー経由でのみ Web サイトを読む読者からの収益を最大化できます。

さらに良いことに、コンテンツを盗んでいるサイトからお金を稼ぐのに役立ちます.

割り当てられたキーワードを自動的にアフィリエイト リンクに置き換える ThirstyAffiliates のようなプラグインを使用するだけです。 WordPress でキーワードをアフィリエイト リンクに自動的にリンクする方法については、ガイドをご覧ください。

RSS フッターで Web サイトを宣伝する

All in One SEO プラグインを使用して、RSS フッターにカスタム アイテムを追加できます。 たとえば、自社の製品、サービス、またはコンテンツを宣伝するバナーを追加できます。

AIOSEO RSS feed footer save

最良の部分は、これらのバナーがスクレーパーの Web サイトにも表示されることです。

私たちの場合、RSS フィードの投稿の最後に小さな免責事項を常に追加しています。 これにより、スクレイパーのサイトから元の記事へのバックリンクを取得します。

これにより、Google や他の検索エンジンは、私たちが権威であることを知ることができます。 また、サイトがコンテンツを盗んでいることをユーザーに知らせます。

その他のヒントについては、WordPress で RSS フィード フッターを制御する方法に関するガイドをご覧ください。

このチュートリアルが、WordPress でブログ コンテンツのスクレイピングを防止する方法を学ぶのに役立つことを願っています。 究極の WordPress セキュリティ ガイドや、WordPress に最適な分析ソリューションのリストもご覧ください。

この記事が気に入ったら、WordPress ビデオチュートリアルの YouTube チャンネルに登録してください。 Twitter や Facebook で私たちを見つけることもできます。