如何防止 WordPress 網站上的內容抓取(5 種方法)

已發表: 2023-07-27


作為網站所有者,投入時間和精力來創建精彩內容,卻有人來竊取它,這可能會令人沮喪。 因此,採取措施防止網站上的內容被抓取非常重要。 ‍

例如,您可以更改 RSS 源或顯示版權聲明。 或者,您可以添加大量內部鏈接,以阻止機器人和詐騙者竊取您的材料。

內容抓取簡介

當用戶從您的網站竊取內容並自行重新發佈時,就會發生內容抓取。 雖然這通常是使用站點的 RSS 源自動完成的,但也可以使用複制和粘貼手動執行。 可以復制各種內容,包括文本、圖像和視頻。

通常,竊賊只會在他們的網站上顯示您的內容,就好像這是他們自己的原創材料一樣。 有時,用戶可能會添加返回您網站的鏈接。 然而,由於他們仍在未經您同意的情況下使用您的內容,這可能同樣令人沮喪。

這也是非法的。 內容抓取違反了版權法和知識產權,肇事者可能會被原創者起訴。

抓取者選擇竊取內容的原因有很多。 例如,企業或個人可能會嘗試通過在其網站上填充高質量信息來在特定領域建立權威。

但是,為了節省時間,他們可能會引用您自己網站上的想法或整個段落。 或者,他們可能會在您的內容中填充廣告,以利用您的材料在自己的網站上獲利。

或者,聯盟營銷人員可以使用您的內容通過搜索引擎獲得自然流量。 然後,他們可以吸引大量潛在客戶來銷售或推廣他們的聯屬產品️。

如何防止 WordPress 網站上的內容被抓取

現在您已經對內容抓取有了更多了解,讓我們看一下防止 WordPress 內容抓取的五種方法:

  1. 顯示版權聲明
  2. 更改您的 RSS 提要
  3. 屏蔽抓取工具的IP地址
  4. 保護您的圖像
  5. 添加大量內部鏈接

1. 顯示版權聲明

版權法保護您的知識產權,包括您的品牌名稱、徽標和其他內容。 因此,當抓取者在您的網站上進行內容盜竊時,他們實際上是違法的。

儘管它可能無法阻止專門的抓取工具,但您可以在網站上顯示版權聲明。 無論如何,這種做法仍然是非法的。 但是,通過這種方式,您可以清楚地表明用戶未經許可不能使用您的內容。

將版權聲明添加到網站的頁腳是個好主意。 或者,您可以添加完整條款和條件的鏈接:

星巴克網站使用版權聲明來幫助防止內容抓取。

頁腳是放置版權聲明的好地方,因為它將顯示在您的所有網頁上。

此外,如果您需要提交 DMCA 投訴以升級問題,版權聲明會派上用場。 如果你想更進一步,請申請版權登記。 但是,您可能需要法律援助,因為這是一個相當棘手的過程。

正如我們之前提到的,如果抓取工具自動竊取您的內容,它們會依賴您網站的 RSS 提要。 因此,最好對您的 feed 進行一些小的更改,以防止 WordPress 中的內容被抓取。

最簡單的更改是在 RSS 源中提供每個帖子的摘要,而不是包含完整內容。 在這種情況下,抓取工具可以復制的只是您的帖子摘錄以及日期和作者等元數據。

要在 WordPress 中配置此功能,只需前往“設置” >“從儀表板讀取”即可。 滾動直到看到對於摘要中的每個帖子,包括並選擇摘錄

將 RSS 提要顯示為摘錄。

然後,單擊“保存更改”以更新您的網站。

3.屏蔽爬蟲IP地址

防止網站內容被抓取的最簡單方法之一就是簡單地阻止惡意 IP 地址。 像 Web 應用程序防火牆 (WAF) 這樣的安全插件會自動執行此操作。

WAF 的工作原理是監控您網站的所有傳入流量。 然後,它將識別並阻止任何它認為存在安全風險的 IP 地址。

更好的是,有很多免費選項可以開始使用,例如SucuriWordfence

但是,如果您是經驗豐富的用戶,也可以手動阻止抓取工具的 IP 地址。 您可以通過 cPanel 儀表板中的原始訪問日誌來執行此操作。 或者,您可以通過文件管理器或 FTP 訪問.htaccess文件。

找到並打開.htaccess文件後,只需添加以下代碼行,將數字替換為您要阻止的 IP 地址:

 Deny from 111.222.333.444.

要阻止多個 IP 地址,請在文件的同一行中輸入它們,但用空格分隔。

不過,執行此操作時要小心。 備份您的 . htaccess文件,以防您阻止自己訪問自己的網站。

4. 保護您的圖像(禁用盜鏈並添加水印)

雖然可以從您的網站獲取文本,但也可以定位圖像。 因此,您可以禁用熱鏈接並向圖像添加水印,以防止 WordPress 網站上的內容被抓取。

當用戶在自己的網站上顯示您的圖像,但從您的服務器加載圖像時,就會發生熱鏈接。 因此,它會增加您的帶寬使用量,因為它會利用您的服務器資源來顯示圖像。

要手動禁用熱鏈接,您需要通過文件管理器或 FTP 訪問.htaccess文件。 然後,將以下代碼粘貼到該文件中:

 /* Prevent image hotlinking in WordPress */ RewriteCond %HTTP_REFERER !^$ RewriteCond %HTTP_REFERER !^http(s)?://(www.)?yourwebsite.com [NC] RewriteCond %HTTP_REFERER !^http(s)?://(www.)?google.com [NC] RewriteCond %HTTP_REFERER !^http(s)?://(www.)?facebook.com [NC] RewriteCond %HTTP_REFERER !^http(s)?://(www.)?twitter.com [NC] RewriteCond %HTTP_REFERER !^http(s)?://(www.)?other-websites-go-here.com [NC] RewriteRule .(jpg|jpeg|png|gif)$ - [F]

此代碼可防止任何網站(Google、Facebook、Twitter 和您自己的網站除外)使用您的圖像。 另外,您可以在最後一行添加或刪除文件格式,以確定要應用防盜鏈的圖像。

現在,您還可以為 WordPress 圖像添加水印,以防止您網站上的內容被盜。 請注意,這會稍微模糊您的圖像,因為水印會干擾圖片:

iStock 為圖像添加水印以防止內容抓取。

圖像水印是一個免費的 WordPress 插件,可以自動為您上傳的新圖像添加水印。 同時,它使您能夠批量為網站上的現有圖像添加水印。

添加水印可能會給潛在的竊賊造成障礙。 抓取者可能會在他們的網站上使用您的照片時三思而後行,因為很明顯這些圖像屬於其他人。

5.添加大量內部鏈接

防止 WordPress 內容抓取的最終策略是向您的帖子添加大量內部鏈接。 這不會讓您的內容難以被抓取,而是確保即使內容被抓取,您仍然可以從該行為中受益。

例如,您帖子中的所有內部鏈接將為您從爬蟲網站獲得有價值的反向鏈接。 由於反向鏈接是任何高質量 SEO 策略的關鍵部分,因此這是提高搜索排名的簡單方法。

更重要的是,內部鏈接使您能夠將流量從抓取工具的網站轉移到您自己的網站。 然後,您可以通過發布高質量的材料、提供快速的加載時間以及實現簡單的網站導航來確保這些訪問者留在您的網站上。

結論

內容抓取不僅令人沮喪,而且也是非法的,因為它涉及其他人竊取您的知識產權。 幸運的是,有一些技術可以阻止人們複製您的文本、圖像和視頻。

回顧一下,以下是防止 WordPress 中內容抓取的五種策略:

  1. 顯示版權聲明。
  2. 更改您的 RSS 源。
  3. 阻止抓取工具的 IP 地址。
  4. 保護您的圖像(禁用熱鏈接並添加水印)。
  5. 添加大量內部鏈接。

您對版權法或內容抓取做法有任何疑問嗎? 請在下面的評論部分告訴我們!