如何繞過付費牆(文章、博客等)
已發表: 2022-02-09- 什麼是付費牆?
- 搜索引擎如何訪問付費內容?
- 谷歌對付費內容的立場
- 由於 GDPR 在歐盟被封鎖
- 如何繞過付費牆
- 12英尺梯子
- 繞過付費牆
- 檔案
- 隱身模式
- 靛藍
- 繞過付費牆是否合乎道德?
“現代”網絡最煩人的事情之一就是付費牆。 越來越多的出版商選擇將他們的內容鎖定在高級訂閱或電子郵件註冊表單後面。 在這篇文章中,我將解釋為什麼存在付費牆,以及如何繞過它們。
我想明確表示,我不會容忍避免為優質內容付費的行為。 出版商應該因為他們的工作而獲得獎勵,我尊重這一點。 但是,造成問題的不僅是像紐約時報這樣的大出版商。
Medium 上的許多博客都在使用邊緣陰暗的策略來強迫人們分享他們的電子郵件地址。 我會盡力解釋如何。 另一個問題是當網站因 GDPR 法規而阻止整個歐盟地區的訪問時。 很快就會有更多信息。
如果您想跳過技術部分,請單擊此處直接跳轉到工具部分。
什麼是付費牆?
在最基本的條款中,付費牆用於保護打算付費的網站內容。 成本可以是金錢——訂閱——也可以是幫助發展時事通訊的電子郵件地址。
使用付費牆背後的原因很簡單:廣告攔截器正在阻礙出版商的收入流。 這已經發生了十多年了。
谷歌在 2017 年報告稱, “[...] 超過 6 億台設備使用廣告攔截器” 。 可以公平地假設這個數字從那時起呈指數增長。

如果您是大型出版商並且依賴廣告收入,那麼過渡到訂閱模式是有意義的。 然而,我在這個話題上的角度與搜索引擎有關。
具體來說,出版商如何讓谷歌等搜索引擎抓取和索引他們的內容,但不讓搜索者閱讀。
搜索引擎如何訪問付費內容?
所以,讓我先說明一下發生了什麼以及我為什麼寫這篇文章。 在為我的開源分析文章進行研究時,我想知道廣告攔截器對分析報告的影響。
特別是廣告攔截器如何影響 Google Analytics 等工具的報告。
我的搜索查詢是: “廣告攔截器分析跟踪” 。
這是來自谷歌的搜索結果:

第一個結果來自Towards Data Science ,它是一個精選片段。 這些片段是 Google 為您提供特定問題的快速答案的方式。 並且,它們被粘在搜索結果頁面的頂部以暗示權威。
儘管如此,答案很簡單,但我想知道更多。 所以,我點擊了文章的鏈接。 這是我受到歡迎的頁面:

我的第一個想法? 這真煩人。 我的第二個想法? Google 是如何看到這篇文章並在搜索結果中推廣的?
當然,我並不是想無知。 我知道 Medium 限制了你一個月可以閱讀的文章數量。 但是,跟踪您閱讀了多少是不可行的。 特別是考慮到您可以為您的 Medium 博客使用自定義域名。
在這種情況下,Towards Data Science 將在 Medium 上發布其內容。 Medium 為創作者提供了一種通過他們的平台發佈內容來賺錢的方法。 這是一種商業關係,而不是個人信任問題。 但這是我對它的抱怨。
為了使這些內容蓬勃發展,它在很大程度上取決於搜索引擎流量。
因此,Google Crawler 可以免費查看整個頁面的內容,還可以在搜索結果中對其進行索引。 正如我們在上面看到的,這些搜索結果可以提升為權威狀態。 老實說,這沒有任何意義。
谷歌對付費內容的立場

Google 為如何使用架構標記構建付費牆內容創建了一個官方指南。 你可以在這裡查看官方文檔。

總之:
- Google 不允許內容偽裝。
- 付費牆內容必須標記到隱藏在付費牆後面的確切部分。
Google 執行這些規則的積極程度未知。
我對 Towards Data Science 進行了盡職調查,這是他們在該特定頁面上使用的代碼:
mainEntityOfPage: https://towardsdatascience.com/how-much-data-is-missing-from-your-google-analytics-dashboard-20506b26e6d isAccessibleForFree: False cssSelector: .meteredContent
正如我們在這裡看到的, isAccessibleForFree為False ,CSS 選擇器設置為.meteredContent。 它告訴我們,Medium 遵循谷歌關於如何構建付費內容的指南。
什麼是“.meteredContent”選擇器?
這個選擇器用於告訴像谷歌這樣的搜索引擎,用戶可以閱讀的免費文章數量是有限制的。 在 Medium 的情況下,每月3 篇免費文章。

誠然,在尋找 Medium 真正的不法行為時,我空手而歸。 我認為,從邏輯上講,谷歌可以看到所有文章是沒有意義的,但真正的讀者在被迫註冊之前只能閱讀 3 篇文章。 谷歌似乎很樂意允許這種行為,我也無話可說。
谷歌公開表示,它對內容的質量更感興趣,而不是關心其可訪問性。 該公司最初發布了關於告訴出版商允許首次訪問者至少獲得 3 篇免費文章的指南。 我們在 Medium 上看到的情況也是如此。 但是,近年來,谷歌已經轉向結構化標記。 在 Google 本身的“搜索算法的工作原理”一文中閱讀有關此內容的更多信息。
由於 GDPR 在歐盟被封鎖
在某些情況下,您可能會遇到完全阻止訪問的網站。 這在很大程度上與阻止歐盟讀者訪問的美國出版商有關。 這樣做的簡單原因是 GDPR——來自歐洲的隱私法規。

雖然上圖暗示手頭的網站“關心”歐盟訪問者,但實際情況顯然並非如此。 發布商這樣做的原因是因為收集用戶數據的複雜廣告技術。 而且,一些人選擇完全阻止訪問,而不是限制跟踪特定區域的數據。
如何繞過付費牆
好吧,讓我們回顧一下付費牆背後的所有戲劇和推理。 相反,讓我們探索一些可用於快速繞過付費牆的工具。
12英尺梯子

越過付費牆的最快方法是使用 12ft Ladder 網站。 您所要做的就是輸入鏈接到付費專區的 URL,剩下的工作交給 12ft。
https://12ft.io/[link to the paywalled website]
至於它是如何工作的,這很簡單。 新聞網站、出版商和其他內容提供商使用付費牆,但允許 Google 爬蟲查看他們的網頁。 在這種情況下,12ft 只是使用 Google 緩存功能向您顯示整頁。
據我所知,12ft 不支持繞過《紐約時報》。
繞過付費牆

Bypass Paywalls 瀏覽器擴展是託管在 GitHub 上的開源項目。 為了使用這個特定的擴展,你必須自己安裝它。 因為它無法在 Google Chrome 市場或 Mozilla 上下載。
該擴展程序本身可用於 Chrome、Firefox 和 Edge 瀏覽器。 最後但同樣重要的是,該項目在 GitHub 上有超過 20,000 顆星。 因此,它既經過時間考驗,又可靠。 您可以使用此擴展程序繞過的站點的完整列表位於項目頁面本身。
檔案

Archive Today 項目的工作方式與許多其他繞過付費牆的工具類似。 它將頁面存檔,就好像該頁面已被搜索引擎瀏覽一樣,並為您返回您嘗試查看的頁面的可讀版本。
這種方法經常被用在像 Hacker News 這樣的網站上,人們在這些網站上提交付費內容背後的故事。 據我所知,它適用於紐約時報、金融時報、華爾街日報等眾多網站。
隱身模式

在某些情況下,網站會存儲 cookie 數據以監控您閱讀了多少免費文章。 一旦達到限額,您將獲得付費牆。 而且,一種更簡單的規避方法是通過隱身模式。 也稱為私有模式。
您可以通過轉到設置並選擇新的私人窗口在任何現代瀏覽器上訪問隱身模式。 這只會給您一個沒有 cookie 歷史記錄的“空白石板”,這意味著您可以繼續訪問隱藏在 cookie 付費牆後面的內容。
靛藍

Incoggo 背後的人正計劃進入廣告攔截器市場。 但是,他們暫時提供免費的基於 Mac 的軟件來跳過付費牆。 同樣,該軟件僅適用於 OSX 用戶,儘管 Windows 版本很快就會出現。
查看他們最新的博客新聞,似乎該項目正在積極開發中。 這是個好消息,因為這意味著該軟件可以在需要時工作。 至於 Incoggo 可以跳過哪些出版物和網站——查看他們的官方網站。
繞過付費牆是否合乎道德?
我認為我們都在不同程度的道德指南針上運作。 雙方有很多爭論。 而且,正如我在文章開頭提到的那樣,我確實認為出版商應該能夠對優質內容收取訂閱費。
我唯一的問題是當這個過程變成勒索時。 換句話說,為什麼要給像谷歌這樣的搜索引擎特權,然後鎖定所有其他用戶?
閱讀真正的免費文章並不少見,該文章鏈接到在其內容中添加了付費專區的出版商。
每年花 50 美元讀一篇文章真的值得嗎? 曾經免費的文章也是如此,但儘管有付費牆,但仍然與它們相關聯。
無論如何,我希望本指南至少能為您提供一些有用的信息。