如何绕过付费墙(文章、博客等)
已发表: 2022-02-09- 什么是付费墙?
- 搜索引擎如何访问付费内容?
- 谷歌对付费内容的立场
- 由于 GDPR 在欧盟被封锁
- 如何绕过付费墙
- 12英尺梯子
- 绕过付费墙
- 档案
- 隐身模式
- 靛蓝
- 绕过付费墙是否合乎道德?
“现代”网络最烦人的事情之一就是付费墙。 越来越多的出版商选择将他们的内容锁定在高级订阅或电子邮件注册表单后面。 在这篇文章中,我将解释为什么存在付费墙,以及如何绕过它们。
我想明确表示,我不会容忍避免为优质内容付费的行为。 出版商应该因为他们的工作而获得奖励,我尊重这一点。 但是,造成问题的不仅是像纽约时报这样的大出版商。
Medium 上的许多博客都在使用边缘阴暗的策略来强迫人们分享他们的电子邮件地址。 我会尽力解释如何。 另一个问题是当网站因 GDPR 法规而阻止整个欧盟地区的访问时。 很快就会有更多信息。
如果您想跳过技术部分,请单击此处直接跳转到工具部分。
什么是付费墙?
在最基本的条款中,付费墙用于保护打算付费的网站内容。 成本可以是金钱——订阅——也可以是帮助发展时事通讯的电子邮件地址。
使用付费墙背后的原因很简单:广告拦截器正在阻碍出版商的收入流。 这已经发生了十多年了。
谷歌在 2017 年报告称, “[...] 超过 6 亿台设备使用广告拦截器” 。 可以公平地假设这个数字从那时起呈指数增长。

如果您是大型出版商并且依赖广告收入,那么过渡到订阅模式是有意义的。 然而,我在这个话题上的角度与搜索引擎有关。
具体来说,出版商如何让谷歌等搜索引擎抓取和索引他们的内容,但不让搜索者阅读。
搜索引擎如何访问付费内容?
所以,让我先说明一下发生了什么以及我为什么写这篇文章。 在为我的开源分析文章进行研究时,我想知道广告拦截器对分析报告的影响。
特别是广告拦截器如何影响 Google Analytics 等工具的报告。
我的搜索查询是: “广告拦截器分析跟踪” 。
这是来自谷歌的搜索结果:

第一个结果来自Towards Data Science ,它是一个精选片段。 这些片段是 Google 为您提供特定问题的快速答案的方式。 并且,它们被粘在搜索结果页面的顶部以暗示权威。
尽管如此,答案很简单,但我想知道更多。 所以,我点击了文章的链接。 这是我受到欢迎的页面:

我的第一个想法? 这真烦人。 我的第二个想法? Google 是如何看到这篇文章并在搜索结果中推广的?
当然,我并不是想无知。 我知道 Medium 限制了你一个月可以阅读的文章数量。 但是,跟踪您阅读了多少是不可行的。 特别是考虑到您可以为您的 Medium 博客使用自定义域名。
在这种情况下,Towards Data Science 将在 Medium 上发布其内容。 Medium 为创作者提供了一种通过他们的平台发布内容来赚钱的方法。 这是一种商业关系,而不是个人信任问题。 但这是我对它的抱怨。
为了使这些内容蓬勃发展,它在很大程度上取决于搜索引擎流量。
因此,Google Crawler 可以免费查看整个页面的内容,还可以在搜索结果中对其进行索引。 正如我们在上面看到的,这些搜索结果可以提升为权威状态。 老实说,这没有任何意义。
谷歌对付费内容的立场

Google 为如何使用架构标记构建付费墙内容创建了一个官方指南。 你可以在这里查看官方文档。

总之:
- Google 不允许内容伪装。
- 付费墙内容必须标记到隐藏在付费墙后面的确切部分。
Google 执行这些规则的积极程度未知。
我对 Towards Data Science 进行了尽职调查,这是他们在该特定页面上使用的代码:
mainEntityOfPage: https://towardsdatascience.com/how-much-data-is-missing-from-your-google-analytics-dashboard-20506b26e6d isAccessibleForFree: False cssSelector: .meteredContent
正如我们在这里看到的, isAccessibleForFree为False ,CSS 选择器设置为.meteredContent。 它告诉我们,Medium 遵循谷歌关于如何构建付费内容的指南。
什么是“.meteredContent”选择器?
这个选择器用于告诉像谷歌这样的搜索引擎,用户可以阅读的免费文章数量是有限制的。 在 Medium 的情况下,每月3 篇免费文章。

诚然,在寻找 Medium 真正的不法行为时,我空手而归。 我认为,从逻辑上讲,谷歌可以看到所有文章是没有意义的,但真正的读者在被迫注册之前只能阅读 3 篇文章。 谷歌似乎很乐意允许这种行为,我也无话可说。
谷歌公开表示,它对内容的质量更感兴趣,而不是关心其可访问性。 该公司最初发布了关于告诉出版商允许首次访问者至少获得 3 篇免费文章的指南。 我们在 Medium 上看到的情况也是如此。 但是,近年来,谷歌已经转向结构化标记。 在 Google 本身的“搜索算法的工作原理”一文中阅读有关此内容的更多信息。
由于 GDPR 在欧盟被封锁
在某些情况下,您可能会遇到完全阻止访问的网站。 这在很大程度上与阻止欧盟读者访问的美国出版商有关。 这样做的简单原因是 GDPR——来自欧洲的隐私法规。

虽然上图暗示手头的网站“关心”欧盟访问者,但实际情况显然并非如此。 发布商这样做的原因是因为收集用户数据的复杂广告技术。 而且,一些人选择完全阻止访问,而不是限制跟踪特定区域的数据。
如何绕过付费墙
好吧,让我们回顾一下付费墙背后的所有戏剧和推理。 相反,让我们探索一些可用于快速绕过付费墙的工具。
12英尺梯子

越过付费墙的最快方法是使用 12ft Ladder 网站。 您所要做的就是输入链接到付费专区的 URL,剩下的工作交给 12ft。
https://12ft.io/[link to the paywalled website]
至于它是如何工作的,这很简单。 新闻网站、出版商和其他内容提供商使用付费墙,但允许 Google 爬虫查看他们的网页。 在这种情况下,12ft 只是使用 Google 缓存功能向您显示整页。
据我所知,12ft 不支持绕过《纽约时报》。
绕过付费墙

Bypass Paywalls 浏览器扩展是托管在 GitHub 上的开源项目。 为了使用这个特定的扩展,你必须自己安装它。 因为它无法在 Google Chrome 市场或 Mozilla 上下载。
该扩展程序本身可用于 Chrome、Firefox 和 Edge 浏览器。 最后但同样重要的是,该项目在 GitHub 上有超过 20,000 颗星。 因此,它既经过时间考验,又可靠。 您可以使用此扩展程序绕过的站点的完整列表位于项目页面本身。
档案

Archive Today 项目的工作方式与许多其他绕过付费墙的工具类似。 它将页面存档,就好像该页面已被搜索引擎浏览一样,并为您返回您尝试查看的页面的可读版本。
这种方法经常被用在像 Hacker News 这样的网站上,人们在这些网站上提交付费内容背后的故事。 据我所知,它适用于纽约时报、金融时报、华尔街日报等众多网站。
隐身模式

在某些情况下,网站会存储 cookie 数据以监控您阅读了多少免费文章。 一旦达到限额,您将获得付费墙。 而且,一种更简单的规避方法是通过隐身模式。 也称为私有模式。
您可以通过转到设置并选择新的私人窗口在任何现代浏览器上访问隐身模式。 这只会给您一个没有 cookie 历史记录的“空白石板”,这意味着您可以继续访问隐藏在 cookie 付费墙后面的内容。
靛蓝

Incoggo 背后的人正计划进入广告拦截器市场。 但是,他们暂时提供免费的基于 Mac 的软件来跳过付费墙。 同样,该软件仅适用于 OSX 用户,尽管 Windows 版本很快就会出现。
查看他们最新的博客新闻,似乎该项目正在积极开发中。 这是个好消息,因为这意味着该软件可以在需要时工作。 至于 Incoggo 可以跳过哪些出版物和网站——查看他们的官方网站。
绕过付费墙是否合乎道德?
我认为我们都在不同程度的道德指南针上运作。 双方有很多争论。 而且,正如我在文章开头提到的那样,我确实认为出版商应该能够对优质内容收取订阅费。
我唯一的问题是当这个过程变成勒索时。 换句话说,为什么要给像谷歌这样的搜索引擎特权,然后锁定所有其他用户?
阅读真正的免费文章并不少见,该文章链接到在其内容中添加了付费专区的出版商。
每年花 50 美元读一篇文章真的值得吗? 曾经免费的文章也是如此,但尽管有付费墙,但仍然与它们相关联。
无论如何,我希望本指南至少能为您提供一些有用的信息。