Como evitar a raspagem de conteúdo em um site WordPress (5 maneiras)
Publicados: 2023-07-27Como proprietário de um site, pode ser frustrante dedicar tempo e esforço para criar um ótimo conteúdo, apenas para que alguém apareça e o roube. Portanto, é muito importante tomar medidas para evitar a extração de conteúdo em seu site.
Por exemplo, você pode fazer alterações em seu feed RSS ou exibir um aviso de direitos autorais. Ou você pode adicionar muitos links internos para desencorajar bots e golpistas de roubar seu material.
Uma introdução à raspagem de conteúdo
A extração de conteúdo ocorre quando um usuário rouba o conteúdo do seu site e o republica por conta própria. Embora isso geralmente seja feito automaticamente usando o feed RSS do seu site, também pode ser feito manualmente, usando copiar e colar. Todos os tipos de conteúdo podem ser copiados, incluindo texto, imagens e vídeos.
Normalmente, o ladrão simplesmente exibirá seu conteúdo em seu site como se fosse seu próprio material original. Às vezes, o usuário pode adicionar um link para seu site. No entanto, como eles ainda estão usando seu conteúdo sem o seu consentimento, isso pode ser frustrante.
Também é ilegal. A raspagem de conteúdo é uma violação das leis de direitos autorais e direitos de propriedade intelectual, e os culpados podem ser processados pelo criador original.
Existem muitas razões pelas quais os scrapers optam por roubar conteúdo. Por exemplo, uma empresa ou indivíduo pode tentar estabelecer autoridade em um campo específico preenchendo seu site com informações de alta qualidade.
No entanto, para economizar tempo, eles podem retirar ideias ou parágrafos inteiros de seu próprio site. Ou, eles podem preencher seu conteúdo com anúncios para monetizar seu próprio site usando seu material.
Como alternativa, os profissionais de marketing afiliados podem obter tráfego orgânico por meio dos mecanismos de pesquisa usando seu conteúdo. Então, eles podem atrair um grande grupo de clientes em potencial para vender ou promover seus produtos afiliados ️.
Como evitar a raspagem de conteúdo em um site WordPress
Agora que você sabe um pouco mais sobre a extração de conteúdo, vamos dar uma olhada em cinco maneiras de evitar a extração de conteúdo no WordPress:
- Exibir um aviso de direitos autorais
- Faça alterações no seu feed RSS
- Bloqueie o endereço IP do raspador
- Proteja suas imagens
- Adicione muitos links internos
1. Exibir um aviso de direitos autorais
As leis de direitos autorais protegem seus direitos de propriedade intelectual, incluindo o nome de sua marca, logotipo e outros conteúdos. Portanto, quando um raspador comete roubo de conteúdo em seu site, ele está realmente infringindo a lei.
Embora isso não impeça os raspadores dedicados, você pode exibir um aviso de direitos autorais em seu site. A prática ainda é ilegal, independentemente. No entanto, dessa forma, você pode deixar bem claro que os usuários não podem usar seu conteúdo sem permissão.
É uma boa ideia adicionar o aviso de direitos autorais ao rodapé do seu site. Ou você pode adicionar um link para seus termos e condições completos:
O rodapé é um ótimo lugar para o seu aviso de direitos autorais, pois será exibido em todas as suas páginas da web.
Além do mais, um aviso de direitos autorais pode ser útil se você precisar registrar uma reclamação DMCA para escalar o problema. Se você quiser ir um passo além, solicite o registro de direitos autorais. No entanto, você pode precisar de assistência jurídica com isso, pois é um processo bastante complicado.
Como mencionamos anteriormente, se um raspador roubar seu conteúdo automaticamente, ele dependerá do feed RSS do seu site. Portanto, é uma boa ideia fazer uma pequena alteração em seu feed para evitar a extração de conteúdo no WordPress.
A alteração mais simples a fazer é fornecer um resumo de cada postagem em seu feed RSS, em vez de incluir o conteúdo completo. Nesse caso, tudo o que o raspador pode copiar é o trecho da postagem e os metadados, como a data e o autor.
Para configurar isso no WordPress, basta ir para Configurações > Leitura no seu painel. Role até ver Para cada postagem em um feed, inclua e selecione Trecho :
Em seguida, clique em Salvar alterações para atualizar seu site.
3. Bloqueie o endereço IP do raspador
Uma das maneiras mais fáceis de evitar a extração de conteúdo em seu site é simplesmente bloquear o endereço IP malicioso. Um plug-in de segurança como um Web Application Firewall (WAF) fará isso automaticamente.
Um WAF funciona monitorando todo o tráfego de entrada em seu site. Em seguida, ele reconhecerá e bloqueará qualquer endereço IP que considere um risco à segurança.
Melhor ainda, existem muitas opções gratuitas como Sucuri e Wordfence para começar:
No entanto, você também pode bloquear o endereço IP de um raspador manualmente se for um usuário mais experiente. Você pode fazer isso por meio dos logs de acesso bruto no painel do cPanel. Ou, você pode acessar seu arquivo .htaccess através do Gerenciador de Arquivos ou FTP.
Depois de localizar e abrir o arquivo .htaccess , basta adicionar a seguinte linha de código, substituindo os números pelo endereço IP que deseja bloquear:
Deny from 111.222.333.444.
Para bloquear vários endereços IP, insira-os na mesma linha do arquivo, mas separe-os com espaços.
Tenha cuidado ao realizar esta operação, no entanto. É sempre uma boa ideia ter um backup do seu arquivo . htaccess caso você bloqueie o acesso ao seu próprio site.
4. Proteja suas imagens (desabilite hotlinking e adicione marcas d'água)
Embora o texto possa ser retirado do seu site, as imagens também podem ser segmentadas. Portanto, você pode desativar o hotlinking e adicionar marcas d'água às suas imagens para evitar a extração de conteúdo em seu site WordPress.
Hotlinking ocorre quando um usuário exibe suas imagens em seu próprio site, mas carrega a imagem do seu servidor. Como tal, aumenta o uso da largura de banda, pois utiliza os recursos do servidor para exibir a imagem.
Para desabilitar o hotlinking manualmente, você precisará acessar seu arquivo .htaccess via Gerenciador de Arquivos ou FTP. Em seguida, cole o seguinte código no arquivo:
/* Prevent image hotlinking in WordPress */ RewriteCond %HTTP_REFERER !^$ RewriteCond %HTTP_REFERER !^http(s)?://(www.)?yourwebsite.com [NC] RewriteCond %HTTP_REFERER !^http(s)?://(www.)?google.com [NC] RewriteCond %HTTP_REFERER !^http(s)?://(www.)?facebook.com [NC] RewriteCond %HTTP_REFERER !^http(s)?://(www.)?twitter.com [NC] RewriteCond %HTTP_REFERER !^http(s)?://(www.)?other-websites-go-here.com [NC] RewriteRule .(jpg|jpeg|png|gif)$ - [F]
Este código impede que qualquer site (exceto Google, Facebook, Twitter e seu próprio site) use suas imagens. Além disso, você pode adicionar ou remover formatos de arquivo da última linha para determinar em quais imagens aplicar a prevenção de hotlink.
Agora, você também pode marcar suas imagens do WordPress para evitar roubo de conteúdo em seu site. Observe que isso obscurecerá levemente suas imagens, pois a marca d'água interferirá na imagem:
Image Watermark é um plug-in gratuito do WordPress que marca automaticamente as novas imagens que você carrega. Enquanto isso, permite que você coloque marcas d'água em massa em imagens existentes em seu site.
Adicionar marcas d'água pode criar um obstáculo para ladrões em potencial. Os raspadores podem pensar duas vezes antes de usar suas fotos em seus sites, pois ficaria bastante claro que as imagens pertencem a outra pessoa.
5. Adicione muitos links internos
A estratégia final para evitar a extração de conteúdo no WordPress é adicionar muitos links internos às suas postagens. Em vez de dificultar a raspagem do seu conteúdo, isso garante que, se o conteúdo for raspado, você ainda se beneficiará com o ato.
Por exemplo, todos os links internos em suas postagens lhe darão backlinks valiosos do site do raspador. E como os backlinks são uma parte fundamental de qualquer estratégia de SEO de qualidade, essa é uma maneira fácil de aumentar suas classificações de pesquisa.
Mais do que isso, os links internos permitem que você desvie o tráfego do site do scraper para o seu. Em seguida, você pode garantir que esses visitantes permaneçam em seu site publicando material de alta qualidade, fornecendo tempos de carregamento rápidos e implementando uma navegação fácil no site.
Conclusão
A raspagem de conteúdo não é apenas frustrante, mas também é ilegal, pois envolve o roubo de sua propriedade intelectual. Felizmente, existem certas técnicas que podem impedir que as pessoas copiem seus textos, imagens e vídeos.
Para recapitular, aqui estão cinco estratégias para evitar a extração de conteúdo no WordPress:
- Exibir um aviso de direitos autorais.
- Faça alterações em seu feed RSS.
- Bloqueie o endereço IP do raspador.
- Proteja suas imagens (desative hotlinking e adicione marcas d'água).
- Adicione muitos links internos.
Você tem alguma dúvida sobre leis de direitos autorais ou práticas de extração de conteúdo? Deixe-nos saber na seção de comentários abaixo!