Cara Terbaik Untuk Menghentikan Mesin Pencari Dari Merayapi Situs Web WordPress

Diterbitkan: 2023-01-27

Apa itu pengindeksan mesin pencari?

Pengindeksan mesin pencari adalah proses dimana mesin pencari, seperti Google, Bing, atau Yahoo, menemukan dan menambahkan halaman web ke database mereka. Basis data ini kemudian digunakan untuk memperkuat hasil pencarian saat pengguna memasukkan kueri ke mesin pencari.

Ketika mesin pencari merayapi web, ia mengikuti tautan dari satu halaman ke halaman lain dan mengindeks konten di setiap halaman yang ditemuinya. Saat mengindeks sebuah halaman, ia memproses konten untuk memahami tentang apa halaman itu dan bagaimana peringkatnya dalam hasil pencarian. Proses ini dikenal sebagai “ pengindeksan ” atau “ perayapan dan pengindeksan ”.

Ketika mesin pencari mengindeks sebuah halaman, ia melihat berbagai faktor seperti teks pada halaman tersebut, gambar dan video pada halaman tersebut, struktur kode HTML, dan tautan yang mengarah ke halaman tersebut. Ini menggunakan informasi ini untuk menentukan relevansi dan otoritas halaman, dan bagaimana peringkatnya dalam hasil pencarian.

Pengindeksan mesin pencari adalah proses yang berkelanjutan, karena mesin pencari terus memperbarui basis data mereka untuk memastikan bahwa mereka memiliki informasi terbaru. Ini penting karena web terus berubah, dengan halaman baru dibuat dan halaman lama diperbarui atau dihapus.

Salah satu faktor kunci untuk meningkatkan peringkat situs web Anda pada hasil mesin pencari adalah mengoptimalkan halaman Anda untuk mesin pencari melalui teknik yang disebut Search Engine Optimization (SEO). Dengan mengoptimalkan halaman Anda untuk mesin pencari, Anda dapat meningkatkan kemungkinan halaman Anda akan diindeks dan mendapat peringkat lebih tinggi dalam hasil pencarian.

Mengapa menghentikan mesin telusur merayapi situs web WordPress?

Mungkin ada beberapa alasan mengapa seseorang ingin menghentikan mesin pencari merayapi situs WordPress. Berikut beberapa kemungkinan alasannya:

  1. Pengembangan dan pengujian : Jika situs web sedang dikembangkan atau menjalani pengujian, situs tersebut mungkin belum siap untuk konsumsi publik. Dalam hal ini, pemilik situs mungkin ingin mencegah mesin telusur merayapi situs hingga siap diluncurkan.
  2. Privasi dan keamanan : Beberapa situs web mungkin berisi informasi sensitif yang tidak boleh diakses publik. Dalam hal ini, pemilik situs mungkin ingin mencegah mesin telusur merayapi situs untuk melindungi privasi dan keamanan informasi.
  3. Manajemen lalu lintas : Beberapa situs web mungkin memiliki jumlah terbatas sumber daya yang tersedia, seperti bandwidth atau kapasitas server. Dalam hal ini, pemilik situs mungkin ingin mencegah mesin telusur merayapi situs untuk menghemat sumber daya dan mengelola lalu lintas.
  4. Konten duplikat : Jika situs web berjalan di beberapa domain, ini dapat menyebabkan masalah konten duplikat, yang dapat berdampak negatif pada pengoptimalan mesin telusur. Dalam hal ini, pemilik situs mungkin ingin mencegah mesin telusur merayapi situs duplikat untuk menghindari masalah ini.
  5. Mode pemeliharaan : Saat melakukan pemeliharaan di situs web, pemilik situs mungkin ingin mencegah mesin telusur merayapi situs untuk menghindari pengembalian kesalahan 404 kepada pengunjung.
  6. Situs Pementasan : Jika pemilik situs ingin menguji perubahan atau pembaruan baru di situs pementasan sebelum memublikasikan perubahan ke situs aktif, mereka mungkin ingin mencegah mesin telusur merayapi situs pementasan untuk menghindari kebingungan atau masalah apa pun dengan pencarian situs langsung mereka peringkat mesin.

Perlu dicatat bahwa meskipun mungkin untuk mencegah mesin telusur merayapi situs WordPress, tidak disarankan untuk melakukannya dalam jangka waktu yang lama. Visibilitas mesin pencari penting untuk mengarahkan lalu lintas ke situs dan menjaganya tetap diperbarui melalui pengindeksan sangat penting untuk pengoptimalan mesin pencari.

Cara untuk menghentikan mesin telusur merayapi situs web WordPress

Ada beberapa metode yang dapat digunakan untuk menghentikan mesin telusur merayapi situs WordPress:

  1. Menggunakan plugin : Ada beberapa plugin WordPress, seperti Yoast SEO atau All in One SEO Pack, yang memungkinkan Anda menambahkan tag meta “noindex” ke halaman Anda. Ini memberi tahu mesin pencari untuk tidak mengindeks halaman, secara efektif mencegah mereka merayapi situs.
  2. Menggunakan file robots.txt : File robots.txt adalah file yang berada di akar situs web dan memberi tahu mesin telusur halaman atau bagian mana dari situs yang tidak boleh dirayapi. Anda dapat menggunakan file robots.txt untuk memblokir mesin telusur agar tidak merayapi seluruh situs Anda, atau hanya laman atau bagian tertentu.
  3. Menggunakan file .htaccess : File .htaccess adalah file konfigurasi untuk server web Apache, yang digunakan oleh banyak penyedia hosting. Anda dapat menggunakan file .htaccess untuk memblokir mesin telusur merayapi situs Anda dengan menambahkan beberapa baris kode.
  4. Perlindungan kata sandi : Perlindungan kata sandi situs Anda menggunakan plugin atau fitur bawaan penyedia hosting Anda juga dapat mencegah mesin telusur merayapi situs Anda, karena mereka tidak akan dapat mengakses halaman yang dilindungi.
  5. Mode pemeliharaan : WordPress memiliki fitur mode pemeliharaan bawaan yang dapat diaktifkan melalui file wp-config.php. Ini akan menampilkan halaman pemeliharaan kepada pengunjung dan mencegah mesin telusur merayapi situs selama pemeliharaan.
  6. Situs pementasan : Banyak penyedia hosting menawarkan fitur pementasan, yang memungkinkan Anda membuat salinan situs langsung untuk pengujian dan pengembangan. Mesin pencari tidak akan dapat merayapi situs pementasan, karena biasanya diblokir agar tidak diindeks.

Mari kita lihat semua metode dengan beberapa detail lebih lanjut.

#1. Menggunakan plugin

Menggunakan plugin untuk menghentikan mesin telusur merayapi situs WordPress adalah metode yang populer, karena pengaturannya relatif mudah dan tidak memerlukan pengetahuan teknis apa pun. Ada beberapa plugin WordPress yang tersedia yang memungkinkan Anda menambahkan tag meta “noindex” ke halaman Anda, seperti Yoast SEO atau All in One SEO Pack.

To Stop Search Engines From Crawling use yoast plugin
Opsi “Tanpa Indeks” di Yoast SEO

Saat Anda menggunakan plugin untuk menambahkan tag meta "noindex", plugin memberi tahu mesin pencari untuk tidak mengindeks halaman, secara efektif mencegah mereka merayapi situs. Ini berarti halaman tersebut tidak akan muncul di hasil mesin pencari, dan mesin pencari tidak akan menghabiskan sumber daya untuk merayapi halaman tersebut.

Untuk menggunakan plugin untuk menghentikan mesin pencari merayapi situs WordPress, Anda harus menginstal dan mengaktifkan plugin terlebih dahulu. Setelah plugin diaktifkan, biasanya Anda dapat mengakses pengaturan plugin dari dasbor WordPress. Dari sana, Anda dapat memilih halaman atau posting yang Anda inginkan untuk mencegah mesin pencari merayapi dan menambahkan tag meta "noindex" ke dalamnya.

To Stop Search Engines, no-index-in-all-in-one-seo

Perlu dicatat bahwa beberapa plugin juga memungkinkan Anda menambahkan tag meta "nofollow", yang memberi tahu mesin telusur untuk tidak mengikuti tautan di halaman. Ini dapat berguna jika Anda ingin mencegah mesin telusur merayapi situs Anda, tetapi tetap ingin mengizinkan pengguna mengakses laman tersebut.

Selain itu, beberapa plugin juga memungkinkan Anda memblokir mesin telusur agar tidak merayapi bagian tertentu dari situs Anda, atau seluruh situs, dengan menambahkan tag meta "noindex" ke bagian atau halaman yang sesuai.

Penting untuk diingat bahwa menggunakan plugin untuk menghentikan mesin telusur merayapi situs WordPress adalah solusi sementara dan tidak boleh digunakan dalam jangka waktu lama karena akan memengaruhi visibilitas dan lalu lintas situs web. Jika Anda ingin membuat perubahan di situs web Anda, Anda dapat menggunakan mode pemeliharaan atau situs pementasan.

#2. Menggunakan file robots.txt

Menggunakan file robots.txt untuk menghentikan mesin telusur merayapi situs WordPress adalah metode yang didasarkan pada standar untuk robot web (juga dikenal sebagai "perayap" atau "laba-laba"). File robots.txt adalah file yang berada di root situs web dan memberi tahu mesin telusur halaman atau bagian mana dari situs yang tidak boleh dirayapi. Dengan membuat dan mengunggah file robots.txt ke situs web, Anda dapat mencegah mesin telusur merayapi laman atau bagian tertentu dari situs Anda.

Untuk membuat file robots.txt, Anda dapat menggunakan editor teks sederhana seperti Notepad atau TextEdit. File harus dimulai dengan baris agen pengguna, yang memberi tahu mesin telusur perayap mana yang harus diblokir. Misalnya, untuk memblokir semua mesin telusur, Anda akan menggunakan “User-agent: *”.

Selanjutnya, Anda dapat menentukan halaman atau bagian mana dari situs Anda yang ingin Anda blokir. Ini dilakukan dengan menggunakan arahan "Larang", diikuti dengan URL halaman atau bagian yang ingin Anda blokir. Misalnya, untuk memblokir halaman tertentu, Anda akan menggunakan “Disallow: /page-to-block/”. Untuk memblokir seluruh direktori, Anda akan menggunakan "Disallow: /directory-to-block/".

Setelah Anda membuat file robots.txt, Anda perlu mengunggahnya ke direktori root situs web Anda. Lokasi direktori akar akan bergantung pada penyedia hosting Anda, tetapi biasanya direktori tersebut sama dengan beranda Anda.

Perlu diperhatikan bahwa meskipun file robots.txt dapat mencegah mesin telusur merayapi situs Anda, ini bukanlah metode yang sangat mudah, karena beberapa perayap mungkin mengabaikan file tersebut. Selain itu, penting untuk diingat bahwa file robots.txt tidak akan mencegah mesin telusur mengetahui keberadaan situs tersebut.

Selain itu, perlu diingat bahwa jika Anda memblokir seluruh situs menggunakan robots.txt, ini akan mencegah situs Anda diindeks dan muncul di hasil mesin telusur sehingga situs web Anda tidak akan mendapatkan lalu lintas dari mesin telusur.

Perlu diperhatikan juga bahwa Anda dapat memeriksa file robots.txt dari situs web mana pun dengan mengunjungi URL “ https://www.example.com/robots.txt ” dan mengganti “example.com” dengan nama domain situs web mana pun.

#3. Menggunakan file .htaccess

Menggunakan file .htaccess untuk menghentikan mesin telusur merayapi situs WordPress adalah metode yang melibatkan pengeditan file .htaccess di server Anda untuk menambahkan aturan khusus yang akan memblokir mesin telusur merayapi halaman atau bagian tertentu dari situs Anda. File .htaccess adalah file konfigurasi yang berada di direktori root situs web Anda dan mengontrol berbagai aspek perilaku situs web Anda, termasuk pengalihan, keamanan, dan kontrol akses.

Berikut adalah contoh bagaimana Anda dapat menggunakan file .htaccess untuk memblokir mesin pencari agar tidak merayapi halaman tertentu di situs WordPress Anda:

  1. Akses direktori root situs web Anda melalui FTP atau pengelola file di panel kontrol hosting web Anda.
  2. Cari file .htaccess, jika belum ada bisa buat file baru dengan nama yang sama.
  3. Buka file .htaccess di editor teks, seperti Notepad atau TextEdit.
  4. Tambahkan kode berikut di akhir file:
 <IfModule mod_rewrite.c> RewriteEngine On RewriteCond %{HTTP_USER_AGENT} (googlebot|bingbot|yahoo) [NC] RewriteRule ^page-to-block/$ - [R=404,L] </IfModule>

Kode ini akan memblokir semua mesin telusur utama agar tidak merayapi laman dengan URL "laman-ke-blokir". Anda dapat mengubah URL agar cocok dengan halaman tertentu yang ingin Anda blokir.

  1. Simpan file .htaccess dan unggah kembali ke server Anda.

Perlu dicatat bahwa metode ini akan mencegah mesin telusur merayapi laman tertentu, tetapi tidak akan mencegah mesin telusur untuk mengetahui keberadaan laman tersebut. Selain itu, metode ini didasarkan pada asumsi bahwa perayap mesin telusur akan mematuhi aturan yang ditentukan dalam file .htaccess, yang mungkin tidak selalu demikian.

Selain itu, penting untuk berhati-hati saat mengedit file .htaccess, karena kesalahan kode dapat menyebabkan situs web Anda tidak dapat diakses. Disarankan untuk menyimpan cadangan file .htaccess asli sebelum melakukan perubahan.

#4. Perlindungan kata sandi

Menggunakan perlindungan kata sandi untuk menghentikan mesin telusur merayapi situs WordPress adalah metode yang melibatkan penambahan kata sandi ke halaman atau bagian tertentu dari situs Anda. Ini berarti bahwa hanya pengguna yang memiliki kata sandi yang dapat mengakses halaman yang dilindungi, sementara mesin telusur tidak dapat merayapinya.

Ada beberapa cara untuk melindungi halaman atau bagian situs WordPress dengan kata sandi:

  1. Menggunakan plugin : Ada beberapa plugin WordPress yang tersedia yang memungkinkan Anda melindungi halaman atau bagian situs Anda dengan kata sandi, seperti Kategori yang Dilindungi Kata Sandi atau Dilindungi Kata Sandi. Plugin ini memungkinkan Anda mengatur kata sandi untuk halaman atau posting tertentu, atau untuk seluruh kategori.
  2. Menggunakan file .htaccess : Anda dapat menggunakan file .htaccess untuk melindungi kata sandi direktori tertentu di situs web Anda. Metode ini sedikit lebih teknis, karena memerlukan pengeditan file .htaccess di server Anda, tetapi dapat berguna jika Anda ingin melindungi seluruh direktori dengan kata sandi, bukan hanya satu halaman atau posting.
  3. Menggunakan cPanel : Beberapa penyedia hosting web juga menyediakan cara untuk melindungi direktori dengan kata sandi di cPanel. Metode ini dapat berguna jika Anda ingin melindungi seluruh direktori dengan kata sandi dan Anda tidak terbiasa dengan pengeditan file .htaccess.

Setelah halaman atau bagian situs Anda dilindungi kata sandi, mesin telusur tidak akan dapat merayapinya. Namun, perlu dicatat bahwa metode ini tidak akan mencegah mesin telusur mengetahui keberadaan halaman tersebut. Selain itu, penting untuk diingat bahwa kata sandi yang melindungi halaman atau bagian dari situs Anda juga akan mencegah pengguna mengaksesnya, sehingga hanya boleh digunakan untuk halaman atau bagian yang tidak penting untuk visibilitas atau lalu lintas situs Anda.

Selain itu, menggunakan perlindungan kata sandi bukanlah solusi jangka panjang, Anda harus menggunakan metode ini hanya jika Anda memiliki kebutuhan sementara untuk memblokir akses ke situs Anda atau bagian tertentu darinya, seperti selama pemeliharaan atau pengujian.

#5. Modus pemeliharaan

WordPress memiliki fitur mode perawatan bawaan yang memungkinkan Anda membuat situs Anda offline untuk sementara saat Anda melakukan pembaruan, pemeliharaan, atau membuat perubahan. Fitur ini biasanya digunakan untuk menampilkan halaman "Coming Soon" atau "Maintenance Mode" kepada pengunjung, sambil tetap mengizinkan Anda dan pengguna lain yang masuk untuk mengakses situs.

Untuk mengaktifkan mode pemeliharaan bawaan di WordPress, Anda dapat mengikuti langkah-langkah berikut:

  1. Buka dasbor WordPress dan navigasikan ke menu "Pengaturan".
  2. Pilih opsi "Mode Pemeliharaan".
  3. Centang kotak "Aktifkan Mode Perawatan".
  4. Klik tombol "Simpan Perubahan".

Setelah Anda mengaktifkan mode pemeliharaan, pengunjung akan melihat halaman "Segera Hadir" atau "Mode Pemeliharaan", sementara Anda dan pengguna yang masuk lainnya akan memiliki akses penuh ke situs. Ini juga akan memblokir mesin telusur agar tidak merayapi situs saat sedang dalam mode pemeliharaan.

Anda juga dapat menginstal plugin seperti "Coming Soon Page & Maintenance Mode by SeedProd" yang memungkinkan Anda menyesuaikan halaman segera hadir dan juga memungkinkan Anda memblokir mesin telusur agar tidak merayapi situs saat sedang dalam mode pemeliharaan.

#6 .Pementasan situs

Situs pementasan adalah duplikat atau replika dari situs web langsung Anda yang digunakan untuk tujuan pengujian dan pengembangan. Ini memungkinkan Anda membuat perubahan dan menguji fitur baru di situs Anda tanpa memengaruhi versi langsung. Ini bisa sangat berguna saat Anda ingin memperbarui situs web atau membuat perubahan besar, tetapi tidak ingin pengunjung atau mesin telusur melihat situs saat sedang dalam proses.

Banyak penyedia hosting menawarkan fitur pementasan yang memungkinkan Anda membuat salinan situs langsung Anda dengan beberapa klik. Ini biasanya melibatkan pembuatan subdomain terpisah, atau subdirektori di domain utama Anda, tempat Anda dapat mengakses situs pementasan. Proses pembuatan situs pementasan dapat bervariasi tergantung pada penyedia hosting, tetapi biasanya melibatkan beberapa langkah sederhana seperti:

  1. Masuk ke akun hosting Anda.
  2. Buka panel kontrol hosting atau cPanel
  3. Cari bagian "Pementasan" atau "Pengembangan".
  4. Pilih situs web Anda dari daftar situs di akun hosting Anda.
  5. Klik tombol "Buat Situs Pementasan".

Setelah situs pementasan dibuat, Anda akan dapat mengaksesnya menggunakan URL yang berbeda dari situs live, seperti “staging.yourdomain.com”. Anda kemudian dapat melakukan perubahan dan menguji fitur baru di situs pementasan tanpa memengaruhi versi langsung.

Penting untuk diperhatikan bahwa mesin telusur tidak akan dapat merayapi situs pementasan, karena situs tersebut biasanya diblokir agar tidak diindeks. Ini berarti situs pementasan tidak akan terlihat oleh mesin telusur dan tidak akan memengaruhi SEO situs langsung. Anda juga dapat memblokir mesin telusur agar tidak merayapi situs menggunakan file robots.txt atau dengan menggunakan plugin untuk mengelola akses ke situs Anda, seperti "Halaman Segera Hadir & Mode Pemeliharaan oleh SeedProd" atau "WordPress SEO oleh Yoast", sehingga mesin telusur tidak dapat mengakses situs saat sedang dalam pengembangan.

Setelah selesai melakukan perubahan dan pengujian di situs pementasan, Anda kemudian dapat mendorong perubahan ke situs langsung. Ini dapat dilakukan dengan menggunakan plugin yang sama dengan yang Anda gunakan untuk membuat situs pementasan, atau dengan mengunggah perubahan secara manual ke situs langsung.

Situs pementasan adalah replika situs aktif, digunakan untuk menguji dan mengembangkan perubahan di lingkungan yang aman, dapat digunakan untuk memblokir mesin telusur agar tidak merayapi situs, dan memungkinkan Anda menguji perubahan sebelum membuatnya aktif. Dan banyak penyedia hosting menawarkan fitur ini sebagai layanan bawaan.

Membungkus

Kesimpulannya, ada beberapa metode yang dapat digunakan untuk menghentikan mesin pencari merayapi situs WordPress, masing-masing dengan kelebihan dan keterbatasannya sendiri. Metode ini termasuk menggunakan mode pemeliharaan bawaan, file robots.txt, plugin, dan membuat situs pementasan. Masing-masing metode ini dapat digunakan untuk mencapai tujuan yang berbeda, seperti melindungi privasi dan keamanan informasi sensitif, mengelola lalu lintas dan sumber daya, menghindari masalah duplikat konten, dan menguji perubahan atau pembaruan baru sebelum memublikasikannya ke situs langsung. Sangat penting untuk memilih metode yang tepat yang paling sesuai dengan kebutuhan Anda dan untuk memastikan bahwa situs Anda dikonfigurasi dengan benar untuk mencegah mesin telusur merayapinya.