Minggu, 16 Maret 2014

Memblokir atau menghapus laman menggunakan file robots.txt

Pembuatan alat robots.txt sedang dalam proses. Anda dapat membuat file robots.txt secara manual, atau menggunakan salah satu alat pembuat robots.txt yang banyak tersedia di web.
File robots.txt membatasi akses ke situs Anda dengan robot mesin telusur yang merayapi web tersebut. Bot bekerja secara otomatis, dan sebelum mengakses laman situs, bot memeriksa apakah file robots.txt ada yang mencegahnya mengakses laman tertentu. (Semua robot akan mengikuti perintah dalam file robots.txt, meskipun beberapa robot mungkin mengartikannya secara berbeda. Namun, robots.txt tidak dapat dipaksakan dan beberapa pelaku spam serta pencari masalah lainnya bisa jadi mengabaikannya. Karenanya, sebaiknya gunakan kata sandi untuk melindungi informasi rahasia).
Untuk melihat URL yang telah diblokir dari perayapan Google, kunjungi laman URL yang Diblokir dari bagian Perayapan Alat Webmaster.
Anda hanya memerlukan file robots.txt jika situs menyertakan konten yang tidak ingin disertakan dalam pengindeksan mesin telusur. Jka Anda ingin mesin telusur mengideks semuanya dalam situs Anda, maka Anda tidak memerlukan file robots.txt (bahkan file yang kosong).
Meskipun Google tidak merayapi atau mengindeks konten laman yang diblokir robots.txt, kami mungkin masih mengindeks URL jika kami menemukannya di laman lain di web. Oleh karena itu, URL laman dan, kemungkinan, informasi yang tersedia secara umum lainnya seperti teks tautan di tautan ke situs, atau judul dari Proyek Direktori Terbuka (www.dmoz.org), dapat muncul di hasil penelusuran Google.
Untuk menggunakan file robots.txt, Anda membutuhkan akses ke root domain Anda (jika tidak yakin, hubungi hoster web Anda). Jika tidak memiliki akses ke akar domain, Anda dapat membatasi akses menggunakan meta tag robot.
Untuk benar-benar mencegah konten laman dicantumkan di indeks web Google meskipun situs lain menautkannya, gunakan meta tag noindex atau x-robots-tag. Selama Googlebot mengambil laman tersebut, Googlebot akan melihat tag meta noindex tersebut dan mencegah laman tersebut ditampilkan di indeks web. Header HTTP x-robots-tag berguna terutama jika Anda ingin membatasi pengindeksan file non-HTML seperti grafik atau jenis dokumen lain.

0 komentar:

Posting Komentar