Back to Question Center
0

Tidak Mematuhi Penjejakan Semuanya Cari Semalat

1 answers:

Menggunakan robot. txt Saya cuba menghentikan semua merangkak URL carian

    Tidak membenarkan: / rest_of_url / carian & pelancongan *   

Di atas adalah apa yang saya gunakan. URL kami kelihatan seperti berikut untuk semua hasil carian. Walau bagaimanapun, segala-galanya selepas carian & pelancongan boleh berbeza, sebagai contoh:

    https: // www. contohnya. com - putzinstitut rapperswil-jona. au / rest_of_url / search & tour-sdfs = the-place + location + & tour-duration = 1 /    

Adakah kod yang tidak dapat diselesaikan halaman?

February 12, 2018

Adakah kod Disallow di atas menghentikan robot daripada merangkak semua halaman hasil carian saya?

Ya, ia akan menghentikan bot (baik) yang mematuhi robot. txt "standard".

Walau bagaimanapun, anda tidak memerlukan trailing * . robot. txt ialah padankan awalan , jadi "wildcard" * pada akhirnya hanya boleh diabaikan. (Perlawanan jenis Wildcard adalah lanjutan dari piawaian asal pula. )

Dan anda pasti memerlukan arahan User-agent yang mendahului peraturan ini, jika anda belum mendapatnya:

  Agen pengguna: *
Membenarkan: / rest_of_url / carian & lawatan 
.

Di samping itu, anda boleh menghalang laman muncul dalam Carian Google dengan memasukkan tag meta noindex dalam kod HTML halaman.