আমি কোনও সাইটের জন্য নিম্নলিখিত রোবটস.টি.এস.টি. ফাইলটি ব্যবহার করছি: টার্গেট হ'ল পেজ ব্যতীত গুগলবট এবং বিংবোটকে সাইটে অ্যাক্সেসের অনুমতি দেওয়া /bedven/bedrijf/*
এবং অন্য সমস্ত বটকে সাইটটি ক্রলিং থেকে আটকাতে হবে।
User-agent: googlebot
Disallow: /bedven/bedrijf/*
Crawl-delay: 10
User-agent: google
Disallow: /bedven/bedrijf/*
Crawl-delay: 10
User-agent: bingbot
Disallow: /bedven/bedrijf/*
Crawl-delay: 10
User-agent: bing
Disallow: /bedven/bedrijf/*
Crawl-delay: 10
User-agent: *
Disallow: /
শেষ বিধিটি কি User-agent: * Disallow: /
সমস্ত বটগুলিকে সাইটের প্রতিটি পৃষ্ঠা ক্রল করা থেকে নিষেধ করে?
robots.txt
যাহাই হউক না কেন
robots.txt
বা কমপক্ষে Disallow: /
নিয়ম করে। যদি আপনার ব্যক্তিগত ওয়েবসাইটটি মাটিতে আছড়ে পড়েছে কারণ কোনও বট প্রোগ্রামার কখনও বিবেচনা করেনি যে 256 কেবিট সংযোগের ভুল প্রান্তে সার্ভারটি রাস্পবেরি পাই হতে পারে, এর মতো একটি কম্বল বর্জনযোগ্য।