উত্তর:
আমি গুগল অনুসন্ধান কনসোল (পূর্বে গুগল ওয়েবমাস্টার সরঞ্জাম) এর সাথে আপনার সাইটটি নিবন্ধ করার জন্য দৃ strongly়ভাবে সুপারিশ করব । সাইট কনফিগারেশনের অধীনে ক্রলার অ্যাক্সেস বিভাগ রয়েছে যা আপনাকে বলবে যে আপনার রোবটস.টি.এস.টি.টি সর্বশেষ কখন ডাউনলোড হয়েছিল। এই সরঞ্জামটি ক্রলাররা কীভাবে আপনার সাইটটি দেখছে, কী অবরুদ্ধ করেছে বা কী কাজ করছে না এবং আপনি কোথায় গুগলে কোয়েরিতে উপস্থিত হচ্ছেন সে সম্পর্কেও অনেক বিশদ সরবরাহ করে।
আমি যা বলতে পারি তা থেকে গুগল প্রায়শই রোবটস টেক্সট ডাউনলোড করে । গুগল অনুসন্ধান কনসোল সাইট আপনাকে সূচক থেকে ইউআরএল সুনির্দিষ্টভাবে মুছে ফেলতে দেবে, যাতে আপনি এখন যেগুলি ব্লক করছেন সেগুলি আপনি মুছে ফেলতে পারেন।
উদ্যম। আমি রোবটস.টেক্সট থেকে মেটা নয়েডেক্স, নোফলোয়ের দিকে পরিবর্তিত হয়েছি। মেটা কাজ করার জন্য রোবটস টেক্সটে ব্লক করা ঠিকানাগুলি প্রথমে অবরোধ মুক্ত করতে হবে।
আমি সম্পূর্ণরূপে রোবটস.টি.এক্সটি মোছার মাধ্যমে (এবং এটি গুগলের ওয়েবমাস্টারে সঞ্চারিত করে) বর্বরতার সাথে এটি করেছি।
ওয়েবমাস্টার সরঞ্জামে প্রদর্শিত রোবটস.টিএসটিএসএস অপসারণ প্রক্রিয়াটি (অবরুদ্ধ পৃষ্ঠাগুলির সংখ্যা) শেষ হতে 10 সপ্তাহ সময় নিয়েছে, যার মধ্যে বেশিরভাগ অংশ গত 2 সপ্তাহের মধ্যে কেবল গুগল দ্বারা সরানো হয়েছিল।
হ্যাঁ, গুগল স্পষ্টতই একটি পরিমাণে রোবটস.টেক্সকে ক্যাশে করবে - এটি প্রতিবার কোনও পৃষ্ঠার দিকে চেয়ে দেখতে এটি ডাউনলোড করবে না। এটি কতক্ষণ ধরে এটি ক্যাশে করে, আমি জানি না। তবে, যদি আপনার একটি দীর্ঘ মেয়াদ উত্তীর্ণ শিরোনাম সেট থাকে তবে গুগলবট ফাইলটি চেক করতে এটি আরও বেশি সময় ছেড়ে যেতে পারে।
আর একটি সমস্যা ভুল কনফিগার করা ফাইল হতে পারে। ওয়েবমাস্টার টুলস danivovich দাড়ায় যে, একটি হল robots.txt এর পরীক্ষক। এটি আপনাকে জানাবে যে কোন ধরণের পৃষ্ঠাগুলি অবরুদ্ধ এবং কোনটি সূক্ষ্ম।
গুগলের ডকুমেন্টেশন উল্লেখ করেছে যে তারা সাধারণত একদিনের জন্য রোবটস.টেক্সটকে ক্যাশে করবে তবে তা রিফ্রেশ করার চেষ্টা করার সময় ত্রুটি পেলে আরও বেশি দিন ধরে এটি ব্যবহার করতে পারে।
একটি রোবটস.টি.এস.টি অনুরোধটি সাধারণত একদিন অবধি ক্যাশে থাকে তবে ক্যাশেড সংস্করণকে রিফ্রেশ করা সম্ভব না এমন পরিস্থিতিতে দীর্ঘতর ক্যাশে রাখা যেতে পারে (উদাহরণস্বরূপ, সময়সীমা বা 5 xxx ত্রুটির কারণে)। ক্যাশেড প্রতিক্রিয়া বিভিন্ন ক্রলারের দ্বারা ভাগ করা যেতে পারে। গুগল সর্বোচ্চ-বয়সের ক্যাশে-নিয়ন্ত্রণ HTTP শিরোনামের ভিত্তিতে ক্যাশে আজীবন বৃদ্ধি বা হ্রাস করতে পারে।
হ্যাঁ. তারা বলে যে তারা সাধারণত এটি একবারে আপডেট করে, তবে কেউ কেউ পরামর্শ দিয়েছেন যে তারা নির্দিষ্ট সংখ্যক পৃষ্ঠা হিট (100?) এর পরে এটি পরীক্ষা করে দেখতে পারে যাতে ব্যস্ত সাইটগুলি আরও বেশিবার চেক করা হয়।
দেখুন /webmasters//a/29946 ও ভিডিও যে @DisgruntedGoat উপরে ভাগ http://youtube.com/watch?v=I2giR-WKUfY ।
তারা ব্যবহারকারীদের অ্যাক্সেসযোগ্য ক্যাশে আমি যা দেখতে পাচ্ছি সেগুলি থেকে আপনাকে যা করতে হবে তা হল আপনার রোবট. txt ফাইলের URL টি একটি Google অনুসন্ধানে টাইপ করুন এবং তারপরে সামান্য সবুজ ড্রপডাউন তীরটি ক্লিক করুন এবং 'ক্যাশেড' ক্লিক করুন (নীচের চিত্রটি দেখুন) এটি আপনাকে গুগল সার্ভার থেকে সেই পৃষ্ঠাটির সর্বশেষতম সংস্করণ দেবে।
আপনি গুগলের ইউআরএল অপসারণ সরঞ্জামটি ব্যবহার করে এটি অপসারণের জন্য অনুরোধ করতে পারেন ।