গুগল রোবটস.টি.টি.কে ক্যাশে করে?


17

আমি এক সপ্তাহ আগে আমার একটি সাইটে একটি রোবটস.টিএসটি ফাইল যুক্ত করেছি, যা গুগলবটকে নির্দিষ্ট ইউআরএল আনার চেষ্টা থেকে বিরত থাকতে হবে। তবে এই উইকএন্ডে আমি গুগলবট দেখতে পাচ্ছি ঠিক সেই ইউআরএলগুলি লোড করা।

গুগল কি রোবটস.টি.এইচটিএসকে ক্যাশে করে এবং যদি তা হয় তবে তা করা উচিত?

উত্তর:


13

আমি গুগল অনুসন্ধান কনসোল (পূর্বে গুগল ওয়েবমাস্টার সরঞ্জাম) এর সাথে আপনার সাইটটি নিবন্ধ করার জন্য দৃ strongly়ভাবে সুপারিশ করব । সাইট কনফিগারেশনের অধীনে ক্রলার অ্যাক্সেস বিভাগ রয়েছে যা আপনাকে বলবে যে আপনার রোবটস.টি.এস.টি.টি সর্বশেষ কখন ডাউনলোড হয়েছিল। এই সরঞ্জামটি ক্রলাররা কীভাবে আপনার সাইটটি দেখছে, কী অবরুদ্ধ করেছে বা কী কাজ করছে না এবং আপনি কোথায় গুগলে কোয়েরিতে উপস্থিত হচ্ছেন সে সম্পর্কেও অনেক বিশদ সরবরাহ করে।

আমি যা বলতে পারি তা থেকে গুগল প্রায়শই রোবটস টেক্সট ডাউনলোড করে । গুগল অনুসন্ধান কনসোল সাইট আপনাকে সূচক থেকে ইউআরএল সুনির্দিষ্টভাবে মুছে ফেলতে দেবে, যাতে আপনি এখন যেগুলি ব্লক করছেন সেগুলি আপনি মুছে ফেলতে পারেন।


2
আমি ওয়েবমাস্টার সরঞ্জামগুলি যাচাই করেছি: রোবটস.টিএসটিএসটি ফাইলটি বৈধ এবং এটি গুগলবোট দ্বারা সন্ধান করা পৃষ্ঠাগুলির সর্বাধিক সাম্প্রতিক দর্শনের 17 ঘন্টা আগে নেওয়া হয়েছিল। আমি সন্দেহ করি এটি গুগলের নেটওয়ার্কের মাধ্যমে প্রচারের প্রশ্ন eventually অবশেষে সমস্ত গুগলবোট সার্ভারগুলি রোবটস টেক্সট নির্দেশাবলীর সাথে মিলিয়ে যাবে।
কওগ

গুগল বট রোবট.টেক্সট ব্যবহার করে না যতক্ষণ অনুসন্ধান কনসোলে আপডেটের খবর পাওয়া যায়। আমি একটি আপডেট তৈরি করে চার সপ্তাহ হয়ে গেছে, এবং গুগল বট এখনও একটি খারাপ রোবটস টেক্সট ব্যবহার করে - এবং এটি আমাদের ট্র্যাফিক এবং স্থান নির্ধারণ করে destro
কর্পোরেট গীক

3

উদ্যম। আমি রোবটস.টেক্সট থেকে মেটা নয়েডেক্স, নোফলোয়ের দিকে পরিবর্তিত হয়েছি। মেটা কাজ করার জন্য রোবটস টেক্সটে ব্লক করা ঠিকানাগুলি প্রথমে অবরোধ মুক্ত করতে হবে।

আমি সম্পূর্ণরূপে রোবটস.টি.এক্সটি মোছার মাধ্যমে (এবং এটি গুগলের ওয়েবমাস্টারে সঞ্চারিত করে) বর্বরতার সাথে এটি করেছি।

ওয়েবমাস্টার সরঞ্জামে প্রদর্শিত রোবটস.টিএসটিএসএস অপসারণ প্রক্রিয়াটি (অবরুদ্ধ পৃষ্ঠাগুলির সংখ্যা) শেষ হতে 10 সপ্তাহ সময় নিয়েছে, যার মধ্যে বেশিরভাগ অংশ গত 2 সপ্তাহের মধ্যে কেবল গুগল দ্বারা সরানো হয়েছিল।


আমি আপনার সাথে সহমত করছি। আমরা একটি ভুল করে ভুলভাবে রোবট.এসটিএসটি ফাইল আপডেট করেছি। গুগল এটি ক্যাশে করেছে এবং আমরা ভুলটি সংশোধন করার চার সপ্তাহ পরে এটি ব্যবহার করছে এবং এটি একটি নতুন রোবট.এসটিএসটি দিয়ে প্রতিস্থাপন করেছে। এমনকি আমি গুগল ওয়েবমাস্টার সরঞ্জামগুলিতে ম্যানুয়ালি একটি রিফ্রেশ অনুরোধ জমা দিয়েছি এবং ... কিছুই নেই। এটি ট্র্যাফিক এবং র‌্যাঙ্কিং হারিয়ে যাওয়ার ফলে এটি অত্যন্ত খারাপ। :(
কর্পোরেট গীক

2

হ্যাঁ, গুগল স্পষ্টতই একটি পরিমাণে রোবটস.টেক্সকে ক্যাশে করবে - এটি প্রতিবার কোনও পৃষ্ঠার দিকে চেয়ে দেখতে এটি ডাউনলোড করবে না। এটি কতক্ষণ ধরে এটি ক্যাশে করে, আমি জানি না। তবে, যদি আপনার একটি দীর্ঘ মেয়াদ উত্তীর্ণ শিরোনাম সেট থাকে তবে গুগলবট ফাইলটি চেক করতে এটি আরও বেশি সময় ছেড়ে যেতে পারে।

আর একটি সমস্যা ভুল কনফিগার করা ফাইল হতে পারে। ওয়েবমাস্টার টুলস danivovich দাড়ায় যে, একটি হল robots.txt এর পরীক্ষক। এটি আপনাকে জানাবে যে কোন ধরণের পৃষ্ঠাগুলি অবরুদ্ধ এবং কোনটি সূক্ষ্ম।



2
@ কিউওগ: এই সাম্প্রতিক ভিডিওটি দেখুন: youtube.com/watch?v=I2giR-WKUfY ম্যাট কাটস পরামর্শ দেয় যে রোবটস.টেক্সট দিনে একবার বা প্রায় 100 টি অনুরোধ ডাউনলোড হয়।
অসন্তুষ্ট গোয়াট

2

গুগলের ডকুমেন্টেশন উল্লেখ করেছে যে তারা সাধারণত একদিনের জন্য রোবটস.টেক্সটকে ক্যাশে করবে তবে তা রিফ্রেশ করার চেষ্টা করার সময় ত্রুটি পেলে আরও বেশি দিন ধরে এটি ব্যবহার করতে পারে।

একটি রোবটস.টি.এস.টি অনুরোধটি সাধারণত একদিন অবধি ক্যাশে থাকে তবে ক্যাশেড সংস্করণকে রিফ্রেশ করা সম্ভব না এমন পরিস্থিতিতে দীর্ঘতর ক্যাশে রাখা যেতে পারে (উদাহরণস্বরূপ, সময়সীমা বা 5 xxx ত্রুটির কারণে)। ক্যাশেড প্রতিক্রিয়া বিভিন্ন ক্রলারের দ্বারা ভাগ করা যেতে পারে। গুগল সর্বোচ্চ-বয়সের ক্যাশে-নিয়ন্ত্রণ HTTP শিরোনামের ভিত্তিতে ক্যাশে আজীবন বৃদ্ধি বা হ্রাস করতে পারে।


1

হ্যাঁ. তারা বলে যে তারা সাধারণত এটি একবারে আপডেট করে, তবে কেউ কেউ পরামর্শ দিয়েছেন যে তারা নির্দিষ্ট সংখ্যক পৃষ্ঠা হিট (100?) এর পরে এটি পরীক্ষা করে দেখতে পারে যাতে ব্যস্ত সাইটগুলি আরও বেশিবার চেক করা হয়।

দেখুন /webmasters//a/29946 ও ভিডিও যে @DisgruntedGoat উপরে ভাগ http://youtube.com/watch?v=I2giR-WKUfY


1

তারা ব্যবহারকারীদের অ্যাক্সেসযোগ্য ক্যাশে আমি যা দেখতে পাচ্ছি সেগুলি থেকে আপনাকে যা করতে হবে তা হল আপনার রোবট. txt ফাইলের URL টি একটি Google অনুসন্ধানে টাইপ করুন এবং তারপরে সামান্য সবুজ ড্রপডাউন তীরটি ক্লিক করুন এবং 'ক্যাশেড' ক্লিক করুন (নীচের চিত্রটি দেখুন) এটি আপনাকে গুগল সার্ভার থেকে সেই পৃষ্ঠাটির সর্বশেষতম সংস্করণ দেবে।

এখানে চিত্র বর্ণনা লিখুন


-2

আপনি গুগলের ইউআরএল অপসারণ সরঞ্জামটি ব্যবহার করে এটি অপসারণের জন্য অনুরোধ করতে পারেন ।


এটি প্রশ্নের উত্তর দেয় না।
মিঃ হোয়াইট

উত্তর না কেন?
কোজাশি সৌজা

কারণ প্রশ্নটি বিশেষত রোবটস টেক্সট , ইউআরএলগুলির ক্যাচিং এবং ক্রলিং সম্পর্কে। এর ফলাফলগুলির মধ্যে একটি হতে পারে ইউআরএলগুলি সূচিযুক্ত নয়, তবে এটি প্রশ্ন নয়। (গুগলের ইউআরএল অপসারণ সরঞ্জামটি কেবল একটি "অস্থায়ী" সমাধান, এটি স্থায়ী করার জন্য আপনাকে অন্যান্য পদক্ষেপগুলি করতে হবে।)
মিঃ হোয়েট
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.