আমার খুব সন্দেহ যে কোনও পোস্ট বা নিবন্ধের প্রকাশিত তারিখটি <lastmod>
কোনও এক্সএমএল সাইটম্যাপে প্রবেশের উপর ভিত্তি করে (অন্যরা যেমন পরামর্শ দিয়েছেন) বা সেই বিষয়ে সর্বশেষ-পরিবর্তিত এইচটিটিপি শিরোনাম। একটি এক্সএমএল সাইটম্যাপ কেবল পরামর্শমূলক, অনুমোদনযোগ্য নয়। কোনও নথির শেষ পরিবর্তিত তারিখ সম্ভবত কোনও নিবন্ধের (মূল) প্রকাশের তারিখের মতো নয়। এবং, যেমন আমি পৃষ্ঠার শীর্ষে আমার মন্তব্যে উল্লেখ করেছি, নথির শেষ পরিবর্তিত তারিখটি ক্যাশে এবং সম্ভবত ক্রল রেট নির্ধারণের জন্য সম্ভবত আরও গুরুত্বপূর্ণ । গতিশীলভাবে উত্পন্ন পৃষ্ঠাগুলির সর্বশেষ-পরিবর্তিত এইচটিটিপি শিরোনামটি প্রায়শই আসল তারিখ / সময় (যেমন এটি ওয়ার্ডপ্রেস ব্লগগুলির ক্ষেত্রে) এর খুব কাছাকাছি থাকে।
অন্যদিকে আরএসএস / অ্যাটম ফিডে তথ্যের এই সুনির্দিষ্ট নাগেট থাকে। এবং প্রকৃতপক্ষে, ওয়ার্ডপ্রেস সাইটগুলিতে যেগুলি সামগ্রীতে প্রকাশের তারিখ অন্তর্ভুক্ত করে না, প্রকাশের তারিখটি এখনও গুগলের অনুসন্ধানের ফলাফলগুলিতে উপস্থিত হয়। এবং যতদূর আমি বলতে পারি, এটি আরএসএস ফিডে তারিখটির সাথে মেলে।
সম্পাদনা # 1: তবে, আরএসএস ফিডে অগত্যা সমস্ত পৃষ্ঠা থাকে না। বেশিরভাগ ক্ষেত্রে এটিতে সর্বশেষতম বা সাম্প্রতিক আপডেট হওয়া পৃষ্ঠাগুলি থাকা উচিত । তবে এর কোনও কারণ নেই যে গুগল ইতিমধ্যে যা পড়েছে তা ভুলে যাওয়া উচিত, এবং সেই পৃষ্ঠাটির বিষয়বস্তু সরবরাহ করা পরিবর্তিত হয়নি তবে শেষ পরিবর্তিত তারিখেরও উচিত নয়।
আরএসএস ফিড না থাকলে আমি মনে করি পৃষ্ঠার সামগ্রীটি বিশ্লেষণ করার জন্য গুগল যথেষ্ট চালাক। বিশেষত যদি মাইক্রোফরমেটের সাহায্যে তারিখগুলি 'শব্দার্থত' হিসাবে চিহ্নিত করা হয় । এটি পুরোপুরি সম্ভাব্য যে Google এর মধ্যে নিবন্ধটি অন্তর্ভুক্ত থাকা নিবন্ধের অনুমোদনযোগ্য প্রকাশের তারিখ হিসাবে নিম্নলিখিতটি দেখবে:
<abbr class="published" title="2010-08-27T15:45:00-0700">
Friday, August 27th, 2010
</abbr>
গুগল অবশ্যই মাইক্রোফর্ম্যাটগুলি পড়ায় - এইচকার্ড, এইচরিভিউ ইত্যাদি does
কেবল যোগ করার জন্য, আমি মনে করি না যে গুগল কোনও প্রকাশের তারিখ বর্ণনা করবে যদি না এটি প্রামাণ্য কিছু খুঁজে পায় যা এটি প্রস্তাব করে। এটি অনুমানমূলক তথ্যের উপর একটি 'প্রকাশের তারিখ' হ্রাস করতে যাচ্ছে না, যেহেতু একটি ভুল 'প্রকাশের তারিখ' কারওর জন্য ব্যবহারযোগ্য নয় এবং গুগল এর জন্য প্রচুর কাঠি পাবে!
এবং কেবল রেকর্ডের জন্য (যদি @ টম অন্যথায় পরামর্শ দিচ্ছে :) আমি মনে করি পোস্ট / নিবন্ধগুলির প্রকাশের তারিখটি দৃশ্যমানভাবে প্রদর্শিত হওয়া উচিত। অনেকেই করেন না, এবং এটি পাঠকের জন্য হতাশাজনক হতে পারে বিশেষত যখন প্রযুক্তি সংক্রান্ত সমস্যাগুলি নিয়ে গবেষণা করে এবং আপনি দেখতে পান যে নিবন্ধটি অর্ধেকটা পড়ে শেষ হয়ে গেছে!
সম্পাদনা # 2: তার পর থেকে আমি একই রকম বিরক্তি পেয়েছি যা @ মিমদানজিগার তার উত্তরে বিশদ বিবরণ দেয়। আমার পুরানো সাইটের একটিতে আমার কাছে প্রতিটি পৃষ্ঠার শীর্ষে "সাইট লাস্ট আপডেটেড সান 17 জুন 2012" (কোনও বিশেষ উপায়ে চিহ্নিত করা হয়নি) ফর্মটির পাঠ্য রয়েছে (জাভাস্ক্রিপ্ট সহ পৃষ্ঠায় লিখিত আছে)! এই একই তারিখটি গুগল তুলে নিয়েছে এবং এখন বেশ কয়েকটি (তবে সমস্ত নয়) এসইআরপিএসে প্রদর্শিত পৃষ্ঠাগুলির পাশাপাশি উপস্থিত হবে - এটি অবশ্যই পৃষ্ঠার প্রকাশের তারিখ নয়। দেখে মনে হবে গুগল "শেষ আপডেট হওয়া ( তারিখের স্ট্রিং )" (জাভাস্ক্রিপ্ট প্রক্রিয়াকরণ করে) ফর্মের স্ট্রিংয়ের জন্য কেবল পৃষ্ঠাটি স্ক্র্যাপ করছে । এই নির্দিষ্ট সাইটে আরএসএস ফিড নেই। সাইটে সাইটম্যাপ.এক্সএমএল ফাইল রয়েছে তবে তারিখগুলি আলাদা।
আমি অন্যান্য সাইটেও একইরকম আচরণ লক্ষ্য করেছি।