গুগল যখন প্রথম কোনও ইউআরএলকে প্রথম সূচীকরণ করেছিল তখন আমি কীভাবে তা জানতে পারি? আমি এমন একটি সমাধান পছন্দ করব যা প্রতিযোগীদের URL এর জন্যও কাজ করে যা আমার মালিকানাধীন নয়।
গুগল যখন প্রথম কোনও ইউআরএলকে প্রথম সূচীকরণ করেছিল তখন আমি কীভাবে তা জানতে পারি? আমি এমন একটি সমাধান পছন্দ করব যা প্রতিযোগীদের URL এর জন্যও কাজ করে যা আমার মালিকানাধীন নয়।
উত্তর:
কোনও ইউআরএল-এর বয়স জানতে আপনি www.example.com
যে URL চান তার পরিবর্তে এই লিঙ্কটি অনুসরণ করতে পারেন:
https://www.google.com/search?tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2000&q=site%3Ahttp%3A%2F%2Fwww.example.com&safe=active&gws_rd=ssl
উদাহরণস্বরূপ, স্ট্যাক ওভারফ্লো এর মেটা সাইটের জন্য গুগলের ফলাফল এখানে :
অন্যথায়, ওয়েব্যাক মেশিনটিও একটি ভাল সমাধান তবে আমার অভিজ্ঞতা থেকে কম সুনির্দিষ্ট।
.fr
করতে .com
।
www
এই সময়েও মুছে ফেলার মাধ্যমে অনুসন্ধান করেছিলাম এটি তারিখের জন্য ফলাফল দেখাচ্ছে Dec 1, 2014
যা খুব সাম্প্রতিক তারিখ যা URL এর বয়স হতে পারে না। আমি কি ভুলভাবে অনুসন্ধান করছি? বা কিছু মিস করছি?
জিস্টোলোইন পৃষ্ঠার সামগ্রীটি প্রথম সূচীকরণ করার সময় গুগল তারিখ প্রদর্শন করার একটি উপায় খুঁজে পেয়েছিল। আমি এটিকে আমার উত্তরে যুক্ত করছি কারণ আমি মনে করি আমি এটি আরও স্পষ্টভাবে ব্যাখ্যা করতে পারি।
গুগল তারপরে অনুসন্ধানের ফলাফলের পৃষ্ঠায় থাকা সামগ্রীটি আবিষ্কার করার তারিখটি প্রদর্শন করবে।
পৃষ্ঠাটি যদি নতুন সামগ্রীতে আপডেট হয় তবে গুগলও এই তারিখটি আপডেট করে। সুতরাং এটি "প্রথমে এই ইউআরএলটিকে প্রথমে সূচিত করা" তারিখের চেয়ে "একটি প্রথম এই বিষয়বস্তুতে তালিকাবদ্ধ করা" তারিখ।
কোনও পৃষ্ঠার জন্য গুগল ক্যাশে প্রদর্শন করে যে পৃষ্ঠাটি সর্বশেষ তালিকাবদ্ধ করা হয়েছিল। আপনি দেখতে পারেন যে স্ট্যাক এক্সচেঞ্জের হোমপেজটি সর্বশেষে আজই সূচকযুক্ত হয়েছিল:
আরেকটি বিকল্প হ'ল ইন্টারনেট আর্কাইভের ওয়েব্যাক মেশিনটি ব্যবহার করা । এটি আপনাকে দেখায় যে অতীতে কোনও পৃষ্ঠা কেমন ছিল। পৃষ্ঠাগুলি কখন প্রকাশিত হয়েছিল সে সম্পর্কে আপনি নির্ধারণ করতে পারেন। গুগল এবং ইন্টারনেট সংরক্ষণাগার উভয়ই প্রথম প্রকাশিত হওয়ার সাথে সাথে পৃষ্ঠাটি ক্রল করে এবং ব্যবহার করে।
bing.com
। আমি ভুল হলে দুঃখিত?
সেখানে নাও হতে পারে হতে খুঁজে বের করতে যখন একটি অবাধ ওয়েবপৃষ্ঠাটি প্রথমে Google দ্বারা সূচীবদ্ধ করা হয় কোন ভাবেই - অবশ্যই আমি তা করার কোন উপায় জানা নেই। এটি সম্ভব যে গুগল কেবল সেই তথ্য সংরক্ষণ করে না, যেহেতু তাদের প্রয়োজনের কোন আসল কারণ নেই। এছাড়াও, তারা এই তথ্যটি সংরক্ষণ করে রাখলেও, তৃতীয় পক্ষগুলিতে অবাধে উপলভ্য করার তাদের কাছে সত্যই কোনও বিশেষ কারণ নেই।
(যদি এটি আপনার নিজস্ব পৃষ্ঠা এবং আপনার পুরানো ওয়েবসার্ভার অ্যাক্সেস লগগুলিতে অ্যাক্সেস রয়েছে তবে এটি সহজ - গুগলবোট থেকে সেই পৃষ্ঠায় প্রথম ভিজিটের জন্য লগগুলি সন্ধান করুন otherwise তবে অন্যথায় নিশ্চিতভাবে বলার উপায় নেই))
যাইহোক, জিসটোলোয়েন এবং স্টিফেন অস্টারমিলার তাদের উত্তরগুলিতে বর্ণিত পদ্ধতিটি সাধারণত কোনও ইউআরএল গুগল দ্বারা সূচীকরণের তারিখটি সাধারণত প্রকাশ করে না । বরং এটি সেই তারিখটি দেখায় যা গুগল মনে করে যে ইউআরএলে থাকা সামগ্রীটি প্রকাশিত হয়েছিল বা শেষবার আপডেট হয়েছিল এবং এটি প্রায়শই গুগলের পৃষ্ঠা বা লিখিত সামগ্রীর তারিখ থেকে "স্নিফ" করার তারিখের কম বা নির্ভরযোগ্য প্রচেষ্টার উপর ভিত্তি করে।
ইন এই ভিডিওটি , Google এর ম্যাট Cutts কিভাবে এই তারিখগুলি নির্বাচিত হয় উপর সংক্ষিপ্তভাবে স্পর্শ করে। সুবিধার্থে, আমি ভিডিওটির প্রাসঙ্গিক টুকরোটি (প্রায় 2:09 থেকে 2:22 পর্যন্ত) নীচে প্রতিলিপি করেছি:
"... প্রায়শই আপনি তারিখটি দেখতে পাবেন, যেমন আমরা এটি অনুমান করেছি, বা আমরা যখন প্রথম পৃষ্ঠাটি দেখেছিলাম, যখনই আমরা পৃষ্ঠাটি ক্রল করেছিলাম, বা যদি পৃষ্ঠায় এটি কোথাও খুঁজে পাই এবং আমরা সেই তারিখটি বের করতে পারি, আপনি ' স্নিপেটের একেবারে শুরুতে এটি দেখতে পাবে "
ব্লগ পোস্ট, উইকি পৃষ্ঠাগুলি বা স্ট্যাক এক্সচেঞ্জ প্রশ্নগুলির মতো পৃষ্ঠাগুলির জন্য, যেখানে সফ্টওয়্যার চলমান সাইট স্বয়ংক্রিয়ভাবে পৃষ্ঠাটিতে একটি সঠিক তৈরি / পরিবর্তন তারিখের প্রতিবেদন করে, গুগলের দ্বারা প্রতিবেদন করা তারিখটি এটির সাথে মিলবে। অন্যান্য ধরণের পৃষ্ঠাগুলির জন্য, যদিও গুগলের ডেট স্নিফারকে আরও কঠোর পরিশ্রম করতে হবে এবং এটি সর্বদা এটি সঠিক হয় না (এই প্রসঙ্গে "ডান" যাই হোক না কেন বোঝায়)।
বিশেষত, এই তারিখগুলি মূলত দুটি কারণেই কোনও পৃষ্ঠাকে কত আগে সূচিবদ্ধ করা হয়েছিল তা নির্ধারণের জন্য অকেজো :
যদি সম্প্রতি কোনও পৃষ্ঠা সংশোধন করা হয়েছে এবং পরিবর্তনের তারিখটি পৃষ্ঠায় বিশিষ্টভাবে প্রদর্শিত হয়, তবে পরিবর্তনটি সম্পূর্ণরূপে তুচ্ছ হলেও Google এই পৃষ্ঠার "তারিখ" হিসাবে বেছে নিতে পারে।
উদাহরণস্বরূপ, বরং এটি পুরাতন উইকি পৃষ্ঠা (যা আর্কাইভ.অর্গ প্রথম 2003 এ সূচি সূচিত হয়েছিল ) বর্তমানে গুগলের 10 নভেম্বর, 2014 থেকে তারিখের সন্ধান করা হয়েছে - যে পৃষ্ঠায় এটি সম্প্রতি সম্পাদিত হয়েছিল, পৃষ্ঠার নীচে দেখানো হয়েছে। Date তারিখে যে পরিবর্তন ঘটেছিল? পৃষ্ঠার নীচে থেকে কেবল একটি লিঙ্ক সরিয়ে ফেলা হচ্ছে।
বিপরীতে, গুগল মনে হয় খুব পুরানো "প্রকাশনার তারিখগুলি" গ্রহণ করতে পেরে খুশি মনে হয় যদি সেগুলি পৃষ্ঠাগুলিতে পাওয়া যায় - এমন কি এমনও যারা ওয়ার্ল্ড ওয়াইড ওয়েবের প্রবর্তনকে পূর্বনির্ধারিত করে ।
উদাহরণস্বরূপ, পুরানো প্রোগ্রামিং প্রতিযোগিতার এই পৃষ্ঠাটি গুগল কর্তৃক 15 ই সেপ্টেম্বর, 1986 তারিখের তারিখ রয়েছে - পৃষ্ঠায় বর্ণিত ইভেন্টের তারিখ। একইভাবে, ১৯ 1970০ সালে শিক্ষার্থীদের ধর্মঘটের ডকুমেন্টিংয়ের এই পৃষ্ঠাটি গুগল কর্তৃক 10 মে, 1970 কে (পৃষ্ঠায় স্ক্যান করা নথিগুলির একটির তারিখ) তারিখ করা হয়েছে, এবং আরও অযৌক্তিকভাবে, এই লিনাক্সের ম্যানুয়াল পৃষ্ঠাটি গুগল কর্তৃক 4 নভেম্বর থেকে তারিখ করা হয়েছে , 1989 (পৃষ্ঠায় ব্যবহৃত এলোমেলো উদাহরণের তারিখ)।
আপনি স্টিফেন এবং জিস্টোলোইন দ্বারা বর্ণিত কাস্টম তারিখের সীমা অনুসন্ধান ব্যবহার করে এরকম আরও অনেকগুলি উদাহরণ খুঁজে পেতে পারেন, তবে রেঞ্জের উপরের প্রান্তটি 6 ই আগস্ট, 1991 এ সেট করুন ।