গুগল কীভাবে কোনও পোস্টের প্রকাশের তারিখকে স্বীকৃতি দেয়


17

আমি যখন গুগলে কিছু অনুসন্ধান করি তখন আমি মাঝে মাঝে নীচের পোস্ট / নিবন্ধের প্রকাশের তারিখটি দেখতে পাই। আমি আমার নিজস্ব একটি নিবন্ধও অনুসন্ধান করেছি যা আমার ওয়ার্ডপ্রেস-চালিত সাইটে রয়েছে এবং গুগলও এর প্রকাশের তারিখটি স্বীকার করে।

আমি যখন আমার ওয়েবসাইটের উত্সটি খুলি, তখন আমি কোনও বিশেষ ট্যাগ বা প্রকাশের তারিখ নির্দেশ করে এমন কোনও কিছুই দেখতে পাই না। এটি কেবল একটি নিয়মিত ডিভিতে রচিত, বিশেষ কোনও ট্যাগযুক্ত যা এসইকে জানাতে পারে যে এটি প্রকাশের তারিখ (পৃষ্ঠাটির চারপাশে অন্যান্য জিনিসের কোনও তারিখও আমার থাকতে পারে)।

সুতরাং এটি কি গুগলটিতে ডোম ট্রিতে ওয়ার্ডপ্রেস প্রকাশের তারিখের সঠিক স্থানটি হার্ডকোড করা হয়েছে, বা আমি কিছু অনুপস্থিত?

আমি আমার নিজস্ব সিএমএস দিয়ে একটি নতুন ওয়েবসাইট তৈরি করছি এবং তারিখ প্রকাশিত স্বীকৃতিটি কীভাবে প্রয়োগ করা যায় তা আবিষ্কার করার চেষ্টা করছি।


2
আপনি অবশ্যই কিছু অনুপস্থিত: আপনি কেবল এইচটিএমএলটি দেখেছেন, তবে এমন একটি এইচটিটিপি শিরোনাম রয়েছে যা বলে যে কোনও পৃষ্ঠা সংশোধন করার সময়। আপনার নিবন্ধের পারমিলিংকের জন্য তারা কী রিপোর্ট করছে? আমি অনুমান করব যে গুগল পৃষ্ঠাটি কতটা পরিবর্তন করেছে তার নিজস্ব রেকর্ডের সাথে এটি ব্যবহার করে, তবে আমার কাছে কোনও সত্য প্রমাণ নেই - সুতরাং উত্তরটির পরিবর্তে মন্তব্য।
পিটার টেলর

হ্যাঁ, আমার একটি "মোটামুটি" চেষ্টা ছিল .. আমি নন-এইচটিএমএল উপাদানগুলি / শিরোনামগুলি এবং সাইট
ম্যাপটি

@ পিটার সন্দেহ নেই যে এইচটিটিপি শিরোনাম (বিশেষত সর্বশেষ-পরিবর্তিত শিরোনাম) এসইএস ব্যবহার করে এমন একটি মেট্রিক। যাইহোক, আমি সন্দেহ করি যে এটি কোনও নিবন্ধের "প্রকাশিত তারিখ" নির্ধারণে অনেকটা ভূমিকা পালন করে - Google প্রকাশের তারিখ হিসাবে অন্তত যা প্রদর্শন করে তা নয়। (অন্যান্য এসই কোনও 'প্রকাশিত তারিখ' প্রদর্শিত হচ্ছে না?) কোনও নিবন্ধের প্রকাশিত তারিখ সম্ভবত কোনও নথির শেষ পরিবর্তিত তারিখ নয়। গতিশীল সাইটগুলিতে বেশিরভাগ পৃষ্ঠাগুলি (এমনকি ওয়ার্ডপ্রেস পোস্টগুলির জন্যও) বর্তমান তারিখ / সময়ের কাছাকাছি ফিরে আসে। আইএমও সর্বশেষ-সংশোধিত শিরোলেখ মূলত ক্যাশিংয়ের জন্য ব্যবহৃত হয়।
মিঃ হোইট

আমার মনে হয় সাইটম্যাপের সাথে এটির কিছু করার আছে ..
পোয়েরাজোলু

এইচটিটিপি সর্বশেষ সংশোধিত স্ট্যাকওভারফ্লো / প্রশ্নগুলি / ২০৪০১০/২ বা কিছু আধা-মানক এইচটিএমএল মেটাডেটা: স্ট্যাকওভারফ্লো / প্রশ্ন / 4575967/ … অন্যান্য সম্ভাবনা, তবে গুগল সত্যিই সেগুলি ব্যবহার করে কিনা তা আমি নিশ্চিত নই।
সিরো সান্তিলি 新疆 改造 中心 法轮功 六四 事件

উত্তর:


4

গুগল, ইয়াহু, এবং এমএসএন এর মতো বড় সার্চ ইঞ্জিনগুলির মাধ্যমে আপনার প্রকাশিত ডেটা সূচী করতে আপনাকে এক্সএমএল সাইটম্যাপ বা আরএসএস ফিড সংস্করণে যেতে হবে। আপনার ওয়েবসাইটের জন্য এক্সএমএল সাইটম্যাপ তৈরি করুন এবং সূচকের জন্য ওয়েব মাস্টার সরঞ্জামগুলিতে এটি জমা দিন।


7

আমার কেবল একটি সমস্যা হয়েছিল যে আমার মূল পৃষ্ঠাগুলি 4 বছর আগে আপডেট হওয়া হিসাবে দেখানো হয়েছিল, যদিও গুগল জানেন যে এটি সত্য নয় কারণ পৃষ্ঠাগুলি দীর্ঘ সময়ের জন্য সূচীভূত হয়েছে এবং এক মাস থেকে মাসের মধ্যে উল্লেখযোগ্যভাবে পরিবর্তিত হয়েছে। সত্যিই বিস্মিত হয়ে যাওয়ার পরে, সত্যিই বিরক্ত হয়ে, আবার চমকে উঠলে, অবশেষে আমি সমস্যাটি খুঁজে পেলাম। আমাদের আইনী শর্তাদি একটি "সর্বশেষ আপডেট: 30 অক্টোবর 2007" সহ একটি লুকানো ডিভিতে পরিবেশন করা হয়েছিল এবং আমাদের প্রায় সমস্ত পৃষ্ঠায় ডিভটি লোড করা হচ্ছিল। (কারণ এটি নিবন্ধকরণে পপ আপ হয়) আমি এটিকে সরিয়ে দিয়েছি এবং এখন আমি ধরে নিয়েছি যে তারিখটি হয় অদৃশ্য হয়ে যাবে বা আরও যুক্তিসঙ্গত কোনওটিতে সংশোধন করা হবে।

একটি সতর্কতা অবলম্বনকারী গল্প এবং আরও একটি প্রমাণ যা তারা প্রযুক্তিগত বিবরণ বা তাদের নিজস্ব সূচীকরণ ইতিহাসের চেয়ে সাইটের শব্দার্থবিজ্ঞানগুলি আরও চেক করে।


আপনি কি পৃষ্ঠাগুলির সর্বশেষ পরিবর্তিত তারিখ পৃষ্ঠায়, বা আরএসএস ফিড, বা এক্সএমএল সাইটম্যাপের অন্য কোথাও অন্তর্ভুক্ত করবেন?
মিঃ হোয়াইট

আমি তা করি না, কারণ সাইটটি কোনও নিউজ সাইট নয় এবং আমি এটির উপর জোর দেওয়া পছন্দ করব না। আদর্শভাবে, আমার হোমপেজের জন্য কোনও তারিখ থাকবে না। এছাড়াও, আমি কল্পনা করেছিলাম যে তারা সম্ভবত লাস্টের একটি বড় দানা দিয়ে লাস্টমড গ্রহণ করে - আমি জানি আমি যদি সেগুলি হতাম।
মিমদানজিগার

7

আমার খুব সন্দেহ যে কোনও পোস্ট বা নিবন্ধের প্রকাশিত তারিখটি <lastmod>কোনও এক্সএমএল সাইটম্যাপে প্রবেশের উপর ভিত্তি করে (অন্যরা যেমন পরামর্শ দিয়েছেন) বা সেই বিষয়ে সর্বশেষ-পরিবর্তিত এইচটিটিপি শিরোনাম। একটি এক্সএমএল সাইটম্যাপ কেবল পরামর্শমূলক, অনুমোদনযোগ্য নয়। কোনও নথির শেষ পরিবর্তিত তারিখ সম্ভবত কোনও নিবন্ধের (মূল) প্রকাশের তারিখের মতো নয়। এবং, যেমন আমি পৃষ্ঠার শীর্ষে আমার মন্তব্যে উল্লেখ করেছি, নথির শেষ পরিবর্তিত তারিখটি ক্যাশে এবং সম্ভবত ক্রল রেট নির্ধারণের জন্য সম্ভবত আরও গুরুত্বপূর্ণ । গতিশীলভাবে উত্পন্ন পৃষ্ঠাগুলির সর্বশেষ-পরিবর্তিত এইচটিটিপি শিরোনামটি প্রায়শই আসল তারিখ / সময় (যেমন এটি ওয়ার্ডপ্রেস ব্লগগুলির ক্ষেত্রে) এর খুব কাছাকাছি থাকে।

অন্যদিকে আরএসএস / অ্যাটম ফিডে তথ্যের এই সুনির্দিষ্ট নাগেট থাকে। এবং প্রকৃতপক্ষে, ওয়ার্ডপ্রেস সাইটগুলিতে যেগুলি সামগ্রীতে প্রকাশের তারিখ অন্তর্ভুক্ত করে না, প্রকাশের তারিখটি এখনও গুগলের অনুসন্ধানের ফলাফলগুলিতে উপস্থিত হয়। এবং যতদূর আমি বলতে পারি, এটি আরএসএস ফিডে তারিখটির সাথে মেলে।

সম্পাদনা # 1: তবে, আরএসএস ফিডে অগত্যা সমস্ত পৃষ্ঠা থাকে না। বেশিরভাগ ক্ষেত্রে এটিতে সর্বশেষতম বা সাম্প্রতিক আপডেট হওয়া পৃষ্ঠাগুলি থাকা উচিত । তবে এর কোনও কারণ নেই যে গুগল ইতিমধ্যে যা পড়েছে তা ভুলে যাওয়া উচিত, এবং সেই পৃষ্ঠাটির বিষয়বস্তু সরবরাহ করা পরিবর্তিত হয়নি তবে শেষ পরিবর্তিত তারিখেরও উচিত নয়।

আরএসএস ফিড না থাকলে আমি মনে করি পৃষ্ঠার সামগ্রীটি বিশ্লেষণ করার জন্য গুগল যথেষ্ট চালাক। বিশেষত যদি মাইক্রোফরমেটের সাহায্যে তারিখগুলি 'শব্দার্থত' হিসাবে চিহ্নিত করা হয় । এটি পুরোপুরি সম্ভাব্য যে Google এর মধ্যে নিবন্ধটি অন্তর্ভুক্ত থাকা নিবন্ধের অনুমোদনযোগ্য প্রকাশের তারিখ হিসাবে নিম্নলিখিতটি দেখবে:

<abbr class="published" title="2010-08-27T15:45:00-0700">
Friday, August 27th, 2010
</abbr>

গুগল অবশ্যই মাইক্রোফর্ম্যাটগুলি পড়ায় - এইচকার্ড, এইচরিভিউ ইত্যাদি does

কেবল যোগ করার জন্য, আমি মনে করি না যে গুগল কোনও প্রকাশের তারিখ বর্ণনা করবে যদি না এটি প্রামাণ্য কিছু খুঁজে পায় যা এটি প্রস্তাব করে। এটি অনুমানমূলক তথ্যের উপর একটি 'প্রকাশের তারিখ' হ্রাস করতে যাচ্ছে না, যেহেতু একটি ভুল 'প্রকাশের তারিখ' কারওর জন্য ব্যবহারযোগ্য নয় এবং গুগল এর জন্য প্রচুর কাঠি পাবে!

এবং কেবল রেকর্ডের জন্য (যদি @ টম অন্যথায় পরামর্শ দিচ্ছে :) আমি মনে করি পোস্ট / নিবন্ধগুলির প্রকাশের তারিখটি দৃশ্যমানভাবে প্রদর্শিত হওয়া উচিত। অনেকেই করেন না, এবং এটি পাঠকের জন্য হতাশাজনক হতে পারে বিশেষত যখন প্রযুক্তি সংক্রান্ত সমস্যাগুলি নিয়ে গবেষণা করে এবং আপনি দেখতে পান যে নিবন্ধটি অর্ধেকটা পড়ে শেষ হয়ে গেছে!

সম্পাদনা # 2: তার পর থেকে আমি একই রকম বিরক্তি পেয়েছি যা @ মিমদানজিগার তার উত্তরে বিশদ বিবরণ দেয়। আমার পুরানো সাইটের একটিতে আমার কাছে প্রতিটি পৃষ্ঠার শীর্ষে "সাইট লাস্ট আপডেটেড সান 17 জুন 2012" (কোনও বিশেষ উপায়ে চিহ্নিত করা হয়নি) ফর্মটির পাঠ্য রয়েছে (জাভাস্ক্রিপ্ট সহ পৃষ্ঠায় লিখিত আছে)! এই একই তারিখটি গুগল তুলে নিয়েছে এবং এখন বেশ কয়েকটি (তবে সমস্ত নয়) এসইআরপিএসে প্রদর্শিত পৃষ্ঠাগুলির পাশাপাশি উপস্থিত হবে - এটি অবশ্যই পৃষ্ঠার প্রকাশের তারিখ নয়। দেখে মনে হবে গুগল "শেষ আপডেট হওয়া ( তারিখের স্ট্রিং )" (জাভাস্ক্রিপ্ট প্রক্রিয়াকরণ করে) ফর্মের স্ট্রিংয়ের জন্য কেবল পৃষ্ঠাটি স্ক্র্যাপ করছে । এই নির্দিষ্ট সাইটে আরএসএস ফিড নেই। সাইটে সাইটম্যাপ.এক্সএমএল ফাইল রয়েছে তবে তারিখগুলি আলাদা।

আমি অন্যান্য সাইটেও একইরকম আচরণ লক্ষ্য করেছি।


এটি এ থেকে সঠিক তারিখটিকে কীভাবে চিনবে? <div class="footer"> <div class="links"> April 24, 2011 | <a href=...এটি কেবলমাত্র একমাত্র স্থান যা আমার পোস্টের প্রকাশিত তারিখকে বোঝায় এবং গুগল এটি সন্ধান করে এবং অনুসন্ধান ফলাফলের মধ্যে সঠিকভাবে প্রদর্শন করে
পোয়ারাজোলু

অ্যাঙ্কারে নির্দিষ্ট কিছু রয়েছে যা এটি অনুসরণ করে? আবার, এটি নাও হতে পারে। আপনার কি আরএসএস ফিড রয়েছে (নথির মেটা ট্যাগগুলিতে লিঙ্কযুক্ত)?
মিঃ হোইট

আমি উত্তর খুঁজছিলাম "গুগল কীভাবে তারিখ নির্ধারণ করে?" কিন্তু একই জিনিস লক্ষ্য! গুগল শিরোনামটি সর্বশেষ-পরিবর্তিত বা সাইটম্যাপ.এক্সএমএল << আধুনিক> এর চেয়ে পৃষ্ঠায় নিজেই সময়ের একটি স্ট্রিং সন্ধান করার চেষ্টা করে! আমার চিন্তা নিশ্চিত করার জন্য ধন্যবাদ!
অশুভ রিকো

5

আমার মনে হয় গুগল প্রকাশিত তারিখটি সনাক্ত করতে সাইটম্যাপ এবং আরএসএস ফিড ব্যবহার করে .. আপনি স্ট্যান্ডার্ড অনুসারে এক্সএমএল সাইট ম্যাপ তৈরি করে আপনার সিএমএসে এই বৈশিষ্ট্যটি অনুকরণ করতে পারেন ।

<lastmod>2011-08-18</lastmod>

2

গুগলে জোন মুয়েলারের মতে:

কোন তারিখটি প্রদর্শন করতে হবে তা নির্ধারণ করতে আমরা বিভিন্ন ধরণের সংকেত ব্যবহার করি, বা যদি কোনওটি প্রদর্শন করার জন্য তা বুদ্ধিমান হয়; এটি একটি নির্দিষ্ট বৈশিষ্ট্যের সাথে আবদ্ধ নয়।

জন মুয়েলার - টুইটার

তবে, আমি এটি সম্ভবত খুঁজে পাচ্ছি যে গুগল নিম্নলিখিত পৃষ্ঠাগুলিতে ওয়েব পৃষ্ঠাগুলিতে তারিখগুলি সন্ধান করে:

  • পৃষ্ঠায় সরল দৃষ্টিতে, মেশিন লার্নিং ব্যবহার করে
  • Schema.org কাঠামোগত ডেটা, বিশেষত যদি ডেটা পৃষ্ঠায় সরল দৃষ্টিতে পাওয়া যায়

1

আমি মনে করি এটি পৃষ্ঠায় কোনও তারিখ বুদ্ধিমানের সাথে সন্ধান করে এবং যখন এটি নিশ্চিত হয় যে এটি এটি প্রাসঙ্গিক তারিখটি ব্যবহার করে।

এটি কখনও কখনও সামান্য কঠিন হিসাবে আমি মনে করি এটি এসইআরপি ক্লিক-ক্ষমতার উপর নেতিবাচক প্রভাব ফেলতে পারে বলে আমি মনে করি এটি সাময়িক ইতিবাচক প্রভাব ফেলতে পারে যদি এটি সাম্প্রতিক নিবন্ধ / পোস্ট হয় তবে আমি নিশ্চিত যে আমার সাইটগুলি এগুলি ছাড়াই ভাল হবে sure (গুগল অনুসন্ধানকারীরা যদিও এটি না থাকলে ভাল না হতে পারে!)

গুগলের মাধ্যমে এটি নিয়ন্ত্রণের কোনও বিকল্প নেই, কেবল আপনার নিজস্ব পদ্ধতি দ্বারা। অপরপক্ষে তুমি:

  • গুগল এটি আবিষ্কার করা বন্ধ করার প্রয়াসে গতিশীল উত্পন্ন চিত্রগুলির সাথে তারিখগুলি প্রতিস্থাপন করুন, তবে এটি অন্যান্য সমস্যা যেমন ভিজ্যুয়াল সারিবদ্ধকরণ / ধারাবাহিক ফন্ট প্রদর্শন / অ্যাক্সেসিবিলিটি ইত্যাদি হতে পারে can
  • পৃষ্ঠাগুলি থেকে সমস্ত তারিখগুলি স্ট্রিপ করুন (এটি যদি আপনার প্রাসঙ্গিক তথ্য থাকে তবে তারা কোনও উত্সের বয়স আবিষ্কার করতে চাইলে দর্শক / ব্যবহারকারীদের জন্য এটি হতাশার কারণ হতে পারে)।

এই কারণে আমি এটিকে কেবল উপেক্ষা করব।


আমি তারিখটি মুছে ফেলার চেষ্টা করছি না :) আমি যে নতুন নতুন সাইট তৈরি করছি তাতে আমি তারিখের বৈশিষ্ট্য যুক্ত করার চেষ্টা করছি ..
পোয়েরাজোলু
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.