আমার সাইটম্যাপ ফাইলটি উপকারী যে কোনও স্পষ্ট সূচক আছে?


73

আমি সম্প্রতি একটি সাইটম্যাপ.এক্সএমএল ফাইল তৈরি করেছি এবং এটি আমার গুগল ওয়েবমাস্টার সরঞ্জাম অ্যাকাউন্টে আপলোড করেছি । গুগল আমার সাইটের আপলোড করা সাইটম্যাপটি নিয়ে কোনও সমস্যা বা ত্রুটির কথা জানায় নি।

এখন আমার প্রশ্ন:

  • আমার সাইটম্যাপ গুগল ওয়েবমাস্টার সরঞ্জামগুলির মধ্যে কাজ করছে কিনা তা আমি কীভাবে জানব?

আমি জিজ্ঞাসা করার কারণটি হ'ল আমি জানি না যে আমি মনে করি আমি কী দেখছি বা অনুসন্ধান করছি এবং এটি অনুভব করে যে আমি কোনও অকেজো ফাইল আপলোড করেছি।

উত্তর:


93

একটি সাইটম্যাপ ফাইল অনুসন্ধান ইঞ্জিনগুলিকে আপনার ওয়েবসাইটে নতুন এবং আপডেট হওয়া URL গুলি আবিষ্কার করতে সহায়তা করে । বিশেষত, যদি আপনার ওয়েবসাইটটি মোটামুটি বড় হয়, তবে এটি কোনও কিছু পরিবর্তিত হয়েছে কিনা তা দেখার জন্য অন্ধভাবে অন্বেষণ করার পরিবর্তে নতুন এবং আপডেট হওয়া সামগ্রীতে ফোকাস করতে সক্ষম হতে তাদের সহায়তা করতে পারে। এর ফলে নতুন কন্টেন্টটি আরও দ্রুত পাওয়া যায়, যা সাইটটি আরও বড় বা আরও জটিল হলে বিশেষত লক্ষণীয় হতে পারে।

বিশেষত গুগলের সাথে (আমি গুগলে কাজ করি; অন্যান্য সার্চ ইঞ্জিনগুলি কীভাবে এটি পরিচালনা করে তা আমি জানি না), এটি নিম্নলিখিতগুলিও করে:

  • আপনার ওয়েবসাইটের জন্য সূচিযুক্ত ইউআরএলগুলির সংখ্যা সন্ধান করুন: এই পরিসংখ্যানগুলি প্রতিদিন এবং পুনরায় গণনা করা হয় খুব নির্ভুল। আপনি এগুলি সাইটম্যাপের বিশদ পৃষ্ঠাতে পেতে পারেন ।
  • ক্যানোনিকালাইজেশন সম্পর্কিত সমস্যাগুলি আবিষ্কার করুন: যদি সেখানে সংখ্যাগুলি মেলে না , তবে এটি প্রায়শই একটি চিহ্ন যে আপনি সাইটম্যাপ ফাইলে ইউআরএল উল্লেখ করছেন যা আমাদের ক্রলিংয়ের সময় আমরা যা পাই তা মেলে না। এটি সাধারণত একটি চিহ্ন যা আপনাকে ক্যানোনিকালাইজেশনে কাজ করতে হবে ।
  • ক্যানোনিকালাইজেশনে সহায়তা: যখন আমরা আপনার সাইটে একাধিক ইউআরএল খুঁজে পাই যা অভিন্ন উপাদান দেখায়, আমরা কোনও সাইটম্যাপে তালিকাভুক্ত যে কোনও ইউআরএলকে একটি অতিরিক্ত প্রান্ত দেব, এমনকি আপনি অন্যান্য আধ্যাত্মিককরণের পদ্ধতি ব্যবহার না করলেও।
  • আপনার সাইটের খারাপভাবে ইনডেক্সযুক্ত অংশগুলি সন্ধান করুন: এই গণনাগুলি সাইটম্যাপ ফাইল প্রতি সরবরাহ করা হয়, যাতে গুগল আপনার পছন্দমতো ইন্ডেক্স করে না এমন অঞ্চলগুলি অনুসন্ধান করতে আপনি আপনার সাইটের লজিক্যাল বিভাগগুলির জন্য পৃথক সাইটম্যাপ ফাইল তৈরি করতে পারেন।
  • ক্রল ত্রুটি অগ্রাধিকার: ইন ক্রল ত্রুটি অধ্যায় , যে URL গুলি সাইটম্যাপ ফাইলের মধ্যে উল্লিখিত হয়েছে আলাদাভাবে তালিকাভুক্ত করা হয়। যেহেতু আপনি বিশেষত এই ইউআরএল সরবরাহ করেছেন তাই আমরা ধরে নিই যে আপনি সেগুলি সূচিকাগুলি করতে চান এবং যে কোনও ক্রল ত্রুটি গুরুত্বপূর্ণ।

অতিরিক্তভাবে, আপনি সাইটম্যাপ ফাইলগুলিতে বেশ কয়েকটি এক্সটেনশন ব্যবহার করতে পারেন (উদাহরণস্বরূপ চিত্র, ভিডিও, সংবাদ বা আন্তর্জাতিকীকরণের জন্য), যদি আপনার এটি করা বেছে নেওয়া হয়। এই এক্সটেনশনগুলি সমস্ত alচ্ছিক।

বেশিরভাগ ওয়েবসাইটের জন্য সাইটম্যাপ ফাইলগুলির সর্বাধিক দৃশ্যমান উপাদানটি হ'ল আপনি সূচিযুক্ত ইউআরএল গণনা দেখতে পারবেন। এটি প্রদর্শিত হতে আরও এক দিন সময় নিতে পারে, সুতরাং আপনি যদি প্রথমবারের জন্য কোনও সাইটম্যাপ জমা দিয়ে থাকেন তবে আপনাকে কিছুটা ধৈর্যশীল হতে হবে। অন্য উপায়গুলি (উদাহরণস্বরূপ একটি সাইট: জিজ্ঞাসা) খুব, খুব রুক্ষ অনুমান হিসাবে, এই গণনাটি অত্যন্ত নির্ভুল।

যুক্ত করার জন্য সম্পাদিত: আর একটি বিষয় যা আমি ব্যক্তিগতভাবে সাইটম্যাপের ক্ষেত্রে অত্যন্ত দরকারী মনে করি তা হ'ল আপনি যদি সরাসরি এটি নিজের সিএমএস দিয়ে তৈরি না করে থাকেন তবে আপনি কীভাবে আপনার ওয়েবসাইটটি ক্রলযোগ্য এবং কী ধরণের ইউআরএল আবিষ্কার করেছেন সে সম্পর্কে আপনি প্রায়শই আবিষ্কার করতে পারেন যে প্রক্রিয়া চলাকালীন। আমি এমন অনেকগুলি ক্ষেত্রে দেখেছি যেখানে আপনার পাশের কোনও সরঞ্জাম সহ কোনও ওয়েবসাইট ক্রল করা (যেমন কোনও সাইটম্যাপ জেনারেটর) আপনার সমস্যার সমাধান করতে পারে যা আপনি অন্যথায় মিস করতে পারেন, সেগুলি URL- এর সেশন-আইডি, ইউআরএল পার্থক্যের মাধ্যমে অনুলিপি থাকা সামগ্রী, অসীম স্থান (যেমন অন্তহীন ক্যালেন্ডার হিসাবে) বা এমন কোনও সাইটের কিছু অংশ যা একেবারেই লিঙ্কযুক্ত নয়।


দুর্দান্ত তথ্য। আমি আরও শুনেছি যে কিছু উচ্চ ট্র্যাফিক ভারী ক্রুড সাইটগুলির সাথে সাইটম্যাপ ব্যবহার না করাই ভাল কারণ গুগল আরও ভাল কাজ করে যেত এবং যদি আপনার সাইটম্যাপ থেকে কিছু হারিয়ে যায় তবে এটি সূচিকৃত হওয়া বন্ধ করে দিতে পারে।
ক্রিস_ও

3
@ ক্রিস_ও আপনি একসাথে বিভিন্ন সমস্যা ম্যাশ করছেন। এই উদাহরণে, এটি এমন নয় যে গুগল একটি "আরও ভাল" কাজ নিজেই চালাচ্ছে; সাইটম্যাপ নিজেই ত্রুটিযুক্ত। "মোটেও কোনও সাইটম্যাপ ব্যবহার করবেন না" এই যুক্তিটির সরাসরি লাইন নয়। সেই পরিস্থিতির সমাধান হ'ল সাইটম্যাপ ঠিক করা। অতিরিক্তভাবে, সাইটম্যাপগুলি তথ্যবহুল, নির্দেশ নয়। সাইটম্যাপ থেকে কিছু হারিয়ে যাওয়ার অর্থ এই নয় যে গুগল এটি নিজেরাই খুঁজে পাবে না বা এড়িয়ে যাবে ard
সু '

প্রশ্নযুক্ত সাইটে 40k এরও বেশি ইনডেক্স পাতাগুলি রয়েছে এবং নতুন সামগ্রী 5 মিনিটেরও কম (কোনও সাইটের মানচিত্র ছাড়াই) ইনডেক্সড হয়ে যায়। আপনার উত্তরের উপর ভিত্তি করে আমরা সেগুলি তৈরি করা শুরু করব এবং তাদেরকে বছরের পর বছর ভেঙে দেব।
ক্রিস_ও

@ জন-মুয়েলার হাই মিঃ মি। - আমি একবার 1000 টি ইউআরএল দিয়ে একটি পরীক্ষার সাইটম্যাপ জমা দিয়েছি, আমরা প্রায় 700 এর একটি সূচক গণনা ফিরে পেয়েছি, এখন আমরা সাইটের মাধ্যমে সমস্ত 1000 URL টি পরীক্ষা করেছি: www.complete.org/url/to/the/page.html, আমরা ফিরে পেয়েছি 700 টি url (200 অঞ্চলে আরও) এর নিচে একটি গণনা উপায় count এটার মানে কি?
ফ্রাঞ্জ

2
@ ফ্র্যাঞ্জ মাঝে মধ্যে এমন কিছু বিবরণ জড়িত থাকে যা সাইটের সাথে সূচকযুক্ত ইউআরএল গণনা পুনরুত্পাদন করা শক্ত করে তোলে: -উত্তীর্ণ। উদাহরণস্বরূপ, এমন পরিস্থিতি রয়েছে যেখানে আমরা একাধিক ইউআরএল একত্রিত করতে পারি এবং কেবল একটি সাইটের জন্য সেগুলির মধ্যে একটি প্রদর্শন করতে পারি: -কোয়ারী। সুতরাং আপনি যদি সেখানে কোনও পার্থক্য দেখেন তবে এটি সাধারণত উদ্বিগ্ন হওয়ার মতো নয়।
জন মোলার

6

যদি আপনি কোনও ত্রুটি না পেয়ে থাকেন তবে ধরে নিতে পারেন গুগল পার্স করেছে এবং বিষয়বস্তু সম্পর্কে অবগত is তবে এর অর্থ এই নয় যে তারা এই পৃষ্ঠাগুলি ক্রল করবে এবং / অথবা সূচী করবে। সাইটম্যাপগুলি আপনার পৃষ্ঠাগুলি সম্পর্কে অনুসন্ধান ইঞ্জিনগুলি বলার অন্য একটি উপায়। এগুলি কোনও বা সমস্ত পৃষ্ঠাতে ক্রল করা এবং সূচীকরণ করতে বাধ্য নয়। লিঙ্ক বা ইউআরএল জমা দেওয়ার মাধ্যমে পৃষ্ঠাগুলি সন্ধান করার ক্ষেত্রে এটি একই রকম হয়।


1
যুক্ত তথ্য হিসাবে, গুগল সাইটম্যাপটি বোঝে কিনা তা দেখতে বেশ সহজ। অপ্টিমাইজেশন -> সাইটম্যাপের অধীনে চেক করুন। এটি আপনাকে বলবে যে সাইটম্যাপে কতগুলি ইউআরএল জমা দেওয়া হয়েছে। সাইটম্যাপটি সামগ্রীগুলি সফলভাবে পড়ে এবং এতে এটির অনেকগুলি লিঙ্ক খুঁজে পেয়েছে। দ্বিতীয় নম্বরটি হ'ল কতজনকে সূচকযুক্ত করা হয়েছে এবং জন জন উল্লেখ করেছেন, পুরোপুরি গুগলের কাছে তারা কী খুঁজে পেয়েছে না, কিছু বা আপনার বেশিরভাগ সামগ্রীর সার্থকতা রয়েছে কিনা। এটি সর্বদা জমা দেওয়া পরিমাণের চেয়ে কম হবে, গুগল কেবল কয়েকটি পৃষ্ঠাগুলি এত উত্তপ্ত নয় এবং এটি নিয়ে বিরক্ত করে না other
ফায়াস্কো ল্যাবগুলি

1

গুগল সাধারণত আপনার ওয়েবসাইট ক্রলিংয়ে ভাল কাজ করে যদি আপনার কাছে বেশ কয়েকটি মানের লিঙ্ক থাকে। আপনার সূচী করা পৃষ্ঠাগুলির সংখ্যার দিকে চেয়ে যদি আপনার অনেক সময় ব্যয় হয় তবে আমি আপনার সাইটের উন্নতি করতে এবং কিছু মানের লিঙ্ক পেতে আরও ভাল পরামর্শ দেব।


0

হয়তো মত একটি সাইটম্যাপ বৈধতা টুল এই , যদিও আমি করেছি কখনো "নয়" দেখা মধ্যে লাথি সাইটম্যাপ শুরু।


ফাইলটি ইতিমধ্যে বৈধ হয়ে গেছে। এটাই প্রশ্ন নয়।
সু '

0

বৃহত্তর ওয়েবসাইটের জন্য, উদাহরণস্বরূপ শত শত, হাজারো বা মিলিয়ন পৃষ্ঠা সহ ওয়েবসাইট, এটি বেশ কার্যকর। আমাদের 400,000 পৃষ্ঠাগুলি সহ আমাদের সংস্থার ওয়েবসাইটে ছিল যেখানে ইউআরএলগুলি গতিশীলভাবে কনটেন্ট আইডি দ্বারা তৈরি করা হয়েছিল এবং ইউআরএল প্যারামিটারগুলি & এর সাথে ব্যবহৃত হয়েছিল, গুগল ওয়েবমাস্টার সরঞ্জামগুলি আপনাকে ক্রলযুক্ত পৃষ্ঠাগুলিতে প্রতিক্রিয়া সরবরাহ করবে এবং আপনাকে ত্রুটিগুলি প্রদর্শন করবে, আপনি পৃষ্ঠাটি ডিবাগ করতে বা খুলতে পারবেন এবং কী ভুল তা নিজের জন্য দেখুন। এইভাবে গুগল আসলে আমাদের আরও ভাল ওয়েবসাইট তৈরি করতে সহায়তা করেছিল এবং কয়েকবার বিশাল বিব্রত থেকে রক্ষা পেয়েছিল।

সূচিকাগুলি পৃষ্ঠাগুলির সংখ্যা বনাম ক্রল করা সংখ্যাটিও দরকারী।

ছোট ওয়েবসাইটগুলির জন্য, ওয়েবসাইটটি যদি এইচটিএমএল পৃষ্ঠাগুলির একটি ছোট গোষ্ঠী যেখানে প্রতিটি পৃষ্ঠা মেনু এবং সাইটের মাধ্যমে সংযুক্ত থাকে তবে প্রায়শই আপডেট হয় না, যদি আপনি সাইটম্যাপ আপলোড করেন তবে অনুসন্ধানের ফলাফলের বিরুদ্ধে কিছুই পরিবর্তন হবে না। সাইটম্যাপ আপলোড করেন নি এমন কারও উপরে সাইটম্যাপ আপলোড করার কোনও সুবিধা আপনার হবে না।

আমার প্রায় 20 টি ছোট ছোট ওয়েবসাইট ছিল, যেখানে আমার ক্রোন স্ক্রিপ্ট দ্বারা স্বয়ংক্রিয়ভাবে সাইটম্যাপ তৈরি হয়েছিল এবং আমি এটি করা বন্ধ করে দিয়েছি। একদিন আমি জানতে পেরেছিলাম যে এক্সএমএল ফাইলগুলি আমার ভুলের দ্বারা প্রায় 6 মাস ধরে সঠিকভাবে উত্পন্ন হয় না, তবে গুগল কৃতজ্ঞতার সাথে আমার ভুলটিকে উপেক্ষা করেছে এবং সাইটম্যাপে ত্রুটি থাকা সত্ত্বেও এই ওয়েবসাইটগুলিকে পুরোপুরি সূচীকরণ করেছিল, গুগল ঠিক কোথায় যেতে হবে তার ইঙ্গিত হিসাবে সাইটম্যাপ ব্যবহার করে, না খুব সিরিয়াসলি

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.