গুগল ওয়েবমাস্টার সরঞ্জামগুলি কেন অবৈধ ইউআরএল ক্রল করছে এবং 500 ত্রুটি দেখাচ্ছে?


11

গুগল ওয়েবমাস্টার সরঞ্জামগুলি 12 কে + 500 ত্রুটির প্রতিবেদন করছে। Eeek!

ইউআরএলএসের কোনওটিই বৈধ নয় they এগুলির মধ্যে www.youtube.com রয়েছে। প্রথমত, গুগল কেন এই ইউআরএলগুলি উপস্থিত না থাকলে তাদের ক্রল করছে? আমি একটি সাইটম্যাপ সরবরাহ করেছি, এবং তারা অবশ্যই সাইটম্যাপে নেই।

আমার কাছে কোনও রোবটসটেক্স নেই কিছুতেই অবরুদ্ধ। আমি অবৈধ পুনঃনির্দেশগুলির জন্য যাচাই করেছি - কোনটিই নয়, এবং অনাবৃত ট্যাগ বা এমন কোনও কিছুর জন্য যাচাই করেছিলাম যা www.youtube.com কে ইউআরএলে দুর্ঘটনাক্রমে নিক্ষেপ করবে - কিছুই নয়।

প্রতি 'লিঙ্কযুক্ত' থেকে, উল্লেখ করা URL টিও একটি খারাপ URL, এতে www.youtube.com রয়েছে। গুগল সরঞ্জামগুলি কোনও ম্যালওয়ারের প্রতিবেদন করে না, এবং আমি সার্ভার লগগুলি পরীক্ষা করতে পারি না কারণ হোস্ট আমাকে অ্যাক্সেস দেয় না।

সত্যিই আটকে !! কোন ধারণা প্রশংসা!


আপনি কিছু উদাহরণ পোস্ট করতে পারেন দয়া করে?
আয়নফিশ

আপনার ওয়েবসাইটটি কি ওয়ার্ডপ্রেস বা অন্য ব্লগ প্ল্যাটফর্ম?
ইউবিক

3
আপনি যদি অবৈধ ইউআরএলগুলির জন্য এইচটিটিপি 500 ত্রুটি (সার্ভার ত্রুটি) দেখতে পাচ্ছেন তবে আপনার সেটআপে সম্ভবত সমস্যা রয়েছে - অবৈধ ইউআরএলগুলি 404 বা 410 ফিরে আসতে পারে
জন জন মোলার

উত্তর:


8

ওয়েবমাস্টার সরঞ্জামগুলিতে অদ্ভুত এবং ম্যাঙ্গেলযুক্ত ইউআরএলগুলি ক্রল ত্রুটি হিসাবে প্রদর্শিত হতে পারে তার দুটি (কমপক্ষে) দুটি সাধারণ কারণ রয়েছে।

প্রথম সম্ভাবনাটি হ'ল যে কেউ আপনার পৃষ্ঠাগুলি অনুলিপি করেছে (বা অন্য কোনও পৃষ্ঠা যা আপনার সাথে লিঙ্ক করেছে) এবং প্রক্রিয়াটিতে লিঙ্কগুলিকে ম্যাঙ্গেল করেছে। এটি আপনার ভাবার চেয়ে প্রায়শই ঘটে; উদাহরণস্বরূপ এই গুগল ওয়েবমাস্টার ব্লগ পোস্টে ষষ্ঠ প্রশ্ন দেখুন ।

অন্যান্য সম্ভাবনা যা Googlebot নিজেই তা মনে করে অনুসরণ করব জাভাস্ক্রিপ্ট লিঙ্ক চেষ্টা এবং হয় এটি একটি জগাখিচুড়ি উপার্জন । আপনি সাধারণত দুটি উল্লেখযোগ্য পৃষ্ঠাগুলি পরিদর্শন করে (যা বিদ্যমান এবং অ্যাক্সেসযোগ্য হওয়া উচিত , গুগল যদি এটি শুরু করার জন্য ক্রল করতে সক্ষম হয়) এবং তার উত্সটিতে লক্ষ্য পৃষ্ঠার নাম সন্ধানের মাধ্যমে এই দুটি ক্ষেত্রে আলাদা করে বলতে পারেন ।

যেভাবেই হোক না কেন, মূলত দুটি জিনিস আপনি করতে পারেন: হয় কেবল লিঙ্কগুলি উপেক্ষা করুন, অথবা ভাঙা URL গুলিকে কাজের লোকগুলিতে ম্যাপ করার চেষ্টা করুন এবং পুনরায় লেখার কিছু নিয়ম নিয়ে আসুন । আপনি যদি ইউআরএলগুলিতে একটি সুস্পষ্ট নিদর্শন দেখতে পান এবং রেগেক্সপসের সাথে পরিচিত হন তবে আমি পরবর্তী পদ্ধতির প্রস্তাব দিই - এটি আপনার ক্রল ত্রুটি তালিকাটি পরিষ্কার করে দেবে এবং সম্ভবত আপনাকে একটি ছোট এবং পরিবর্তে ছদ্মবেশী দেবে, তবে বাস্তব, পেজর্যাঙ্ক উত্সাহ দেয় ।

তৃতীয় বিকল্প, যদি আপনি দেখতে পান যে কেউ অনুমতি ছাড়াই আপনার সামগ্রী অনুলিপি করছে, তা হচ্ছে চেষ্টা করার জন্য এবং তালিকাভুক্ত করা । এমনকি যদি আপনি বিশ্বাস করেন যে এটি যদি ন্যায়সঙ্গত হয় তবে আপনি তাদের হোস্টিং সরবরাহকারীর কাছে অভিযোগ (এবং / অথবা একটি আনুষ্ঠানিক টেকডাউন অনুরোধ) প্রেরণও করতে পারেন। অবশ্যই, প্রদত্ত যে তারা করছে দৃশ্যত আপনার সাইটের ফিরে লিঙ্ক, আপনি অগত্যা চেষ্টার অধিকারী না হতে পারে।


0

গুগল তাত্ক্ষণিকভাবে সমস্ত পৃষ্ঠাগুলি একবারে নয় index

গুগল সূচীকরণ পৃষ্ঠাগুলি প্রথম সর্বোচ্চ স্তরের। তারপরে গুগল কয়েক দিনের পরে আরও গভীর - সূচীকরণের চেষ্টা করছে - দ্বিতীয় স্তরের পৃষ্ঠাগুলি (যে পৃষ্ঠাগুলিতে গুগল প্রথম পৃষ্ঠার পৃষ্ঠাগুলিতে লিঙ্কগুলি পেয়েছিল), এবং আরও অনেক কিছু। এইভাবে গুগল সাইটে প্রতিটি পৃষ্ঠাতে সূচি দেওয়ার চেষ্টা করে। সুতরাং গুগল লিঙ্কগুলির শ্রেণিবদ্ধ গাছ তৈরি করে এবং প্রতিটি পৃষ্ঠায় কোন পৃষ্ঠাগুলিতে লিঙ্কযুক্ত তা গুগল জানে।

তারপরে গুগল কিছু সময়ের পরে প্রতিটি সূচী পাতায় এসে পৃষ্ঠার লিখিত সামগ্রীটি পরিবর্তন করা হয় কিনা তা পরীক্ষা করে। প্রতিটি পৃষ্ঠা এবং প্রতিটি সাইটের জন্য সূচকের ব্যবধান অনেক কারণের উপর ভিত্তি করে।

সুতরাং আপনি যদি কোনও পৃষ্ঠা মুছে ফেলেন এবং অন্য সমস্ত পৃষ্ঠায় এই পৃষ্ঠার সমস্ত লিঙ্ক আপডেট করেছেন - গুগল তা তাৎক্ষণিকভাবে জানে না এবং এটি মুছে ফেলা পৃষ্ঠাকে সূচীকরণের চেষ্টা করে কারণ এটি নির্ধারিত সময়ে এই পৃষ্ঠাটিকে সূচিবদ্ধ করার পরিকল্পনা করা হয়েছে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.