কে-মানে সম্পাদনের আগে প্রাক-প্রসেসিংয়ের সেরা (প্রস্তাবিত) পদক্ষেপগুলি কী কী?
কে-মানে সম্পাদনের আগে প্রাক-প্রসেসিংয়ের সেরা (প্রস্তাবিত) পদক্ষেপগুলি কী কী?
উত্তর:
যদি আপনার ভেরিয়েবলগুলি অতুলনীয় ইউনিট হয় (উদাহরণস্বরূপ উচ্চতা সেন্টিমিটার এবং ওজনে কেজি) তবে অবশ্যই অবশ্যই ভেরিয়েবলগুলি মানক করা উচিত। এমনকি যদি ভেরিয়েবলগুলি একই ইউনিটের হয় তবে বেশ ভিন্ন ভিন্ন রূপগুলি দেখায় তবে কে-মানে করার আগে এটি মানক করা এখনও ভাল ধারণা। আপনি দেখতে পাচ্ছেন, কে-মানে ক্লাস্টারিং স্থানের সব দিকেই "আইসোট্রপিক" এবং অতএব আরও বা কম বৃত্তাকার (প্রসারিতের চেয়ে) গুচ্ছ উত্পাদন করতে ঝোঁক। এই পরিস্থিতিতে বৈষম্যগুলি অসম ছেড়ে দেওয়ার কারণে ভেরিয়েবলগুলিতে আরও ছোট ওজনযুক্ত ভারসাম্য রাখার সমতুল্য, সুতরাং ক্লাস্টারগুলি আরও বেশি বৈকল্পের সাথে ভেরিয়েবলের সাথে পৃথক হওয়ার প্রবণতা রাখে।
গুচ্ছ বা অন্যান্য বহুবিধ বিশ্লেষণের বৈশিষ্ট্যগুলিকে মানিকরণের বিষয়ে কিছু সাধারণ যুক্তি এখানে দেওয়া হল।
আমার ধারণা অনুযায়ী আপনার ডেটা নির্ভর করে। আপনি যদি আপনার ডেটাতে প্রবণতাগুলি বিশাল আকার নির্বিশেষে একসাথে ক্লাস্টার করতে চান তবে আপনার কেন্দ্রে উচিত। যেমন। বলুন যে আপনার কিছু জিনের এক্সপ্রেশন প্রোফাইল রয়েছে এবং জিনের প্রকাশের প্রবণতাগুলি দেখতে চান, তবে কেন্দ্রীকরণ ব্যতীত আপনার কম অভিব্যক্তি জিনগুলি একসাথে ক্লাস্টার হবে এবং প্রবণতা নির্বিশেষে উচ্চ এক্সপ্রেশন জিনগুলি থেকে দূরে থাকবে। কেন্দ্রীভূতকরণ জিনকে (উচ্চ এবং নিম্ন উভয়ই প্রকাশিত) মত প্রকাশের ধরণগুলি একসাথে গুচ্ছ করে তোলে।