কে-মানে ক্লাস্টারিংয়ের জন্য কি গড় সাধারণকরণ এবং বৈশিষ্ট্য স্কেলিংয়ের প্রয়োজন?


উত্তর:


63

যদি আপনার ভেরিয়েবলগুলি অতুলনীয় ইউনিট হয় (উদাহরণস্বরূপ উচ্চতা সেন্টিমিটার এবং ওজনে কেজি) তবে অবশ্যই অবশ্যই ভেরিয়েবলগুলি মানক করা উচিত। এমনকি যদি ভেরিয়েবলগুলি একই ইউনিটের হয় তবে বেশ ভিন্ন ভিন্ন রূপগুলি দেখায় তবে কে-মানে করার আগে এটি মানক করা এখনও ভাল ধারণা। আপনি দেখতে পাচ্ছেন, কে-মানে ক্লাস্টারিং স্থানের সব দিকেই "আইসোট্রপিক" এবং অতএব আরও বা কম বৃত্তাকার (প্রসারিতের চেয়ে) গুচ্ছ উত্পাদন করতে ঝোঁক। এই পরিস্থিতিতে বৈষম্যগুলি অসম ছেড়ে দেওয়ার কারণে ভেরিয়েবলগুলিতে আরও ছোট ওজনযুক্ত ভারসাম্য রাখার সমতুল্য, সুতরাং ক্লাস্টারগুলি আরও বেশি বৈকল্পের সাথে ভেরিয়েবলের সাথে পৃথক হওয়ার প্রবণতা রাখে।

এখানে চিত্র বর্ণনা লিখুন

1

গুচ্ছ বা অন্যান্য বহুবিধ বিশ্লেষণের বৈশিষ্ট্যগুলিকে মানিকরণের বিষয়ে কিছু সাধারণ যুক্তি এখানে দেওয়া হল।


1


2
এলোমেলোভাবে পুনরায় চালানো, গড় এবং চূড়ান্ত রান খুব ভাল পরামর্শ। ধন্যবাদ
পেড্রোসওরিও

1
অর্ডার দেওয়ার ক্ষেত্রে কে-মানে কীভাবে সংবেদনশীল হবে?
স্মলচিস

1
@ স্টুডেন্টটি, আমি এর জন্য একটি পাদটীকা যুক্ত করেছি। ধন্যবাদ.
ttnphns

1
@ttnphns কীভাবে পরিমিতভাবে নির্ধারণ করে যে ভেরিয়েবলগুলির "বেশ আলাদা বৈকল্পিক" রয়েছে?
হারমান টুথ্রোট

1
@ ক্যামিলিজর, দয়া করে এই প্রশ্ন: stats.stackexchange.com/q/418427/3277 পরীক্ষা করে শুরু করুন ।
ttnphns

4

আমার ধারণা অনুযায়ী আপনার ডেটা নির্ভর করে। আপনি যদি আপনার ডেটাতে প্রবণতাগুলি বিশাল আকার নির্বিশেষে একসাথে ক্লাস্টার করতে চান তবে আপনার কেন্দ্রে উচিত। যেমন। বলুন যে আপনার কিছু জিনের এক্সপ্রেশন প্রোফাইল রয়েছে এবং জিনের প্রকাশের প্রবণতাগুলি দেখতে চান, তবে কেন্দ্রীকরণ ব্যতীত আপনার কম অভিব্যক্তি জিনগুলি একসাথে ক্লাস্টার হবে এবং প্রবণতা নির্বিশেষে উচ্চ এক্সপ্রেশন জিনগুলি থেকে দূরে থাকবে। কেন্দ্রীভূতকরণ জিনকে (উচ্চ এবং নিম্ন উভয়ই প্রকাশিত) মত প্রকাশের ধরণগুলি একসাথে গুচ্ছ করে তোলে।


আমি আসলে আলাদা আলাদা বৈশিষ্ট্যগুলির সাথে তুলনা করছি যাগুলির নিজস্ব স্কেল রয়েছে। উদাহরণস্বরূপ, আমি জিসি সামগ্রীটির সাথে তুলনা করছি যার পরিসীমা প্রায় 0.3 থেকে 0.5 হয় যা ছোট বলে মনে হচ্ছে তবে পার্থক্যটি বেশ গুরুত্বপূর্ণ; কিছু অন্যান্য বৈশিষ্ট্যের বিস্তৃত ব্যাপ্তি রয়েছে, কিছু আবার খুব ছোট স্কেলের আকারে।
পেড্রোসওরিও

সুতরাং, আপনি বিভিন্ন বিষয় গুচ্ছ করছেন? সম্ভবত কিছু ওজন বা মান রূপান্তর ব্যবহার করতে পারে।
নাইট রাইটার

না, আমি সমস্ত অবিচ্ছিন্ন ভেরিয়েবলের সাথে তুলনা করছি
পেড্রোসওরিও
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.