কোনও পরিবর্তনশীলকে ওজন নির্ধারণের একটি উপায় হল এর স্কেল পরিবর্তন করা। কৌশলটি আপনি উল্লিখিত ক্লাস্টারিং অ্যালগরিদমগুলির জন্য কাজ করে, যেমন। কে-মানে, ওজনযুক্ত-গড় লিঙ্কেজ এবং গড়-লিঙ্কেজ।
কাউফম্যান, লিওনার্ড এবং পিটার জে রুসিউউ। " ডেটাতে গোষ্ঠী সন্ধান করা: গুচ্ছ বিশ্লেষণের একটি ভূমিকা ।" (2005) - পৃষ্ঠা 11:
পরিমাপ ইউনিটগুলির পছন্দ ভেরিয়েবলগুলির আপেক্ষিক ওজনকে বাড়িয়ে তোলে। ছোট ইউনিটগুলিতে ভেরিয়েবল প্রকাশ করা হলে সেই ভেরিয়েবলের জন্য বৃহত্তর পরিসীমা বাড়ে, যার ফলে ফলাফলের কাঠামোর উপর একটি বড় প্রভাব পড়বে। অন্যদিকে, উদ্দেশ্যপ্রণালী অর্জনের আশায়, সমস্ত পরিবর্তনশীলকে একটি সমান ওজন দেয়ার প্রয়াসকে মানক করে তোলা। এর মতো, এটি কোনও অনুশীলনকারী দ্বারা ব্যবহার করা যেতে পারে যার কোনও পূর্ব জ্ঞান নেই। তবে এটি ভালভাবে হতে পারে যে কোনও নির্দিষ্ট প্রয়োগের ক্ষেত্রে কিছু পরিবর্তনশীল অন্যদের চেয়ে অভ্যন্তরীণভাবে আরও বেশি গুরুত্বপূর্ণ এবং তারপরে ওজন নির্ধারণের বিষয়টি বিষয়বস্তু জ্ঞানের উপর ভিত্তি করে হওয়া উচিত (দেখুন, উদাহরণস্বরূপ, আব্রাহামোভিজ, 1985)।
অন্যদিকে, ক্লাস্টারিং কৌশলগুলি তৈরি করার চেষ্টা করা হয়েছে যা ভেরিয়েবলগুলির স্কেল থেকে পৃথক (ফ্রেডম্যান এবং রুবিন, 1967) of হার্ডি এবং রাসনের প্রস্তাব (1982) ক্লাস্টারগুলির উত্তল হালগুলির মোট পরিমাণকে হ্রাস করে এমন একটি পার্টিশন অনুসন্ধান করা। নীতিগতভাবে এই জাতীয় পদ্ধতিটি ডেটাগুলির রৈখিক রূপান্তরগুলির সাথে সম্পর্কিত, তবে দুর্ভাগ্যক্রমে এর বাস্তবায়নের জন্য কোনও অ্যালগরিদম বিদ্যমান নেই (দুটি মাত্রায় সীমাবদ্ধ এমন একটি আনুমানিক ব্যতীত)। সুতরাং, বর্তমানে মানকতার দ্বিধাটি অপরিহার্য বলে মনে হয় এবং এই বইয়ে বর্ণিত প্রোগ্রামগুলি ব্যবহারকারীকে পছন্দ হিসাবে ছেড়ে দেয়
আব্রাহামোইক্জ, এম। (1985), সাইকোমেট্রিক সোসাইটি এবং ক্লাসিফিকেশন সোসাইটির চতুর্থ ইউরোপীয় সভায় উপস্থাপিত কাগজ, অসামঞ্জস্যতা পরিমাপের জন্য অ-সংখ্যাসূচক একটি পোন তথ্য ব্যবহার, 2-5 জুলাই, কেমব্রিজ (ইউকে)।
ফ্রাইডম্যান, এইচপি, এবং রুবিন, জে। (1967), ডেটা গ্রুপিংয়ের জন্য কিছু আক্রমণাত্মক মানদণ্ডে। জে। আমের। পরিসংখ্যানবিৎ। এএসএসওসি 6।, 2, 1159-1178।
হার্ডি, এ। এবং রাসন, জেপি (1982), উনি নওভেল অ্যাপ্রোচ ডেস সমস্যাগুলি ডি শ্রেণিবিন্যাস অটোমেটিক, স্ট্যাটিস্ট। পায়ুসংক্রান্ত। ডোনিস, 7, 41-56।