আমি একটি ছোট ডেটা সেট ক্লাস্টার করতে দেখছি (4 ইন্টারভাল ভেরিয়েবলের 64 টি পর্যবেক্ষণ এবং একটি একক তিন-গুণক শ্রেণিবদ্ধ ভেরিয়েবল)। এখন, আমি ক্লাস্টার বিশ্লেষণে বেশ নতুন, তবে আমি জানি যে দিনগুলি থেকে ক্রমবর্ধমান ক্লাস্টারিং বা কে-মানে একমাত্র উপলভ্য বিকল্প ছিল since বিশেষত, দেখে মনে হয় যে মডেল ভিত্তিক ক্লাস্টারিংয়ের নতুন পদ্ধতিগুলি উপলব্ধ যেগুলি chl দ্বারা নির্দেশিত হিসাবে , "ক্লাস্টার বা শ্রেণীর সংখ্যা সম্পর্কে সিদ্ধান্ত নিতে" সদল্য-বুদ্ধিমান সূচকগুলি "সক্ষম করে।
তবে মডেল ভিত্তিক ক্লাস্টারিংয়ের জন্য স্ট্যান্ডার্ড আর প্যাকেজটি mclust
দৃশ্যত মিশ্র ডেটা ধরণের মডেলগুলিতে ফিট করে না। fpc
মডেল হবে, কিন্তু কষ্ট একটি মডেল ঝুলানো আছে, আমি ক্রমাগত ভেরিয়েবল অ গসিয়ান প্রকৃতির কারণে সন্দেহ। আমার কি মডেল-ভিত্তিক পদ্ধতির সাথে চালিয়ে যাওয়া উচিত? আমি সম্ভব হলে আর ব্যবহার চালিয়ে যেতে চাই। আমি এটি দেখতে হিসাবে আমার কাছে কয়েকটি বিকল্প রয়েছে:
- তিন স্তরের শ্রেণিবদ্ধ ভেরিয়েবলকে দুটি ডামি ভেরিয়েবলে রূপান্তর করুন এবং ব্যবহার করুন
mclust
। আমি নিশ্চিত না যে এটি ফলাফলগুলিকে পক্ষপাতিত্ব করবে কিনা, তবে তা না হলে এটি আমার পছন্দসই বিকল্প। - অবিচ্ছিন্ন ভেরিয়েবলগুলি কোনওভাবে রূপান্তর করুন এবং
fpc
প্যাকেজটি ব্যবহার করুন । - আমি এখনও মুখোমুখি হইনি এমন আরও কিছু আর প্যাকেজ ব্যবহার করুন।
- গওয়ারের পরিমাপ ব্যবহার করে একটি ভিন্নতা ম্যাট্রিক্স তৈরি করুন এবং traditionalতিহ্যগত শ্রেণিবিন্যাস বা স্থানান্তরকরণ ক্লাস্টার কৌশলগুলি ব্যবহার করুন।
Stats.se hivemind এখানে কোন পরামর্শ আছে?