গুচ্ছ বিশ্লেষণ পরিচালনা করতে আমাকে ভেরিয়েবলের সংখ্যা হ্রাস করতে হবে। আমার ভেরিয়েবলগুলি দৃ corre়ভাবে সম্পর্কিত, তাই আমি একটি ফ্যাক্টর বিশ্লেষণ পিসিএ (মূল উপাদান বিশ্লেষণ) করার চিন্তা করলাম । তবে, আমি যদি ফলাফল প্রাপ্ত স্কোরগুলি ব্যবহার করি তবে আমার ক্লাস্টারগুলি বেশ সঠিক নয় (সাহিত্যের পূর্ববর্তী শ্রেণিবিন্যাসের তুলনায়)।
প্রশ্ন:
প্রতিটি উপাদান / ফ্যাক্টরের জন্য সবচেয়ে বড় লোড সহ ভেরিয়েবলগুলি নির্বাচন করতে এবং আমার ক্লাস্টারিংয়ের জন্য কেবল এই ভেরিয়েবলগুলি ব্যবহার করতে কি আমি ঘূর্ণন ম্যাট্রিক্সটি ব্যবহার করতে পারি?
যে কোনও গ্রন্থপঞ্জি উল্লেখগুলি সহায়ক হবে।
হালনাগাদ:
কিছু স্পষ্টতা:
আমার লক্ষ্য: এসপিএসএসের দ্বি-পদক্ষেপ অ্যালগরিদম সহ আমাকে একটি ক্লাস্টার বিশ্লেষণ চালাতে হবে, তবে আমার পরিবর্তনগুলি স্বতন্ত্র নয়, তাই আমি তাদের কয়েকটি ত্যাগের বিষয়ে চিন্তা করেছি।
আমার ডেটাসেট: আমি 100,000 কেসের 15 স্কেলার পরামিতিগুলিতে (আমার ভেরিয়েবল) কাজ করছি। কিছু ভেরিয়েবল দৃ strongly়ভাবে সম্পর্কিত হয় ( পিয়ারসন)
আমার সন্দেহ: যেহেতু আমার কেবল স্বাধীন ভেরিয়েবলগুলি দরকার, তাই আমি একটি প্রধান অধ্যায় বিশ্লেষণ চালানোর চিন্তা করলাম (দুঃখিত: আমি ভুলভাবে আমার মূল প্রশ্নে ফ্যাক্টর বিশ্লেষণ সম্পর্কে কথা বললাম) এবং প্রতিটি উপাদানগুলির জন্য সবচেয়ে বড় লোডিংয়ের সাথে কেবলমাত্র ভেরিয়েবলগুলি নির্বাচন করি। আমি জানি যে পিসিএ প্রক্রিয়াটি কিছু স্বেচ্ছাচারিত পদক্ষেপ উপস্থাপন করে তবে আমি জানতে পেরেছিলাম যে এই নির্বাচনটি আসলে আইটি জোলিফের প্রস্তাবিত " পদ্ধতি বি 4 " এর অনুরূপ (1972 এবং 2002) ভেরিয়েবলগুলি নির্বাচন করতে এবং জেআর কিং এবং ডিএ জ্যাকসন দ্বারা প্রস্তাবিত 1999 সালে ।
সুতরাং আমি এইভাবে কিছু নির্বাচন করতে চাইছিলাম স্বাধীন ভেরিয়েবলের উপ-গ্রুপ। তারপরে আমি গ্রুপগুলি বিভিন্ন ক্লাস্টার বিশ্লেষণ চালানোর জন্য ব্যবহার করব এবং আমি ফলাফলগুলি তুলনা করব।