আমার কাছে 19 টি ভেরিয়েবলের 1000+ স্যাম্পল ডেটাসেট রয়েছে। আমার উদ্দেশ্যটি অন্যান্য 18 ভেরিয়েবল (বাইনারি এবং অবিচ্ছিন্ন) এর উপর ভিত্তি করে বাইনারি ভেরিয়েবলের পূর্বাভাস দেওয়া। আমি যথেষ্ট আত্মবিশ্বাসী যে ভবিষ্যদ্বাণীকারী ভেরিয়েবলগুলির মধ্যে 6 বাইনারি প্রতিক্রিয়ার সাথে যুক্ত, তবে, আমি ডেটাসেটটি আরও বিশ্লেষণ করতে চাই এবং অন্যান্য সমিতি বা কাঠামো যা আমি অনুপস্থিত হতে পারি তা খুঁজতে চাই। এটি করার জন্য, আমি পিসিএ এবং ক্লাস্টারিং ব্যবহার করার সিদ্ধান্ত নিয়েছি।
সাধারণীকরণ করা ডেটাতে পিসিএ চালানোর সময় দেখা যায় যে 85% বৈকল্পিকতা ধরে রাখতে 11 টি উপাদান রাখা দরকার।
জোড় প্লটগুলি প্লট করে আমি এটি পেয়েছি:

এরপরের কী বিষয়ে আমি নিশ্চিত নই ... আমি পিসিএতে কোনও উল্লেখযোগ্য প্যাটার্ন দেখতে পাচ্ছি না এবং আমি ভাবছি যে এর অর্থ কী এবং যদি কিছু পরিবর্তনশীল বাইনারি হওয়ার কারণে এটি ঘটতে পারে। Cl টি ক্লাস্টার সহ একটি ক্লাস্টারিং অ্যালগরিদম চালিয়ে আমি নিম্নলিখিত ফলাফলটি পাই যা হুবহু উন্নতি হয় না যদিও কিছু ব্লব মনে হচ্ছে (হলুদগুলি)।

আপনি সম্ভবত বলতে পারেন যে, আমি পিসিএ-তে বিশেষজ্ঞ নই, তবে কয়েকটি টিউটোরিয়াল দেখেছি এবং কীভাবে এটি উচ্চ মাত্রিক স্থানে কাঠামোর ঝলক পাওয়া শক্তিশালী হতে পারে। বিখ্যাত এমএনআইএসটি সংখ্যা (বা আইআরআইএস) ডেটাসেটের সাহায্যে এটি দুর্দান্ত কাজ করে। আমার প্রশ্ন হ'ল পিসিএ থেকে আরও বেশি বোঝার জন্য এখন আমাকে কী করা উচিত? ক্লাস্টারিং কোনও কার্যকর কিছু গ্রহণ করেছে বলে মনে হচ্ছে না, আমি কীভাবে বলতে পারি যে পিসিএতে কোনও প্যাটার্ন নেই বা পিসিএ ডেটাতে নিদর্শনগুলি খুঁজে পেতে আমার আরও কী চেষ্টা করা উচিত?


