একটি ছোট ভেরিয়েবলের সেট নির্ধারণের জন্য আমি 17 টি পরিমাণগত ভেরিয়েবলের উপর পিসিএ চালিয়েছি, এটি প্রধান উপাদান, দুটি শ্রেণিতে শ্রেণিবদ্ধকরণের জন্য তদারকি করা মেশিন লার্নিংয়ে ব্যবহৃত হতে পারে। পিসিএর পরে পিসি 1 ডেটাতে 31% পার্থক্য রাখে, পিসি 2 অ্যাকাউন্টে 17%, পিসি 3 10%, পিসি 4 অ্যাকাউন্ট 8%, পিসি 5 অ্যাকাউন্ট 7% এবং পিসি 6 অ্যাকাউন্ট 6%।
যাইহোক, আমি যখন দুটি শ্রেণীর মধ্যে পিসিগুলির মধ্যে গড় পার্থক্যগুলি দেখি, আশ্চর্যরূপে, পিসি 2 দুটি শ্রেণির মধ্যে ভাল বৈষম্যমূলক নয়। বাকি পিসি ভাল বৈষম্যমূলক। তদুপরি, পিসি 1 কোনও সিদ্ধান্ত গাছে ব্যবহার করার সময় অপ্রাসঙ্গিক হয়ে যায় যার অর্থ গাছের ছাঁটাইয়ের পরে গাছটিতে উপস্থিত হয় না। গাছটি PC2-PC6 নিয়ে গঠিত।
এই ঘটনার জন্য কোন ব্যাখ্যা আছে? উদ্ভূত ভেরিয়েবলগুলির সাথে এটি কিছু ভুল হতে পারে?