পার্টিতে দেরীতে, তবে যাইহোক এখানেই আমার উত্তর, এবং এটি "হ্যাঁ", মডেল / পদ্ধতিটি লিনিয়ার হোক বা না থাকুক বা মূল কাজটি ভবিষ্যদ্বাণী বা শ্রেণিবিন্যাসকে বিবেচনা না করেই সর্বদা কোলিনারিটি সম্পর্কে উদ্বিগ্ন হওয়া উচিত।
পদ্ধতি হিসাবে ডেটা সেট এবং র্যান্ডম ফরেস্টে উপস্থিত বেশ কয়েকটি লিনিয়ার পারস্পরিক কোভারিয়েটস / বৈশিষ্ট্যগুলি ধরুন। স্পষ্টতই, নোডের জন্য এলোমেলো নির্বাচন কেবল (বা বেশিরভাগ ক্ষেত্রে) কলিনারি বৈশিষ্ট্যগুলি বেছে নিতে পারে যা ফলস্বরূপ দুর্বল হয়ে যায় এবং এটি বারবার ঘটতে পারে, ফলে কার্যকারিতাটিকে নেতিবাচকভাবে প্রভাবিত করে।
এখন, কলিনারি বৈশিষ্ট্যগুলি অন্যান্য (কল-লাইনবিহীন) বৈশিষ্ট্যগুলির তুলনায় ফলাফল সম্পর্কে কম তথ্যবহুল হতে পারে এবং এগুলি যেভাবেই বৈশিষ্ট্য সেট থেকে বাদ দেওয়ার জন্য বিবেচনা করা উচিত। তবে, ধরে নিন যে বৈশিষ্ট্যগুলি আরএফ দ্বারা উত্পাদিত 'বৈশিষ্ট্য গুরুত্ব' তালিকায় উচ্চ স্থানে রয়েছে। এগুলি হিসাবে অকারণে মাত্রিক মাত্রা বাড়িয়ে ডেটা সেটে রাখা হবে। সুতরাং, বাস্তবে, আমি সর্বদা, একটি অনুসন্ধানের পদক্ষেপ হিসাবে (অনেকের মধ্যে সম্পর্কিত) লিনিয়ার পারস্পরিক সম্পর্ক সহ বৈশিষ্ট্যগুলির যুগল সংযুক্তি পরীক্ষা করে দেখি।