আমি নিজেকে জিজ্ঞাসা করছি যে কোনও রিগ্রেশন প্রসঙ্গে negativeণাত্মক ভেরিয়েবল গুরুত্ব মান ("% IncMSE") সহ সেই ভেরিয়েবলগুলি সরিয়ে ফেলা ভাল ধারণা কিনা। এবং যদি এটি আমাকে আরও ভাল ভবিষ্যদ্বাণী দেয়? আপনি কি মনে করেন?
আমি নিজেকে জিজ্ঞাসা করছি যে কোনও রিগ্রেশন প্রসঙ্গে negativeণাত্মক ভেরিয়েবল গুরুত্ব মান ("% IncMSE") সহ সেই ভেরিয়েবলগুলি সরিয়ে ফেলা ভাল ধারণা কিনা। এবং যদি এটি আমাকে আরও ভাল ভবিষ্যদ্বাণী দেয়? আপনি কি মনে করেন?
উত্তর:
র্যান্ডম বনে পরিবর্তনীয় গুরুত্ব নিম্নরূপ গণনা করা হয়:
তারপরে, একটি একক কলামের মানগুলি অনুমতি দেওয়া হয় এবং এমএসই আবার গণনা করা হয়। উদাহরণস্বরূপ, যদি কোনও কলাম (কল 1) মানগুলি 1,2,3,4 গ্রহণ করে এবং মানগুলির একটি এলোমেলো অনুগতি 4,3,1,2 ফলাফল করে। এটি এমএসই 1-এ ফলাফল দেয়। তারপরে এমএসই, অর্থাত্, এমএসই 1 - এমএসই বৃদ্ধি পেলে ভেরিয়েবলের গুরুত্ব বোঝায়।
আমরা পার্থক্যটি ইতিবাচক হওয়ার প্রত্যাশা করি, তবে negativeণাত্মক সংখ্যার ক্ষেত্রে এটি বোঝায় যে এলোমেলোভাবে অনুচ্ছেদটি আরও ভালভাবে কাজ করেছে। এটি অনুমান করা যায় যে ভেরিয়েবলের ভবিষ্যদ্বাণীতে কোনও ভূমিকা নেই, অর্থাত্ গুরুত্বপূর্ণ নয়।
আশাকরি এটা সাহায্য করবে!
একটি বিস্তৃত ব্যাখ্যার জন্য দয়া করে নীচের লিঙ্কটি দেখুন!
/programming/27918320/what-does-negative-incmse-in-randomforest-package-mean
এটি কেবল একটি এলোমেলো ওঠানামা হতে পারে (উদাহরণস্বরূপ আপনার যদি ছোট ntree থাকে)।
যদি তা না হয় তবে এটি প্রদর্শিত হতে পারে যে আপনার ডেটাতে কিছু মারাত্মক পরিমাণে প্যারাডক্স রয়েছে, অর্থাত্ প্রায় অভিন্ন ভবিষ্যদ্বাণীকারীগুলির সাথে জোড়া জোড়া বস্তু এবং খুব আলাদা ফলাফল। এই ক্ষেত্রে, আমি মডেলটি আসলে কোনও অর্থবোধ করে কিনা তা আমি দুবার যাচাই করে দেখব এবং কীভাবে তাদের সমাধানের জন্য আরও গুণাবলি পেতে পারি তা ভাবতে শুরু করি।