আমার কি র‌্যান্ডম ফরেস্ট রেজিস্ট্রার বা শ্রেণিবদ্ধকারী নির্বাচন করা উচিত?

আমি এলোমেলো বন দ্বারা বাইনারি টার্গেট ক্লাসের সাথে একটি ডেটাসেট ফিট করি। পাইথনে, আমি এটি এলোমেলোভাবে ক্লাসিফায়ার বা র্যান্ডম ফরেস্টগ্রেস্টার দ্বারা করতে পারি।

আমি এলোমেলোভাবে স্টক ক্লাসিফায়ার থেকে সরাসরি শ্রেণিবিন্যাসটি পেতে পারি বা আমি প্রথমে র্যান্ডম ফরেস্টগ্রেস্টার চালাতে পারি এবং আনুমানিক স্কোরগুলির এক সেট (অবিচ্ছিন্ন মান) ফিরে পেতে পারি। তারপরে স্কোরের সেট থেকে বেরিয়ে ভবিষ্যদ্বাণী করা ক্লাসগুলি অর্জন করার জন্য আমি একটি কাটফুল মান পেতে পারি। উভয় পদ্ধতিই একই লক্ষ্য অর্জন করতে পারে (যেমন পরীক্ষার ডেটার জন্য ক্লাসের পূর্বাভাস)।

এছাড়াও আমি এটি পর্যবেক্ষণ করতে পারেন

randomforestclassifier.predict_proba(X_test)[:,1])

এর থেকে আলাদা

randomforestregressor.predict(X_test)

সুতরাং আমি কেবল তা নিশ্চিত করতে চাই যে দুটি পদ্ধতিই বৈধ এবং তারপরে কোনটি এলোমেলো বন প্রয়োগে ভাল?

python random-forest

— LUSAQX
সূত্র

আমার তাত্ক্ষণিক প্রতিক্রিয়া হ'ল আপনার ক্লাসিফায়ারটি ব্যবহার করা উচিত কারণ এটি ঠিক এটির জন্য নির্মিত হয়েছিল তবে আমি এটি 100% নিশ্চিত নই যে এটির বেশি পার্থক্য রয়েছে। রেজিস্টার ব্যবহার করা লজিস্টিক রিগ্রেশনের পরিবর্তে লিনিয়ার রিগ্রেশন ব্যবহার করার মতো হবে - এটি কাজ করে তবে অনেক পরিস্থিতিতে তা নয়। আমি হয়ত সঠিক উত্তর পেতে পারি তবে এক বা একদিনের জন্য নয়।

— পিটার এলিস

শ্রেণিবদ্ধ ব্যবহার করুন। না, তারা উভয়ই বৈধ নয়।

প্রথমত, আমি আপনাকে সত্যিকার অর্থে রিগ্রেশন বনাম শ্রেণিবদ্ধকরণের বিষয় পড়তে উত্সাহিত করি। কারণ এটি সম্পর্কে কিছু না জেনে এমএল ব্যবহার করা আপনাকে ভুল ফলাফল দেয় যা আপনি বুঝতে পারবেন না। এবং এটি বেশ বিপজ্জনক ... ( আপনার চারপাশের কোন উপায়ে আপনার বন্দুকটি ধরে রাখা উচিত কিনা তা জিজ্ঞাসা করার মতো কিছুটা )

আপনি যদি একটি ক্লাসিফায়ার বা regressor ব্যবহার কিনা শুধুমাত্র আপনি এই ধরণের সমস্যার সমাধান করছে উপর নির্ভর করে। আপনার বাইনারি শ্রেণিবদ্ধকরণ সমস্যা রয়েছে, তাই শ্রেণিবদ্ধ ব্যবহার করুন।

আমি প্রথমে র্যান্ডম ফরেস্টগ্রেস্টার চালাতে এবং আনুমানিক সম্ভাবনার একটি সেট ফিরে পেতে পারি।

কোন। আপনি রিগ্রেশন থেকে সম্ভাবনা পাবেন না। এটি কেবল আপনার দেওয়া মানগুলি "এক্সট্রোপোলেট" করার চেষ্টা করে (এই ক্ষেত্রে কেবল 0 এবং 1)। এর অর্থ হল 1 বা নীচের 0 এর নীচের মানগুলি রিগ্রেশন আউটপুট হিসাবে পুরোপুরি বৈধ output কারণ এটি আউটপুট হিসাবে কেবলমাত্র দুটি পৃথক মানের প্রত্যাশা করে না (এটিকে শ্রেণিবিন্যাস বলা হয় !) তবে একটানা মানগুলি।

আপনি যদি একটি নির্দিষ্ট শ্রেণীর অন্তর্গত হওয়ার জন্য নির্দিষ্ট পয়েন্টের জন্য "সম্ভাব্যতাগুলি" ( সচেতন হন যে এগুলি ভালভাবে ক্যালিবিরেটেড সম্ভাবনা থাকতে হবে না ) রাখতে চান তবে শ্রেণিবদ্ধকে প্রশিক্ষণ দিন (সুতরাং এটি ডেটা শ্রেণীবদ্ধ করতে শেখে ) এবং তারপরে ব্যবহার করুন .predict_proba (), যা তখন সম্ভাবনার পূর্বাভাস দেয়।

এখানে এটি উল্লেখ করার জন্য:। ভবিষ্যদ্বাণী বনাম .predict_proba (একটি শ্রেণিবদ্ধের জন্য!)
P

মন্তব্য: নিশ্চিত, অভ্যন্তরীণভাবে, "শেষ স্তর" ইত্যাদি ব্যতীত এগুলি একই রকম! তবুও, তাদের (বা আরও ভাল যে সমস্যাটি তারা সমাধান করছেন) দেখুন সম্পূর্ণ আলাদা!

— Mayou36
সূত্র