আমার কি র‌্যান্ডম ফরেস্ট রেজিস্ট্রার বা শ্রেণিবদ্ধকারী নির্বাচন করা উচিত?


11

আমি এলোমেলো বন দ্বারা বাইনারি টার্গেট ক্লাসের সাথে একটি ডেটাসেট ফিট করি। পাইথনে, আমি এটি এলোমেলোভাবে ক্লাসিফায়ার বা র্যান্ডম ফরেস্টগ্রেস্টার দ্বারা করতে পারি।

আমি এলোমেলোভাবে স্টক ক্লাসিফায়ার থেকে সরাসরি শ্রেণিবিন্যাসটি পেতে পারি বা আমি প্রথমে র্যান্ডম ফরেস্টগ্রেস্টার চালাতে পারি এবং আনুমানিক স্কোরগুলির এক সেট (অবিচ্ছিন্ন মান) ফিরে পেতে পারি। তারপরে স্কোরের সেট থেকে বেরিয়ে ভবিষ্যদ্বাণী করা ক্লাসগুলি অর্জন করার জন্য আমি একটি কাটফুল মান পেতে পারি। উভয় পদ্ধতিই একই লক্ষ্য অর্জন করতে পারে (যেমন পরীক্ষার ডেটার জন্য ক্লাসের পূর্বাভাস)।

এছাড়াও আমি এটি পর্যবেক্ষণ করতে পারেন

randomforestclassifier.predict_proba(X_test)[:,1]) 

এর থেকে আলাদা

randomforestregressor.predict(X_test)

সুতরাং আমি কেবল তা নিশ্চিত করতে চাই যে দুটি পদ্ধতিই বৈধ এবং তারপরে কোনটি এলোমেলো বন প্রয়োগে ভাল?


1
আমার তাত্ক্ষণিক প্রতিক্রিয়া হ'ল আপনার ক্লাসিফায়ারটি ব্যবহার করা উচিত কারণ এটি ঠিক এটির জন্য নির্মিত হয়েছিল তবে আমি এটি 100% নিশ্চিত নই যে এটির বেশি পার্থক্য রয়েছে। রেজিস্টার ব্যবহার করা লজিস্টিক রিগ্রেশনের পরিবর্তে লিনিয়ার রিগ্রেশন ব্যবহার করার মতো হবে - এটি কাজ করে তবে অনেক পরিস্থিতিতে তা নয়। আমি হয়ত সঠিক উত্তর পেতে পারি তবে এক বা একদিনের জন্য নয়।
পিটার এলিস

উত্তর:


7

শ্রেণিবদ্ধ ব্যবহার করুন। না, তারা উভয়ই বৈধ নয়।

প্রথমত, আমি আপনাকে সত্যিকার অর্থে রিগ্রেশন বনাম শ্রেণিবদ্ধকরণের বিষয় পড়তে উত্সাহিত করি। কারণ এটি সম্পর্কে কিছু না জেনে এমএল ব্যবহার করা আপনাকে ভুল ফলাফল দেয় যা আপনি বুঝতে পারবেন না। এবং এটি বেশ বিপজ্জনক ... ( আপনার চারপাশের কোন উপায়ে আপনার বন্দুকটি ধরে রাখা উচিত কিনা তা জিজ্ঞাসা করার মতো কিছুটা )

আপনি যদি একটি ক্লাসিফায়ার বা regressor ব্যবহার কিনা শুধুমাত্র আপনি এই ধরণের সমস্যার সমাধান করছে উপর নির্ভর করে। আপনার বাইনারি শ্রেণিবদ্ধকরণ সমস্যা রয়েছে, তাই শ্রেণিবদ্ধ ব্যবহার করুন।

আমি প্রথমে র্যান্ডম ফরেস্টগ্রেস্টার চালাতে এবং আনুমানিক সম্ভাবনার একটি সেট ফিরে পেতে পারি।

কোন। আপনি রিগ্রেশন থেকে সম্ভাবনা পাবেন না। এটি কেবল আপনার দেওয়া মানগুলি "এক্সট্রোপোলেট" করার চেষ্টা করে (এই ক্ষেত্রে কেবল 0 এবং 1)। এর অর্থ হল 1 বা নীচের 0 এর নীচের মানগুলি রিগ্রেশন আউটপুট হিসাবে পুরোপুরি বৈধ output কারণ এটি আউটপুট হিসাবে কেবলমাত্র দুটি পৃথক মানের প্রত্যাশা করে না (এটিকে শ্রেণিবিন্যাস বলা হয় !) তবে একটানা মানগুলি।

আপনি যদি একটি নির্দিষ্ট শ্রেণীর অন্তর্গত হওয়ার জন্য নির্দিষ্ট পয়েন্টের জন্য "সম্ভাব্যতাগুলি" ( সচেতন হন যে এগুলি ভালভাবে ক্যালিবিরেটেড সম্ভাবনা থাকতে হবে না ) রাখতে চান তবে শ্রেণিবদ্ধকে প্রশিক্ষণ দিন (সুতরাং এটি ডেটা শ্রেণীবদ্ধ করতে শেখে ) এবং তারপরে ব্যবহার করুন .predict_proba (), যা তখন সম্ভাবনার পূর্বাভাস দেয়।

এখানে এটি উল্লেখ করার জন্য:। ভবিষ্যদ্বাণী বনাম .predict_proba (একটি শ্রেণিবদ্ধের জন্য!)
P

মন্তব্য: নিশ্চিত, অভ্যন্তরীণভাবে, "শেষ স্তর" ইত্যাদি ব্যতীত এগুলি একই রকম! তবুও, তাদের (বা আরও ভাল যে সমস্যাটি তারা সমাধান করছেন) দেখুন সম্পূর্ণ আলাদা!

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.