র‌্যান্ডমফোরেস্ট-স্কলারনে শ্রেণিবিন্যাসের প্রান্তিককরণ


9

1) স্কলারনে র‌্যান্ডমফোরেস্টে আমি শ্রেণিবদ্ধের প্রান্তিক (আমার মনে হয় এটি ডিফল্টরূপে 0.5 হয়) কীভাবে পরিবর্তন করতে পারি?

2) আমি কীভাবে স্কলারনে আন্ডার-স্যাম্পল করতে পারি?

3) আমার র্যান্ডমফোরস্ট শ্রেণিবদ্ধের নিম্নলিখিত ফলাফল রয়েছে: [[1635 1297] [520 3624]]

         precision    recall  f1-score   support

class 0       0.76      0.56      0.64      2932
class 1       0.74      0.87      0.80      4144

গড় / মোট 0.75 0.74 0.73 7076

প্রথমত, ডেটা ভারসাম্যহীন (শ্রেণি -0 থেকে 30% এবং শ্রেণি -1 থেকে 70%)। সুতরাং, আমি মনে করি শ্রেণিবদ্ধকারী ক্লাস -১ এর পক্ষপাতদুষ্ট হওয়ার বেশি সম্ভাবনা রয়েছে যার অর্থ কিছুটা ক্লাস -০ থেকে শ্রেণি -১ এ স্থানান্তরিত করা হয়েছে (শ্রেণি -১ এর জন্য ১২৯৯ মিসক্লাসিফিকেশন তবে শ্রেণি -১ এর জন্য ৫২০ মিসক্লাসিফিকেশন রয়েছে)। আমি এটা কিভাবে ঠিক করবো? যদি ডাউনসাম্পলিং সাহায্য করতে পারে? বা শ্রেণিবিন্যাসের প্রান্তিক পরিবর্তন?

আপডেট: শ্রেণি -0 এর জনসংখ্যার 40% রয়েছে যখন শ্রেণি -1 60%। তবে, ক্লাস -0 থেকে ক্লাস -1 (1297) এ প্রবাহের পরিমাণ বেশি রয়েছে এবং আমি চাই এটি কম হয়ে যায়।

উত্তর:


7

আপনি প্রকৃতপক্ষে কোনও শ্রেণিতে র্যান্ডম অরণ্যটিকে মোড়া করতে পারেন যা অভ্যন্তরীণ এলোমেলো বন এবং আউটপুট ক্লাস 1 predictএর predict_probaপদ্ধতিটিকে কল করে এমন একটি পদ্ধতি কেবল কাস্টম প্রান্তিকের চেয়ে বেশি হলে higher

বিকল্পভাবে আপনি sample_weightসংখ্যালঘু শ্রেণীর নমুনাগুলির জন্য উচ্চতর পাস করে প্রশিক্ষণের অ্যালগরিদমকে পক্ষপাত করতে পারেন ।


ধন্যবাদ। আমি নাবালক শ্রেণীর ওজন বাড়ানোর কথা ভাবছিলাম। তবে, আমি র‌্যান্ডমফোরস্ট শ্রেণিবদ্ধে কিছু দেখতে পাচ্ছি না (সেখানে এসজিডিক্লাসিফায়ার রয়েছে)
বড় ডেটা প্রেমিক

ফিট পদ্ধতিটি একটি sample_weightপ্যারাম গ্রহণ করে (প্রতি প্যারামিটারে একটি ওজন) যা খুব নমনীয় এবং এটি অনুকরণ করা সম্ভব করে তোলে class_weight(লক্ষ্য শ্রেণীর জন্য এক ওজন)।
ogrisel

ধন্যবাদ। যখন আমি ব্যবহার clf clf.fit (x, y, sample_weight = preprocessing.balance_weights (Y) = এটা আমার দেয় ValueError: operands আকার সঙ্গে একসঙ্গে সম্প্রচার করা যায়নি Y বাইনারি 0/1 হয়।
বিগ ডেটা লাভার্স

এর আকৃতি কী y? আপনার আলাদা Yএবং কেন y?
ogrisel
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.