আমি পাইথনে সাইকিট-লার্ন লাইব্রেরির সাথে কাজ করছি। নীচের কোডটিতে, আমি সম্ভাবনার পূর্বাভাস দিচ্ছি তবে আউটপুট কীভাবে পড়তে হয় তা আমি জানি না।
তথ্য পরীক্ষা করা হচ্ছে
from sklearn.ensemble import RandomForestClassifier as RF
from sklearn import cross_validation
X = np.array([[5,5,5,5],[10,10,10,10],[1,1,1,1],[6,6,6,6],[13,13,13,13],[2,2,2,2]])
y = np.array([0,1,1,0,1,2])
ডেটাসেট বিভক্ত করুন
X_train, X_test, y_train, y_test = cross_validation.train_test_split(X, y, test_size=0.5, random_state=0)
সম্ভাবনা গণনা করুন
clf = RF()
clf.fit(X_train,y_train)
pred_pro = clf.predict_proba(X_test)
print pred_pro
আউটপুট
[[ 1. 0.]
[ 1. 0.]
[ 0. 1.]]
এক্স_স্টেস্ট তালিকায় 3 টি অ্যারে রয়েছে (আমার কাছে 6 টি নমুনা এবং টেস্ট_সাইজ = 0,5 রয়েছে) সুতরাং আউটপুটটিতে 3 টিও রয়েছে।
তবে আমি 3 টি মান (0,1,2) পূর্বাভাস দিচ্ছি তবে কেন আমি প্রতিটি অ্যারেতে কেবল 2 টি উপাদান পাচ্ছি?
আমি আউটপুট কিভাবে পড়া উচিত?
আমি আরও লক্ষ্য করেছি, যখন আমি y এর স্বতন্ত্র মানগুলির সংখ্যাটি সংশোধন করি, আউটপুটে কলামগুলির সংখ্যা সর্বদা y -1 এর স্বতন্ত্র গণনা।