আমি সাইকিট-শিখার সাথে এলোমেলো বন নিয়ে পরীক্ষা নিরীক্ষা করছি এবং আমি আমার প্রশিক্ষণের সেটটির দুর্দান্ত ফলাফল পাচ্ছি, তবে আমার পরীক্ষার সেটে তুলনামূলকভাবে খারাপ ফলাফল ...
এই সমস্যাটি (পোকার দ্বারা অনুপ্রাণিত) যা আমি সমাধান করার চেষ্টা করছি: এখানে দেওয়া খেলোয়াড় এ এর গর্ত কার্ড, প্লেয়ার বি এর গর্ত কার্ড এবং একটি ফ্লপ (3 কার্ড), কোন খেলোয়াড়ের সেরা হাত আছে? গাণিতিকভাবে, এটি 14 ইনপুট (7 টি কার্ড - প্রত্যেকের জন্য একটি পদ এবং একটি স্যুট) এবং একটি আউটপুট (0 বা 1)।
এখন পর্যন্ত আমার কয়েকটি ফলাফল এখানে রয়েছে:
Training set size: 600k, test set size: 120k, number of trees: 25
Success rate in training set: 99.975%
Success rate in testing set: 90.05%
Training set size: 400k, test set size: 80k, number of trees: 100
Success rate in training set: 100%
Success rate in testing set: 89.7%
Training set size: 600k, test set size: 120k, number of trees: 5
Success rate in training set: 98.685%
Success rate in testing set: 85.69%
এখানে প্রাসঙ্গিক কোড ব্যবহৃত হয়:
from sklearn.ensemble import RandomForestClassifier
Forest = RandomForestClassifier(n_estimators = 25) #n_estimator varies
Forest = Forest.fit(inputs[:trainingSetSize],outputs[:trainingSetSize])
trainingOutputs = Forest.predict(inputs[:trainingSetSize])
testOutputs = Forest.predict(inputs[trainingSetSize:])
এটি ব্যবহার করা গাছের সংখ্যা নির্বিশেষে দেখা যায়, তুলনামূলকভাবে বড় প্রশিক্ষণের সেট এবং যুক্তিসঙ্গতভাবে সংখ্যক বৈশিষ্ট্য থাকা সত্ত্বেও প্রশিক্ষণ সংস্থার পারফরম্যান্স পরীক্ষার তুলনায় অনেক ভাল ...