আমি 100 সংখ্যার বৈশিষ্ট্য সহ 50 কে উদাহরণের মাধ্যমে গ্রেডিয়েন্ট বুস্টিং মডেলটি প্রশিক্ষণের চেষ্টা করছি। XGBClassifier
আমার মেশিনে 43 সেকেন্ডের মধ্যে 500 গাছ হ্যান্ডল করে, যখন GradientBoostingClassifier
1 মিনিট 2 সেকেন্ডের মধ্যে কেবল 10 টি গাছ (!) পরিচালনা করে :( আমি কয়েক ঘন্টা লাগবে বলে 500 গাছ বাড়ানোর চেষ্টা করতে বিরক্ত করিনি। আমি একই learning_rate
এবং max_depth
সেটিংস ব্যবহার করছি , নিচে দেখ.
এক্সজিবিস্টকে এত তাড়াতাড়ি কী করে তোলে? এটি স্কেলার্ন ছেলেরা জানেন না এমন গ্রেডিয়েন্ট বৃদ্ধির জন্য কিছু অভিনব বাস্তবায়ন ব্যবহার করে? নাকি এটি "কোণে কাটা" এবং অগভীর গাছ বাড়ছে?
PS আমি এই আলোচনাটি সম্পর্কে অবগত: https://www.kaggle.com/c/higgs-boson/forums/t/10335/xgboost-post-compression-survey কিন্তু সেখানে উত্তর পেতে পারেনি ...
XGBClassifier(base_score=0.5, colsample_bylevel=1, colsample_bytree=1,
gamma=0, learning_rate=0.05, max_delta_step=0, max_depth=10,
min_child_weight=1, missing=None, n_estimators=500, nthread=-1,
objective='binary:logistic', reg_alpha=0, reg_lambda=1,
scale_pos_weight=1, seed=0, silent=True, subsample=1)
GradientBoostingClassifier(init=None, learning_rate=0.05, loss='deviance',
max_depth=10, max_features=None, max_leaf_nodes=None,
min_samples_leaf=1, min_samples_split=2,
min_weight_fraction_leaf=0.0, n_estimators=10,
presort='auto', random_state=None, subsample=1.0, verbose=0,
warm_start=False)