ক্যারেট প্যাকেজটি আপনাকে আপনার সমস্যার জন্য পরামিতি পছন্দটি অনুকূল করতে সহায়তা করতে পারে। ক্যারেটট্রেন উইগনেটটি দেখায় যে কীভাবে 10 গিগুণ পুনরাবৃত্তি ক্রস-বৈধতা ব্যবহার করে জিবিএম প্যারামিটারগুলি টিউন করা যায় - অন্যান্য অপ্টিমাইজেশান পন্থাগুলি উপলভ্য রয়েছে এটি সমস্ত ফোরচ প্যাকেজ ব্যবহার করে সমান্তরালে চালানো যেতে পারে। vignette("caretTrain", package="caret")
দস্তাবেজটি পড়তে ব্যবহার করুন ।
প্যাকেজটি জিবিএম মডেলের জন্য টিউনিং shrinkage
, n.trees
এবং interaction.depth
পরামিতিগুলিকে সমর্থন করে , যদিও আপনি নিজের নিজস্ব যুক্ত করতে পারেন।
হিউরিস্টিক্সের জন্য, এটি আমার প্রাথমিক পদ্ধতির:
shrinkage
: আপনার যত কম সময় আছে (জিবিএম ম্যানুয়ালটিতে এর বেশি রয়েছে, তবে সাধারণভাবে আপনি একটি ছোট মান দিয়ে ভুল করতে পারেন)। আপনার ডেটা সেটটি ছোট তাই আমি সম্ভবত 1e-3 দিয়ে শুরু করব
n.trees
: আমি সাধারণত প্রাথমিক মডেলটি আরও বেশি করে গাছ যুক্ত করে বৃদ্ধি করি যতক্ষণ না gbm.perf
বলে যে আমার পর্যাপ্ত পরিমাণ রয়েছে (প্রকৃতপক্ষে, সাধারণত সেই মানের থেকে 1.2 গুণ বেশি) এবং তারপরে আরও বিশ্লেষণের জন্য গাইড হিসাবে এটি ব্যবহার করি।
interaction.depth
: আপনার এই সম্পর্কে ইতিমধ্যে ধারণা আছে। ছোট মানগুলিও চেষ্টা করে দেখুন। সর্বাধিক মান হ'ল ফ্লোর (স্কয়ার্ট (এনসিওএল (ডেটা))।
n.minobsinnode
: আমি এই পরিবর্তনশীল টিউন করা সত্যিই গুরুত্বপূর্ণ মনে করি। আপনি এটিকে এত ছোট চান না যে অ্যালগরিদম খুব বেশি উদ্দীপনাযুক্ত বৈশিষ্ট্য খুঁজে পায়।