জিবিএম পরামিতিগুলির জন্য কিছু দরকারী নির্দেশিকা কী কী?


31

জিবিএম ব্যবহার করে প্যারামিটারগুলি পরীক্ষা করার জন্য (যেমন ইন্টারঅ্যাকশন গভীরতা, মিনিচাইল্ড, স্যাম্পল রেট ইত্যাদি) কিছু দরকারী নির্দেশিকা কী?

ধরা যাক আমার কাছে 70-100 বৈশিষ্ট্য রয়েছে, 200,000 জনসংখ্যা রয়েছে এবং আমি 3 এবং 4 এর আন্তঃসংযোগ গভীরতার পরীক্ষা করার ইচ্ছা নিয়েছি যে স্পষ্টতই পরামিতিগুলির সংমিশ্রণটি নমুনা ছাড়াই সেরা পরীক্ষা করে দেখার জন্য আমাকে কিছু পরীক্ষা করা দরকার need এই পরীক্ষার নকশার কাছে কীভাবে যেতে হবে সে সম্পর্কে কোনও পরামর্শ?

উত্তর:


34

ক্যারেট প্যাকেজটি আপনাকে আপনার সমস্যার জন্য পরামিতি পছন্দটি অনুকূল করতে সহায়তা করতে পারে। ক্যারেটট্রেন উইগনেটটি দেখায় যে কীভাবে 10 গিগুণ পুনরাবৃত্তি ক্রস-বৈধতা ব্যবহার করে জিবিএম প্যারামিটারগুলি টিউন করা যায় - অন্যান্য অপ্টিমাইজেশান পন্থাগুলি উপলভ্য রয়েছে এটি সমস্ত ফোরচ প্যাকেজ ব্যবহার করে সমান্তরালে চালানো যেতে পারে। vignette("caretTrain", package="caret")দস্তাবেজটি পড়তে ব্যবহার করুন ।

প্যাকেজটি জিবিএম মডেলের জন্য টিউনিং shrinkage, n.treesএবং interaction.depthপরামিতিগুলিকে সমর্থন করে , যদিও আপনি নিজের নিজস্ব যুক্ত করতে পারেন।

হিউরিস্টিক্সের জন্য, এটি আমার প্রাথমিক পদ্ধতির:

shrinkage: আপনার যত কম সময় আছে (জিবিএম ম্যানুয়ালটিতে এর বেশি রয়েছে, তবে সাধারণভাবে আপনি একটি ছোট মান দিয়ে ভুল করতে পারেন)। আপনার ডেটা সেটটি ছোট তাই আমি সম্ভবত 1e-3 দিয়ে শুরু করব

n.trees: আমি সাধারণত প্রাথমিক মডেলটি আরও বেশি করে গাছ যুক্ত করে বৃদ্ধি করি যতক্ষণ না gbm.perfবলে যে আমার পর্যাপ্ত পরিমাণ রয়েছে (প্রকৃতপক্ষে, সাধারণত সেই মানের থেকে 1.2 গুণ বেশি) এবং তারপরে আরও বিশ্লেষণের জন্য গাইড হিসাবে এটি ব্যবহার করি।

interaction.depth: আপনার এই সম্পর্কে ইতিমধ্যে ধারণা আছে। ছোট মানগুলিও চেষ্টা করে দেখুন। সর্বাধিক মান হ'ল ফ্লোর (স্কয়ার্ট (এনসিওএল (ডেটা))।

n.minobsinnode: আমি এই পরিবর্তনশীল টিউন করা সত্যিই গুরুত্বপূর্ণ মনে করি। আপনি এটিকে এত ছোট চান না যে অ্যালগরিদম খুব বেশি উদ্দীপনাযুক্ত বৈশিষ্ট্য খুঁজে পায়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.