"পদক্ষেপের প্রতিরোধ" কীভাবে কাজ করে?


11

আমি একটি প্রোবিট মডেল ফিট করতে নিম্নলিখিত আর কোড ব্যবহার করেছি:

p1 <- glm(natijeh ~ ., family=binomial(probit), data=data1)
stepwise(p1, direction='backward/forward', criterion='BIC')

আমি জানতে চাই stepwiseএবং backward/forwardঠিক কী করে এবং কীভাবে ভেরিয়েবল নির্বাচন করে?


7
পদক্ষেপের প্রতিরোধ কেন খারাপ তা নিয়ে ফ্র্যাঙ্ক হ্যারেল ( stats.stackexchange.com/users/4253/frank-harrell ) দ্বারা কিছু মন্তব্য : stata.com/support/faqs/statistics/stepwise-regression-problems

4
বাবাকপির লিঙ্কগুলি ছাড়াও সাইট থেকে এই পোস্টটি দেখুন ।
COOLSerdash

3
স্টেপওয়াইজ (এবং পিছিয়ে এবং এগিয়েও) নিয়ে সমস্যা সম্পর্কে আরও একটি পোস্ট হ'ল একটি কাগজ যা আমি ডেভিড ক্যাসেলের সাথে লিখেছিলাম: স্টেপওয়াইস থামানো
পিটার ফ্লুম - মনিকা পুনরায় স্থাপন করুন

@ পিটারফ্লম, এই কাগজটি উল্লেখ করার জন্য, সঠিক উদ্ধৃতিটি বোঝার জন্য আমার কিছু সমস্যা হচ্ছে। আপনি এখানে এটি তালিকা করতে পারেন? ধন্যবাদ।
ডগ.নম্বার্স

2
@ ডাগ.নম্বারস এটি বিভিন্ন স্থানে উপস্থাপন করা হয়েছিল এবং সম্মেলনের কার্যক্রমের অংশ হিসাবে প্রকাশিত হয়েছিল। যদি আপনি "ফ্লুম, ক্যাসেল, স্টেপওয়াইজ" গুগল করেন তবে আপনি যে জায়গাটি উপস্থাপন করেছিলেন তা পেয়ে যাবেন এবং আপনি প্রকাশিত উপস্থাপনাগুলিতে উদ্ধৃতি বিন্যাস করতে পারেন তবে আপনি এটি ফর্ম্যাট করতে পারেন।
পিটার ফ্লুম - মনিকা পুনরায়

উত্তর:


10

পদক্ষেপের বাছাইয়ের মূলনীতি

  1. আপনি চান সমস্ত ভেরিয়েবলের সাথে আপনি একটি মডেল ফিট করে fit এটি আপনার বর্তমান সেরা মডেল।
  2. আপনি একটি চলক মুছে ফেলুন (বা বর্তমানের সেরা মডেলটিতে ব্যবহার না করা চলকগুলির মধ্যে একটি যুক্ত করুন) এবং প্রত্যেকটির জন্য আপনি নতুন মডেলটি ফিট করেন এবং বিআইসির (বা যে কোনও কোনও হিসাবে আপনি প্রতিটিটির সাথে এবং মূলটির সাথে তুলনা করেন) অন্যান্য মানদণ্ড, যেমন এআইসি ) আপনি অন্য একটি "বর্তমান সেরা মডেল" পান।

আপনি 2 টি পুনরাবৃত্তি করবেন যতক্ষণ না বিআইসির কোনও হ্রাস নেই। আপনার কাছে কেবল বিআইসির স্থানীয় ন্যূনতম রয়েছে, যার অর্থ আপনি ভেরিয়েবলের সাবসেটের সমস্ত পছন্দ পছন্দগুলির মধ্যে সেরা মডেলটি নাও পেতে পারেন। তবে যাইহোক, সাধারণত তাদের মধ্যে অনেকগুলি থাকে, তাই এটি খুব বেশি কাজ না করে কিছুটা অনুকূল করার একটি উপায়।

উইকিপিডিয়ায় স্টেপওয়াস রিগ্রেশন এবং মডেল নির্বাচনও দেখুন ।


5

ধাপে ধাপে রিগ্রেশন মূলত একটি নির্দিষ্ট মানদণ্ডের উপর ভিত্তি করে কোভারিয়েটগুলিকে একবারে যুক্ত / বাদ দিয়ে রিগ্রেশন মডেলটিকে ফিট করে (আপনার উদাহরণে মানদণ্ডটি বিআইসির উপর ভিত্তি করে থাকবে)।

সামনে উল্লেখ করে আপনি বলছেন Rযে আপনি সর্বাধিক সহজ মডেল (অর্থাৎ, একটি সমবায়) থেকে শুরু করতে চান এবং তারপরে কেবল একটি মডেল বিআইসি-র উন্নতির ফলস্বরূপ রেখে একটি কোভারিয়েট যুক্ত করুন add

পশ্চাৎপদ নির্দিষ্ট করে আপনি বলছেন Rযে আপনি পুরো মডেল (অর্থাত্, সমস্ত covariates সহ মডেল) দিয়ে শুরু করতে চান এবং তারপরে covariates ফেলে রাখুন, এক সময়, এটি বিআইসির উন্নতির ফলে।

স্টেপওয়াইজ রিগ্রেশন একটি অত্যন্ত বিপজ্জনক পরিসংখ্যান পদ্ধতি হতে পারে কারণ এটি একটি অনুকূল মডেল নির্বাচনের পদ্ধতি নয়। পদ্ধতিটি খুব খারাপ মডেল নির্বাচনের দিকে পরিচালিত করতে পারে কারণ এটি আপনাকে একাধিক তুলনার মতো সমস্যার থেকে সুরক্ষা দেয় না।


ধন্যবাদ। এবং 'পিছিয়ে / এগিয়ে' কি?
মাহমুদ

পিছিয়ে / ফরোয়ার্ড বলতে কী বোঝ?

আর স্টেপওয়াই () এর একটি পদ্ধতি হ'ল 'পিছিয়ে / ফরোয়ার্ড'! এটি কি উভয়ের সংমিশ্রণ?
মাহমুদ

2
ওহ দুঃখিত, আপনি এখন যা জিজ্ঞাসা করছেন তা এখন বুঝতে পারছি। হ্যাঁ, আপনি যদি উভয় নির্দিষ্ট করে থাকেন তবে তা সামনের এবং পিছিয়ে উভয় ক্ষেত্রেই প্রযোজ্য এবং সেরা মানদণ্ডের সাথে এটি বেছে নেয়।
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.