গণনা ডেটাতে রিগ্রেশন মডেলগুলির তুলনা করা


11

আমি সম্প্রতি একই পূর্বাভাসক / প্রতিক্রিয়া ডেটার জন্য 4 টি একাধিক রিগ্রেশন মডেল ফিট করেছি। আমি দুটি মডেল পইসন রিগ্রেশনের সাথে ফিট করি।

model.pois <- glm(Response ~ P1 + P2 +...+ P5, family=poisson(), ...)
model.pois.inter <- glm(Response ~ (P1 + P2 +...+ P5)^2, family=poisson(), ...)

আমি দুটি মডেল নেতিবাচক দ্বিপদী রিগ্রেশন সঙ্গে ফিট।

library(MASS)
model.nb <- glm.nb(Response ~ P1 + P2 +...+ P5, ...)
model.nb.inter <- glm.nb(Response ~ (P1 + P2 +...+ P5)^2, ...)

এই মডেলগুলির তুলনা করতে আমি কি কোনও পরিসংখ্যান পরীক্ষা করতে পারি? আমি ফিটের একটি পরিমাপ হিসাবে এআইসি ব্যবহার করছি, কিন্তু আফাইক এটি প্রকৃত পরীক্ষার প্রতিনিধিত্ব করে না।


আপনি একটি পরিসংখ্যান পরীক্ষা ব্যবহার করে মডেলগুলির ফিটের তুলনা করতে চান , তাই না? আপনি কোন ধরণের হাইপোথিসিস পরীক্ষা করতে চান?
ফায়ারফ্যাডার

@Firefeather উদাহরণস্বরূপ, আমি পরীক্ষা করতে ইচ্ছুক কিনা তা উপযোগীতা model.nb.interহয় উল্লেখযোগ্যভাবে যে এর চেয়ে ভাল model.pois.inter। হ্যাঁ, এআইসি কম, তবে কতটা নীচে উল্লেখযোগ্যভাবে উন্নত হয় ?
ড্যানিয়েল স্ট্যান্ডেজ

দ্রষ্টব্য: এই প্রশ্নের উত্তরে এআইসিকে আসলে অন্তর্ভুক্ত করা উচিত নয়।
ড্যানিয়েল স্ট্যান্ডেজ 21

আমি এই প্রশ্নের উত্তর জানি না, তবে আমি একটি শুরু করতে পারি। আমি তোমাদের কাছে এক ব্যবহার করতে পারেন জানেন তুলনা পরীক্ষা বিরুদ্ধে (এবং একইভাবে তুলনা বিরুদ্ধে ), কিন্তু আমি একটি পইসন মডেল এবং একটি নেতিবাচক দ্বিপদ মডেল কাজ করবে মধ্যে যে তুলনা নিশ্চয়তা দিতে পারে না। আমি ভাবছি যদি প্রতিটি জোড়ের বৈচিত্রের তুলনা করার জন্য কোনও পরীক্ষাটি নির্ভরযোগ্য হয়। এফFmodel.poismodel.pois.intermodel.nbmodel.nb.interF
ফায়ারফ্যাডার

1
@ ফায়ারফিডার, হ্যাঁ পারিবারিকভাবে আত্মবিশ্বাসের স্তর নিয়ন্ত্রণ করার প্রয়োজনীয়তা সম্পর্কে আমি সচেতন। বলি, বনফেরনির চেয়ে এখানে কি শেফি বেশি উপযুক্ত হবে?
ড্যানিয়েল স্ট্যান্ডেজ 21

উত্তর:


14

আপনি সম্ভাবনা অনুপাত পরীক্ষার সাথে সম্পর্কিত পোইসন মডেলের সাথে নেতিবাচক দ্বিপদী মডেলটির তুলনা করতে পারেন। একটি পইসন মডেল শূন্যের ওভারডিস্পেরেশন প্যারামিটার সহ একটি নেতিবাচক দ্বিপদী মডেলের সমতুল্য। সুতরাং তারা নেস্টেড মডেল এবং সম্ভাবনা অনুপাত বৈধ। জটিলতা হ'ল ওভারডিস্পেরেশন প্যারামিটারটি অ-নেতিবাচক হিসাবে সীমাবদ্ধ, অর্থাত এটি যৌক্তিকভাবে শূন্যের চেয়ে কম হতে পারে না, সুতরাং নাল অনুমানটি প্যারামিটার স্পেসের সীমানায় রয়েছে is এর অর্থ হ'ল একগুণ স্বাধীনতার সাথে চি-স্কোয়ার ডিস্ট্রিবিউশনের সাথে লগ-সম্ভাবনার দ্বিগুণ তুলনা করার পরিবর্তে, আপনি এটিকে চি-স্কোয়ারের সমান অংশ 1 ডিএফ এবং শূন্যের একটি পয়েন্ট ভর দিয়ে গঠিত মিশ্রণ বিতরণের সাথে তুলনা করতে হবে (মুক্তির শূন্য ডিগ্রি সহ একটি চি-স্কোয়ার বিতরণ)। বাস্তবে এর অর্থ হ'ল আপনি 1-df এর সাথে চি-স্কোয়ার্ড ব্যবহার করে পি-মানটি গণনা করতে পারেন এবং তারপরে এটি অর্ধেক করতে পারেন। আরও বিশদ এবং পটভূমির জন্য, 5 এর কেস দেখুনস্ব & লিয়াং জাসা 1987; 82 : 605-610।

নোট করুন যে কয়েকটি স্ট্যাটিস্টিকাল সফ্টওয়্যার প্যাকেজ, যেমন স্টাটা যখন আপনি নেতিবাচক দ্বিপদী মডেলটি ফিট করেন তখন স্বয়ংক্রিয়ভাবে আপনার জন্য এটি করবে। প্রকৃতপক্ষে আমি নির্লজ্জভাবে স্টাটা সহায়তা সিস্টেম থেকে উপরের অনেকগুলি আঁকড়ে ধরেছি - যদি আপনার স্টাটা দেখতে পান help j_chibar


5

আমি বিশ্বাস করি anova()আর এর জন্য ব্যবহার করা যেতে পারে। এর নাম সত্ত্বেও এটি একটি সম্ভাবনা অনুপাতের পরীক্ষা। তাঁর দ্য আর বইতে ক্রোলির ব্যবহারের কয়েকটি উদাহরণ রয়েছে।


1

অনস্টপ নোট হিসাবে, কারণ মডেলগুলি বাসা বেধে আছে আপনি সম্ভাবনা অনুপাত পরীক্ষা করতে পারেন।

সাধারণভাবে যদিও এটি সত্য নয়, সুতরাং আপনি যদি অ-নেস্টেড মডেলগুলির তুলনা করতে চান তবে আপনি ভুংয়ের পরীক্ষাটি ব্যবহার করতে পারেন ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.