আমি একটি লজিস্টিক রিগ্রেশন মডেল ফিটিং করার সময় কাউন্টের ডেটা কোভারিয়েট হিসাবে নিয়োগ করতে চাই। আমার প্রশ্নটি হ'ল:
- গণনা, অ-নেতিবাচক পূর্ণ সংখ্যার ভেরিয়েবলগুলি স্বাধীন ভেরিয়েবল হিসাবে নিয়োগ করে আমি কি লজিস্টিক (এবং আরও সাধারণভাবে সাধারণ রৈখিকের) মডেলগুলির কোনও অনুমান লঙ্ঘন করি?
কাউন্ট ডেটা ফলাফল হিসাবে ব্যবহার করার জন্য উত্তপ্ত সম্পর্কিত সাহিত্যে আমি প্রচুর উল্লেখ পেয়েছি, কিন্তু কোভারিয়েট হিসাবে নয়; উদাহরণস্বরূপ খুব স্পষ্ট কাগজটি দেখুন: "এনই ব্রেসলো (১৯৯)) সাধারণীকরণিত লিনিয়ার মডেলগুলি: অনুমানগুলি এবং শক্তিশালীকরণের সিদ্ধান্তগুলি পরীক্ষা করা হচ্ছে, কংগ্রেস নাজিওনালে সোসিয়েটা ইতালিয়া দি বায়োমেট্রিয়ার, কর্টোনার জুন 1995", http://biostat.georgiahealth.edu/~dryu এ উপলব্ধ /course/stat9110spring12/land16_ref.pdf ।
আলগাভাবে বলতে গেলে, মনে হচ্ছে গ্ল্যাম অনুমানগুলি নিম্নলিখিত হিসাবে প্রকাশ করা যেতে পারে:
- আইআইডি অবশিষ্টাংশ;
- লিঙ্ক ফাংশন অবশ্যই নির্ভরশীল এবং স্বতন্ত্র ভেরিয়েবলের মধ্যে সম্পর্ককে সঠিকভাবে উপস্থাপন করতে পারে;
- বহিরাগতদের অনুপস্থিতি
প্রত্যেকে কি জানেন যে অন্য কোনও অনুমান / প্রযুক্তিগত সমস্যা রয়েছে যা গণনা সহযাত্রীদের মোকাবেলা করার জন্য কিছু অন্যান্য ধরণের মডেল ব্যবহার করার পরামর্শ দিতে পারে?
পরিশেষে, দয়া করে লক্ষ্য করুন যে আমার ডেটাতে তুলনামূলকভাবে কয়েকটি নমুনা রয়েছে (<100) এবং সেই গণনা ভেরিয়েবলের ব্যাপ্তি 3-4 মাত্রার 3-4 ক্রমের মধ্যে পরিবর্তিত হতে পারে (যেমন কিছু ভেরিয়েবলের মান 0-10 মানের মধ্যে থাকে, অন্য ভেরিয়েবলের মধ্যে মান থাকতে পারে) 0-10000)।
একটি সাধারণ আর উদাহরণ কোড অনুসরণ করে:
\###########################################################
\#generating simulated data
var1 <- sample(0:10, 100, replace = TRUE);
var2 <- sample(0:1000, 100, replace = TRUE);
var3 <- sample(0:100000, 100, replace = TRUE);
outcome <- sample(0:1, 100, replace = TRUE);
dataset <- data.frame(outcome, var1, var2, var3);
\#fitting the model
model <- glm(outcome ~ ., family=binomial, data = dataset)
\#inspecting the model
print(model)
\###########################################################