আমাদের কাছে বাইনারি ফলাফল এবং কিছু সংখ্যক সমাহারযুক্ত ডেটা রয়েছে। আমি ডেটা মডেল করতে লজিস্টিক রিগ্রেশন ব্যবহার করেছি। কেবল একটি সাধারণ বিশ্লেষণ, অসাধারণ কিছু নয়। চূড়ান্ত আউটপুটটি একটি ডোজ-প্রতিক্রিয়াযুক্ত বক্র বলে মনে করা হয় যেখানে আমরা নির্দিষ্ট কোভারিয়েটের সম্ভাবনা কীভাবে পরিবর্তিত হয় তা দেখায়। এটার মতো কিছু:
লজিস্টিক রিগ্রেশন বাছাই করার জন্য আমরা কোনও অভ্যন্তরীণ পর্যালোচক (খাঁটি পরিসংখ্যানবিদ নয়) থেকে কিছু সমালোচনা পেয়েছি। লজিস্টিক রিগ্রেশন অনুমান করে (বা সংজ্ঞায়িত) যে সম্ভাব্যতা স্কেলে এস-আকৃতির বক্ররেখার প্রতিফলন পয়েন্টটি সম্ভাব্যতা 0.5 এ রয়েছে। তিনি যুক্তি দিয়েছিলেন যে অনুমানের পয়েন্টটি প্রকৃতপক্ষে সম্ভাব্যতা 0.5 এ ছিল বলে ধরে নেওয়ার কোনও কারণ নেই এবং আমাদের একটি আলাদা রিগ্রেশন মডেল বেছে নেওয়া উচিত যা প্রতিযোগিতার পয়েন্টটি এমনভাবে পরিবর্তিত করতে দেয় যে আসল অবস্থানটি ডেটা চালিত হয়।
প্রথমে আমি তার যুক্তি দেখে রক্ষা পেয়েছিলাম, যেহেতু আমি এই বিষয়টি সম্পর্কে কখনও ভাবি না। অনুমিতি বিন্দুটি ০.০ এ অনুমান করা কেন ন্যায়সঙ্গত হবে তা নিয়ে আমার কোনও যুক্তি ছিল না। কিছু গবেষণা করার পরেও আমার কাছে এখনও এই প্রশ্নের উত্তর নেই।
আমি 5-প্যারামিটার লজিস্টিক রিগ্রেশন পেলাম, যার জন্য প্রতিসরণ বিন্দু একটি অতিরিক্ত পরামিতি, তবে মনে হয় এই রেগ্রেশন মডেলটি সাধারণত অবিচ্ছিন্ন ফলাফলের সাথে ডোজ-প্রতিক্রিয়া বক্ররেখা উত্পাদন করার সময় ব্যবহৃত হয়। আমি নিশ্চিত না এবং কীভাবে এটি বাইনারি প্রতিক্রিয়া ভেরিয়েবলগুলিতে প্রসারিত করা যায়।
আমার অনুমান যে আমার মূল প্রশ্নটি কেন বা যখন এটি ধরে নেওয়া ঠিক হয় যে লজিস্টিক রিগ্রেশনটির জন্য প্যারাঙ্ক পয়েন্টটি 0.5? এটা এমনকি কোন ব্যাপার? আমি কখনই কাউকে লজিস্টিক রিগ্রেশন মডেল ফিট করে এবং প্লেইন পয়েন্টের বিষয়টি স্পষ্টভাবে আলোচনা করতে দেখিনি। যেখানে কোনও ডোজ প্রতিক্রিয়া বক্ররেখা তৈরির বিকল্প রয়েছে যেখানে প্রতিস্থাপনের পয়েন্টটি প্রয়োজনীয়ভাবে 0.5 এ হয় না?
কেবল সম্পূর্ণতার জন্য, উপরের ছবিটি তৈরি করার জন্য আর কোড:
dat <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv")
dat$rank <- factor(dat$rank)
logit <- glm(admit ~ gre + gpa + rank, family = binomial(link = "logit"), data = dat)
newdata <- data.frame(gre = seq(-2000,8000,1), gpa = 2.5, rank = factor(1,c(1,2,3,4)))
pp <- predict(logit, newdata, type = "response", se.fit = TRUE)
plot(newdata$gre, pp$fit, type="l", col="black", lwd=2,ylab="Probability", xlab="Dose")
সম্পাদনা 1:
স্কার্টচি একটি মন্তব্যে যা বলেছেন কেবল তা যুক্ত করার জন্য: পর্যালোচক প্রকৃতপক্ষে যুক্তি দিয়েছিলেন যে জৈবিকভাবে এটি সম্ভবত বর্ধনের পরিবর্তনের 0.5% এর আগে ঘটে যাওয়ার সম্ভাবনা বেশি। সুতরাং অনুমান পয়েন্টটি 0.5 এ অনুমান করার বিরুদ্ধে তার প্রতিরোধ।
সম্পাদনা 2:
ফ্র্যাঙ্ক হ্যারেলের মন্তব্যের প্রতিক্রিয়া হিসাবে:
উদাহরণস্বরূপ, আমি একটি চতুর্ভুজ এবং একটি ঘনক শব্দ gre
(যা এই উদাহরণে "ডোজ") অন্তর্ভুক্ত করার জন্য উপরে আমার মডেলটি সংশোধন করেছি ।
logit <- glm(admit ~ gre+I(gre^2)+I(gre^3)+ gpa + rank, family = binomial(link = "logit"), data = dat)
newdata <- data.frame(admit=1, gre = seq(-2000,8000,1), gpa = 2.5, rank = factor(1,c(1,2,3,4)))
pp <- predict(logit, newdata, type = "response", se.fit = TRUE)
plot(newdata$gre, pp$fit, type="l", col="black", lwd=2,xlim=c(-2000,4000),ylab="Probability", xlab="Dose")
gre
এই ক্ষেত্রে চতুর্ভুজ এবং একটি ঘনক শব্দ যুক্ত করা সম্ভবত অর্থবহ না হওয়া সত্ত্বেও আমরা দেখতে পাচ্ছি যে ডোজ-প্রতিক্রিয়া বক্ররেখার রূপটি পরিবর্তিত হয়েছে। প্রকৃতপক্ষে এখন আমাদের প্রায় 0.25 এবং 0.7 এর কাছাকাছি দুটি প্রতিসারণ পয়েন্ট রয়েছে।