লজিস্টিক রিগ্রেশন এবং ইনফ্লেশন পয়েন্ট


11

আমাদের কাছে বাইনারি ফলাফল এবং কিছু সংখ্যক সমাহারযুক্ত ডেটা রয়েছে। আমি ডেটা মডেল করতে লজিস্টিক রিগ্রেশন ব্যবহার করেছি। কেবল একটি সাধারণ বিশ্লেষণ, অসাধারণ কিছু নয়। চূড়ান্ত আউটপুটটি একটি ডোজ-প্রতিক্রিয়াযুক্ত বক্র বলে মনে করা হয় যেখানে আমরা নির্দিষ্ট কোভারিয়েটের সম্ভাবনা কীভাবে পরিবর্তিত হয় তা দেখায়। এটার মতো কিছু:

এখানে চিত্র বর্ণনা লিখুন

লজিস্টিক রিগ্রেশন বাছাই করার জন্য আমরা কোনও অভ্যন্তরীণ পর্যালোচক (খাঁটি পরিসংখ্যানবিদ নয়) থেকে কিছু সমালোচনা পেয়েছি। লজিস্টিক রিগ্রেশন অনুমান করে (বা সংজ্ঞায়িত) যে সম্ভাব্যতা স্কেলে এস-আকৃতির বক্ররেখার প্রতিফলন পয়েন্টটি সম্ভাব্যতা 0.5 এ রয়েছে। তিনি যুক্তি দিয়েছিলেন যে অনুমানের পয়েন্টটি প্রকৃতপক্ষে সম্ভাব্যতা 0.5 এ ছিল বলে ধরে নেওয়ার কোনও কারণ নেই এবং আমাদের একটি আলাদা রিগ্রেশন মডেল বেছে নেওয়া উচিত যা প্রতিযোগিতার পয়েন্টটি এমনভাবে পরিবর্তিত করতে দেয় যে আসল অবস্থানটি ডেটা চালিত হয়।

প্রথমে আমি তার যুক্তি দেখে রক্ষা পেয়েছিলাম, যেহেতু আমি এই বিষয়টি সম্পর্কে কখনও ভাবি না। অনুমিতি বিন্দুটি ০.০ এ অনুমান করা কেন ন্যায়সঙ্গত হবে তা নিয়ে আমার কোনও যুক্তি ছিল না। কিছু গবেষণা করার পরেও আমার কাছে এখনও এই প্রশ্নের উত্তর নেই।

আমি 5-প্যারামিটার লজিস্টিক রিগ্রেশন পেলাম, যার জন্য প্রতিসরণ বিন্দু একটি অতিরিক্ত পরামিতি, তবে মনে হয় এই রেগ্রেশন মডেলটি সাধারণত অবিচ্ছিন্ন ফলাফলের সাথে ডোজ-প্রতিক্রিয়া বক্ররেখা উত্পাদন করার সময় ব্যবহৃত হয়। আমি নিশ্চিত না এবং কীভাবে এটি বাইনারি প্রতিক্রিয়া ভেরিয়েবলগুলিতে প্রসারিত করা যায়।

আমার অনুমান যে আমার মূল প্রশ্নটি কেন বা যখন এটি ধরে নেওয়া ঠিক হয় যে লজিস্টিক রিগ্রেশনটির জন্য প্যারাঙ্ক পয়েন্টটি 0.5? এটা এমনকি কোন ব্যাপার? আমি কখনই কাউকে লজিস্টিক রিগ্রেশন মডেল ফিট করে এবং প্লেইন পয়েন্টের বিষয়টি স্পষ্টভাবে আলোচনা করতে দেখিনি। যেখানে কোনও ডোজ প্রতিক্রিয়া বক্ররেখা তৈরির বিকল্প রয়েছে যেখানে প্রতিস্থাপনের পয়েন্টটি প্রয়োজনীয়ভাবে 0.5 এ হয় না?

কেবল সম্পূর্ণতার জন্য, উপরের ছবিটি তৈরি করার জন্য আর কোড:

dat <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv")
dat$rank <- factor(dat$rank)
logit <- glm(admit ~ gre + gpa + rank, family = binomial(link = "logit"), data = dat)
newdata <- data.frame(gre = seq(-2000,8000,1), gpa = 2.5, rank = factor(1,c(1,2,3,4)))
pp <- predict(logit, newdata, type = "response", se.fit = TRUE)
plot(newdata$gre, pp$fit, type="l", col="black", lwd=2,ylab="Probability", xlab="Dose")

সম্পাদনা 1:

স্কার্টচি একটি মন্তব্যে যা বলেছেন কেবল তা যুক্ত করার জন্য: পর্যালোচক প্রকৃতপক্ষে যুক্তি দিয়েছিলেন যে জৈবিকভাবে এটি সম্ভবত বর্ধনের পরিবর্তনের 0.5% এর আগে ঘটে যাওয়ার সম্ভাবনা বেশি। সুতরাং অনুমান পয়েন্টটি 0.5 এ অনুমান করার বিরুদ্ধে তার প্রতিরোধ।

সম্পাদনা 2:

ফ্র্যাঙ্ক হ্যারেলের মন্তব্যের প্রতিক্রিয়া হিসাবে:

উদাহরণস্বরূপ, আমি একটি চতুর্ভুজ এবং একটি ঘনক শব্দ gre(যা এই উদাহরণে "ডোজ") অন্তর্ভুক্ত করার জন্য উপরে আমার মডেলটি সংশোধন করেছি ।

logit <- glm(admit ~ gre+I(gre^2)+I(gre^3)+  gpa + rank, family = binomial(link = "logit"), data = dat)
newdata <- data.frame(admit=1, gre = seq(-2000,8000,1), gpa = 2.5, rank = factor(1,c(1,2,3,4)))
pp <- predict(logit, newdata, type = "response", se.fit = TRUE)
plot(newdata$gre, pp$fit, type="l", col="black", lwd=2,xlim=c(-2000,4000),ylab="Probability", xlab="Dose")

এখানে চিত্র বর্ণনা লিখুন

greএই ক্ষেত্রে চতুর্ভুজ এবং একটি ঘনক শব্দ যুক্ত করা সম্ভবত অর্থবহ না হওয়া সত্ত্বেও আমরা দেখতে পাচ্ছি যে ডোজ-প্রতিক্রিয়া বক্ররেখার রূপটি পরিবর্তিত হয়েছে। প্রকৃতপক্ষে এখন আমাদের প্রায় 0.25 এবং 0.7 এর কাছাকাছি দুটি প্রতিসারণ পয়েন্ট রয়েছে।


2
এটি কি প্রতিক্রিয়ার লগ-প্রতিক্রিয়াগুলির সাথে ভবিষ্যদ্বাণীকারীদের অ-লিনিয়ার সম্পর্কগুলি তদন্ত করতে বলার মতো নয়?
Scortchi - পুনর্বহাল মনিকা

উত্তর:


8

@ স্কোর্টচির ছোঁয়ায় পর্যালোচনাকারী এই মিথ্যা ছাপের ভিত্তিতে কাজ করছে যে লজিস্টিক রিগ্রেশন প্রসঙ্গে লজিট স্কেলে ভবিষ্যদ্বাণীকারীদের ননলাইন প্রভাবগুলি মডেল করা সম্ভব নয়। মূল মডেলটি সমস্ত ভবিষ্যদ্বাণীকের লাইনারিটি ধরে নেওয়া দ্রুত ছিল। লিনিয়ারিটি অনুমানকে শিথিল করে উদাহরণস্বরূপ সীমাবদ্ধ কিউবিক স্প্লাইনগুলি (প্রাকৃতিক স্প্লাইনস) ব্যবহার করে, বক্ররের পুরো আকারটি নমনীয় এবং প্রতিসরণ বিন্দু আর কোনও সমস্যা নয় is যদি কোনও একক ভবিষ্যদ্বানী হয়ে থাকে এবং এটি যদি রিগ্রেশন স্প্লিন ব্যবহার করে প্রসারিত করা হত, তবে কেউ বলতে পারেন যে লজিস্টিক মডেলটি কেবল পর্যবেক্ষণের স্বচ্ছতা এবং স্বাধীনতার অনুমান করে।


আমাকে স্বীকার করতে হবে যে আমি স্প্লাইন রিগ্রেশন নিয়ে খুব বেশি পরিচিত নই। লজিস্টিক রিগ্রেশন (আর এ) এর সাথে একসাথে এটি করা সম্পর্কে আমি কীভাবে করব। ভবিষ্যদ্বাণীতে বহুপদী শর্তাদি অন্তর্ভুক্ত করার জন্য আমি আমার মূল পোস্টটি সম্পাদনা করেছি (2 সম্পাদনা করুন)। আমি কি স্প্লিন স্মুথিংয়ের বিকল্প হিসাবে এটি ব্যবহার করতে পারি? অবশ্যই আমার স্প্লাইচগুলির সাথে আমার মতো নমনীয়তা নেই।
ফ্রান্সিস

1
@ ফ্র্যাঙ্কো: ফ্র্যাঙ্ক হ্যারেলের নিজস্ব রিগ্রেশন মডেলিং কৌশলগুলি - বই , ওয়েবসাইট , আর প্যাকেজ - আপনাকে এগিয়ে নেওয়া উচিত। রিগ্রেশন স্প্লাইজের কিছু সুবিধা সম্পর্কে সংক্ষিপ্ত আলোচনা এখানে ; তবে আপনি অবশ্যই বলেছেন যে বহুপথ একটি বিকল্প।
Scortchi - পুনর্বহাল মনিকা

4

আমার কাছে মনে হয় যে পর্যালোচক কেবল কিছু বলার জন্য সন্ধান করেছিলেন। উহ্য আনতি বিন্দু মত স্পেসিফিকেশন এই বৈশিষ্ট্যগুলো পরীক্ষা করার আগে, আছে একটি টন অনুমানগুলোর যে আমরা অর্ডারে একটি শ্রদ্ধেয় মডেল উতরান করার জন্য, করেছি। সকলকে প্রশ্নবিদ্ধ ও বিতর্ক করা যেতে পারে - লজিস্টিক ফাংশনটি নিজেই একটি সম্ভাব্য প্রাথমিক লক্ষ্য হিসাবে ব্যবহার করা: আমাদেরকে কে বলেছে যে অন্তর্নিহিত ত্রুটি শর্তের শর্তাধীন বিতরণটি লজিস্টিক? কেউ।

সুতরাং বিষয়টি হ'ল: বক্রতা পরিবর্তন কী বোঝায়? অধ্যয়নের অধীনে আসল-জগতের ঘটনার পক্ষে কতটা গুরুত্বপূর্ণ, সেই বিন্দুটি হতে পারে যেখানে বক্রতার এই পরিবর্তন ঘটে, যাতে আমরা এটিকে "ডেটা-চালিত" হিসাবে বিবেচনা করব? পারসিমনি নীতির থেকে আরও দূরে সরে যাওয়া?

প্রশ্নটি নয় "কেন প্রতিচ্ছবি বিন্দুটি 0.5 এ হওয়া উচিত?" তবে "এটি যদি 0.5% এ ছেড়ে যায় তবে এটি আমাদের সিদ্ধান্তের জন্য কত বিভ্রান্তিকর হতে পারে?"


2
এটা কিছুটা অস্বীকারযোগ্য বলে মনে হচ্ছে। আমরা জানি না যে অন্যদের চেয়ে তিনি যে চ্যালেঞ্জ করেছেন তার চেয়ে এই ধারণাটিকে চ্যালেঞ্জ করার উপযুক্ত কারণ পর্যালোচকের ছিল না have এটিকে প্রতিস্থাপনের পয়েন্টগুলির শর্তে রাখার একটি অদ্ভুত উপায় ছেড়ে দিন, এবং লজিস্টিক রিগ্রেশন সম্পর্কে একটি সম্ভাব্য ভুল ধারণা এবং তিনি মূলত জিজ্ঞাসা করছেন কেন মডেলটি বক্ররেখা পরিবর্তন এবং প্রসারিত করতে পারে তবে বাঁক দেয় না, যা উত্তরের উপযুক্ত হতে পারে।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

@ স্কোর্টচি "এটি লাগানোর অদ্ভুত পদ্ধতি" ... "লজিস্টিক রিগ্রেশন সম্পর্কে একটি সম্ভাব্য ভুল ধারণা" ... যদি পর্যালোচকের সমালোচনাকে যুক্তিযুক্ত করতে এটিই লাগে তবে (গুলি) তার পরেও কাগজটি পর্যালোচনা করা উচিত নয়।
অ্যালেকোস পাপাদোপল্লোস

1
@ স্কার্টচির মতো আমি এটিকে কিছুটা তীক্ষ্ণ বলে মনে করি। এখানকার অনেক বেশি সক্রিয় ব্যক্তিদের মূলধারার পরিসংখ্যানের চেয়ে বিভিন্ন বিজ্ঞানে ব্যাকগ্রাউন্ড রয়েছে। পরিসংখ্যানবিদ, খাঁটি বা অন্যথায়, ভাল পরামর্শ দেওয়ার জন্য অপরিহার্য বা পর্যাপ্তও নয় (যদিও প্রায় সব ক্ষেত্রেই এটি প্রকাশ্যে সহায়তা করবে)।
নিক কক্স

@ নিক কক্স আমি "তীক্ষ্ণতা" স্বীকার করি এবং আমি আমার শেষ বাক্যটি deletedকমত্যের চিহ্ন হিসাবে মুছে ফেলেছি। আমার বক্তব্যটি হল একটি সাধারণ উপায়ে প্রশ্ন করা যে কোনও মডেলের অনুমানের কোনও মূল্য নেই - মডেলগুলি সর্বদা মিথ্যা। সুতরাং যদি সম্ভাবনার সম্ভাবনা যেখানে বক্ররেখা পরিবর্তন অধ্যয়নের অধীনে বাস্তব-জগতের ঘটনার জন্য একরকম সমালোচিত হয়, তবে পর্যালোচক সত্যই সঠিকভাবে জিজ্ঞাসা করেছিলেন যে এই পয়েন্টটি ডেটা-চালিত হয়। তবে যদি পর্যালোচক কেবল "p = 0.5 তে এবং অন্য কোথাও নেই কেন?" মন্তব্য করেন তবে এই মন্তব্য গঠনমূলক নয়।
আলেকোস পাপাদোপল্লোস

2
এর জন্য ধন্যবাদ. আমি আপনার সাধারণ অবস্থানের সাথে একমত: (ক) বিভিন্ন পদ্ধতির গুণাবলীর আলোচনা এবং (খ) আমাদের কীভাবে সেগুলি নিয়ে আলোচনা করা উচিত তা উভয়ই সুষ্ঠু খেলা। ব্যক্তি বা এমনকি গোষ্ঠীগুলির মন্তব্যগুলি বিপরীতে থাকে সাধারণত সহায়ক হয় না (যদিও আমি কখনও কখনও হতাশায় লাইনটি অতিক্রম করি ...)।
নিক কক্স

0

Mho মধ্যে, লগইট রিগ্রেশন ডোজ প্রতিক্রিয়া জন্য একটি যুক্তিসঙ্গত পছন্দ। অবশ্যই, আপনি প্রবিট, লগ-লগ, সি-লগ-লগ লিঙ্কটি ব্যবহার করতে পারেন এবং ফিটের সদ্ব্যবহারের তুলনা করতে পারেন (ডিইভি, বিআইসি, সিএআইসি, ইত্যাদি)। তবে সরলতম লজিট রিগ্রেশন প্যাকেজ এলডি 50 = -b0 / বি 1 এর আরামদায়ক আনুষ্ঠানিক মূল্যায়ন দেয়। আমরা মনে করি এটি একটি নির্দিষ্ট পয়েন্ট, যার জন্য আমরা ন্যূনতম অনিশ্চয়তা (সিএফ।, এলডি 16, এলডি 84 এবং অন্য যে কোনও একটির বৃহত্তর সিআই থাকবে, ফিনির, 1947, 1977 এর "প্রবিট বিশ্লেষণ" দেখুন) আমার অভিজ্ঞতায়, সর্বদা (?) ডোজটির লগারিদম ব্যবহার করা আরও ভাল ছিল এবং তারপরে কেবলমাত্র মূল স্কেলে 95% সিআই রূপান্তর করতে পারেন the মডেলটিতে অন্যান্য কোভারিয়েটগুলির প্রকৃতি কী? আমি বহু মডেল পদ্ধতির ব্যবহারের সম্ভাবনাটিকে প্রমাণ করি ... অবশ্যই স্প্লাইনগুলি নমনীয়, তবে আনুষ্ঠানিক প্যারাম্যাট্রিকগুলি ব্যাখ্যা করা সহজ!

Http://www.epa.gov/ncea/bmds/bmds_training/software/overp.htm দেখুন


0

০.০ প্রতিচ্ছবি পয়েন্টটি একটি বৃহত্তর প্রশ্নের একটি ছোট্ট অংশ: লজিস্টিক সমীকরণটি নির্মাণ প্রতিসম হয়। এবং এটির বেশিরভাগ বিকাশে, মডেলিং এফেক্টটির প্রতিসম হওয়ার কারণ রয়েছে। যেমন একজন খেলোয়াড় জিতলে অন্য খেলোয়াড় হেরে যায়, বা সম্পৃক্ততার জন্য দায়ী প্রভাবটি একইভাবে প্রাথমিক বৃদ্ধির জন্য দায়ী একই শারীরিক প্রভাব ইত্যাদি .... .... সুতরাং যদি কোনও কারণ থাকে তবে নিম্ন X আচরণের উত্স একই উত্স যেহেতু পিছনের হাতটি আচরণগত বা অন্য কোনও কারণে সমস্যাটি প্রতিসাম্যিক হয় তবে আপনার সমর্থনযোগ্যতা রয়েছে।

যদি তা না হয় তবে সম্ভবত পরবর্তী পরবর্তী মডেলটি হ'ল সাধারণীকরণমূলক লজিস্টিক সমীকরণ। এটির আরও পরামিতি রয়েছে এবং আপনি কোনও সীমাবদ্ধতা যুক্ত করতে চাইতে পারেন সেগুলি সমস্ত ফ্রি পরামিতি নয়। আপনি যে ক্লডজেস যুক্ত করেছেন সেগুলির চেয়ে এটি সম্ভবত আরও আকাঙ্ক্ষিত কারণ এটির মধ্যে তাকগুলি যুক্ত করা হচ্ছে যেখানে প্রথম ডেরাইভেটিভ পিছনে পিছিয়ে আসছে - এই ধরণের জিনিসটি যদি স্থানীয় সাম্যাবস্থার কল্পিত মিথ্যা পয়েন্ট তৈরি করতে থাকে তবে আপনি যদি এর কিছু প্রত্যাশার মানটি অপ্টিমাইজ করার চেষ্টা করছেন বন্টন। জেনারালাইজড ফর্মটি প্রতিসাম্যতাটিকে ভেঙে দেবে তবে মসৃণ উপায়ে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.