লজিস্টিক রিগ্রেশনগুলির বৈশিষ্ট্য


17

আমরা কিছু লজিস্টিক রিগ্রেশন নিয়ে কাজ করছি এবং আমরা বুঝতে পেরেছি যে গড় অনুমান করা সম্ভাবনা সর্বদা নমুনায় থাকা অনুপাতের সমান; অর্থাৎ, লাগানো মানগুলির গড় গড় নমুনার গড়ের সমান।

কেউ আমাকে কারণ ব্যাখ্যা করতে পারেন বা আমাকে একটি রেফারেন্স দিতে পারেন যেখানে আমি এই বিক্ষোভ খুঁজে পাব?


2
এর কারণ হ'ল লজিস্টিক রিগ্রেশন ঠিক তা অর্জন করার চেষ্টা করছে: পূর্ব সম্ভাব্যতা ("গড়") সহ ডেটা বিতরণকে মডেলিং করা। এই আচরণ কি অনাকাঙ্ক্ষিত?
বায়ারজ

1
@ বায়ার লিঙ্ক ফাংশনের অরেখারতা ইঙ্গিত দেয় যে এই ঘটনাটি আপনার চরিত্রায়নের চেয়ে গভীর। এখানে প্রকৃতপক্ষে কিছু প্রদর্শন করা দরকার।
শুক্র

ঝুঁকি অনুমান করার জন্য লজিস্টিক রিগ্রেশন ব্যবহৃত হলে এই সম্পত্তিটিকে কখনও কখনও বড় আকারে ক্যালিব্রেশন-ইন-দ্য লার্জ বলা হয়।
জুলাইথ

উত্তর:


26

আপনি যে আচরণটি পর্যবেক্ষণ করছেন তা লজিস্টিক রিগ্রেশনের ক্ষেত্রে "সাধারণ" ক্ষেত্রে তবে সর্বদা সত্য হয় না । এটি আরও অনেক সাধারণতা ধরে রাখে (নীচে দেখুন)। এটি তিনটি পৃথক সত্যের মিলনের পরিণাম।

  1. ভবিষ্যদ্বাণীকারীদের লিনিয়ার ফাংশন হিসাবে লগ-প্রতিকূলগুলির মডেলিংয়ের পছন্দ,
  2. লজিস্টিক রিগ্রেশন মডেলটিতে সহগের অনুমানগুলির সর্বাধিক সম্ভাবনার ব্যবহার এবং
  3. মডেলটিতে একটি ইন্টারসেপ্ট টার্ম অন্তর্ভুক্তি।

যদি উপরের কোনও একটি উপস্থিত না থাকে, তবে গড় অনুমান করা সম্ভাব্যতাগুলি, সাধারণভাবে, নমুনায় থাকা অনুপাতের সাথে মেলে না।

তবে, (প্রায়) সমস্ত পরিসংখ্যান সংক্রান্ত সফ্টওয়্যার এই জাতীয় মডেলগুলির সর্বাধিক সম্ভাবনার প্রাক্কলন ব্যবহার করে, সুতরাং, অনুশীলনে, আইটেম 1 এবং 2 মূলত সর্বদা উপস্থিত থাকে, এবং বিশেষ ক্ষেত্রে বাদে আইটেম 3 সাধারণত উপস্থিত থাকে।

কিছু বিশদ

টিপিক্যাল লজিস্টিক রিগ্রেশন ফ্রেমওয়ার্ক, আমরা সম্ভাব্যতা সঙ্গে স্বাধীন দ্বিপদ বিচারের পরিণতি পালন । যাক Y আমি পর্যবেক্ষিত প্রতিক্রিয়ার হও। তারপরে মোট সম্ভাবনা হ'ল L = n i = 1 p y i i ( 1 - p i ) 1 - y i = n i = 1 এক্সপ্রেস ( y আমি লগ ( পি i / ( 1 - পি i)পিআমিYআমি এবং তাই লগ-সম্ভাবনা নেই = Σ আমি = 1 Y আমি লগ ইন করুন ( P আমি / ( 1 - পি আমি ) ) + + Σ আমি = 1 লগ ( 1 - পি আমি )

এল=Πআমি=1এনপিআমিYআমি(1-পিআমি)1-Yআমি=Πআমি=1এনমেপুঃ(Yআমিলগ(পিআমি/(1-পিআমি))+ +লগ(1-পিআমি)),
=Σআমি=1এনYআমিলগ(পিআমি/(1-পিআমি))+ +Σআমি=1এনলগ(1-পিআমি)

এখন আমরা ভবিষ্যতবক্তা একটি ভেক্টর আছে প্রতিটি পর্যবেক্ষণ এবং ফ্যাক্ট 1 থেকে উপরে, লজিস্টিক প্রত্যাবৃত্তি মডেল posits যে লগ পি আমিএক্সআমি

লগপিআমি1-পিআমি=βটিএক্সআমি,
βপিআমি=1/(1+ +-βটিএক্সআমি)

/β=0

β=ΣআমিYআমিএক্সআমি-Σআমিএক্সআমি1+ +মেপুঃ(-βটিএক্সআমি)=ΣআমিYআমিএক্সআমি-Σআমিপিআমিএক্সআমি,
ΣআমিYআমিএক্সআমি=Σআমিপি^আমিএক্সআমি,
পি^আমি=(1+ +মেপুঃ(-β^টিএক্সআমি))-1

এক্সআমিআমিΣআমিYআমিএক্সআমি=ΣআমিYআমি=Σআমিপি^আমি

একটি অনুকরণ

আর

x <- rnorm(100)
p <- 1/(1+exp(-3*x))
y <- runif(100) <= p
mean(y)
# Should be identical to mean(y)
mean( predict( glm(y~x, family="binomial"), type="response" ) )
# Won't be identical (usually) to mean(y)
mean( predict( glm(y~x+0, family="binomial"), type="response") )

সাধারণ ক্ষেত্রে : উপরে বর্ণিত হিসাবে, সম্পত্তিটি যে গড় প্রতিক্রিয়ার গড় পূর্বাভাসিত গড়ের সমান, সাধারণীকৃত রৈখিক মডেলগুলির শ্রেণীর জন্য বৃহত্তর সাধারণত্ব ধারণ করে সর্বাধিক সম্ভাবনা অনুসারে, ক্যানোনিকাল লিঙ্ক ফাংশনটি ব্যবহার করে এবং এতে একটি বাধা সহ মডেল.

তথ্যসূত্র

সম্পর্কিত তত্ত্বের জন্য কয়েকটি ভাল উল্লেখ নিম্নলিখিত।

  1. উ। এগ্রেস্তি (২০০২), শ্রেণিবদ্ধ ডেটা বিশ্লেষণ , ২ য় সংস্করণ, উইলি।
  2. পি। ম্যাককুলাঘ এবং জেএ নেল্ডার (1989), জেনারালাইজড লিনিয়ার মডেলস , দ্বিতীয় তৃতীয় সংস্করণ, চ্যাপম্যান এবং হল। (সাধারণ পদ্ধতিগুলির মূল লেখকদের পাঠ্য))

4
+1 এই বিক্ষোভ (সমস্ত জিএলএমগুলিকে সাধারণীকরণের চেষ্টা ছাড়াই লজিস্টিক রিগ্রেশন মডেলের সাথে সুনির্দিষ্ট) মদদালায় (1983) ইকোনোমেট্রিক্সের সীমাবদ্ধ নির্ভরশীল এবং গুণগত ভেরিয়েবলগুলিতেও দেওয়া হয়েছে , পৃষ্ঠা 25-26।
StasK

@ স্ট্যাস্ক: অতিরিক্ত রেফারেন্সের জন্য ধন্যবাদ, যার সাথে আমি পরিচিত নই। চিয়ার্স।
কার্ডিনাল

@ কার্ডিনাল: আমি এগ্রেস্তি এর সাথে আলোচনা করার কথা মনে করি না। এটি ম্যাককুল্লাগ এবং নেল্ডারে আলোচনা হয়?
জুলাইথ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.