লজিস্টিক রিগ্রেশনটির জন্য কীভাবে বায়সিয়ান ন্যায্যতার কল্পনা করা যায় ize


10

বয়েসীয় লজিস্টিক রিগ্রেশন সমস্যার জন্য, আমি একটি উত্তরোত্তর ভবিষ্যদ্বাণীমূলক বিতরণ তৈরি করেছি। আমি ভবিষ্যদ্বাণীপূর্ণ বিতরণ থেকে নমুনা করি এবং আমার প্রতিটি পর্যবেক্ষণের জন্য হাজার হাজার নমুনা (0,1) পাই। মাপসই করা কল্যাণকর দৃষ্টি আকর্ষণীয় চেয়ে কম, উদাহরণস্বরূপ:

এখানে চিত্র বর্ণনা লিখুন

এই প্লটটি 10 ​​000 নমুনা + পর্যবেক্ষণ করা ডেটাম পয়েন্ট দেখায় (বাম দিক দিয়ে একটি লাল রেখা তৈরি করতে পারে: হ্যাঁ এটি পর্যবেক্ষণ)। সমস্যাটি হ'ল এই প্লটটি খুব কমই তথ্যবহুল এবং আমার কাছে তাদের মধ্যে 23 টি রয়েছে, প্রতিটি ডাটা পয়েন্টের জন্য একটি।

23 টি ডেটা পয়েন্ট প্লাস সেখানে উত্তরোত্তর নমুনাগুলি কল্পনা করার আরও ভাল উপায় আছে কি?


আরেকটি প্রচেষ্টা:

এখানে চিত্র বর্ণনা লিখুন


কাগজ উপর ভিত্তি করে আরেকটি প্রয়াস এখানে

এখানে চিত্র বর্ণনা লিখুন


1
উপরের ডেটা-ভিস কৌশলটি যেখানে কাজ করে সেখানে একটি উদাহরণের জন্য এখানে দেখুন ।
ক্যাম.ড্যাভিডসন.পিলন

তা হ'ল প্রচুর অপচয়! আপনার কি সত্যিই কেবলমাত্র 3 টি মান রয়েছে (0.5 এর নীচে, 0.5 এর উপরে, এবং পর্যবেক্ষণ) বা আপনি যে উদাহরণ দিয়েছেন তার একটি নিদর্শন?
অ্যান্ডি ডব্লু

এটি আসলে আরও খারাপ: আমার 8500 0s এবং 1500 1s রয়েছে। গ্রাফটি কেবল সংযুক্ত হিস্টোগ্রাম তৈরি করতে এই মানগুলিকে ঠেলে দেয়। তবে আমি সম্মত: প্রচুর অপচয় করা জায়গা। সত্যই, প্রতিটি ডেটা পয়েন্টের জন্য আমি এটিকে একটি অনুপাত (প্রাক্তন 8500/10000) এবং পর্যবেক্ষণে (0 বা 1)
কমাতে পারি

সুতরাং আপনার কাছে 23 ডেটা পয়েন্ট রয়েছে এবং কতটি ভবিষ্যদ্বাণী রয়েছে? এবং নতুন তথ্য পয়েন্টগুলির জন্য বা আপনি যে মডেলটির সাথে মানানসই ব্যবহার করেছেন সেই 23 জনের জন্য কি আপনার উত্তরোত্তর ভবিষ্যদ্বাণীপূর্ণ বিভ্রান্তি?
সম্ভাব্যতাসংক্রান্ত 5

আপনার আপডেট হওয়া প্লটটি আমি যা প্রস্তাব করতে চলেছি তার কাছাকাছি। যদিও এক্স অক্ষটি প্রতিনিধিত্ব করে? এটিতে আপনার কাছে কিছু চাপ রয়েছে যা আরোপিত রয়েছে - যা কেবল ২৩ এর সাথে অপ্রয়োজনীয় বলে মনে হয়।
অ্যান্ডি ডব্লিউ

উত্তর:


5

আমার আপনার মনে হয় যে আপনার পরিস্থিতি পুরোপুরি পুরোপুরি ছেড়ে দিচ্ছেন না, তবে আমাদের সামনে যা দেওয়া হয়েছে তা প্রদত্ত তথ্য প্রদর্শন করার জন্য একটি সাধারণ বিন্দু-চক্রান্তের ইউটিলিটি বিবেচনা করি ।

ডট প্লট

এখানে না আসার একমাত্র আসল জিনিস (এটি সম্ভবত ডিফল্ট আচরণ নয়) হ'ল:

  • আমি কোনও ত্রুটি ও ত্রুটিযুক্ত পর্যবেক্ষণের মানগুলির মধ্যে পার্থক্য করার জন্য রিডানড্যান্ট এনকোডিংগুলি, আকার এবং রঙ ব্যবহার করেছি। এই জাতীয় সহজ তথ্য সহ, গ্রাফটিতে একটি বিন্দু রাখার প্রয়োজন নেই। এছাড়াও আপনার যদি সমস্যা হয় যখন পয়েন্টটি মাঝারি মানেরগুলির নিকটে থাকে তবে পর্যবেক্ষণকৃত মানটি শূন্য বা এক হয় কিনা তা দেখতে আরও সন্ধান করতে হবে।
  • আমি পর্যবেক্ষণ অনুপাত অনুযায়ী গ্রাফিক বাছাই।

বাছাই হ'ল এগুলির মতো ডট-প্লটের জন্য আসল পদাঙ্ক। অনুপাতের মান অনুসারে বাছাই করা খুব সহজেই উচ্চ অবশিষ্টাংশ পর্যবেক্ষণগুলি উদঘাটনে সহায়তা করে। এমন একটি সিস্টেম থাকা যেখানে আপনি সহজেই প্লটের মধ্যে থাকা বা মামলার বাহ্যিক বৈশিষ্ট্যগুলিতে থাকা মানগুলি অনুসারে বাছাই করতে পারেন আপনার বকের জন্য ধনুক পাওয়ার সেরা উপায়।

এই পরামর্শ ক্রমাগত পর্যবেক্ষণ পর্যন্ত প্রসারিত। আপনি অবশিষ্টগুলি নেতিবাচক বা ধনাত্মক কিনা সেই অনুযায়ী পয়েন্টগুলিকে রঙ / আকার দিতে পারেন এবং তারপরে পরম (বা স্কোয়ার্ড) অবশিষ্টাংশ অনুসারে পয়েন্টটি আকার দিতে পারেন। পর্যবেক্ষিত মানগুলির সরলতার কারণে যদিও এখানে আইএমওর প্রয়োজন নেই।


1
আমি এই সমাধান এবং বিষয়বস্তু পছন্দ করি, আমি কেবল অন্যান্য জমা দেওয়ার জন্য অপেক্ষা করছি। ধন্যবাদ অ্যান্ডি
ক্যাম.ড্যাভিডসন.পিলন

1
@ ক্যাম.ড্যাভিডসন.পিলন - আমি অন্যান্য সাবমিশনের জন্যও অপেক্ষা করছি! কারণ আপনার মডেলটির কেবলমাত্র একজন ভবিষ্যদ্বাণী রয়েছে - ত্রুটিগুলির পূর্বাভাসিত অনুপাত অনুসারে বাছাই করা তাপমাত্রা অনুসারে বাছাইয়ের সমার্থক হবে (এটি আপনার গ্রাফে প্রদর্শিত যেমন একটি একঘেয়েমিক প্রভাব অনুমান করে)। সম্ভবত কেউ আবার অন্য সমাধানের সাথে আসবেন যা কার্যকরভাবে ভবিষ্যদ্বাণী করা অনুপাত এবং মূল তাপমাত্রা (বা সম্পূর্ণ আলাদা কিছু) উভয়ই দেখতে দেয়। এই প্রদর্শনটি খারাপ ভবিষ্যদ্বাণী দেখার জন্য ভাল তবে অ-রৈখিক প্রভাবগুলি দেখার মতো জিনিসগুলির পক্ষে খুব ভাল নয়।
অ্যান্ডি ডব্লিউ

1
আমি আপনাকে অনুদান পুরষ্কার খুশি। বাছাই করা এটি উপস্থাপনের মূল চাবিকাঠি এবং আপনার আগের পোস্ট থেকে লিঙ্ক করা কাগজটি আমি ব্যবহার করব। ধন্যবাদ!
ক্যাম.ড্যাভিডসন.পিলন

4

একজন প্রেডিক্টরের সাথে বায়সীয় লজিস্টিক রিগ্রেশন মডেলের ফিটটি দেখার জন্য সাধারণ উপায় হ'ল সম্পর্কিত অনুপাতের সাথে ভবিষ্যতবাণী বিতরণকে প্লট করা। (দয়া করে, আমি যদি আপনার প্রশ্নটি বুঝতে পারি তবে আমাকে জানান)

জনপ্রিয় আনন্দের ডেটা সেট ব্যবহার করে একটি উদাহরণ।

এখানে চিত্র বর্ণনা লিখুন

আর এর নীচে কোড:

library(mcmc)

# Beetle data

ni = c(59, 60, 62, 56, 63, 59, 62, 60) # Number of individuals
no = c(6, 13, 18, 28, 52, 53, 61, 60) # Observed successes
dose = c(1.6907, 1.7242, 1.7552, 1.7842, 1.8113, 1.8369, 1.8610, 1.8839) # dose

dat = cbind(dose,ni,no)

ns = length(dat[,1])

# Log-posterior using a uniform prior on the parameters

logpost = function(par){
var = dat[,3]*log(plogis(par[1]+par[2]*dat[,1])) + (dat[,2]-dat[,3])*log(1-plogis(par[1]+par[2]*dat[,1]))

if( par[1]>-100000 ) return( sum(var) )
else return(-Inf)
}

# Metropolis-Hastings
N = 60000

samp <- metrop(logpost, scale = .35, initial = c(-60,33), nbatch = N)

samp$accept

burnin = 10000
thinning = 50

ind = seq(burnin,N,thinning)

mu1p =   samp$batch[ , 1][ind]

mu2p =   samp$batch[ , 2][ind]


# Visual tool

points = no/ni
# Predictive dose-response curve
DRL <- function(d) return(mean(plogis(mu1p+mu2p*d)))
DRLV = Vectorize(DRL)

v <- seq(1.55,2,length.out=55)
FL = DRLV(v)

plot(v,FL,type="l",xlab="dose",ylab="response")
points(dose,points,lwd=2)

আমি কোনও আর লোক নই, আপনি কি প্লট / আউটপুট সরবরাহ করতে পারবেন?
ক্যাম.ড্যাভিডসন.পিলন

@ ক্যাম.ড্যাভিডসন.পিলন আমি দুঃখিত, আমার খ্যাতি আমাকে প্লটগুলি অন্তর্ভুক্ত করতে দেয় না। তবে ধারণাটি হ'ল পর্যবেক্ষণের অনুপাতের সাথে পুরো ডোজ-প্রতিক্রিয়া বক্ররেখা প্লট করা।
সেরবেরিস

আমি ছবি যুক্ত করেছি। আপনি সেই ডেটাটির জন্য একটি আলাদা কাঠামো ধরে নিয়েছেন যাতে ওপি'র সরাসরি আপনার উদাহরণটি প্রসারিত হয় না। ওপির ডেটা এমন হবে যদি আপনার ni = 23এবং no = 723 জনের প্রত্যেকের আলাদা থাকে dose। আপনি ওপি'র ডেটার জন্য একই ধরণের প্লট তৈরি করতে পারেন, (পয়েন্টগুলি হয় ওয়াই অক্ষের উপরে 0 বা 1 এ স্থাপন করা হয়, এবং আপনি ফাংশনটি প্লট করেন)। এই উত্তরটিতে আমি যে রেফারেন্স দিয়েছি সেগুলিতে লজিস্টিক রিগ্রেশনের জন্য অনুরূপ প্লটের কয়েকটি উদাহরণ দেখুন ।
অ্যান্ডি ডব্লিউ

@ অ্যানডাব্লিউ এটির জন্য এবং স্পষ্টতার জন্য ধন্যবাদ।
সেরবেরিস

@ অ্যানডাব্লু আহ যে কাগজপত্রগুলি আপনি লিঙ্ক করেছেন এটি বেশ কার্যকর! আমি সেগুলি প্রয়োগ করতে পারি কিনা তা দেখার জন্য আমি তাদের ঘনিষ্ঠভাবে নজর রাখতে হবে।
ক্যাম.ড্যাভিডসন.পিলন

3

আমি বিকল্প গ্রাফিকাল কৌশলগুলির জন্য একটি অনুরোধের জবাব দিচ্ছি যা দেখায় যে ব্যর্থতার ঘটনাগুলি যথাযথভাবে সিমুলেটেড ব্যর্থতার সাথে মেলে। প্রশ্নটি এখানে পাওয়া "প্র্যাকিবিলিস্টিক প্রোগ্রামিং এবং বেইসিয়ান পদ্ধতি হ্যাকারদের জন্য" পেয়েছিল । এখানে আমার গ্রাফিকাল পদ্ধতির:

সিমুলেটেড বনাম পর্যবেক্ষণ করা ও-রিং ব্যর্থতা

কোড এখানে পাওয়া যায় ।


আকর্ষণীয় - কেন আপনি এই কৌশলটি ব্যবহার করবেন সে সম্পর্কে কোনও যুক্তি দিতে পারেন? ভাগ করে নেওয়ার জন্য ধন্যবাদ!
ক্যাম.ড্যাভিডসন.পিলন

এটি একটি সম্ভাবনাময়, একটি নির্ণায়ক ফলাফল নয়। অতএব, আমি এমন একটি প্রতিনিধিত্বের সন্ধান করলাম যা বেশ কয়েকটি জিনিস পৌঁছে দেয়: ১) পর্যবেক্ষণ করা এবং পূর্বাভাসিত ইভেন্টগুলির পরিসর; 2: পূর্বাভাস ব্যর্থতার সম্ভাব্যতা বিতরণ; 3) পূর্বাভাস অ-ব্যর্থতার সম্ভাব্যতা বিতরণ; এবং 4) এমন ব্যপ্তি যেখানে ব্যর্থতা বেশি হয়, অ-ব্যর্থতা বেশি হয় এবং ব্যর্থতা এবং অ-ব্যর্থতার সম্ভাবনা ওভারল্যাপ হয় এমন সীমাগুলি। এই গ্রাফটি আমার চোখের সামনে সমস্ত কিছু দেখায়।
ব্যবহারকারী 35216

আরও কয়েকটি সংযোজন / স্পষ্টতা: ১) পর্যবেক্ষণ করা ও পূর্বাভাসিত ইভেন্টগুলির তাপমাত্রা পরিসীমা; 5) প্রকৃত পর্যবেক্ষণ ব্যর্থতা এবং অ-ব্যর্থতা
ব্যবহারকারী 35216
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.