লিনিয়ার রিগ্রেশন-এ আত্মবিশ্বাস ব্যান্ডগুলির আকার এবং গণনা বোঝা


33

আমি কোনও ওএলএস লিনিয়ার রিগ্রেশন সম্পর্কিত কার্ভড শেপযুক্ত কনফিডেন্স ব্যান্ডের উত্স এবং এটি কীভাবে রিগ্রেশন প্যারামিটারের (আচ্ছাদন এবং ইন্টারসেপ্ট) আত্মবিশ্বাসের অন্তরগুলির সাথে সম্পর্কিত তা বোঝার চেষ্টা করছি: উদাহরণস্বরূপ (আর ব্যবহার করে):

require(visreg)
fit <- lm(Ozone ~ Solar.R,data=airquality)
visreg(fit)

এখানে চিত্র বর্ণনা লিখুন

দেখা যাচ্ছে যে ব্যান্ডটি 2.5% ইন্টারসেপ্ট, এবং 97.5% opeালের পাশাপাশি 97.5% ইন্টারসেপ্ট এবং 2.5% opeাল (যদিও যথেষ্ট নয়) এর সাথে গণনা করা লাইনের সীমাটির সাথে সম্পর্কিত:

xnew <- seq(0,400)
int <- confint(fit)
lines(xnew, (int[1,2]+int[2,1]*xnew))
lines(xnew, (int[1,1]+int[2,2]*xnew))

এখানে চিত্র বর্ণনা লিখুন

আমি যা বুঝতে পারি না তা দুটি জিনিস:

  1. 2.5% opeাল এবং 2.5% ইন্টারসেপ্ট পাশাপাশি 97.5% slাল এবং 97.5% ইন্টারসেপ্টের সংমিশ্রণ সম্পর্কে কী বলা যায়? এইগুলি এমন লাইনগুলি দেয় যা উপরের প্লট করা ব্যান্ডের বাইরে স্পষ্ট। হতে পারে আমি আত্মবিশ্বাসের ব্যবধানের অর্থ বুঝতে পারি না, তবে যদি 95% ক্ষেত্রে আমার অনুমানগুলি আত্মবিশ্বাসের ব্যবধানের মধ্যে থাকে তবে এগুলি কোনও সম্ভাব্য পরিণতির মতো বলে মনে হচ্ছে?
  2. উপরের এবং নিম্ন সীমাটির মধ্যে ন্যূনতম দূরত্বটি কী নির্ধারণ করে (অর্থাত্ দুটি রেখাগুলি ইন্টারসেপ্টের উপরে সংযুক্ত যেখানে বিন্দুর নিকটে)?

আমি অনুমান করি যে উভয় প্রশ্নই উত্থাপিত হয়েছে কারণ আমি জানি না / বুঝতে পারি না যে এই ব্যান্ডগুলি আসলে গণনা করা হয়।

রিগ্রেশন প্যারামিটারের আত্মবিশ্বাসের ব্যবধানগুলি (পূর্বাভাসের উপর নির্ভর না করে) বা কোনও অনুরূপ ফাংশন, অর্থাৎ হাতে হাতে) কীভাবে আমি উচ্চ এবং নিম্ন সীমাটি গণনা করতে পারি? আমি আর-তে পূর্বাভাস.এলএম ফাংশনটি বোঝার চেষ্টা করেছি, তবে কোডিংটি আমার বাইরে। আমি প্রাসঙ্গিক সাহিত্য বা পরিসংখ্যান শুরুর জন্য উপযুক্ত ব্যাখ্যা জন্য কোন পয়েন্টার প্রশংসা করব।

ধন্যবাদ।


4
আপনার নীচে দুটি ভাল উত্তর আছে। আপনি যদি আরও তথ্য চান তবে এটি আমার উত্তরটি পড়তে আপনাকে এখানে সহায়তা করতে পারে: লিনিয়ার রিগ্রেশন প্রেডিকশন ইন্টারভাল , যা পূর্বাভাস অন্তরগুলির সাথে সম্পর্কিত তবে ধারণাটি খুব মিল।
গুং - মনিকা পুনরায়


সহায়ক উত্তর এবং দুর্দান্ত লিঙ্কগুলির জন্য টিএ।
ডেভিড

দয়া করে দেখুন: stats.stackexchange.com/a/397504/144543
ouranos

উত্তর:


19

Xগুলিওয়াই^এক্স

sY^X=sY|X1n+(XX¯)2i=1n(XiX¯)2

sY|X

sY|X=i=1n(YiY^)2n2

Y^±tν=n2,α/2sY^

YX

β^α^


1
এখানে এমন কোন পাঠ্যপুস্তক রয়েছে যা ব্যাখ্যা করে যে এই সূত্রগুলি কোথা থেকে এসেছে?
মাইকেল গার্জ

1
@ মিশেলগোয়ার্জ যে কোনও প্রারম্ভিক পরিসংখ্যান, বায়োস্ট্যাটিস্টিক্স, ইকোনোমেট্রিক্স ইত্যাদি পাঠ্যপুস্তকে সাধারণ ন্যূনতম স্কোয়ারগুলিকে রৈখিক প্রতিরোধের অন্তর্ভুক্ত থাকতে হবে।
অ্যালেক্সিস 4

আমার ওয়াসারম্যান - সমস্ত পরিসংখ্যান, জেমস এট আল - পরিসংখ্যান শিক্ষার পরিচিতি, এবং হাস্টি এট আল। - পরিসংখ্যান শিক্ষার উপাদানসমূহ। আমি তাদের কোনওটিতেই লিনিয়ার রিগ্রেশন কনফিডেন্স ব্যান্ডের সমীকরণগুলি খুঁজে পেতে সক্ষম হইনি। এগুলির যে কোনও একটি, বা অন্য কোনও বহুল পরিমাণে উপলভ্য বইয়ের জন্য আপনার কাছে একটি অধ্যায় / একিউ নম্বর রয়েছে?
মাইকেল গয়ের্স

2
আপনি যে বইগুলির উল্লেখ করেছেন তার কোনওটিই অ্যালেক্সিস যে ধরণের বই নিয়ে আলোচনা করছে তা নয়। ফলস রিগ্রেশন সম্পর্কিত ফক্সের বইটিতে এটি আছে যদি আমি সঠিকভাবে স্মরণ করি।
গ্লেন_বি -রিনস্টেট মনিকা

1
@ মিশেলগোয়ার্জ যেমন প্যাগানো, এম এবং গাউভেরু, কে। (2000) উভয়েই করেন। বায়োস্ট্যাটাস্টিকসের নীতিমালা । ডক্সবারি প্রেস, প্যাসিফিক গ্রোভ, সিএ, ২ য় সংস্করণ এবং গ্লান্টজ, এসএ (২০১১)। বায়োস্টাটিক্সের প্রাইমার । ম্যাকগ্রা-হিল মেডিকেল, নিউ ইয়র্ক, এনওয়াই, সপ্তম সংস্করণ যদিও তারা রিগ্রেশন-নির্দিষ্ট পাঠ্য নয়।
অ্যালেক্সিস

16

দুর্দান্ত প্রশ্ন। এই ধারণাগুলি বোঝা গুরুত্বপূর্ণ এবং সেগুলি সোজা নয়।

y¯y¯y¯

আমরা যখন সমস্ত সম্ভাব্য ইন্টারভ্যালের সমস্ত সংমিশ্রণ করি, প্রতিটি সম্ভাব্য এক্সের জন্য এটি আমাদের আউটপুটে দেখতে পাওয়া ধূসর ব্যান্ড দেয়।

এর কার্যকরী অর্থটি হ'ল আমরা 95% আত্মবিশ্বাসী যে সত্যিকারের রিগ্রেশন লাইন সেই ধূসর অঞ্চলের কোথাও রয়েছে।

যেহেতু আত্মবিশ্বাস ব্যান্ডগুলি প্রতিটি পৃথক পয়েন্টের জন্য 95% আস্থা অন্তর ব্যবহার করে গণনা করা হয়, এটি ইন্টারসেপ্টের জন্য 95% সিআইয়ের সাথে খুব ঘনিষ্ঠভাবে সম্পর্কিত। প্রকৃতপক্ষে, x = 0 এ ধূসর জোনের প্রান্তটি বিরতিটির জন্য 95% সিআইয়ের সাথে ঠিক মিলবে, কারণ আমরা আত্মবিশ্বাসের ব্যান্ডগুলি তৈরি করেছি। এজন্য আপনি উপরে যে লাইনগুলি যুক্ত করেছেন তা ধূসর ব্যান্ডের প্রান্তটি বাম দিকে আঘাত করে।

তবে opeাল কিছুটা আলাদা। এটি সীমাবদ্ধতায় অবদান রাখে, যেমন আপনি উপরে দেখেছেন, তবে lineালু এবং বিরতি কোনও লিনিয়ার রিগ্রেশন-এ পৃথক নয়। সুতরাং, আপনি সত্যই বলতে পারবেন না "ভাল কি তবে যদি ইন্টারসেপ্টটি সিআই পরিসরের নূন্যতম ছিল এবং opeালটিও সর্বনিম্ন ছিল?" এই লাইনটি এমন পয়েন্টগুলি উত্পন্ন করবে যেগুলি অনেকগুলি এক্স এর জন্য আমাদের 95% সিআই এর বাইরে রয়েছে। এর অর্থ আমরা 95% আত্মবিশ্বাসী যা আমাদের সত্যিকারের রিগ্রেশন লাইন নয়।

x¯sy^x(xx¯)x=x¯ this value is zero, so the standard error is smaller.

There's a decent powerpoint here that can help you visualize some of these things: http://www.stat.duke.edu/~tjl13/s101/slides/unit6lec3H.pdf


2
I think I fixed it - replaced the yhats with ybars. Is that more correct? I always screw up yhat.
Duncan

Ta. One thing that remains unclear to me is how to make the following two statements consistent: "What this functionally means is that we're 95% confident that the true regression line lies somewhere in that gray zone." vs "[...] the confidence intervals about the intercept and slope are yet other quantities." If the first statement is correct, there must be some (mathematical?) relation between the CIs of intercept and slope and the band plotted above? I guess this relates to a part of my question: How can I calculate (if possible) the band above using the CI's of slope and intercept?
David

1
You can't calculate the bands using just the CIs of slop and intercept because the bands are generated by calculating the CIs at each x. As the bands get tighter the closer you get to x¯ they'll deviate from the lines that the extreme values of CIs for slope and intercept generate.
Duncan

Nice understandable post and a nice link! +1
theforestecologist
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.