অনুমানের জন্য একটি টি বিতরণ কেন লিনিয়ার রিগ্রেশন সহগ পরীক্ষার জন্য ব্যবহৃত হয়?


17

অনুশীলনে, লিনিয়ার রিগ্রেশন সহগের তাত্পর্য পরীক্ষা করার জন্য একটি স্ট্যান্ডার্ড টি-টেস্ট ব্যবহার করা সাধারণ অভ্যাস। গণনার যান্ত্রিকতা আমাকে বোঝায়।

কেন এটি টি-বিতরণ লিনিয়ার রিগ্রেশন হাইপোথিসিস টেস্টিংয়ে ব্যবহৃত স্ট্যান্ডার্ড টেস্টের পরিসংখ্যানকে মডেল করতে ব্যবহার করা যেতে পারে? স্ট্যান্ডার্ড পরীক্ষার পরিসংখ্যান আমি এখানে উল্লেখ করছি:

T0=β^β0SE(β^)

এই প্রশ্নের একটি সম্পূর্ণ এবং সম্পূর্ণ উত্তর বেশ দীর্ঘ হবে, আমি নিশ্চিত। সুতরাং আপনি যখন কারও সাথে এটি মোকাবেলা করার জন্য অপেক্ষা করছেন, আপনি অনলাইনে এখানে পাওয়া কয়েকটি নোটগুলি দেখে এটি কেন হয় তা সম্পর্কে আপনি বেশ ভাল ধারণা পেতে পারেন: onlinecourses.sज्ञान . psu.edu/stat501/node/297 । বিশেষভাবে নোট করুন যে t(np)2=F(1,np)
স্ট্যাটাস স্টুডেন্ট

1
আমি বিশ্বাস করতে পারছি না এই সদৃশ নয়, এবং এখনো সব upvotes (উভয় প্রশ্ন ও উত্তর দিকে) ... কি এই ? বা সম্ভবত এটি কোনও সদৃশ নয়, যার অর্থ এখানে রয়েছে (বা আজ অবধি ছিল) অতি-মৌলিক বিষয়গুলি যা ক্রস ভ্যালিডেটেডের প্রায় সাত বছরের অস্তিত্বের আওতায় আসে নি ... বাহ ...
রিচার্ড হার্ডি

পুনঃটুইট যদিও এটা আরো বাগাড়ম্বরপূর্ণ, প্রশ্ন বিশেষভাবে হল: "আমি কিভাবে যে প্রমাণ করতে পারেন β আমি , β আমি - β আমিβ^i"β^iβisβ^itnk
ফায়ারবাগকে

উত্তর:


26

বোঝার জন্য কেন আমরা টি-ডিস্ট্রিবিউশান ব্যবহার করেন, আপনি জানেন যে অন্তর্নিহিত বন্টন কি প্রয়োজন β এবং বর্গের অবশিষ্ট সমষ্টি (এর আর এস এস ) এই দুই করা একসঙ্গে আপনি টি-ডিস্ট্রিবিউশান দিতে হবে।β^RSS

সহজ অংশ বিতরণের হয় β যা সাধারন বন্টনের হয় - এই নোটটি দেখতে β = ( এক্স টি এক্স ) - 1 এক্স টি ওয়াই তাই এটি একটি রৈখিক ফাংশন ওয়াই যেখানে ওয়াই ~ এন ( এক্স β , σ 2 আমি এন ) । এর ফলে এটি স্বাভাবিকভাবে বিতরণ করা হয়, β ~ এন ( β , σ 2 ( এক্স টি এক্স ) -β^β^(XTX)1XTYYYN(Xβ,σ2In)- আপনি বিতরণের আহরিত সাহায্যের প্রয়োজন হয় তাহলে আমাকে জানাতে ββ^N(β,σ2(XTX)1)β^

অতিরিক্তভাবে, , যেখানে এন হল পর্যবেক্ষণের সংখ্যা এবং পি হল আপনার প্রতিরোধে ব্যবহৃত পরামিতিগুলির সংখ্যা। এর প্রমাণটি আরও কিছুটা জড়িত, তবে সরাসরি প্রাপ্তও সরাসরি (এখানে প্রমাণ দেখুন কেন চিএস বর্গ বার এনপি বিতরণ করা হয়? )।RSSσ2χnp2np

আপ এই বিন্দু পর্যন্ত আমি ম্যাট্রিক্স / ভেক্টর স্বরলিপি সবকিছু বিবেচনা করেছেন, কিন্তু সরলতা ব্যবহারের জন্য চল β আমি এবং তার স্বাভাবিক বন্টন ব্যবহার যা আমাদের দিতে হবে: β আমি - β আমিβ^i

β^iβiσ(XTX)ii1N(0,1)

অতিরিক্তভাবে, এর চি-স্কোয়ার বিতরণ থেকে আমাদের তা রয়েছে: ( এন - পি ) এর 2RSS

(np)s2σ2χnp2

এটি কেবল প্রথম চি-স্কোয়ার এক্সপ্রেশনটির পুনরায় সাজানো ছিল এবং এটি । অতিরিক্তভাবে, আমরা এস 2 = আর এস এসকে সংজ্ঞায়িত করিN(0,1) , যাσ2 এরজন্য একটি নিরপেক্ষ অনুমানক। সংজ্ঞামতেটিএন-পিসংজ্ঞা যে একটি স্বাধীন চি-ছক (স্বাধীনতা তার ডিগ্রী বেশি) আপনি একটি টি-বন্টন (প্রমাণ দেখুন দেয় একটি সাধারণ বন্টনের বিভাজক:একটি স্বাভাবিক দ্বারা বিভক্তs2=RSSnpσ2tnp আপনাকে একটি টি-বিতরণ - প্রমাণ দেয়χ2(s)/sযা আপনি পান:

β^iβis(XTX)ii1tnp

Where s(XTX)ii1=SE(β^i).

Let me know if it makes sense.


what a great answer! could you please explain why
β^iβiσ(XTX)ii1N(0,1)
?
KingDingeling

4

The answer is actually very simple: you use t-distribution because it was pretty much designed specifically for this purpose.

Ok, the nuance here is that it wasn't designed specifically for the linear regression. Gosset came up with distribution of sample that was drawn from the population. For instance, you draw a sample x1,x2,,xn, and calculate its mean x¯=i=1nxi/n. What is the distribution of a sample mean x¯?

If you knew the true (population) standard deviation σ, then you'd say that the variable ξ=(x¯μ)n/σ is from the standard normal distribution N(0,1). The trouble's that you usually do not know σ, and can only estimate it σ^. So, Gosset figured out the distribution when you substitute σ with σ^ in the denominator, and the distribution is now called after his pseduonym "Student t".

The technicalities of linear regression lead to a situation where we can estimate the standard error σ^β of the coefficient estimate β^, but we do not know the true σ, therefore Student t distribution is applied here too.

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.