হিটারোস্কেস্টাস্টিটি এবং অবশিষ্টাংশগুলির স্বাভাবিকতা


12

আমার একটি লিনিয়ার রিগ্রেশন রয়েছে যা বেশ ভাল, আমি অনুমান করি (এটি কোনও বিশ্ববিদ্যালয় প্রকল্পের জন্য যাতে আমার সত্যিকারের নির্ভুল হতে হবে না)।

পয়েন্টটি হ'ল, যদি আমি অবশিষ্টাংশ বনাম পূর্বাভাসিত মানগুলি প্লট করি তবে সেখানে (আমার শিক্ষকের মতে) হিটারোস্কেস্টাস্টিটির একটি ইঙ্গিত রয়েছে।

তবে আমি যদি অবশিষ্টাংশের কিউকিউ-প্লট প্লট করি তবে এটি স্পষ্ট যে তারা সাধারণত বিতরণ করা হয়। অধিকন্তু, অবশিষ্টাংশ উপর শাপিরো পরীক্ষা হয়েছে এর -value 0.8 তাই আমি মনে করি কোন সন্দেহ অবশিষ্টাংশ আসলে স্বাভাবিকভাবে বিতরণ করা হয় আছে।p0.8

প্রশ্ন: যদি অবশিষ্টাংশগুলি সাধারণত বিতরণ করা হয় তবে কীভাবে পূর্বাভাসিত মানগুলিতে বৈকল্পিকতা থাকতে পারে?


1
@ হুবুহুদের উত্তরের উত্তরে একটি খুব সংক্ষিপ্ত সংযোজন: আপনি হেটেরোসেসডাস্টিকটির জন্য একটি আনুষ্ঠানিক পরীক্ষা করার জন্য গাড়ী প্যাকেজেরncvTest ফাংশনটি ব্যবহার করতে পারেন । Whuber এর উদাহরণে, কমান্ডটি একটি পি- মূল্য দেয় যা প্রায় শূন্য এবং ধ্রুব ত্রুটির পরিবর্তনের বিরুদ্ধে দৃ strong ় প্রমাণ সরবরাহ করে (যা অবশ্যই প্রত্যাশিত ছিল)। RncvTest(fit)p
COOLSerdash

উত্তর:


16

এই প্রশ্নের কাছে যাওয়ার একটি উপায় হ'ল এটির বিপরীত দিকে নজর দেওয়া: কীভাবে আমরা সাধারণভাবে বিতরণ করা অবশিষ্টাংশগুলি দিয়ে শুরু করতে পারি এবং সেগুলি হেটেরোসেসটাস্টিক হওয়ার ব্যবস্থা করতে পারি? এই দৃষ্টিকোণ থেকে উত্তরটি সুস্পষ্ট হয়ে ওঠে: ছোট্ট রেসিডুয়ালগুলিকে আরও ছোট পূর্বাভাসিত মানগুলির সাথে যুক্ত করুন।

উদাহরণস্বরূপ, এখানে একটি স্পষ্ট নির্মাণ রয়েছে।

ব্যক্তিত্ব

বাম দিকের ডেটাগুলি লিনিয়ার ফিটের সাথে পরিষ্কারভাবে হেটেরোসেসটেস্টিক (লাল রঙে দেখানো)। এই অবশিষ্টাংশ বাড়িতে চালিত হয় বনাম ডানদিকে পূর্বাভাস চক্রান্ত। তবে - নির্মাণের মাধ্যমে - অচিরাচরিত অবরুদ্ধদের সেটটি সাধারণত বিতরণের কাছাকাছি হয়, যেমন মধ্যম শোতে তাদের হিস্টোগ্রাম। (স্বাভাবিকের শাপিরো-উইলক পরীক্ষার পি-মানটি 0.60, নীচের কোডটি চালানোর পরে জারি করা Rকমান্ডের সাথে পাওয়া যায় shapiro.test(residuals(fit))))

বাস্তব তথ্যও এর মতো দেখতে পারে। নৈতিকতা হিটরোসসিডাস্টিটিটি অবশিষ্টাংশ এবং ভবিষ্যদ্বাণীগুলির মধ্যে একটি সম্পর্কের বৈশিষ্ট্যকে চিহ্নিত করে, যেখানে অবশিষ্টতাগুলি অন্য কোনও কিছুর সাথে কীভাবে সম্পর্কযুক্ত তা সম্পর্কে স্বাভাবিকতা আমাদের কিছুই বলে না।


Rএই নির্মাণের জন্য কোড এখানে ।

set.seed(17)
n <- 256
x <- (1:n)/n                       # The set of x values
e <- rnorm(n, sd=1)                # A set of *normally distributed* values
i <- order(runif(n, max=dnorm(e))) # Put the larger ones towards the end on average
y <- 1 + 5 * x + e[rev(i)]         # Generate some y values plus "error" `e`.
fit <- lm(y ~ x)                   # Regress `y` against `x`.
par(mfrow=c(1,3))                  # Set up the plots ...
plot(x,y, main="Data", cex=0.8)
abline(coef(fit), col="Red")
hist(residuals(fit), main="Residuals")
plot(predict(fit), residuals(fit), cex=0.8, main="Residuals vs. Predicted")

2
ঠিক আছে তাই আপনি বলছেন যে আমি যদি উচ্চ পূর্বাভাসিত মানগুলির সাথে স্বল্প অবশিষ্টাংশগুলিকে যুক্ত করি তবে অবশিষ্টাংশগুলি সাধারণত বিতরণ করা গেলেও হেটেরোসেসটাস্টিটিটি উত্থিত হতে পারে? আমি মনে করি এটি পেয়েছি, যদিও আমার এটি সম্পর্কে সত্যই আরও চিন্তা করা উচিত .. যাইহোক আপনাকে ধন্যবাদ!
পিপীলিকা

... বা কম পূর্বাভাসিত মানগুলি (যেমন এখানে উদাহরণ হিসাবে), বা আরও জটিল উপায়ে কম অবশিষ্টাংশ। উদাহরণস্বরূপ, বেঁচে থাকার গড় পরিধি যখন পূর্বাভাসিত মানটি দিয়ে দোলায়। (হেটেরোসেসটাস্টিটির সর্বাধিক আনুষ্ঠানিক পরীক্ষাগুলি এটি সনাক্ত করতে পারে না তবে সাধারণ ডায়াগনস্টিক প্লটগুলি স্পষ্টভাবে এটি প্রদর্শন করবে))
শুক্রবার

0

ওয়েটড ন্যূনতম স্কোয়ার্স (ডাব্লুএলএস) রিগ্রেশন-এ, আনুমানিক অবশিষ্টাংশগুলির এলোমেলো কারণগুলি যা আপনি দেখতে সক্ষম হতে পারেন তা সাধারণত বিতরণ করা হয়, যদিও এটি প্রায়শই ভয়ঙ্করভাবে গুরুত্বপূর্ণ নয়। আনুমানিক অবশিষ্টাংশগুলি 1 (পৃষ্ঠার নীচের অংশে) একটি সাধারণ (এক নিবন্ধক এবং উত্সর মাধ্যমে) রিগ্রেশন কেস হিসাবে দেখানো হয়েছে, যেমন https://www.researchgate.net/publication এর 2 এবং 7 পৃষ্ঠার নীচের অংশে প্রদর্শিত হবে / 263036348_ প্রপার্টি_স_উইটাইট_লাইস্ট_সোয়ারস_আগ্রেশন_স_কুটফ_সাম্পলিং_ইন_এস্টাব্লিশমেন্ট_সার্ভেস যাই হোক না কেন, ছবিতে স্বাভাবিকতা কোথায় আসতে পারে তা দেখাতে এটি সহায়তা করতে পারে।


@ জিমকনৌব, সাইটে আপনাকে স্বাগতম। মাঝেমধ্যে প্রশ্নে আপনার দক্ষতা toণ দেওয়ার জন্য আমরা আপনার কাছাকাছি থাকতে চাই। কেন আপনার অ্যাকাউন্ট নিবন্ধন করবেন না? আমাদের সহায়তা কেন্দ্রের আমার অ্যাকাউন্ট বিভাগে আপনি কীভাবে তা জানতে পারেন । যেহেতু আপনি এখানে নতুন, আপনি আমাদের সফর নিতে চাইতে পারেন , যাতে নতুন ব্যবহারকারীদের জন্য তথ্য রয়েছে।
গুং - মনিকা পুনরায়

3
আমরা প্রশ্নোত্তর আকারে উচ্চমানের পরিসংখ্যান সম্পর্কিত তথ্যের একটি স্থায়ী সংগ্রহস্থল তৈরি করার চেষ্টা করছি। সুতরাং, আমরা লিঙ্করোটের কারণে লিঙ্কগুলির উপর নির্ভরশীল এমন উত্তরগুলি থেকে সতর্ক থাকি। আপনি কি লিঙ্কটি থেকে একটি সম্পূর্ণ উদ্ধৃতি এবং তথ্যের একটি সংক্ষিপ্তসার (উদাহরণস্বরূপ, পরিসংখ্যান / ব্যাখ্যা) পোস্ট করতে পারেন যাতে লিঙ্কটি মারা গেলেও তথ্য কার্যকর থাকবে?
গুং - মনিকা পুনরায়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.