এটি সমস্ত কীভাবে আপনি প্যারামিটারগুলি অনুমান করেন তার উপর নির্ভর করে । সাধারণত, অনুমানকারীগুলি লিনিয়ার হয়, যা বোঝায় যে অবশিষ্টাংশগুলি ডেটার লিনিয়ার ফাংশন। যখন ত্রুটি একটি সাধারণ বন্টনের আছে, তারপর তাই তথ্য না কোথা তাই অবশিষ্টাংশ না তোমার দর্শন লগ করা আমি ( আমি ইনডেক্স তথ্য মামলা অবশ্যই,)।তোমার দর্শন লগ করাআমিতোমার দর্শন লগ করা^আমিআমি
এটি অনুমেয়যোগ্য (এবং যুক্তিযুক্তভাবে সম্ভব) যে অবশিষ্টাংশগুলিতে আনুমানিক একটি সাধারণ (অবিবাহিত) বন্টন উপস্থিত দেখা যায়, যা ত্রুটির অ-সাধারণ বিতরণ থেকে উদ্ভূত হয় । তবে, কমপক্ষে স্কোয়ার (বা সর্বাধিক সম্ভাবনা) কৌশলগুলি অনুমানের সাথে, অবশিষ্টাংশগুলি গণনা করার ক্ষেত্রে রৈখিক রূপান্তরটি "মৃদু" অর্থে যে অবশিষ্টাংশগুলির (বহুবিধ) বন্টনের বৈশিষ্ট্যগত কার্য ত্রুটির সিএফ থেকে অনেকগুলি পৃথক হতে পারে না ।
বাস্তবে, আমরা কখনো প্রয়োজন যা ত্রুটির করা ঠিক , সাধারণত বিতরণ তাই এই একটি গুরুত্বহীন বিষয়। ত্রুটিগুলির জন্য আরও বৃহত্তর আমদানি হ'ল (১) তাদের প্রত্যাশাগুলি সমস্তই শূন্যের কাছাকাছি হওয়া উচিত; (২) তাদের পারস্পরিক সম্পর্ক কম হওয়া উচিত; এবং (3) স্বীকৃত স্বল্প সংখ্যক বহির্মুখী মান থাকতে হবে। এগুলি পরীক্ষা করতে, আমরা বিভিন্ন ধার্মিকতা-ফিট-টেস্ট, পারস্পরিক সম্পর্ক পরীক্ষা এবং আউটলিয়ারদের (যথাক্রমে) অবশিষ্টাংশের পরীক্ষাগুলি প্রয়োগ করি। সাবধানতার সাথে রিগ্রেশন মডেলিংয়ে সর্বদা এ জাতীয় পরীক্ষা চালানো অন্তর্ভুক্ত থাকে (যার মধ্যে অবশিষ্টাংশগুলির বিভিন্ন গ্রাফিকাল ভিজ্যুয়ালাইজেশন অন্তর্ভুক্ত থাকে, যেমন plot
কোনও lm
শ্রেণিতে প্রয়োগ করার সময় আর এর পদ্ধতি দ্বারা স্বয়ংক্রিয়ভাবে সরবরাহ করা হয় )।
এই প্রশ্নে উঠার আরেকটি উপায় হ'ল হাইপোথাইজড মডেল থেকে অনুকরণ করে। কাজটি করার জন্য এখানে কয়েকটি (ন্যূনতম, এক-অফ) R
কোড রয়েছে:
# Simulate y = b0 + b1*x + u and draw a normal probability plot of the residuals.
# (b0=1, b1=2, u ~ Normal(0,1) are hard-coded for this example.)
f<-function(n) { # n is the amount of data to simulate
x <- 1:n; y <- 1 + 2*x + rnorm(n);
model<-lm(y ~ x);
lines(qnorm(((1:n) - 1/2)/n), y=sort(model$residuals), col="gray")
}
#
# Apply the simulation repeatedly to see what's happening in the long run.
#
n <- 6 # Specify the number of points to be in each simulated dataset
plot(qnorm(((1:n) - 1/2)/n), seq(from=-3,to=3, length.out=n),
type="n", xlab="x", ylab="Residual") # Create an empty plot
out <- replicate(99, f(n)) # Overlay lots of probability plots
abline(a=0, b=1, col="blue") # Draw the reference line y=x
কেস এন = 32 এর জন্য, 99 টি অবশিষ্টাংশের এই ওভারলড সম্ভাব্যতা প্লটটি দেখায় যে তারা ত্রুটি বিতরণ (যা সাধারণ স্বাভাবিক) এর কাছাকাছি থাকে কারণ তারা রেফারেন্স লাইনে অবিচ্ছিন্নভাবে আঁকড়ে থাকে :Y= এক্স
এন = case ক্ষেত্রে, সম্ভাব্যতা প্লটগুলির মধ্যে ছোট মাঝারি opeাল ইঙ্গিত দেয় যে অবশিষ্টাংশগুলি ত্রুটিগুলির তুলনায় কিছুটা ছোট পার্থক্য রাখে, তবে সামগ্রিকভাবে তারা সাধারণত বিতরণ করতে থাকে, কারণ তাদের বেশিরভাগ রেফারেন্স লাইন পর্যাপ্তভাবে ট্র্যাক করে থাকে (প্রদত্ত প্রদত্ত ছোট মান ):এন