সামান্য ব্যাকগ্রাউন্ড
আমি রিগ্রেশন বিশ্লেষণের ব্যাখ্যার উপর কাজ করছি তবে আমি r, r স্কোয়ারড এবং অবশিষ্ট স্ট্যান্ডার্ড বিচ্যুততার অর্থ সম্পর্কে সত্যিই বিভ্রান্ত হয়ে পড়েছি। আমি সংজ্ঞাগুলি জানি:
Characterizations
r একটি স্ক্যাটারপ্লোটে দুটি ভেরিয়েবলের মধ্যে রৈখিক সম্পর্কের শক্তি এবং দিকের পরিমাপ করে
আর-স্কোয়ারটি ফিটেড রিগ্রেশন লাইনের সাথে ডেটা কতটা কাছাকাছি তার পরিসংখ্যানগত পরিমাপ।
রেসিডুয়াল স্ট্যান্ডার্ড বিচ্যুতি হ'ল একটি পরিসংখ্যানীয় শব্দ যা লিনিয়ার ফাংশনটির চারপাশে গঠিত পয়েন্টগুলির স্ট্যান্ডার্ড বিচ্যুতি বর্ণনা করতে ব্যবহৃত হয় এবং এটি নির্ভরশীল পরিবর্তনশীল পরিমাপের নির্ভুলতার একটি অনুমান esti ( ইউনিটগুলি কী তা জানেন না, এখানে ইউনিটগুলি সম্পর্কে কোনও তথ্য সহায়ক হবে )
(সূত্র: এখানে )
প্রশ্ন
যদিও আমি বৈশিষ্ট্যগুলি "বুঝতে" পারি, তবুও আমি বুঝতে পারি কীভাবে এই পদগুলি ডেটাসেট সম্পর্কে কোনও উপসংহার আঁকতে সহায়তা করে। আমি এখানে একটি সামান্য উদাহরণ সন্নিবেশ করবো, সম্ভবত এটি আমার প্রশ্নের উত্তর দেওয়ার জন্য গাইড হিসাবে পরিবেশন করতে পারে ( আপনার নিজের উদাহরণ ব্যবহার করতে নির্দ্বিধায়!)
উদাহরণ
এটি কোনও হুবহু প্রশ্ন নয়, তবে আমি একটি সাধারণ উদাহরণ পেতে আমার বইতে অনুসন্ধান করেছি (আমি যে বর্তমান ডেটাসেটটি বিশ্লেষণ করছি তা এখানে দেখানোর জন্য খুব জটিল এবং বড়)
প্রতিটি দশ x 4 মিটার বিশটি প্লট এলোমেলোভাবে ভুট্টার একটি বৃহত ক্ষেত্রটিতে বেছে নেওয়া হয়েছিল। প্রতিটি প্লটের জন্য, উদ্ভিদের ঘনত্ব (প্লটে গাছের সংখ্যা) এবং গড় শখের ওজন (প্রতি কর্কে শস্যের গ্রাম) লক্ষ্য করা যায়। ফলাফলগুলি নিম্নলিখিত সারণিতে জিভিন:
(উত্স: জীবন বিজ্ঞানের পরিসংখ্যান )
╔═══════════════╦════════════╦══╗
║ Platn density ║ Cob weight ║ ║
╠═══════════════╬════════════╬══╣
║ 137 ║ 212 ║ ║
║ 107 ║ 241 ║ ║
║ 132 ║ 215 ║ ║
║ 135 ║ 225 ║ ║
║ 115 ║ 250 ║ ║
║ 103 ║ 241 ║ ║
║ 102 ║ 237 ║ ║
║ 65 ║ 282 ║ ║
║ 149 ║ 206 ║ ║
║ 85 ║ 246 ║ ║
║ 173 ║ 194 ║ ║
║ 124 ║ 241 ║ ║
║ 157 ║ 196 ║ ║
║ 184 ║ 193 ║ ║
║ 112 ║ 224 ║ ║
║ 80 ║ 257 ║ ║
║ 165 ║ 200 ║ ║
║ 160 ║ 190 ║ ║
║ 157 ║ 208 ║ ║
║ 119 ║ 224 ║ ║
╚═══════════════╩════════════╩══╝
প্রথমে আমি ডেটা ভিজ্যুয়ালাইজ করার জন্য একটি স্ক্যাটারপ্লট তৈরি করব:
সুতরাং আমি আর, আর 2 এবং অবশিষ্টগুলি স্ট্যান্ডার্ড বিচ্যুতি গণনা করতে পারি ।
প্রথম পারস্পরিক সম্পর্ক পরীক্ষা:
Pearson's product-moment correlation
data: X and Y
t = -11.885, df = 18, p-value = 5.889e-10
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.9770972 -0.8560421
sample estimates:
cor
-0.9417954
এবং দ্বিতীয়ত: রিগ্রেশন লাইনের একটি সংক্ষিপ্তসার:
Residuals:
Min 1Q Median 3Q Max
-11.666 -6.346 -1.439 5.049 16.496
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 316.37619 7.99950 39.55 < 2e-16 ***
X -0.72063 0.06063 -11.88 5.89e-10 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 8.619 on 18 degrees of freedom
Multiple R-squared: 0.887, Adjusted R-squared: 0.8807
F-statistic: 141.3 on 1 and 18 DF, p-value: 5.889e-10
সুতরাং এই পরীক্ষার উপর ভিত্তি করে: r = -0.9417954
, আর-স্কোয়ার্ড: 0.887
এবং অবশিষ্টাংশের মান ত্রুটি: 8.619
এই মানগুলি ডেটাসেট সম্পর্কে আমাদের কী বলে? ( প্রশ্ন দেখুন )