পাঁচ দফা সংক্ষিপ্তসার
হ্যাঁ, ধারণাটি হ'ল বিতরণটির দ্রুত সংক্ষিপ্তসার দেওয়া। এটি গড় সম্পর্কে মোটামুটি প্রতিসাম্যপূর্ণ হওয়া উচিত, মাঝারিটি 0 টির কাছাকাছি হওয়া উচিত, 1Q এবং 3Q মানগুলি আদর্শভাবে মোটামুটি একই মানের হতে হবে।
সহগ এবংβi^s
মডেলের প্রতিটি সহগ একটি গাউসিয়ান (সাধারণ) এলোমেলো পরিবর্তনশীল। যে দৈব চলক বিতরণের গড় হিসেব, এবং মান ত্রুটি যে বিতরণের ভ্যারিয়েন্সের বর্গমূল। এটা অনুমানে অনিশ্চয়তা একটি পরিমাপ ।βi^βi^
এগুলি কীভাবে উইকিপিডিয়ায় গণনা করা হয় (গাণিতিক সূত্রগুলি ভাল ব্যবহার করা হয়) তা দেখতে পারেন । নোট করুন যে কোনও স্ব-সম্মানজনক পরিসংখ্যান প্রোগ্রাম গণনা করার জন্য স্ট্যান্ডার্ড গাণিতিক সমীকরণগুলি ব্যবহার করবে না কারণ কম্পিউটারে সেগুলি করার ফলে গণনাগুলিতে নির্ভুলতার বড় ক্ষতি হতে পারে canβi^
t স্ট্যাটিস্টিকস
পরিসংখ্যান অনুমান ( ) তাদের মান ত্রুটি দ্বারা বিভক্ত ( ), যেমন। ধরে নিলাম আপনার কিউ এর মতো একই মডেল রয়েছে :tβi^σi^ti=βi^σi^mod
> mod <- lm(Sepal.Width ~ Petal.Width, data = iris)
এরপরে টিস্যুতে আর রিপোর্টগুলি হিসাবে গণনা করা হয়:t
> tstats <- coef(mod) / sqrt(diag(vcov(mod)))
(Intercept) Petal.Width
53.277950 -4.786461
কোথায় coef(mod)হয় , এবং মডেল পরামিতি কোভ্যারিয়েন্স ম্যাট্রিক্স তির্যক উপাদান, যা পরামিতি মান ত্রুটি হয় বর্গমূল দেয় ( )।βi^sqrt(diag(vcov(mod)))σi^
পি-মান হ'ল একটি অর্জন করার সম্ভাবনা যত বড় বা পরিলক্ষিত পরম টি মান নাল হাইপোথিসিস (যদি চেয়ে বড় ) সত্য ছিল, যেখানে হয় । এগুলি ( উপরে থেকে ব্যবহার করে ) হিসাবে গণনা করা হয় :|t|H0H0βi=0tstats
> 2 * pt(abs(tstats), df = df.residual(mod), lower.tail = FALSE)
(Intercept) Petal.Width
1.835999e-98 4.073229e-06
সুতরাং আমরা মডেলের স্বাধীনতার ডিগ্রী বাকী ডিগ্রির সমান স্বাধীনতার ডিগ্রি সহ একটি বিতরণ থেকে - মান অর্জনের উপরের লেজের সম্ভাব্যতাটি গণনা করি । এটি পর্যবেক্ষণকৃত এর পরম মানের চেয়ে বেশি মানের মান অর্জনের সম্ভাব্যতা উপস্থাপন করে । এটি 2 দ্বারা গুণিত হয়, কারণ অবশ্যই নেতিবাচক দিকেও বড় হতে পারে।ttttt
অবশিষ্ট স্ট্যান্ডার্ড ত্রুটি
অবশিষ্ট অবধি ত্রুটি প্যারামিটার একটি অনুমান । সাধারণ ন্যূনতম স্কোয়ারগুলিতে অনুমানটি হ'ল অবশিষ্টাংশগুলি পৃথকভাবে গড় 0 এবং স্ট্যান্ডার্ড বিচ্যুতি সহ গাউসীয় (সাধারণ) বন্টন দ্বারা পৃথকভাবে বর্ণনা করা হয় । ধ্রুবক ভ্যারিয়েন্স ধৃষ্টতা সম্পর্কিত; প্রতিটি অবশিষ্টাংশের একই বৈকল্পিকতা রয়েছে এবং সেই বৈকল্পিকটি । সমান ।σσσσ2
সমন্বিতR2
সমন্বিত এরূপে গণনা করা হয়:R2
1−(1−R2)n−1n−p−1
স্থায়ী হিসাবে একই জিনিস , কিন্তু (অর্থাত পরামিতি সংখ্যা) মডেল জটিলতা জন্য স্থায়ী। একটি নির্দিষ্ট প্যারামিটার সহ একটি মডেল দেওয়া হয়েছে, একটি নির্দিষ্ট , আমরা যদি এই মডেলটিতে অন্য একটি প্যারামিটার যুক্ত করি তবে নতুন মডেলের বৃদ্ধি করতে হবে, এমনকি যুক্ত পরামিতির কোনও পরিসংখ্যানীয় শক্তি না থাকলেও । অ্যাডজাস্ট করা এতে মডেলের পরামিতিগুলির সংখ্যা অন্তর্ভুক্ত করে forR2R2R2R2R2
F স্ট্যাটাস্টিক
দুই ভেরিয়ানস (অনুপাত ), ভ্যারিয়েন্স মডেল মাপদণ্ডগুলি (প্রত্যাবৃত্তি, SSR বর্গের সমষ্টি) এবং অবশিষ্ট বা অব্যাখ্যাত ভ্যারিয়েন্স (ত্রুটি বর্গের সমষ্টি, SSE) দ্বারা ব্যাখ্যা। আপনি যদি মডেলের জন্য আনোভা টেবিলটি পেয়ে থাকেন তবে আপনি এটি আরও ভাল দেখতে পাবেন :FSSR/SSEanova()
> anova(mod)
Analysis of Variance Table
Response: Sepal.Width
Df Sum Sq Mean Sq F value Pr(>F)
Petal.Width 1 3.7945 3.7945 22.91 4.073e-06 ***
Residuals 148 24.5124 0.1656
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
গুলি ANOVA আউটপুট এবং একই আউটপুট। কলাম দুই ভেরিয়ানস রয়েছে । আমরা 1 এবং 148 ডিগ্রির স্বাধীনতার ডিস্ট্রিবিউশন থেকে কোনও ডিস্ট্রিবিউশন থেকে কোনও কার্যকারিতার নাল অনুমানের অধীনে অর্জনের সম্ভাবনা গণনা করতে পারি । আনোভা সারণীর চূড়ান্ত কলামে এটিই জানা গেছে। একক, অবিচ্ছিন্ন ভবিষ্যদ্বাণীকারীর সাধারণ ক্ষেত্রে (আপনার উদাহরণ অনুসারে), , যে কারণে পি-মানগুলি একই। এই সমতুল্যতা কেবল এই সাধারণ ক্ষেত্রে ধারণ করে।Fsummary(mod)Mean Sq3.7945/0.1656=22.91FFF=t2Petal.Width