রৈখিক প্রতিরোধের সহগের মানক ত্রুটিগুলি কীভাবে ব্যাখ্যা করবেন?


26

আমি ভাবছি যে আর-তে ডিসপ্লে ফাংশনটি ব্যবহার করার সময় কোনও রিগ্রেশনটির সহগের মান সহকারী ত্রুটিগুলি কীভাবে ব্যাখ্যা করা যায়

উদাহরণস্বরূপ নিম্নলিখিত আউটপুট:

lm(formula = y ~ x1 + x2, data = sub.pyth)
        coef.est coef.se
(Intercept) 1.32     0.39   
x1          0.51     0.05   
x2          0.81     0.02   

n = 40, k = 3
residual sd = 0.90, R-Squared = 0.97

একটি উচ্চতর স্ট্যান্ডার্ড ত্রুটি কি আরও তাত্পর্য বোঝায়?

এছাড়াও অবশিষ্টাংশের মানক বিচ্যুতির জন্য, উচ্চতর মানের অর্থ বৃহত্তর ছড়িয়ে পড়া, তবে আর স্কোয়ার্ড একটি খুব ঘনিষ্ঠ ফিট দেখায়, এটি কি বৈপরীত্য নয়?

উত্তর:


52

প্যারামিটারের অনুমানগুলি, যেমন একটি নমুনা গড় বা ওএলএস রিগ্রেশন সহগের মতো, নমুনা পরিসংখ্যান যা আমরা সম্পর্কিত জনসংখ্যার পরামিতিগুলি সম্পর্কে সূত্রগুলি আঁকতে ব্যবহার করি। জনসংখ্যার প্যারামিটারগুলি হ'ল আমরা সত্যই যত্নশীল তবে আমাদের পুরো জনসংখ্যার অ্যাক্সেস নেই (সাধারণত অসীম বলে ধরে নেওয়া হয়), পরিবর্তে আমাদের অবশ্যই এই পদ্ধতির ব্যবহার করতে হবে। যাইহোক, কিছু অস্বস্তিকর তথ্য রয়েছে যা এই পদ্ধতির সাথে আসে। উদাহরণস্বরূপ, আমরা যদি অন্য কোনও নমুনা নিয়েছি এবং আবার প্যারামিটারটি অনুমান করার জন্য পরিসংখ্যান গণনা করি, আমরা প্রায় অবশ্যই এটি পৃথক করে দেখতে পাব। তদুপরি, কোনও অনুমানই আমরা জানতে চাইলে সত্য পরামিতি মানটির সাথে বেশ মেলে। প্রকৃতপক্ষে, আমরা যদি চূড়ান্তভাবে এই কাজটি করে থাকি এবং চিরকালের জন্য নমুনা এবং অনুমান করে চলেছি, আমরা দেখতে পাই যে বিভিন্ন প্রাক্কলন মানগুলির আপেক্ষিক ফ্রিকোয়েন্সি সম্ভাব্যতা বন্টনকে অনুসরণ করে। কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি পরামর্শ দেয় যে এই বিতরণটি স্বাভাবিক হওয়ার সম্ভাবনা রয়েছে। আমাদের সেই বিতরণে কতটা অনিশ্চয়তা রয়েছে তা পরিমাপ করার একটি উপায় প্রয়োজন। এটি আপনার জন্য স্ট্যান্ডার্ড ত্রুটিটি করে।

আপনার উদাহরণে, আপনি জনসংখ্যার মধ্যে x1 এবং y এর মধ্যে লিনিয়ার সম্পর্কের opeাল জানতে চান, তবে আপনার কেবলমাত্র আপনার নমুনাতে অ্যাক্সেস রয়েছে। আপনার নমুনায়, সেই opeালটি .51, তবে এর সাথে কতটা পরিবর্তনশীলতা রয়েছে তা জেনেও নমুনা বিতরণের of সংখ্যাটি কী তৈরি করা যায় তা জানা মুশকিল। এই ক্ষেত্রে স্ট্যান্ডার্ড ত্রুটি, .05 হল সেই নমুনা বিতরণের মানক বিচ্যুতি। তাত্পর্য গণনা করতে, আপনি এসই দ্বারা অনুমানটি ভাগ করে এবং টেবিলের উপর ভাগফলটি সন্ধান করেন। সুতরাং, বৃহত্তর এসইগুলি নিম্ন তাত্পর্য বোঝায় ।

আপনার opালু স্যাম্পলিং বিতরণের সাথে অবশিষ্টাংশের মানক বিচ্যুতির কোনও সম্পর্ক নেই। এটি আপনার মডেলটিতে শর্তযুক্ত আপনার নমুনার মানক বিচ্যুতি। কোনও দ্বন্দ্ব নেই, হতেও পারে না। আপনার কীভাবে একটি উচ্চ আর only 2 এবং কেবল 40 ডেটা পয়েন্ট সহ একটি বৃহত্তর এসডি রয়েছে, আমি অনুমান করব যে আপনার সীমার সীমাবদ্ধতার বিপরীত রয়েছে - আপনার এক্স মানগুলি খুব ব্যাপকভাবে ছড়িয়ে পড়ে।


দুর্দান্ত এবং খুব পরিষ্কার উত্তর! সুতরাং মূলত দ্বিতীয় প্রশ্নের জন্য এসডি অনুভূমিক বিভাজনকে নির্দেশ করে এবং আর ^ 2 সামগ্রিক ফিট বা উল্লম্ব বিস্তারের ইঙ্গিত দেয়?

7
@ ডিবিআর, সাহায্য করে খুশি। সাধারণত আমরা অনুভূমিক অক্ষের উপর অনুভূমিক অক্ষ এবং প্রেডিকটার ভেরিয়েবল হিসাবে প্রতিক্রিয়ার ভেরিয়েবলটি ভাবি think এই সেটআপের সাহায্যে সমস্ত কিছুই উল্লম্ব - রিগ্রেশন পূর্বাভাস এবং প্রতিক্রিয়া পরিবর্তনশীল (এসএসই) এর মধ্যে উল্লম্ব দূরত্বকে হ্রাস করছে। তেমনিভাবে, অবশিষ্টাংশ এসডি হ'ল পূর্বাভাসিত মানগুলির জন্য গণনা করার পরে উল্লম্ব বিচ্ছুরণের একটি পরিমাপ। পরিশেষে, আর ^ 2 হ'ল আপনার ভবিষ্যদ্বাণীগুলির উল্লম্ব ছড়িয়ে দেওয়ার অনুপাত যা আপনার কাঁচা ডেটার মোট উল্লম্ব বিস্তারের সাথে।
গুং - মনিকা পুনরায়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.