সাধারণ অবশিষ্টাংশগুলি কী বোঝায় এবং এটি আমার ডেটা সম্পর্কে আমাকে কী বলে?


13

খুব বেসিক প্রশ্ন:

লিনিয়ার রিগ্রেশন থেকে অবশিষ্টাংশের সাধারণ বিতরণ বলতে কী বোঝায়? পদগুলির ক্ষেত্রে, এটি রিগ্রেশন থেকে আমার মূল ডেটার উপর কীভাবে প্রতিবিম্বিত করে?

আমি সম্পূর্ণ স্টাম্পড, ধন্যবাদ ছেলেরা

উত্তর:


5

লিনিয়ার রিগ্রেশন আসলে আপনার ফলাফলের শর্তসাপেক্ষ প্রত্যাশিত মানকে মডেল করে। এর অর্থ: আপনি যদি রিগ্রেশন প্যারামিটারগুলির প্রকৃত মান জানতেন (বলুন এবং ), আপনার পূর্বাভাসকারী এক্স এর মান দেওয়া হয়েছে, সমীকরণটি করবে আপনি কি সমস্ত (সম্ভাব্য) পর্যবেক্ষণে জন্য প্রত্যাশিত মানটি জন্য এই প্রদত্ত মানটি গণনা করেছেন ?β 1[ ওয়াই | এক্স ] = β 0 + β 1 এক্স ওয়াই এক্সβ0β1

E[Y|X]=β0+β1X
YX

তবে: আপনি প্রদত্ত মানটির (শর্তসাপেক্ষ) অর্থের সমান হতে পারে এমন কোনও মান সত্যই প্রত্যাশা করবেন না । আপনার মডেলটি ভুল বলে নয়, তবে এমন কিছু প্রভাব রয়েছে যার জন্য আপনি দায়বদ্ধ হন নি (যেমন: পরিমাপের ত্রুটি)। সুতরাং প্রদত্ত মানের এই মানগুলি গড় মানের (যেমন জ্যামিতিকভাবে: সেই জন্য রিগ্রেশন লাইনের বিন্দুর আশেপাশের) কাছাকাছি ওঠানামা করবে ।X Y X XYXYXX

স্বাভাবিকতা অনুমান, এখন, বলে যে এর সাথে তাদের মেলে মধ্যে পার্থক্য গড় শূন্যের সাথে একটি সাধারণ বিতরণ অনুসরণ করে। এর মানে হল, যদি আপনি একটি আছে মান, তাহলে আপনি একটি নমুনা পারেন মান প্রথম গণনা করে (অর্থাত আবার , পরবর্তী স্যাম্পলিং, রিগ্রেশন লাইনে পয়েন্ট) থেকে সাধারণ বিতরণ এবং সেগুলি যুক্ত করে: E [ Y | | এক্স ] এক্স ওয়াই β 0 + β 1 এক্স [ ওয়াই | এক্স ] ϵ ওয়াই = [ ওয়াই | এক্স ] + + εYE[Y|X]XYβ0+β1XE[Y|X]ϵ

Y=E[Y|X]+ϵ

সংক্ষেপে: এই সাধারণ বন্টন মডেল দ্বারা ব্যাখ্যা করা পরিবর্তনশীলতার শীর্ষে আপনার ফলাফলের পরিবর্তনশীলতার প্রতিনিধিত্ব করে ।

দ্রষ্টব্য: বেশিরভাগ ডেটাসেটে, আপনার দেওয়া কোনও জন্য আপনার একাধিক মান নেই (যদি না আপনার ভবিষ্যদ্বাণীকারী সেটটি শ্রেণিবদ্ধ হয়) তবে এই স্বাভাবিকতাটি কেবলমাত্র আপনার ডেটাসেটের পর্যবেক্ষণের জন্য নয়, পুরো জনগণের জন্য চলে।এক্সYX

দ্রষ্টব্য: আমি একজন ভবিষ্যদ্বাণীকের সাথে লিনিয়ার রিগ্রেশন যুক্তি যুক্ত করেছি, তবে আরও কিছু ঘটবে: উপরের "হাইপারপ্লেন" দিয়ে কেবল "লাইন" প্রতিস্থাপন করুন।


এটি একটি দুর্দান্ত ব্যাখ্যা! যদিও একটি প্রশ্ন: সাধারণভাবে বিতরণ করার অর্থ আপনি কি ধরে নেবেন যে ই এর সর্বাধিক সম্ভাব্য মানগুলি -1 এবং +1 এর মধ্যে (সেগুলি মানক হওয়ার পরে)? সুতরাং আপনি মূলত একটি বিষ বিতরণ পরিবর্তে একটি সাধারণ বিতরণ ব্যবহার করুন, কারণ সাধারণ বন্টন আরও ভাল মডেলগুলি বাস্তবে এই মানগুলি কীভাবে আচরণ করে?
ব্যবহারকারী 3813234

1

এটি অনেক অর্থ হতে পারে বা এর অর্থ কিছুই হতে পারে না। সর্বাধিক আর-স্কোয়ার্ড পাওয়ার জন্য আপনি যদি কোনও মডেল ফিট করেন তবে এর অর্থ হ'ল আপনি বোকা। ভেরিয়েবলগুলি প্রয়োজনীয় এবং প্রয়োজনীয় এবং বহিরাগতদের সনাক্ত করার জন্য যত্নের ক্ষেত্রে যদি আপনি কোনও মডেল ফিট করেন তবে আপনি একটি ভাল কাজ করেছেন। এই http://www.autobox.com/cms/index.php?option=com_content&view=article&id=175 এ আরও তথ্যের জন্য এখানে একবার দেখুন


0

অবশিষ্টাংশের স্বাভাবিকতা রৈখিক মডেল চালানোর একটি ধারণা। সুতরাং, যদি আপনার অবশিষ্টাংশগুলি স্বাভাবিক থাকে তবে এর অর্থ হল যে আপনার অনুমানটি বৈধ এবং মডেল অনুমিতি (আত্মবিশ্বাসের ব্যবধান, মডেল পূর্বাভাস )ও বৈধ হওয়া উচিত। এটা যে সহজ!


স্বাভাবিক ধারণাটি অবলম্বনযোগ্য ত্রুটি সম্পর্কে (সুতরাং একটি অনুমানের প্রয়োজন) পর্যবেক্ষণযোগ্য অবশিষ্টাংশ সম্পর্কে নয়।
ডিএল ডাহলি

2
হ্যাঁ, তবে আপনি অবলম্বনযোগ্য ত্রুটি সম্পর্কে আপনার অনুমানের পরীক্ষা করতে অবশিষ্টাংশগুলি ব্যবহার করেন।
ডাব্লু ক্যাম্পবেল

 to 
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.