লিনিয়ার রিগ্রেশন মডেলটিতে "ধ্রুবক বৈচিত্র" থাকার অর্থ কী?


53

ত্রুটি শব্দটির মধ্যে "ধ্রুবক বৈকল্পিক" থাকার অর্থ কী? আমি এটি দেখতে পাচ্ছি, আমাদের একটি নির্ভরশীল ভেরিয়েবল এবং একটি স্বতন্ত্র ভেরিয়েবল সহ একটি ডেটা আছে। নিয়মিত বৈকল্পিকতা লিনিয়ার রিগ্রেশন-এর অন্যতম অনুমান। আমি ভাবছি যে সমকামিতা মানে কি। যেহেতু আমার কাছে 500 টি সারি রয়েছে, আমার একক বৈকল্পিক মান থাকবে যা স্পষ্টত ধ্রুবক। কোন চলকের সাথে আমার বৈকল্পিকের তুলনা করা উচিত?

উত্তর:


34

এর অর্থ হ'ল যখন আপনি পৃথক ত্রুটিটিকে পূর্বাভাসিত মানের বিরুদ্ধে চক্রান্ত করেন তখন ত্রুটিটির পূর্বাভাসিত মানটির বৈকল্পিক স্থির হওয়া উচিত। নীচের ছবিতে লাল তীরগুলি দেখুন, লাল রেখাগুলির দৈর্ঘ্য (তার বৈচিত্রের একটি প্রক্সি) একই।

এখানে চিত্র বর্ণনা লিখুন


1
ঠিক আছে বোঝা। !! এটি যেহেতু এটি একটি অনুমান তাই আমাদের মডেলটি চালানোর আগে অনুমানটি যাচাই করার দরকার নেই। এবং কেন আমাদের এই অনুমানের প্রয়োজন
মুকুল

2
কিছু অনুমান কেবলমাত্র মডেলটি চালানোর পরে পরীক্ষা করা যায়। কোনও মডেল গণনা করা কেবল গণিত এবং কোনও মডেলকে ব্যাখ্যা করার মতো নয়।
জন

6
পেনগুইন নাইটের ব্যাপ্তি বিস্তৃত নয় তাই আপনি এখানে নিজের শব্দবন্ধ আপডেট করতে চাইতে পারেন।
জন

4
যদি আপনার ভেরিয়েন্স অনুমানটি ভুল হয়, তবে এর অর্থ সাধারণত হ'ল মান ত্রুটিগুলি ভুল এবং কোনও অনুমানের পরীক্ষায় ভুল সিদ্ধান্ত নেওয়া যায়। (একটি ভিন্ন জন)
জন

4
আমি কিছুটা আলাদা। আমি এটি বলব না যে হেটেরোসেসটাস্টিকটির অগত্যা আপনার বিটাগুলির স্ট্যান্ডার্ড ত্রুটিগুলি ভুল, বরং এটি যে ওএলএসের অনুমানকারী এখন আর সবচেয়ে কার্যকর নিরপেক্ষ অনুমানক নয়। এটি হ'ল আপনি যদি আরও ধীরে ধীরে বৈকল্পিকতা রাখেন (সম্ভবত ওয়াইয়ের পরিবর্তনের কারণে) বা আপনি যদি অ-স্থিরতাটিকে সঠিকভাবে অ্যাকাউন্টে নেন (তবে সম্ভবত সাধারণতর ন্যূনতম স্কোয়ারের অনুমানের মাধ্যমে) আপনি আরও শক্তি / নির্ভুলতা পেতে পারেন।
গুং - মনিকা পুনরায়

58

এটি এমন এক জায়গা যেখানে আমি খুঁজে পেয়েছি কিছু সূত্রগুলি সাহায্য করে এমনকি গণিতের উদ্বেগযুক্ত লোকদের জন্যও (আমি আপনাকে পরামর্শ দিচ্ছি না যে, আপনি অবশ্যই এটি করেন)। সরল লিনিয়ার রিগ্রেশন মডেলটি হ'ল: এখানে লক্ষণীয় যেটি গুরুত্বপূর্ণ তা এই মডেলটি স্পষ্টভাবে আপনি একবার ডেটাতে অর্থপূর্ণ তথ্য অনুমান করার পরে বলেছিলেন (এটি "the ") সাদা শোরগোল ছাড়া আর কিছুই অবশিষ্ট নেই। , ত্রুটিগুলি একটি সাধারণ হিসাবে পরিবর্তনের সাথে বিতরণ করা হয় ।

Y=β0+β1X+εwhere εN(0,σε2)
β0+β1Xσε2

এটি উপলব্ধি করা গুরুত্বপূর্ণ যে। কোনও পরিবর্তনশীল নয় (যদিও জুনিয়র হাই স্কুল স্তরের বীজগণিতগুলিতে, আমরা এটিকে ডাকব)। এটি আলাদা হয় না। পরিবর্তিত হয়। পরিবর্তিত হয়। ত্রুটি শব্দ, , এলোমেলোভাবে পরিবর্তিত হয় ; এটি, এটি একটি এলোমেলো পরিবর্তনশীল । যাইহোক, প্যারামিটারগুলি ( আমরা জানি না এমন মানগুলির স্থানধারক - সেগুলি আলাদা হয় না। পরিবর্তে, তারা অজানা ধ্রুবক । এই আলোচনার জন্য এই বাস্তবতার ফলস্বরূপ হ'ল কী তা (যেমন, সেখানে কী মানটি প্লাগ ইন করা হয়েছে),σε2XYεβ0, β1, σε2)Xσε2একই রয়ে গেছে. অন্য কথায়, ত্রুটিগুলি / অবশিষ্টাংশগুলির বৈচিত্রটি স্থির থাকে। বিপরীতে (এবং আরও বৃহত্তর স্বচ্ছতার জন্য), এই মডেলটি বিবেচনা করুন: এই ক্ষেত্রে, আমরা জন্য একটি মান প্লাগ করব (তৃতীয় লাইনে শুরু করে) , ফাংশন মাধ্যমে এটি পাস এবং ত্রুটি ভ্যারিয়েন্স যে সংগ্রহ পেতে যে সঠিক মূল্য এ । তারপরে আমরা যথারীতি বাকী সমীকরণের মধ্য দিয়ে চলে যাই।
এক্স এফ ( এক্স ) এক্স

Y=β0+β1X+εwhere εN(0,f(X)) where f(X)=exp(γ0+γ1X)and γ10
Xf(X) X

উপরের আলোচনাটি অনুমানের প্রকৃতি বোঝার জন্য সহায়তা করা উচিত ; এটি কীভাবে মূল্যায়ন করা যায় সে সম্পর্কে প্রশ্নও জিজ্ঞাসা করে। মূলত দুটি পন্থা রয়েছে: আনুষ্ঠানিক অনুমান পরীক্ষা এবং প্লট পরীক্ষা করা। হেটেরোসিসেস্টাস্টিটির জন্য পরীক্ষাগুলি ব্যবহার করা যেতে পারে যদি আপনার পরীক্ষামূলক-ইশ ডেটা থাকে (যেমন, এটি কেবল স্থির মানগুলিতে ঘটে ) বা একটি এনওওভা থাকে। আমি এখানে এ জাতীয় কয়েকটি পরীক্ষার বিষয়ে আলোচনা করেছি: কেন এফ-রেশিওয়ের চেয়ে ভিন্নতার সমতার টেস্ট লেভেনX। তবে আমি মনে করি যে প্লটগুলি সন্ধান করা সবচেয়ে ভাল। @ পেনকুইন_কাইটটি এমন এক মডেলের অবশিষ্টাংশের প্লট করে ধ্রুবক বৈকল্পিক দেখতে কেমন তা প্রদর্শন করার জন্য একটি ভাল কাজ করেছে যেখানে সমকামী বৈশিষ্ট্যগুলি মানযুক্ত মানগুলির তুলনায় প্রাপ্ত হয়। হেটেরোসেসটেস্টিটি সম্ভবত কাঁচা ডেটার প্লট বা স্কেল-লোকেশনে (স্প্রেড-লেভেল নামে পরিচিত) প্লটও সনাক্ত করা যায়। আর সহজেই কলটি আপনার কাছে কল দিয়ে কল করে plot.lm(model, which=2); এটি লাগানো মানগুলির বিরুদ্ধে অবশিষ্টাংশগুলির নিখুঁত মানগুলির বর্গমূল, একটি নিম্নবিত্ত বক্ররেখা সাহায্যকারীভাবে আবৃত। আপনি চাইছেন নীচু ফিটটি সমতল হোক, opালু নয়।

নীচের প্লটগুলি বিবেচনা করুন, যা তুলনামূলকভাবে হোমোসেসডেস্টিক বনাম হেটেরোসেসটাস্টিক ডেটা এই তিনটি বিভিন্ন ধরণের চিত্রগুলিতে দেখতে পারে। উপরের দুটি ভিন্ন ভিন্ন ভিন্ন প্লটের জন্য ফানেল আকার এবং শেষের দিকে theালু লোভনেস লাইনটি নোট করুন।

এখানে চিত্র বর্ণনা লিখুন

সম্পূর্ণতার জন্য, আমি এখানে এই ডেটাগুলি তৈরি করতে কোডটি ব্যবহার করেছি:

set.seed(5)

N  = 500
b0 = 3
b1 = 0.4

s2 = 5
g1 = 1.5
g2 = 0.015

x        = runif(N, min=0, max=100)
y_homo   = b0 + b1*x + rnorm(N, mean=0, sd=sqrt(s2            ))
y_hetero = b0 + b1*x + rnorm(N, mean=0, sd=sqrt(exp(g1 + g2*x)))

mod.homo   = lm(y_homo~x)
mod.hetero = lm(y_hetero~x)

1
ধন্যবাদ এটি খুব সহায়ক। একটি সাধারণ লোকের কেন আমাদের এই অনুমানের প্রয়োজন তাও আপনি ব্যাখ্যা করতে পারেন
মুকুল

5
আপনাকে স্বাগতম, মুকুল সমকামিতা (ধ্রুবক বৈকল্পিকতা) অনুমানের জন্য ওএলএসের অনুমানকারী তৈরি করা প্রয়োজন (যেমন, ডিফল্ট পদ্ধতি সফটওয়্যার বিটা নির্ধারণের জন্য ব্যবহার করে) যে অনুমানের পদ্ধতিটি বেটাসের নমুনা বিতরণ তৈরি করবে যা ফলনকারী সমস্ত অনুমানের পদ্ধতির সংক্ষিপ্ত স্ট্যান্ডার্ড ত্রুটি রয়েছে নমুনা বিতরণগুলি যা প্রকৃত মানকে কেন্দ্র করে। IE, ওএলএসের অনুমানের জন্য ন্যূনতম বৈকল্পিক নিরপেক্ষ অনুমানক হওয়া প্রয়োজন
গুং - মনিকা পুনরায়

5
যদি আপনার প্রতিক্রিয়া পরিবর্তনশীল বাইনারি হয় তবে এটি দ্বি-দ্বি হিসাবে বিতরণ করা হবে। IE, উপরে বর্ণিত লিনিয়ার রিগ্রেশন মডেলের অনেকগুলি অংশ অনুপযুক্ত। এই ইস্যুগুলির মধ্যে একটি হ'ল দ্বিপাক্ষিকতার বৈকল্পিক যেহেতু গড়ের একটি কার্য (অর্থ: , রূপান্তর: ), তাই সমকামিতার অনুমান লঙ্ঘিত হয়। এই বিষয়গুলি আরও ভালভাবে বুঝতে, এটি আমার উত্তরটি এখানে পড়তে সহায়তা করতে পারে: লগইট এবং প্রবিট-মডেলগুলির মধ্যে পার্থক্য - যদিও এটি ভিন্ন প্রসঙ্গে লেখা হয়েছিল। ( পি ( 1 - পি ) ) / এন )p(p(1p))/n)
গুং - মনিকা পুনরায়

2
আপনার মন্তব্যে @ গুং আপনি ন্যূনতম বৈকল্পিক নিরপেক্ষ অনুমানক বাক্যাংশের সমস্ত শব্দের উপর ইটালিকস রেখেছেন। আমি বুঝতে পেরেছি যে হেটেরোসেসটাস্টিটির সাথে অনুমানকারী কম কার্যকর (আরও বৈকল্পিক) হয়ে উঠবে, তবে এটি কি পক্ষপাতদুষ্ট হয়ে যাবে?
ব্যবহারকারী1205901 - মনিকা

5
@ ব্যবহারকারী1205901, এটি নিরপেক্ষ থাকবে।
গুং - মনিকা পুনরায়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.