এটি এমন এক জায়গা যেখানে আমি খুঁজে পেয়েছি কিছু সূত্রগুলি সাহায্য করে এমনকি গণিতের উদ্বেগযুক্ত লোকদের জন্যও (আমি আপনাকে পরামর্শ দিচ্ছি না যে, আপনি অবশ্যই এটি করেন)। সরল লিনিয়ার রিগ্রেশন মডেলটি হ'ল:
এখানে লক্ষণীয় যেটি গুরুত্বপূর্ণ তা এই মডেলটি স্পষ্টভাবে আপনি একবার ডেটাতে অর্থপূর্ণ তথ্য অনুমান করার পরে বলেছিলেন (এটি "the ") সাদা শোরগোল ছাড়া আর কিছুই অবশিষ্ট নেই। , ত্রুটিগুলি একটি সাধারণ হিসাবে পরিবর্তনের সাথে বিতরণ করা হয় ।
Y=β0+β1X+εwhere ε∼N(0,σ2ε)
β0+β1Xσ2ε
এটি উপলব্ধি করা গুরুত্বপূর্ণ যে। কোনও পরিবর্তনশীল নয় (যদিও জুনিয়র হাই স্কুল স্তরের বীজগণিতগুলিতে, আমরা এটিকে ডাকব)। এটি আলাদা হয় না। পরিবর্তিত হয়। পরিবর্তিত হয়। ত্রুটি শব্দ, , এলোমেলোভাবে পরিবর্তিত হয় ; এটি, এটি একটি এলোমেলো পরিবর্তনশীল । যাইহোক, প্যারামিটারগুলি ( আমরা জানি না এমন মানগুলির স্থানধারক - সেগুলি আলাদা হয় না। পরিবর্তে, তারা অজানা ধ্রুবক । এই আলোচনার জন্য এই বাস্তবতার ফলস্বরূপ হ'ল কী তা (যেমন, সেখানে কী মানটি প্লাগ ইন করা হয়েছে),σ2εXYεβ0, β1, σ2ε)Xσ2εএকই রয়ে গেছে. অন্য কথায়, ত্রুটিগুলি / অবশিষ্টাংশগুলির বৈচিত্রটি স্থির থাকে। বিপরীতে (এবং আরও বৃহত্তর স্বচ্ছতার জন্য), এই মডেলটি বিবেচনা করুন:
এই ক্ষেত্রে, আমরা জন্য একটি মান প্লাগ করব (তৃতীয় লাইনে শুরু করে) , ফাংশন মাধ্যমে এটি পাস এবং ত্রুটি ভ্যারিয়েন্স যে সংগ্রহ পেতে যে সঠিক মূল্য এ । তারপরে আমরা যথারীতি বাকী সমীকরণের মধ্য দিয়ে চলে যাই।
এক্স এফ ( এক্স ) এক্স
Y=β0+β1X+εwhere ε∼N(0,f(X)) where f(X)=exp(γ0+γ1X)and γ1≠0
Xf(X) X
উপরের আলোচনাটি অনুমানের প্রকৃতি বোঝার জন্য সহায়তা করা উচিত ; এটি কীভাবে মূল্যায়ন করা যায় সে সম্পর্কে প্রশ্নও জিজ্ঞাসা করে। মূলত দুটি পন্থা রয়েছে: আনুষ্ঠানিক অনুমান পরীক্ষা এবং প্লট পরীক্ষা করা। হেটেরোসিসেস্টাস্টিটির জন্য পরীক্ষাগুলি ব্যবহার করা যেতে পারে যদি আপনার পরীক্ষামূলক-ইশ ডেটা থাকে (যেমন, এটি কেবল স্থির মানগুলিতে ঘটে ) বা একটি এনওওভা থাকে। আমি এখানে এ জাতীয় কয়েকটি পরীক্ষার বিষয়ে আলোচনা করেছি: কেন এফ-রেশিওয়ের চেয়ে ভিন্নতার সমতার টেস্ট লেভেনX। তবে আমি মনে করি যে প্লটগুলি সন্ধান করা সবচেয়ে ভাল। @ পেনকুইন_কাইটটি এমন এক মডেলের অবশিষ্টাংশের প্লট করে ধ্রুবক বৈকল্পিক দেখতে কেমন তা প্রদর্শন করার জন্য একটি ভাল কাজ করেছে যেখানে সমকামী বৈশিষ্ট্যগুলি মানযুক্ত মানগুলির তুলনায় প্রাপ্ত হয়। হেটেরোসেসটেস্টিটি সম্ভবত কাঁচা ডেটার প্লট বা স্কেল-লোকেশনে (স্প্রেড-লেভেল নামে পরিচিত) প্লটও সনাক্ত করা যায়। আর সহজেই কলটি আপনার কাছে কল দিয়ে কল করে plot.lm(model, which=2)
; এটি লাগানো মানগুলির বিরুদ্ধে অবশিষ্টাংশগুলির নিখুঁত মানগুলির বর্গমূল, একটি নিম্নবিত্ত বক্ররেখা সাহায্যকারীভাবে আবৃত। আপনি চাইছেন নীচু ফিটটি সমতল হোক, opালু নয়।
নীচের প্লটগুলি বিবেচনা করুন, যা তুলনামূলকভাবে হোমোসেসডেস্টিক বনাম হেটেরোসেসটাস্টিক ডেটা এই তিনটি বিভিন্ন ধরণের চিত্রগুলিতে দেখতে পারে। উপরের দুটি ভিন্ন ভিন্ন ভিন্ন প্লটের জন্য ফানেল আকার এবং শেষের দিকে theালু লোভনেস লাইনটি নোট করুন।
সম্পূর্ণতার জন্য, আমি এখানে এই ডেটাগুলি তৈরি করতে কোডটি ব্যবহার করেছি:
set.seed(5)
N = 500
b0 = 3
b1 = 0.4
s2 = 5
g1 = 1.5
g2 = 0.015
x = runif(N, min=0, max=100)
y_homo = b0 + b1*x + rnorm(N, mean=0, sd=sqrt(s2 ))
y_hetero = b0 + b1*x + rnorm(N, mean=0, sd=sqrt(exp(g1 + g2*x)))
mod.homo = lm(y_homo~x)
mod.hetero = lm(y_hetero~x)