ইন্টারসেপ্ট অপসারণ করা একটি ভিন্ন মডেল, তবে প্রচুর উদাহরণ রয়েছে যেখানে এটি বৈধ। উত্তরগুলি এখনও পর্যন্ত উদাহরণটিতে বিশদ আলোচনা করেছে যেখানে সত্যিকারের ইন্টারসেপেশন 0 হয়। আমি কয়েকটি উদাহরণের দিকে মনোনিবেশ করব যেখানে আমরা একটি অ্যাটপিকাল মডেল প্যারামাইট্রাইজেশনে আগ্রহী হতে পারি।
উদাহরণ 1: আনোভা-শৈলীর মডেল। শ্রেণিবদ্ধ ভেরিয়েবলের জন্য, আমরা সাধারণত গ্রুপ সদস্যতা এনকোডিং বাইনারি ভেক্টর তৈরি। স্ট্যান্ডার্ড রিগ্রেশন মডেলটি ইন্টারসেপ্ট + কে - 1 ডামি ভেক্টর হিসাবে প্যারামিট্রাইজড। ইন্টারসেপ্ট "রেফারেন্স" গোষ্ঠী, বা বাদ দেওয়া ভেক্টর, এবং অবশিষ্ট ভেক্টরগুলির জন্য প্রত্যাশিত মানটিকে প্রতিটি গ্রুপ এবং রেফারেন্সের মধ্যে পার্থক্য পরীক্ষা করে codes তবে কিছু ক্ষেত্রে, প্রতিটি গ্রুপের প্রত্যাশিত মান রাখা কার্যকর হতে পারে।
dat <- mtcars
dat$vs <- factor(dat$vs)
## intercept model: vs coefficient becomes difference
lm(mpg ~ vs + hp, data = dat)
Coefficients:
(Intercept) vs1 hp
26.96300 2.57622 -0.05453
## no intercept: two vs coefficients, conditional expectations for both groups
lm(mpg ~ 0 + vs + hp, data = dat)
Coefficients:
vs0 vs1 hp
26.96300 29.53922 -0.05453
উদাহরণ 2: প্রমিত তথ্যের ক্ষেত্রে। কিছু ক্ষেত্রে, কেউ মানকযুক্ত ডেটা নিয়ে কাজ করতে পারে। এই ক্ষেত্রে, নকশা দ্বারা ইন্টারসেপ্ট 0 হয়। আমি মনে করি এটির একটি সর্বোত্তম উদাহরণটি ছিল পুরানো শৈলীর কাঠামোগত সমীকরণ মডেল বা ফ্যাক্টর, যা কেবলমাত্র ডেভেলপার্সের ম্যাট্রিক্সে পরিচালিত হয়েছিল। নীচের ক্ষেত্রে, যেভাবেই হোক না কেন কেবলমাত্র অতিরিক্ত ডিগ্রি স্বাধীনতা (যা আপনার সত্যিকার অর্থে নির্ধারিত হয়েছিল বলেই হারাতে হবে) ছেড়ে দেওয়ার জন্য, তবে কোনওভাবেই বাধা নিরূপণ করা সম্ভবত একটি ভাল ধারণা, তবে বেশ কয়েকটি পরিস্থিতিতে রয়েছে যেখানে নির্মাণ, অর্থ 0 হতে পারে (উদাঃ, নির্দিষ্ট পরীক্ষা-নিরীক্ষা যেখানে অংশগ্রহণকারীরা রেটিং নির্ধারণ করে তবে সমান ধনাত্মকতা এবং outণাত্মক ধারণা দিতে বাধা হয়)।
dat <- as.data.frame(scale(mtcars))
## intercept is 0 by design
lm(mpg ~ hp + wt, data = dat)
Coefficients:
(Intercept) hp wt
3.813e-17 -3.615e-01 -6.296e-01
## leaving the intercept out
lm(mpg ~ 0 + hp + wt, data = dat)
Coefficients:
hp wt
-0.3615 -0.6296
উদাহরণ 3: মাল্টিভারিয়েট মডেল এবং লুকানো ইন্টারসেপ্টস। এই উদাহরণটি বিভিন্ন দিক থেকে প্রথমটির সাথে সমান। এই ক্ষেত্রে, ডেটা স্ট্যাক করা হয়েছে যাতে দুটি পৃথক ভেরিয়েবল এখন একটি দীর্ঘ ভেক্টরে থাকে। প্রতিক্রিয়া ভেক্টর y
, এর অন্তর্গত mpg
বা এর সম্পর্কিত কিনা সে সম্পর্কে একটি দ্বিতীয় পরিবর্তনশীল এনকোড তথ্য disp
। এই ক্ষেত্রে, প্রতিটি ফলাফলের জন্য পৃথক ইন্টারসেপ্টগুলি পেতে, আপনি সামগ্রিক ইন্টারসেপ্টটি দমন করেন এবং পরিমাপের জন্য উভয় ডামি ভেক্টরকে অন্তর্ভুক্ত করেন। এটি এক ধরণের বহুবিশ্লেষ বিশ্লেষণ। এটি সাধারণত ব্যবহার করে করা হয় নাlm()
কারণ আপনার বারবার ব্যবস্থা রয়েছে এবং সম্ভবত অযৌক্তিকতার জন্য অনুমতি দেওয়া উচিত। তবে কিছু আকর্ষণীয় ঘটনা রয়েছে যেখানে এটি প্রয়োজনীয়। উদাহরণস্বরূপ, এলোমেলো প্রভাবগুলির সাথে মধ্যস্থতা বিশ্লেষণ করার চেষ্টা করার সময়, সম্পূর্ণ বৈকল্পিক কোভারিয়েন্স ম্যাট্রিক্স পাওয়ার জন্য আপনার একই সাথে আনুমানিক উভয় মডেল প্রয়োজন, যা ডেটা স্ট্যাক করে এবং ডমি ভেক্টরগুলির কিছু চতুর ব্যবহারের মাধ্যমে করা যেতে পারে।
## stack data for multivariate analysis
dat <- reshape(mtcars, varying = c(1, 3), v.names = "y",
timevar = "measure", times = c("mpg", "disp"), direction = "long")
dat$measure <- factor(dat$measure)
## two regressions with intercepts only
lm(cbind(mpg, disp) ~ 1, data = mtcars)
Coefficients:
mpg disp
(Intercept) 20.09 230.72
## using the stacked data, measure is difference between outcome means
lm(y ~ measure, data = dat)
Coefficients:
(Intercept) measurempg
230.7 -210.6
## separate 'intercept' for each outcome
lm(y ~ 0 + measure, data = dat)
Coefficients:
measuredisp measurempg
230.72 20.09
আমি যুক্তি দিচ্ছি না যে ইন্টারসেপ্টগুলি সাধারণত সরানো উচিত, তবে নমনীয় হওয়া ভাল good