Rlm () রিগ্রেশন সহগের অনুমানগুলি আর-তে lm () এর চেয়ে আলাদা কেন?


15

আমি মাল্টিভারিয়েট লিনিয়ার মডেলটি পুনরায় চাপতে আর এস এস এস প্যাকেজে rlm ব্যবহার করছি। এটি বেশ কয়েকটি নমুনার জন্য ভাল কাজ করে তবে আমি একটি নির্দিষ্ট মডেলের জন্য কোয়াটি-নাল সহগ পাচ্ছি:

Call: rlm(formula = Y ~ X1 + X2 + X3 + X4, data = mymodel, maxit = 50, na.action = na.omit)
Residuals:
       Min         1Q     Median         3Q        Max 
-7.981e+01 -6.022e-03 -1.696e-04  8.458e-03  7.706e+01 

Coefficients:
             Value    Std. Error t value 
(Intercept)    0.0002   0.0001     1.8418
X1             0.0004   0.0000    13.4478
X2            -0.0004   0.0000   -23.1100
X3            -0.0001   0.0002    -0.5511
X4             0.0006   0.0001     8.1489

Residual standard error: 0.01086 on 49052 degrees of freedom
  (83 observations deleted due to missingness)

তুলনার জন্য, এইগুলি lm () দ্বারা গণনা করা সহগ রয়েছে:

Call:
lm(formula = Y ~ X1 + X2 + X3 + X4, data = mymodel, na.action = na.omit)

Residuals:
    Min      1Q  Median      3Q     Max 
-76.784  -0.459   0.017   0.538  78.665 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)  -0.016633   0.011622  -1.431    0.152    
X1            0.046897   0.004172  11.240  < 2e-16 ***
X2           -0.054944   0.002184 -25.155  < 2e-16 ***
X3            0.022627   0.019496   1.161    0.246    
X4            0.051336   0.009952   5.159  2.5e-07 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 

Residual standard error: 2.574 on 49052 degrees of freedom
  (83 observations deleted due to missingness)
Multiple R-squared: 0.0182, Adjusted R-squared: 0.01812 
F-statistic: 227.3 on 4 and 49052 DF,  p-value: < 2.2e-16 

এলএম প্লট কোনও বিশেষ উচ্চ আউটলেট দেখায় না, যেমন কুকের দূরত্ব দ্বারা পরিমাপ করা হয়েছে:

এলএম ডায়াগনস্টিক

সম্পাদনা

রেফারেন্সের জন্য এবং ম্যাক্রোর দেওয়া উত্তরের উপর ভিত্তি করে ফলাফলগুলি নিশ্চিত করার পরে, kহুবারের অনুমানকারীটিতে টিউনিং প্যারামিটার সেট করার জন্য আর কমান্ডটি ( k=100এই ক্ষেত্রে):

rlm(y ~ x, psi = psi.huber, k = 100)

অন্যান্য তথ্যের সাথে মিশ্রিত অবশিষ্ট স্ট্যান্ডার্ড ত্রুটিগুলি এটিকে rlmএমনভাবে দেখায় যে ওজন ফাংশনটি প্রায় সমস্ত পর্যবেক্ষণগুলি ছুঁড়ে ফেলেছে। আপনি কি নিশ্চিত যে এটি দুটি রিগ্রেশনে একই ওয়াই? (কেবলমাত্র পরীক্ষা করা হচ্ছে ...) method="MM"আপনার rlmকলটিতে চেষ্টা করুন, তারপরে চেষ্টা করুন (যদি এটি ব্যর্থ হয়) psi=psi.huber(k=2.5)(2.5 নির্বিচারে, ডিফল্ট 1.345-র তুলনায় আরও বড়) যা lmওজন ফাংশনের মত - মত অঞ্চলটি ছড়িয়ে দেয়।
jboman

@ জবোম্যান ওয়াই সঠিক। এমএম পদ্ধতি যুক্ত করা হয়েছে। আমার অন্তর্নিহিত আপনি একইভাবে উল্লেখ করেছেন। আমি চেষ্টা করেছি অন্যদের তুলনায় এই মডেলের অবশিষ্টাংশগুলি তুলনামূলকভাবে কমপ্যাক্ট। দেখে মনে হচ্ছে পদ্ধতিটি বেশিরভাগ পর্যবেক্ষণ বাতিল করে দিচ্ছে।
রবার্ট কুব্রিক

1
@ রবার্টকুব্রিক আপনি বুঝতে পারছেন যে কে থেকে 100 সেট করার মানে , তাই না?
ব্যবহারকারী 60

এর উপর ভিত্তি করে: একাধিক আর-স্কোয়ারড: 0.0182, অ্যাডজাস্টেড আর-স্কোয়ারড: 0.01812 আপনার আরও একবার মডেল পরীক্ষা করা উচিত। আউটলিয়ার্স, প্রতিক্রিয়া বা ভবিষ্যদ্বাণীকারীদের রূপান্তর। অথবা আপনার ননলাইনার মডেলটি বিবেচনা করা উচিত। ভবিষ্যদ্বাণীকারী এক্স 3 উল্লেখযোগ্য নয়। আপনি যা তৈরি করেছেন তা লিনিয়ার মডেল নয়।
মারিজা মিলোজিয়েভিক

উত্তর:


15

পার্থক্যটি হ'ল rlm()বিভিন্ন এসিস্টেমেটরগুলির একটির জন্য আপনার পছন্দগুলি ব্যবহার করে মডেলগুলি ফিট করে leastMlm()

M

i=1nρ(YiXiβσ)

βYiiXii

ρ(x)=x2
rlm()M

ρ(x)={12x2if |x|kk|x|12k2if |x|>k.

krlm()k=1.345

সম্পাদনা করুন: উপরে প্রদর্শিত কিউকিউ প্লট থেকে দেখে মনে হচ্ছে আপনার খুব দীর্ঘ লেজযুক্ত ত্রুটি বিতরণ রয়েছে। এটি হুবার এম-অনুমানকারী যে ধরণের পরিস্থিতির জন্য ডিজাইন করা হয়েছে এবং সেই পরিস্থিতিতে একেবারে আলাদা অনুমান দিতে পারে:

ρ|x|<k|x|>k


আমি বেশ কয়েকটি অন্যান্য মডেল চেষ্টা করেছি (একই সংখ্যার পর্যবেক্ষণ, একই আইভি) এবং সহগগুলি rlm এবং lm এর মধ্যে মোটামুটি মিল similar এই নির্দিষ্ট ডেটা সেটে অবশ্যই কিছু থাকতে হবে যা সহগের মধ্যে বড় পার্থক্য তৈরি করছে।
রবার্ট কুব্রিক

1
k

1
k=1.5,2,2.5,3,3.5,4psi.huberklmrlm
jboman

1
এটি যোগ করা তথ্যের জন্য, @ জবোম্যান - এগুলি দরকারী মন্তব্য। আপনার শেষ মন্তব্যে, সেই বৃহত পর্যবেক্ষণগুলি হুবহু নিক্ষেপ করা হচ্ছে না - তাদের প্রভাবটি কেবল ডায়াল করা হচ্ছে (যেমন মনে হয় তাদের হওয়া উচিত) ঠিক তাই না?
ম্যাক্রো

1
σσ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.