ইন্টারন্যাশন শব্দটি অন্তর্ভুক্ত করা হয় তখনই কোলাইনারিটি ডায়াগনস্টিকস সমস্যাযুক্ত


26

আমি মার্কিন কাউন্টিগুলিতে রিগ্রেশন চালিয়েছি, এবং আমার 'স্বতন্ত্র' ভেরিয়েবলগুলিতে কলিনারিটি পরীক্ষা করছি। বেলসলে, কুহ এবং ওয়েলশ-এর রিগ্রেশন ডায়াগনস্টিকস কন্ডিশন সূচক এবং ভেরিয়্যান্স পঁচনের অনুপাতের দিকে তাকানোর পরামর্শ দেয়:

library(perturb)
## colldiag(, scale=TRUE) for model with interaction
Condition
Index   Variance Decomposition Proportions
           (Intercept) inc09_10k unins09 sqmi_log pop10_perSqmi_log phys_per100k nppa_per100k black10_pct hisp10_pct elderly09_pct inc09_10k:unins09
1    1.000 0.000       0.000     0.000   0.000    0.001             0.002        0.003        0.002       0.002      0.001         0.000            
2    3.130 0.000       0.000     0.000   0.000    0.002             0.053        0.011        0.148       0.231      0.000         0.000            
3    3.305 0.000       0.000     0.000   0.000    0.000             0.095        0.072        0.351       0.003      0.000         0.000            
4    3.839 0.000       0.000     0.000   0.001    0.000             0.143        0.002        0.105       0.280      0.009         0.000            
5    5.547 0.000       0.002     0.000   0.000    0.050             0.093        0.592        0.084       0.005      0.002         0.000            
6    7.981 0.000       0.005     0.006   0.001    0.150             0.560        0.256        0.002       0.040      0.026         0.001            
7   11.170 0.000       0.009     0.003   0.000    0.046             0.000        0.018        0.003       0.250      0.272         0.035            
8   12.766 0.000       0.050     0.029   0.015    0.309             0.023        0.043        0.220       0.094      0.005         0.002            
9   18.800 0.009       0.017     0.003   0.209    0.001             0.002        0.001        0.047       0.006      0.430         0.041            
10  40.827 0.134       0.159     0.163   0.555    0.283             0.015        0.001        0.035       0.008      0.186         0.238            
11  76.709 0.855       0.759     0.796   0.219    0.157             0.013        0.002        0.004       0.080      0.069         0.683            

## colldiag(, scale=TRUE) for model without interaction
Condition
Index   Variance Decomposition Proportions
           (Intercept) inc09_10k unins09 sqmi_log pop10_perSqmi_log phys_per100k nppa_per100k black10_pct hisp10_pct elderly09_pct
1    1.000 0.000       0.001     0.001   0.000    0.001             0.003        0.004        0.003       0.003      0.001        
2    2.988 0.000       0.000     0.001   0.000    0.002             0.030        0.003        0.216       0.253      0.000        
3    3.128 0.000       0.000     0.002   0.000    0.000             0.112        0.076        0.294       0.027      0.000        
4    3.630 0.000       0.002     0.001   0.001    0.000             0.160        0.003        0.105       0.248      0.009        
5    5.234 0.000       0.008     0.002   0.000    0.053             0.087        0.594        0.086       0.004      0.001        
6    7.556 0.000       0.024     0.039   0.001    0.143             0.557        0.275        0.002       0.025      0.035        
7   11.898 0.000       0.278     0.080   0.017    0.371             0.026        0.023        0.147       0.005      0.038        
8   13.242 0.000       0.001     0.343   0.006    0.000             0.000        0.017        0.129       0.328      0.553        
9   21.558 0.010       0.540     0.332   0.355    0.037             0.000        0.003        0.003       0.020      0.083        
10  50.506 0.989       0.148     0.199   0.620    0.393             0.026        0.004        0.016       0.087      0.279        

?HH::vif পরামর্শ দেয় যে ভিআইএফ> 5 সমস্যাযুক্ত:

library(HH)
## vif() for model with interaction
        inc09_10k           unins09          sqmi_log pop10_perSqmi_log      phys_per100k      nppa_per100k       black10_pct        hisp10_pct 
         8.378646         16.329881          1.653584          2.744314          1.885095          1.471123          1.436229          1.789454 
    elderly09_pct inc09_10k:unins09 
         1.547234         11.590162 

## vif() for model without interaction
        inc09_10k           unins09          sqmi_log pop10_perSqmi_log      phys_per100k      nppa_per100k       black10_pct        hisp10_pct 
         1.859426          2.378138          1.628817          2.716702          1.882828          1.471102          1.404482          1.772352 
    elderly09_pct 
         1.545867 

যেখানে জন ফক্সের রিগ্রেশন ডায়াগনস্টিকস ভিআইএফের বর্গমূলের দিকে নজর দেওয়ার পরামর্শ দেয়:

library(car)
## sqrt(vif) for model with interaction
        inc09_10k           unins09          sqmi_log pop10_perSqmi_log      phys_per100k      nppa_per100k       black10_pct        hisp10_pct 
         2.894589          4.041025          1.285917          1.656597          1.372987          1.212898          1.198428          1.337705 
    elderly09_pct inc09_10k:unins09 
         1.243879          3.404433 
## sqrt(vif) for model without interaction
        inc09_10k           unins09          sqmi_log pop10_perSqmi_log      phys_per100k      nppa_per100k       black10_pct        hisp10_pct 
         1.363608          1.542121          1.276251          1.648242          1.372162          1.212890          1.185108          1.331297 
    elderly09_pct 
         1.243329 

প্রথম দুটি ক্ষেত্রে (যেখানে একটি পরিষ্কার কাট অফের পরামর্শ দেওয়া হয়েছে), ইন্টারঅ্যাকশন শব্দটি অন্তর্ভুক্ত করা হলেই মডেলটি সমস্যাযুক্ত।

মিথস্ক্রিয়া শব্দটির সাথে মডেলটি এই পয়েন্টটি পর্যন্ত আমার পছন্দসই স্পেসিফিকেশন।

ডেটাটির এই গৌরব দেওয়া আমার কাছে দুটি প্রশ্ন রয়েছে:

  1. একটি মিথস্ক্রিয়া শব্দটি সর্বদা ডেটার প্রান্তিকতা খারাপ করে?
  2. মিথস্ক্রিয়া শব্দটি ব্যতীত দুটি পরিবর্তনশীল যেহেতু প্রান্তিকের উপরে নয়, তাই আমি কি ইন্টারেকশন শব্দটি দিয়ে মডেলটি ব্যবহার করছি। বিশেষত, আমার মনে হয় যে কারণ এটি ঠিক হতে পারে তা হ'ল আমি সহগের (নেতিবাচক দ্বিপদী মডেল) ব্যাখ্যার জন্য কিং, টমজ এবং উইটেনবার্গ (2000) পদ্ধতিটি ব্যবহার করছি, যেখানে আমি সাধারণত অন্যান্য সহগুণগুলি ধরে রাখি এবং তারপরে আমার নির্ভরশীল পরিবর্তনশীলের পূর্বাভাসের সাথে কী ঘটে যায় তা ব্যাখ্যা করুন যখন আমি inc09_10kএবং unins09স্বতন্ত্রভাবে এবং যৌথভাবে ঘোরাফেরা করি ।

উত্তর:


31

হ্যাঁ, এটি সাধারণত কেন্দ্রিক মিথস্ক্রিয়তার ক্ষেত্রে ঘটে। দুটি স্বতন্ত্র ভেরিয়েবল এবং তাদের "মিথস্ক্রিয়া" এর পারস্পরিক সম্পর্কের সাথে কী ঘটে তার এক ঝলক

set.seed(12345)
a = rnorm(10000,20,2)
b = rnorm(10000,10,2)
cor(a,b)
cor(a,a*b)

> cor(a,b)
[1] 0.01564907
> cor(a,a*b)
[1] 0.4608877

এবং তারপরে আপনি যখন সেগুলি কেন্দ্র করবেন:

c = a - 20
d = b - 10
cor(c,d)
cor(c,c*d)

> cor(c,d)
[1] 0.01564907
> cor(c,c*d)
[1] 0.001908758

ঘটনাচক্রে, প্রথম কেন্দ্রীকরণ ব্যতীত বহুপদী শর্তাদি (যেমন, ) অন্তর্ভুক্ত একই ঘটতে পারে ।X, X2, ...

সুতরাং আপনি আপনার জুটির সাথে একটি শট দিতে পারেন।


কেন কেন কেন্দ্রিয় সহায়তা করে - তবে আসুন আমরা covariance এর সংজ্ঞা ফিরে যাই to

Cov(X,XY)=E[(XE(X))(XYE(XY))]=E[(Xμx)(XYμxy)]=E[X2YXμxyXYμx+μxμxy]=E[X2Y]E[X]μxyE[XY]μx+μxμxy

এমনকি এক্স এবং ওয়াইয়ের স্বাধীনতাও দিয়েছেন

=E[X2]E[Y]μxμxμyμxμyμx+μxμxμy=(σx2+μx2)μyμx2μy=σx2μy

এটি সরাসরি আপনার রিগ্রেশন সমস্যার সাথে সম্পর্কিত নয়, যেহেতু আপনার কাছে সম্ভবত সম্পূর্ণ স্বাধীন এবং এবং , এবং যেহেতু দুটি ব্যাখ্যামূলক ভেরিয়েবলের মধ্যে পারস্পরিক সম্পর্কের ফলস্বরূপ সর্বদা বহুগুণকে ইস্যুতে আটকানো যায় না। তবে এটি দেখায় যে দুটি কেন্দ্রীভূত স্বতন্ত্র ভেরিয়েবলের মধ্যে একটি মিথস্ক্রিয়া কীভাবে পারস্পরিক সম্পর্ক দেখায় এবং এই পারস্পরিক সম্পর্কটি বহুবিধ লাইন সংক্রান্ত সমস্যার কারণ হতে পারে।ওয়াইXY


স্বজ্ঞাতভাবে আমার কাছে, কেন্দ্র-ভিত্তিক ভেরিয়েবলগুলি ইন্টারঅ্যাক্ট করার সহজ অর্থ হ'ল যখন বড় হয়, তখন নির্বিশেষে একটি পরম স্কেলে আরও বড় হতে চলেছে , এবং তাই এবং সম্পর্কযুক্ত হবে এবং একইভাবে জন্য ।এক্স ওয়াই ওয়াই এক্স এক্স ওয়াই ওয়াইXXYYXXYY


আকর্ষণীয়, ধন্যবাদ। কেন কেন কেন্দ্রিয় বিষয়গুলির জন্য আপনার কাছে কোনও ব্যাখ্যা বা উদ্ধৃতি রয়েছে?
এরি বি ফ্রেডম্যান

আমার মতে এই উত্তরটি পুরো অনুগ্রহের প্রাপ্য নয়, তবে আমি এটি অর্ধ-অনুগ্রহ দিতে চাই। নিশ্চিত না যে এটির দ্বিতীয়বারের মত ভোট না থাকলে এটি ঘটে: - / /
এরি বি ফ্রেডম্যান

1
@ আরিবি.ফ্রিডম্যান, আপনার কাছে অর্ধেক অনুগ্রহ দেওয়ার বিকল্প নেই (ঠিক)। আপনি অনুগ্রহটি পুরষ্কার দিতে পারবেন না (যদিও আপনি এখনও কোনওভাবেই এই প্রতিপত্তিটি হারিয়ে ফেলবেন) এবং এই পোস্টটি সম্ভবত অর্ধেক অনুগ্রহটি স্বয়ংক্রিয়ভাবে পুরস্কৃত হবে ( সহায়তা পৃষ্ঠার প্রাসঙ্গিক বিভাগটি দেখুন )। তবে, কেন এই উত্তর অনুগ্রহের যোগ্য হবে না? আফাইন ঠিক এখানে (+1)।
গুং - মনিকা পুনরায়

@ গুং আমি প্রাক সম্পাদনা খুঁজছিলাম। অবশ্যই এটি এখন প্রাপ্য। ধন্যবাদ @ আফাইন! অর্ধ-অনুগ্রহ অংশ হিসাবে, আমার বোধগম্যতা যদি >=+1 উত্তরটি ম্যানুয়ালি পুরষ্কার না দেওয়া হয় তবে একটি উত্তর একটি অর্ধ-অনুগ্রহ পায়।
এরি বি ফ্রেডম্যান

@ আরিবি.ফ্রিডম্যান, এটা ঠিক, তবে আমি মন্তব্য করার আগে (& upvated, এবং অন্য কেউও করেছে), তার কাছে 2+ upvotes ছিল না।
গুং - মনিকা পুনরায়

0

আমি এই বিষয়ে নিম্নলিখিত প্রকাশনা দরকারী খুঁজে পেয়েছি:

রবিনসন এবং শুম্যাকার (২০০৯): মিথস্ক্রিয়া প্রতিক্রিয়া: কেন্দ্রিককরণ, বৈচিত্র্য মুদ্রাস্ফীতি ফ্যাক্টর এবং ব্যাখ্যার বিষয়

'রিগ্রেশন সমীকরণের গুণাগুণগুলির উপর পূর্বাভাসক স্কেলিংয়ের প্রভাবগুলি (কেন্দ্রিক বনাম অনাস্থিত সমাধানগুলি এবং উচ্চতর অর্ডার ইন্টারঅ্যাকশন ইফেক্টগুলি (3-উপায় ইন্টারঅ্যাকশন; অবিচ্ছিন্ন প্রভাব দ্বারা শ্রেণীবদ্ধ)) বিবেচনা করে আইকন এবং ওয়েস্ট দ্বারা আচ্ছাদিত করা হয়েছে। তাদের উদাহরণ চিত্রিত করে যে যথেষ্ট বহুবিশ্লেষ যখন ভেরিয়েবলগুলি কেন্দ্রিক না হয় তখন ইন্টারঅ্যাকশন শব্দটি সহ একটি রিগ্রেশন সমীকরণের সাথে পরিচিত হয় ''

আফশারটোস অ্যান্ড প্রেস্টন (২০১১): কেন্দ্রীকরণের সাথে ইন্টারঅ্যাকশন মডেলের মূল ফলাফল

'ভেরিয়েবল সেন্টারিংয়ের নিয়োগের প্রেরণায় কোফিয়েন্টিয়েন্টগুলির বর্ধিত ব্যাখ্যামূলকতা এবং বহুবিধরনের সাথে সম্পর্কিত অনুমানের জন্য সংখ্যাগত অস্থিতিশীলতা অন্তর্ভুক্ত রয়েছে।'

স্পষ্টতই আইকন এবং পশ্চিম (1991) এই বিষয়টিকেও কভার করে, তবে আমার কাছে তাদের বই নেই।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.