যখন একাধিক শ্রেণিবদ্ধ ভেরিয়েবল থাকে তখন বিতার ব্যাখ্যা


18

আমি ধারণাটি বুঝতে পারি যে যখন শ্রেণীবদ্ধ ভেরিয়েবল 0 (বা রেফারেন্স গ্রুপ) এর সমান হয় তখন এর অর্থ হয় যে পার্থক্য। এমনকি> 2 বিভাগের সাথেও আমি প্রতিটি ধরে নেব যে বিভাগের গড় এবং রেফারেন্সের মধ্যে পার্থক্য ব্যাখ্যা করবে। ββ^0β^

তবে, যদি আরও ভেরিয়েবলগুলি মাল্টিভারেবল মডেলটিতে আনা হয়? এখন ইন্টারসেপেটটি কী বোঝায় যে এটি দুটি শ্রেণীবদ্ধ ভেরিয়েবলের রেফারেন্সের জন্য অর্থ হিসাবে বিবেচিত হবে না? উদাহরণস্বরূপ যদি লিঙ্গ (এম (রেফ) / এফ) এবং জাতি (সাদা (রেফ) / কালো) উভয়ই একটি মডেলটিতে থাকত। Is গড় শুধুমাত্র সাদা পুরুষদের? কীভাবে কেউ অন্য কোনও সম্ভাবনার ব্যাখ্যা দেয়?β^0

একটি পৃথক নোট হিসাবে: বিপরীত বিবৃতি প্রভাব পরিবর্তন তদন্ত করার পদ্ধতির উপায় হিসাবে কাজ করে? বা কেবল বিভিন্ন স্তরে প্রভাব ( ) দেখতে ?β^


টার্মিনোলজিকাল নোট হিসাবে, "মাল্টিভারিয়েট" এর অর্থ একাধিক প্রতিক্রিয়ার ভেরিয়েবল, একাধিক পূর্বাভাসকারী ভেরিয়েবল নয় ( এখানে দেখুন )। এছাড়াও, আমি আপনার শেষ প্রশ্ন অনুসরণ না।
গুং - মনিকা পুনরায়

এই স্পষ্টির জন্য ধন্যবাদ। ভাষাটি সঠিক হওয়া আমার পক্ষে গুরুত্বপূর্ণ! আমি মনে করি যে আমি কেন বিপরীতে বিবৃতি ব্যবহার করা যায় তা কেন বুঝতে পারি না যেহেতু একজন সর্বদা কেবল যার বিপরীতে রয়েছে তার সাথে রেফারেন্স ভেরিয়েবলটি সেট করতে পারে?
রিনি

1
আমার ধারণা আপনি কেবলমাত্র মডেল ডাব্লু / বিভিন্ন রেফারেন্স স্তরগুলিকে পুনরায় ফিট করে রাখতে পারেন। আমি নিশ্চিত না যে এটি আরও সুবিধাজনক। বৈসাদৃশ্যগুলির সাথে, আপনি পরীক্ষা করতে অরথোগোনাল বিপরীতে একটি সেট বা তাত্ত্বিকভাবে প্রচ্ছন্ন বৈসাদৃশ্য (বি ও সি এর বনাম সংমিশ্রণ )ও নির্দিষ্ট করতে পারেন।
গুং - মনিকা পুনরায়

উত্তর:


19

স্তরের সাথে একক শ্রেণিবদ্ধ ভেরিয়েবল থাকলে আপনি বিটার ব্যাখ্যার বিষয়ে সঠিক right যদি একাধিক শ্রেণিবদ্ধ ভেরিয়েবলগুলি ছিল (এবং কোনও ইন্টারঅ্যাকশন শব্দটি ছিল না), তবে ইন্টারসেপ্ট ( ) উভয় (সমস্ত) শ্রেণিবদ্ধ ভেরিয়েবলের জন্য রেফারেন্স স্তর গঠন করে এমন গ্রুপের গড় । আপনার উদাহরণের পরিস্থিতিটি ব্যবহার করে, কোনও ইন্টারঅ্যাকশন নেই এমন ক্ষেত্রে বিবেচনা করুন, তবে বিটাগুলি হ'ল: β 0β^0

  • β^0 : সাদা পুরুষদের গড়
  • β^এফমিএকটি : মহিলা এবং পুরুষদের গড়ের মধ্যে পার্থক্য
  • β^বিএকটি : কৃষ্ণাঙ্গের গড় এবং সাদাদের গড়ের মধ্যে পার্থক্য

বিভিন্ন গ্রুপের গণনা কীভাবে করা যায় তার পরিপ্রেক্ষিতে আমরা এগুলিও ভাবতে পারি:

x¯White Maleগুলি=β^0এক্স¯ওয়াটআমিটি এফমিএকটিগুলি=β^0+ +β^এফমিএকটিএক্স¯বিএকটি এমএকটিগুলি=β^0+ +β^বিএকটিএক্স¯বিএকটি এফমিএকটিগুলি=β^0+ +β^এফমিএকটি+ +β^বিএকটি

আপনার যদি ইন্টারঅ্যাকশন শব্দটি থাকে তবে এটি কালো মহিলাদের জন্য সমীকরণের শেষে যুক্ত করা হত। (এই জাতীয় মিথস্ক্রিয়া শব্দের ব্যাখ্যাটি বেশ বিশৃঙ্খল, তবে আমি এটির মাধ্যমে এখানে চলেছি: মিথস্ক্রিয়া শব্দটির ব্যাখ্যা ))


আপডেট : আমার পয়েন্টগুলি পরিষ্কার করতে, আসুন কোড করা একটি ক্যানড উদাহরণ বিবেচনা করুন R

d = data.frame(Sex  =factor(rep(c("Male","Female"),times=2), levels=c("Male","Female")),
               Race =factor(rep(c("White","Black"),each=2),  levels=c("White","Black")),
               y    =c(1, 3, 5, 7))
d
#      Sex  Race y
# 1   Male White 1
# 2 Female White 3
# 3   Male Black 5
# 4 Female Black 7

এখানে চিত্র বর্ণনা লিখুন

yএই শ্রেণিবদ্ধ ভেরিয়েবলগুলির মাধ্যমগুলি হ'ল :

aggregate(y~Sex,  d, mean)
#      Sex y
# 1   Male 3
# 2 Female 5
## i.e., the difference is 2
aggregate(y~Race, d, mean)
#    Race y
# 1 White 2
# 2 Black 6
## i.e., the difference is 4

আমরা এই উপায়গুলির মধ্যে পার্থক্যগুলিকে কোনও উপযুক্ত মডেল থেকে সহগের সাথে তুলনা করতে পারি:

summary(lm(y~Sex+Race, d))
# ...
# Coefficients:
#             Estimate Std. Error  t value Pr(>|t|)    
# (Intercept)        1   3.85e-16 2.60e+15  2.4e-16 ***
# SexFemale          2   4.44e-16 4.50e+15  < 2e-16 ***
# RaceBlack          4   4.44e-16 9.01e+15  < 2e-16 ***
# ...
# Warning message:
#   In summary.lm(lm(y ~ Sex + Race, d)) :
#   essentially perfect fit: summary may be unreliable

এই পরিস্থিতিটি সম্পর্কে স্বীকৃতি দেওয়ার বিষয়টি হ'ল, কোনও মিথস্ক্রিয়া শব্দ ছাড়াই আমরা সমান্তরাল রেখা ধরে নিচ্ছি। সুতরাং, Estimateজন্য (Intercept)সাদা পুরুষদের গড় হয়। Estimateজন্য SexFemaleনারী গড় এবং পুরুষদের গড় মধ্যে পার্থক্য। Estimateজন্য RaceBlackব্ল্যাক্স গড় বা সাদা গড় মধ্যে পার্থক্য। আবার, কারণ মিথস্ক্রিয়া শব্দ ছাড়া একটি মডেল প্রভাবগুলি কঠোরভাবে সংযোজনীয় বলে মনে করে (লাইনগুলি কঠোরভাবে সমান্তরাল হয়), তাই কালো মহিলাদের মেয়েদের গড়টি তখন সাদা পুরুষদের গড় এবং স্ত্রীলোকের গড় এবং পুরুষের গড়ের মধ্যকার পার্থক্য কৃষ্ণাঙ্গের গড়তা এবং শ্বেতের গড়ের মধ্যে পার্থক্য।


ধন্যবাদ! খুব পরিষ্কার এবং সহায়ক। শেষে আপনি ইন্টারঅ্যাকশন শর্তাদি উল্লেখ করুন। যদি কেউ একটি ইন্টারঅ্যাকশন শব্দটি করে তবে কীভাবে এটি বিটাগুলিকে পরিবর্তন করবে (অর্থাত্ত ইন্টারঅ্যাকশন টার্মের মডেল থেকে নতুন বিটাগুলি)? আমি জানি যে ইন্টারঅ্যাকশন শব্দটির জন্য পি মানটি গুরুত্বপূর্ণ, তবে মিথস্ক্রিয়া শব্দটির বিটাটির কী অর্থপূর্ণ ব্যাখ্যা রয়েছে? আপনার সাহায্যের জন্য আবার আপনাকে ধন্যবাদ!
রিনি

1
β^Femalex¯White Malex¯White Female

ইন্দ্রিয় তোলে। ধন্যবাদ! এবং এটি ইন্টারঅ্যাকশন টার্ম ছাড়াই মডেল থেকে পরিবর্তিত হয় ইন্টারঅ্যাকশন টার্মের কারণে মূল প্রভাবকে প্রশমিত করে? অর্থ যদি কোনও ইন্টারঅ্যাকশন না থাকে তবে মূল প্রভাব শব্দটি তাত্ত্বিকভাবে একই হবে?
রিনি 21

যদি ইন্টারঅ্যাকশন ইফেক্টটি ঠিক 0 (অসীম দশমিক স্থানে) হত তবে কেবল জনসংখ্যায় নয়, আপনার নমুনায়ও, প্রধান প্রভাব বিটাগুলি একটি মডেল ডাব্লু / বা ডাব্লু / ও ইন্টারঅ্যাকশন শব্দটির ক্ষেত্রে একই হবে।
গুং - মনিকা পুনরায়

1
@ hans0l0, মন্তব্যগুলিতে এখানে দাফন করা তথ্যের চেয়ে একটি নতুন প্রশ্ন হিসাবে ভাল হবে; আপনি প্রসঙ্গে এই লিঙ্ক করতে পারে। সংক্ষেপে, এটি সমস্ত রেফারেন্স স্তরের গড় যখন সমস্ত অবিচ্ছিন্ন চলক = 0 হয়।
গুং - মনিকা পুনরায়

6

β^0β^

যদি আমরা রেস ক্যাটাগরিতে ( এশিয়ান বলুন ) তৃতীয় স্তর অন্তর্ভুক্ত করার জন্য আপনার উদাহরণটিকে কিছুটা প্রসারিত করি এবং হোয়াইটটিকে রেফারেন্স হিসাবে বেছে নিয়েছি, তবে আপনার কাছে এটি হবে:

  • β^0=এক্স¯ওয়াটআমিটি
  • β^বিএকটি=এক্স¯বিএকটি-এক্স¯ওয়াটআমিটি
  • β^একজনগুলিআমিএকটিএন=এক্স¯একজনগুলিআমিএকটিএন-এক্স¯ওয়াটআমিটি

β^

  • এক্স¯একজনগুলিআমিএকটিএন=β^একজনগুলিআমিএকটিএন+ +β^0

দুর্ভাগ্যক্রমে একাধিক শ্রেণীবদ্ধ ভেরিয়েবলের ক্ষেত্রে, ইন্টারসেপ্টের সঠিক ব্যাখ্যাটি আর স্পষ্ট নয় (শেষে নোটটি দেখুন)। যখন সেখানে এন বিভাগ, একাধিক মাত্রা এবং এক রেফারেন্স স্তর (যেমন সঙ্গে প্রতিটি হোয়াইট এবং পুরুষ আপনি উদাহরণস্বরূপ), পথিমধ্যে সাধারন ফর্ম হল:

β^0=Σআমি=1এনএক্স¯RRএন,আমি-(এন-1)এক্স¯,
এক্স¯RRএন,আমি i-th শ্রেণীবদ্ধ ভেরিয়েবলের রেফারেন্স স্তরের গড়
এক্স¯ পুরো ডেটা সেট এর গড়

β^

আমরা যদি আপনার উদাহরণে ফিরে যাই তবে আমরা পেতাম:

  • β^0=এক্স¯ওয়াটআমিটি+ +এক্স¯এমএকটি-এক্স¯
  • β^বিএকটি=এক্স¯বিএকটি-এক্স¯ওয়াটআমিটি
  • β^একজনগুলিআমিএকটিএন=এক্স¯একজনগুলিআমিএকটিএন-এক্স¯ওয়াটআমিটি
  • β^এফমিএকটি=এক্স¯এফমিএকটি-এক্স¯এমএকটি

β^

β^β^0, β^বিএকটি, β^একজনগুলিআমিএকটিএনβ^এফমিএকটি

সংখ্যার উদাহরণ

ক্যানড সংখ্যার উদাহরণের জন্য আমাকে @ গুং থেকে orrowণ নিতে দিন:

d = data.frame(Sex=factor(rep(c("Male","Female"),times=3), levels=c("Male","Female")),
    Race =factor(rep(c("White","Black","Asian"),each=2),levels=c("White","Black","Asian")),
    y    =c(0, 3, 7, 8, 9, 10))
d

#      Sex  Race  y
# 1   Male White  0
# 2 Female White  3
# 3   Male Black  7
# 4 Female Black  8
# 5   Male Asian  9
# 6 Female Asian 10

β^

aggregate(y~1,  d, mean)

#          y
# 1 6.166667

aggregate(y~Sex,  d, mean)

#      Sex        y
# 1   Male 5.333333
# 2 Female 7.000000

aggregate(y~Race, d, mean)

#    Race   y
# 1 White 1.5
# 2 Black 7.5
# 3 Asian 9.5

আমরা এই সংখ্যার তুলনামূলক ফলাফলের সাথে তুলনা করতে পারি:

summary(lm(y~Sex+Race, d))

# Coefficients:
#             Estimate Std. Error t value Pr(>|t|)
# (Intercept)   0.6667     0.6667   1.000   0.4226
# SexFemale     1.6667     0.6667   2.500   0.1296
# RaceBlack     6.0000     0.8165   7.348   0.0180
# RaceAsian     8.0000     0.8165   9.798   0.0103

β^β^0

β^0=এক্স¯ওয়াটআমিটি+ +এক্স¯এমএকটি-এক্স¯
1.5 + 5.333333 - 6.166667
# 0.66666

বিপরীতে পছন্দটি নোট করুন

β^

β^এনটিRগুলিতোমার দর্শন লগ করামিβ^এনটিRগুলিতোমার দর্শন লগ করামি

  • β^0এনটিRগুলিতোমার দর্শন লগ করামি=এক্স¯
  • β^আমিএনটিRগুলিতোমার দর্শন লগ করামি=এক্স¯আমি-এক্স¯

আমরা যদি আগের উদাহরণটিতে ফিরে যাই তবে আপনার কাছে এমনটি ছিল:

  • β^0এনটিRগুলিতোমার দর্শন লগ করামি=এক্স¯
  • β^ওয়াটআমিটিএনটিRগুলিতোমার দর্শন লগ করামি=এক্স¯ওয়াটআমিটি-এক্স¯
  • β^বিএকটিএনটিRগুলিতোমার দর্শন লগ করামি=এক্স¯বিএকটি-এক্স¯
  • β^একজনগুলিআমিএকটিএনএনটিRগুলিতোমার দর্শন লগ করামি=এক্স¯একজনগুলিআমিএকটিএন-এক্স¯
  • β^এমএকটিএনটিRগুলিতোমার দর্শন লগ করামি=এক্স¯এমএকটি-এক্স¯
  • β^এফমিএকটিএনটিRগুলিতোমার দর্শন লগ করামি=এক্স¯এফমিএকটি-এক্স¯

β^এনটিRগুলিতোমার দর্শন লগ করামি

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.