নন-প্যারামেট্রিক টেস্টের সাথে কীভাবে ইন্টারঅ্যাকশন ইফেক্টটি পরীক্ষা করতে হবে (উদাহরণস্বরূপ একটি ক্রমায়ন পরীক্ষা)?


10

আমার দুটি শ্রেণীবদ্ধ / নামমাত্র ভেরিয়েবল রয়েছে। তাদের প্রত্যেকটি মাত্র দুটি স্বতন্ত্র মান নিতে পারে (সুতরাং, আমার মোট 4 টি সংমিশ্রণ রয়েছে)।

প্রতিটি মানগুলির সংমিশ্রণটি সংখ্যাসূচক মানের একটি সেট নিয়ে আসে। সুতরাং, আমি সংখ্যা 4 সেট আছে। এটি আরও কংক্রিট করার জন্য, আসুন আমরা বলি যে আমার কাছে male / femaleএবং young / oldনামমাত্র ভেরিয়েবল এবং আমার কাছে weightনির্ভরশীল সংখ্যাসূচক "আউটপুট" হিসাবে রয়েছে।

আমি থেকে যে রূপান্তরটি জানেন maleকরার femaleগড় ওজন পরিবর্তন না এবং এই পরিবর্তনগুলি পরিসংখ্যানগত ভাবে উল্লেখযোগ্য হয়। সুতরাং, আমি একটি genderফ্যাক্টর গণনা করতে পারি । একই ageপরিবর্তনশীল ক্ষেত্রে প্রযোজ্য । আমি যে রূপান্তরটি চেনা ব্যক্তিদের না youngকরতে oldগড় ওজন পরিবর্তন করেন এবং আমি সংশ্লিষ্ট নিরূপণ করতে পারেন ageফ্যাক্টর।

এখন, আমি কী দেখতে চাই যে ডেটা প্রমাণ করে যে অল্প বয়সী-স্ত্রী থেকে বৃদ্ধ-পুরুষের মধ্যে রূপান্তর লিঙ্গ- এবং বয়সের কারণগুলির সংমিশ্রণ। অন্য কথায়, আমি জানতে চাই যে ডেটা প্রমাণ করে যে "2 ডি ইফেক্টস" রয়েছে বা অন্য কথায়, বয়স এবং লিঙ্গ-প্রভাবগুলি স্বাধীন নয়। উদাহরণস্বরূপ, এটি হতে পারে যে পুরুষদের জন্য বয়স্ক হয়ে ওজন বৃদ্ধি করে 1.3 ফ্যাক্টর এবং মহিলাদের ক্ষেত্রে সংশ্লিষ্ট ফ্যাক্টরটি 1.1 হয়।

অবশ্যই আমি দুটি উল্লিখিত কারণগুলি (পুরুষদের বয়সের ফ্যাক্টর এবং মহিলাদের ক্ষেত্রে বয়সের ফ্যাক্টর) গণনা করতে পারি এবং সেগুলি আলাদা। তবে আমি এই পার্থক্যের পরিসংখ্যানগত তাত্পর্য গণনা করতে চাই। এই পার্থক্যটি কতটা বাস্তব।

আমি যদি সম্ভব হয় তবে একটি প্যারামিমেট্রিক পরীক্ষা করতে চাই। চারটি সেট মিশ্রিত করে, এলোমেলো করে দেওয়া, পুনরায় বিভাজন এবং কোনও কিছুর গণনা করে আমি যা করতে চাই তা করা সম্ভব?


2
অপ্রতিরোধ্যভাবে মিথস্ক্রিয়া নিয়ে কাজ করার ক্ষেত্রে একটি অসুবিধা হ'ল প্রতিক্রিয়ার একঘেয়ে রূপান্তর উপস্থিত উপস্থিত মিথস্ক্রিয়াকে সরিয়ে দিতে পারে, যেখানে অনুপস্থিত ছিল সেখানে মিথস্ক্রিয়াকে প্ররোচিত করতে পারে বা মিথস্ক্রিয়াটির দিকটি সরিয়ে দিতে পারে। এটি পরামর্শ দেয় যে র‌্যাঙ্ক-ভিত্তিক পদ্ধতিগুলি উদাহরণস্বরূপ, আপনি তাদের কাছে যা প্রত্যাশা রেখেছিলেন তা করতে পারে না।
গ্লেন_বি -রিনস্টেট মনিকা

মূল ভেরিয়েবলগুলিতে ক্রমবর্ধমান পরীক্ষার সাহায্যে আপনার সমস্যা নেই তবে এটি দেখা যাচ্ছে যে মিথস্ক্রিয়াটির জন্য কোনও সঠিক পরীক্ষা নেই। আপনি কিছু আনুমানিক পরীক্ষা পেতে পারেন।
গ্লেন_বি -রিনস্টেট মনিকা

উত্তর:


5

মিথস্ক্রিয়া জন্য ননপ্যারমেট্রিক পরীক্ষা আছে। মোটামুটিভাবে বলতে গেলে, আপনি পর্যবেক্ষণকৃত ওজনগুলিকে তাদের র‌্যাঙ্ক দ্বারা প্রতিস্থাপন করুন এবং ফলাফল ডেটা সেটটিকে হেটেরোসটেস্টেস্টিক আনোভা হিসাবে বিবেচনা করুন। উদাহরণস্বরূপ ব্রুনার এবং পুরি (2001) দ্বারা "ফ্যাক্টরিয়াল ডিজাইনে ননপ্যারমেট্রিক পদ্ধতিগুলি" দেখুন।

তবে আপনি যে ধরণের ননপ্যারামেট্রিক ইন্টারঅ্যাকশন করতে আগ্রহী তা এই সাধারণতায় প্রদর্শিত হতে পারে না। তুমি বলেছিলে:

অন্য কথায়, আমি জানতে চাই যে ডেটা প্রমাণ করে যে "2 ডি ইফেক্টস" রয়েছে বা অন্য কথায়, বয়স এবং লিঙ্গ-প্রভাবগুলি স্বাধীন নয়। উদাহরণস্বরূপ, এটি হতে পারে যে পুরুষদের জন্য বয়স্ক হয়ে ওজন বৃদ্ধি করে 1.3 ফ্যাক্টর এবং মহিলাদের ক্ষেত্রে সংশ্লিষ্ট ফ্যাক্টরটি 1.1 হয়।

পরেরটি অসম্ভব। ননপ্যারমেট্রিক ক্রিয়াকলাপ অবশ্যই একটি লক্ষণ পরিবর্তনের সাথে জড়িত থাকতে হবে, অর্থাত্ বৃদ্ধ বয়স্ক পুরুষদের ওজন বৃদ্ধি করে কিন্তু মহিলাদের ওজন হ্রাস করে। আপনি যদি একঘেয়েভাবে ওজনকে রূপান্তর করেন তবে এ জাতীয় চিহ্ন পরিবর্তন রয়েছে। তবে আপনি যে ডেটাতে ওজন বৃদ্ধির মানচিত্রটি ১.১ এর কাছাকাছি যেতে চান তত কাছাকাছি যেতে চান এমন ডেটাতে একঘেয়ে রূপান্তর চয়ন করতে পারেন 1. অবশ্যই, আপনি কখনই তাত্পর্যপূর্ণ হতে পারছেন তা যদি আপনি চান তার কাছাকাছি হতে পারে না।

আপনি যদি সত্যই সাইন পরিবর্তন ছাড়াই মিথস্ক্রিয়ায় আগ্রহী হন, আপনার স্বাভাবিক প্যারাম্যাট্রিক বিশ্লেষণে আটকে থাকা উচিত। সেখানে, একঘেয়ে রূপান্তরগুলি যে "পার্থক্যটি গ্রাস করে" অনুমোদিত নয়। অবশ্যই, এটি আবার আপনার পরিসংখ্যানের মডেলিং এবং ব্যাখ্যা করে মনে রাখার মতো।


1

আপনি যদি বিশ্বাস করেন যে বয়স এবং লিঙ্গের প্রভাবগুলি কেবলমাত্র পৃথক প্রভাবের চেয়ে বেশি, আপনিweighti=αagei+βgenderi+γ(genderiagei). সহগ যেমনটি বয়স এবং লিঙ্গ এর "2D" এফেক্ট মাপ। আপনি এর টি-পরিসংখ্যাত পরীক্ষা করতে পারবেন γ উপর একটা মোটামুটি ধারণা পেতে হবে কিনা তা γ আপনি আপনার মডেল পালন থেকে উল্লেখযোগ্যভাবে ভিন্ন হয় γ = 0γγγγ=0

এই অতিরিক্ত গুণক শব্দ করে তা দেখানোর জন্য এখানে একটি খুব রুক্ষ গ্রাফিকাল উদাহরণ রয়েছে ।genderiagei

মডেলটিতে , আমরা প্রয়োজনীয়ভাবে ডেটার সাথে একটি সাধারণ হাইপারপ্লেন ফিট করার চেষ্টা করিresponse=x1+x2

এখানে চিত্র বর্ণনা লিখুন

এটি মডেলটি কোভেরিয়েটগুলিতে রৈখিক, সুতরাং উপরের প্লটে আপনি লিনিয়ার আকৃতিটি দেখেন see

অন্যদিকে, মডেলটি এক্স 1 এবং x 2 -তে অ-রৈখিক এবং সুতরাং কিছু স্তর বক্ররেখার জন্য অনুমতি দেয়response=x1+x2+x1x2x1x2

এখানে চিত্র বর্ণনা লিখুন

মডেলটিতে এই ফর্মের কিছু বক্রতা রয়েছে তা প্রত্যাখ্যান করতে ব্যর্থ হওয়ার মতো অনুমানটিকে প্রত্যাখ্যান করতে ব্যর্থ।γ=0

একটি অ-স্থিতিমাপ পরীক্ষা নিরিখে আপনার জন্য বুটস্ট্র্যাপ মান ত্রুটি প্রাপ্তির কি প্রস্তাব লাইন বরাবর কিছু করতে পারেন । এর অর্থ এই যে, বেশ কয়েকবার আপনি: 1) প্রতিস্থাপন সঙ্গে আপনার তথ্যের নমুনা, 2) রৈখিক মোড, 3) একটি অনুমান পেতে পুনঃগণনা γ । আপনি অনেক অনুমান পর γ , আপনি ব্যবহার করতে পারেন 50 ± পি % অ-স্থিতিমাপ সেট আপ করার সমাংশক 2 পি % জন্য আস্থা ব্যবধান γ । এ সম্পর্কে আরও তথ্যের জন্য গুগল "বুটস্ট্র্যাপ স্ট্যান্ডার্ড ত্রুটিগুলি"।γγ^γ^50±p%2p%γ


X1 এবং x2 কেবল 0 বা 1 এর মান নিতে পারলে এটি কীভাবে অ-রৈখিক হতে পারে? আপনার উদাহরণে গামা বক্রতার কোনও রূপকে কীভাবে ব্যাখ্যা করবে?
ইয়াতে

ডোমেনটি কী তা তা বিবেচনা করে না, এটি এখনও অ-রৈখিক কারণ ফাংশনটি তার আর্গুমেন্টের রৈখিক সংমিশ্রণ হিসাবে লেখা যায় না (যেমন )। আপনার দ্বিতীয় পয়েন্টের জন্য, লক্ষ্য করুন আমি সাবধানে বলেছি "খুব রুক্ষ গ্রাফিকাল উদাহরণ"। এটি বাইনারি কেসের অবিচ্ছিন্ন অ্যানালগ। αR2:x1+x2+x1x2=i=12αixi
মোস্তফা এস আইসা

তবে আমি যুক্ত করব যে ডোমেনটি যখন বাইনারি হয় (যা 2D ঘনক্ষেত্রের মতো হয়) তবে আপনি এই ফাংশনটিকে রৈখিকভাবে আচরণ করতে পারেন। তবে কার্যকরী ফর্মটি কঠোরভাবে অ-রৈখিক।
মোস্তফা এস আইসা

@ মুস্তফাএমইসা, আমি কোনও লিনিয়ার মডেলটিতে "ইন্টারভিউ টার্মটি একটি 2 ডি কিউবের উল্লম্ব অংশ" ব্যাখ্যা করে কখনও দেখিনি। আপনি বিস্তারিত বলতে পারলে এটি তথ্যবহুল হবে।
ইয়াতে

@ হোর্স্টগ্রনবুশ, আপনার উত্তর সম্পর্কে আপনার মন্তব্য সম্পর্কে আমি কৌতূহলী, কারণ আপনি ইতিমধ্যে আমার উত্তর সম্পর্কে সহায়ক মন্তব্য দিয়েছেন a
ইয়াতে

1

wt=α+b1age+b2gender+b3agegender+ϵ

wtgender=b2+b3age

gender=0age=0gender=1age=1gender=0age=1gender=1age=0

wt=α+b1young.male+b2old.male+b3young.female+ϵ

old.femaleb1old.femaleyoung.maleαwtold.female

উপরোক্ত উদাহরণগুলি এই উপসংহারে পৌঁছানোর জন্য একটি অতি জটিল উপায় (যে আমরা সত্যিকার অর্থে কেবল চারটি গ্রুপের সাথে তুলনা করছি), তবে মিথস্ক্রিয়াগুলি কীভাবে কাজ করে তা শিখার জন্য, আমি মনে করি এটি একটি সহায়ক সংক্ষেপণ। নামমাত্র ভেরিয়েবলের সাথে অবিচ্ছিন্ন ভেরিয়েবলের সাথে ইন্টারঅ্যাক্ট করার বা দুটি ক্রমাগত ভেরিয়েবলের সাথে ইন্টারঅ্যাক্ট করার বিষয়ে সিভিতে আরও খুব ভাল পোস্ট রয়েছে। যদিও আপনার প্রশ্নটি নন-প্যারাম্যাট্রিক পরীক্ষা নির্দিষ্ট করার জন্য সম্পাদনা করা হয়েছে, তবে আমি মনে করি এটি আপনার সমস্যাটি আরও প্রচলিত (অর্থাত্ প্যারাম্যাট্রিক) পদ্ধতির মাধ্যমে চিন্তা করা সহায়ক বলে মনে হয়, কারণ হাইপোথিসিস টেস্টিংয়ের বেশিরভাগ নন-প্যারামেট্রিক পদ্ধতির একই যুক্তি রয়েছে তবে সাধারণত নির্দিষ্ট বিতরণ সম্পর্কে কম অনুমান।

wt

old.menyoung.women

"উল্লেখযোগ্য" মিথস্ক্রিয়া সংক্ষিপ্ততর

x1x2x1x2তবে আরও একবার, যদি আমাদের কাছে কেবল দুটি কোভারিয়েট থাকে যা কেবল 0 বা 1 এর মান নিতে পারে, তার মানে আমরা মূলত চারটি গ্রুপের দিকে তাকাই।

কাজের উদাহরণ

আসুন ইন্টারন্যাশনাল মডেল থেকে ডান পরীক্ষার ফলাফলের সাথে ফলাফলের তুলনা করি। প্রথমে আসুন এমন কিছু ডেটা তৈরি করা যাক যেখানে (ক) পুরুষরা মহিলাদের তুলনায় বেশি ওজন পান করেন (খ) বয়স্ক পুরুষদের চেয়ে কম বয়সী পুরুষদের ওজন কম এবং (গ) তরুণ এবং বয়স্ক মহিলাদের মধ্যে কোনও পার্থক্য নেই।

set.seed(405)
old.men<-rnorm(50,mean=80,sd=15)
young.men<-rnorm(50,mean=70,sd=15)
young.women<-rnorm(50,mean=60,sd=15)
old.women<-rnorm(50,mean=60,sd=15)
cat<-rep(1:4, c(50,50,50,50))
gender<-rep(1:2, c(100,100))
age<-c(rep(1,50),rep(2,100),rep(1,50))
wt<-c(old.men,young.men,young.women,old.women)
data<-data.frame(cbind(wt,cat,age,gender))
data$cat<-factor(data$cat,labels=c("old.men","young.men","young.women","old.women"))
data$age<-factor(data$age,labels=c("old","young"))
data$gender<-factor(data$gender,labels=c("male","female"))

wt

mod<-lm(wt~age*gender,data)
library(effects)
allEffects(mod)

 model: wt ~ age * gender

 age*gender effect
       gender
age         male   female
  old   80.61897 57.70635
  young 67.78351 56.01228

আপনার প্রান্তিক প্রভাবের জন্য একটি আদর্শ ত্রুটি বা আত্মবিশ্বাসের ব্যবধান গণনা করা দরকার? উপরের রেফারেন্সযুক্ত 'ইফেক্টস' প্যাকেজটি এটি আপনার জন্য করতে পারে তবে আরও ভাল, আইকন এবং পশ্চিম (1991) আপনাকে আরও সূত্রগুলি প্রদান করে, এমনকি আরও জটিল ইন্টারঅ্যাকশন মডেলের জন্যও। তাদের টেবিলগুলি এখানে ম্যাট গোল্ডারের খুব ভাল ভাষ্য সহ সুবিধামত মুদ্রণ করা হয়েছে

এখন ডান পরীক্ষা বাস্তবায়ন করতে।

#install.packages("dunn.test")
dunn.test(data$wt, data$cat, method="bh")

Kruskal-Wallis chi-squared = 65.9549, df = 3, p-value = 0


                           Comparison of x by group                            
                             (Benjamini-Hochberg)                              
Col Mean-|
Row Mean |    old.men   young.me   young.wo
---------+---------------------------------
young.me |   3.662802
         |    0.0002*
         |
young.wo |   7.185657   3.522855
         |    0.0000*    0.0003*
         |
old.wome |   6.705346   3.042544  -0.480310
         |    0.0000*    0.0014*     0.3155

কৃস্কাল-ওয়ালিস চি-স্কোয়ার পরীক্ষার ফলাফলের পি-মানটি থেকে বোঝা যায় যে আমাদের গ্রুপের কমপক্ষে একটি 'ভিন্ন জনগোষ্ঠী থেকে আসে' ' গ্রুপ-বি-গ্রুপের তুলনাগুলির জন্য, শীর্ষ সংখ্যাটি হ'ল ডানের জেড-পরীক্ষা পরিসংখ্যান, এবং নীচের সংখ্যাটি পি-মান, যা একাধিক তুলনার জন্য সামঞ্জস্য করা হয়েছে। আমাদের উদাহরণস্বরূপ ডেটা বরং কৃত্রিম ছিল, এটি আশ্চর্যজনক যে আমাদের এতগুলি ছোট পি-মান রয়েছে। তবে কম বয়সী এবং বয়স্ক মহিলাদের মধ্যে নীচের অংশে ডান তুলনাটি নোট করুন। পরীক্ষাটি নাল অনুমানকে সঠিকভাবে সমর্থন করে যে এই দুটি দলের মধ্যে কোনও পার্থক্য নেই।

আপডেট: অন্যান্য উত্তর দেওয়া, এই উত্তরটি আপডেট করা হয়েছে এই ধারণাটি বিতর্ক করতে যে এটির জন্য কোনও রৈখিক মডেলিংয়ের কোনও ফর্ম প্রয়োজন, বা এটি - দুটি বাইনারি কোভারিয়েটগুলির ওপির নির্দিষ্ট উদাহরণ দেওয়া হয়েছে, যেমন, চারটি গ্রুপ - যে একটি অবশ্যই থাকতে হবে এই অ-প্যারাম্যাট্রিকভাবে অ্যাসেসিসে পরিবর্তনের জন্য সাইন ইন করুন। বয়স যদি অবিচ্ছিন্ন থাকে, উদাহরণস্বরূপ, এই সমস্যাটির কাছে যাওয়ার আরও অন্যান্য উপায় থাকতে পারে, তবে এটি ওপি-র দেওয়া উদাহরণ নয়।


আপনি দুটি ক্রস কারণের কাঠামো ব্যবহার করবেন না। আপনি কেবল চারটি গ্রুপের তুলনা করুন। ডানের পরীক্ষা মোটেই ইন্টারঅ্যাকশন সম্পর্কিত নয়।
হোর্স্ট গ্রানবুশ

সম্মত, ডনের পরীক্ষা ইন্টারঅ্যাকশন সম্পর্কে নয়। তবে, প্রশ্নটি দুটি বাইনারি ভেরিয়েবলের মধ্যে মিথস্ক্রিয়া সম্পর্কে বিশেষভাবে জিজ্ঞাসা করে। আমার উত্তরটি দেখায় যে এটি কীভাবে চারটি দলের তুলনার সমান। যদি ইন্টারঅ্যাকশন শর্তাদি ওপিতে নতুন হয়, আশা করি এটি সহায়ক সহায়ক ration
ইয়াতে

1

সুতরাং আপনার এই র্যান্ডম ভেরিয়েবলগুলি রয়েছে:

  • AN
  • S{male,female}
  • W]0,[

এবং আপনার এই সম্ভাব্যতা ভর / ঘনত্ব ফাংশন রয়েছে:

  • fWW
  • fW,AW,A
  • fW,SW,S
  • fW,A,SW,A,S

was

  • fW,A(w,a)fW(w)
  • fW,S(w,s)fW(w)

fW,A,S(w,a,s)fW,A(w,a)fW,S(w,s)

was

তবে আপনি উপরের সত্যিকারের যৌথ পিডিএফগুলি জানেন না। যেহেতু আপনি নিজেকে নন-প্যারাম্যাট্রিক পদ্ধতিতে সীমাবদ্ধ রাখতে চান, এখন আপনার কাজ হ'ল এই প্যারাম্যাট্রিক অ অনুমানগুলি খুঁজে পাওয়া:

  • f^W,A(w,a)
  • f^W,S(w,s)
  • f^W,A,S(w,a,s)

এবং তারপরে এটি দেখান:

  • আপনার ঘনত্বের অনুমানগুলি যথেষ্ট সঠিক।
  • f^W,A,S(w,a,s)f^W,A(w,a)f^W,S(w,s)
  • f^W,A,S(w,a,s)=f^W,A(w,a)=f^W,S(w,s)

0

এটি ইন্টারঅ্যাকশন প্রভাবগুলির জন্য পরীক্ষা করা হবে । লিনিয়ার মডেলিং এ জাতীয় জিনিসটি পরীক্ষা করতে সক্ষম হবে তবে এটি প্যারামিমেট্রিক নয় তাই আমার ধারণা অন্য একটি সরঞ্জাম অবশ্যই ব্যবহার করা উচিত।

আপনি কিভাবে আপনার যাচাই করছি ageএবং genderপ্রভাব এখন পর্যন্ত আপ করবেন?

সম্পাদনা: উত্তরটি দেখে মনে হচ্ছে এটি আপনাকে সহায়তা করবে

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.