তাত্ক্ষণিক আনোভাতে ত্রুটি শব্দটি কীভাবে ন্যায়সঙ্গত করা যায়?


13

মাল্টি-ফ্যাক্টরিয়াল আনোভা সম্পর্কে সম্ভবত একটি খুব প্রাথমিক প্রশ্ন। একটি দ্বি-মুখী নকশা অনুমান করুন যেখানে আমরা এ, বি এবং ইন্টারঅ্যাকশন দুটি মূল প্রভাব পরীক্ষা করি। টাইপ আই এসএস দিয়ে এ-এর মূল প্রভাব পরীক্ষা করার সময়, প্রভাব এসএসকে পার্থক্য হিসাবে গণনা করা হয় , যেখানে কেবলমাত্র বিরতি দিয়ে মডেলের জন্য স্কোয়ারের অবশিষ্ট অবধি, এবং ফ্যাক্টর এ সহ মডেলটির জন্য আরএসএস যুক্ত হয়েছে। আমার প্রশ্নটি ত্রুটি শর্তের জন্য পছন্দটি সম্পর্কিত:RSS(1)RSS(A)RSS(1)RSS(A)

আপনি কীভাবে ন্যায়সঙ্গত করবেন যে এই পরীক্ষার জন্য ত্রুটি শব্দটি সাধারণত পুরো মডেল A + B + A: B এর আরএসএস থেকে গণনা করা হয়: বি এতে প্রধান প্রভাব এবং মিথস্ক্রিয়া উভয়ই অন্তর্ভুক্ত?

FA=(RSS1RSSA)/(dfRSS1dfRSSA)RSSA+B+A:B/dfRSSA+B+A:B

... প্রকৃত তুলনা থেকে সীমাহীন মডেল থেকে ত্রুটি শব্দটি নেওয়ার বিরোধিতা করা হয়েছে (উপরের ক্ষেত্রে কেবল প্রধান প্রভাব এ থেকে আরএসএস):

FA=(RSS1RSSA)/(dfRSS1dfRSSA)RSSA/dfRSSA

এটি একটি পার্থক্য তৈরি করে, কারণ সম্পূর্ণ মডেল থেকে ত্রুটি শব্দটি প্রায়শই (সর্বদা নয়) তুলনায় অনিচ্ছিন্ন মডেল থেকে ত্রুটি শব্দটির চেয়ে ছোট হয় smaller দেখে মনে হচ্ছে ত্রুটি শর্তের জন্য পছন্দটি কিছুটা স্বেচ্ছাসেবী, কেবল আগ্রহী নয় এমন উপাদানগুলি যুক্ত / অপসারণ করে কাঙ্ক্ষিত পি-মান পরিবর্তনের জন্য জায়গা তৈরি করে তবে ত্রুটি শর্তটি যেকোনভাবে পরিবর্তন করে।

নিম্নলিখিত উদাহরণে, এফের জন্য এ-মানটি পুরো মডেলের নির্বাচনের উপর নির্ভর করে যথেষ্ট পরিবর্তিত হয়, যদিও এসএসের প্রভাবের আসল তুলনা একই থাকে।

> DV  <- c(41,43,50, 51,43,53,54,46, 45,55,56,60,58,62,62,
+          56,47,45,46,49, 58,54,49,61,52,62, 59,55,68,63,
+          43,56,48,46,47, 59,46,58,54, 55,69,63,56,62,67)

> IV1 <- factor(rep(1:3, c(3+5+7, 5+6+4, 5+4+6)))
> IV2 <- factor(rep(rep(1:3, 3), c(3,5,7, 5,6,4, 5,4,6)))
> anova(lm(DV ~ IV1))                           # full model = unrestricted model (just A)
          Df  Sum Sq Mean Sq F value Pr(>F)
IV1        2  101.11  50.556  0.9342 0.4009
Residuals 42 2272.80  54.114

> anova(lm(DV ~ IV1 + IV2))                     # full model = A+B
          Df  Sum Sq Mean Sq F value   Pr(>F)    
IV1        2  101.11   50.56  1.9833   0.1509    
IV2        2 1253.19  626.59 24.5817 1.09e-07 ***
Residuals 40 1019.61   25.49                     

> anova(lm(DV ~ IV1 + IV2 + IV1:IV2))           # full model = A+B+A:B
          Df  Sum Sq Mean Sq F value    Pr(>F)    
IV1        2  101.11   50.56  1.8102    0.1782    
IV2        2 1253.19  626.59 22.4357 4.711e-07 ***
IV1:IV2    4   14.19    3.55  0.1270    0.9717    
Residuals 36 1005.42   27.93

একই প্রশ্নটি দ্বিতীয় এসএস টাইপ করতে প্রযোজ্য এবং সাধারণ রৈখিক হাইপোথিসিসের ক্ষেত্রে, অর্থাত্ একটি সম্পূর্ণ মডেলের মধ্যে সীমাবদ্ধ এবং একটি সীমাহীন মডেলের মধ্যে একটি মডেল তুলনা করতে। (তৃতীয় এসএস টাইপের ক্ষেত্রে, বাধাবদ্ধ মডেলটি সর্বদা সম্পূর্ণ মডেল থাকে, সুতরাং সেখানে প্রশ্নটি উত্থাপিত হয় না)


আমি শুধু আপনার প্রশ্ন সঙ্গে গুলিয়ে ফেলা হতে পারে, কিন্তু এর প্রভাব পরীক্ষার জন্য প্রকার 1 এস এস সঙ্গে, হর হয় আপনি আপনার দ্বিতীয় অভিব্যক্তি আছে। চলমান থেকে আউটপুট এফ-মান আপনার দ্বিতীয় এক্সপ্রেশন মাধ্যমে গণনা করা হয়। মানে, যদি আপনি দৌড়ে এবং এবং আপনার দ্বিতীয় অভিব্যক্তি মধ্যে সংশ্লিষ্ট মান প্লাগ, আপনি পেতে । আমি যদি আপনার উদ্বেগকে পুরোপুরি মিস করছি তবে আমাকে জানান। Aanova(lm(DV ~ IV1))anova(lm(DV ~ 1))anova(lm(DV ~ IV1))F=0.9342

@ মাইকওয়াইয়ারজবিকি আপনি ঠিক বলেছেন যে যদি পুরো মডেলটিতে কেবলমাত্র IV1(1 ম উদাহরণ) থাকে তবে ডিনোমিনেটরের জন্য দুটি অভিব্যক্তি একই রকম। যাইহোক, যখন পূর্ণ মডেল অতিরিক্ত প্রভাব রয়েছে, পরীক্ষার জন্য হর এমনকি মডেল তুলনা (যদিও পরিবর্তন বনাম জন্য টাইপ 1 এস এস) নেই। 3 উদাহরণে, জন্য গড় বর্গ (সব ক্ষেত্রে একই মডেল তুলনা) পরিবর্তন করে না, কিন্তু গড় বর্গ ত্রুটি আছে। আমি যখন আসল তুলনা একই থাকে তখন পরিবর্তিত ত্রুটি শব্দটিকে কী ন্যায়সঙ্গত করে তা সম্পর্কে আমি আগ্রহী। A~ 1~ IV1 + 1A
কারাকাল

আরে @ কারাকাল, এত পুরানো উত্তর হঠাৎ স্বীকার হয়ে ভাল লাগল! :-) চিয়ার্স
অ্যামিবা বলেছেন মনিকাকে

উত্তর:


4

এটি একটি খুব পুরানো প্রশ্ন, এবং আমি বিশ্বাস করি যে @ গুং এর উত্তর খুব ভাল (+1)। তবে এটি সম্পূর্ণরূপে @ কারাকালের জন্য বিশ্বাসযোগ্য ছিল না এবং আমি এর সমস্ত জটিলতাও পুরোপুরি অনুসরণ করি না, তাই আমি কীভাবে বিষয়টি বুঝি তা বোঝানোর জন্য একটি সহজ চিত্র সরবরাহ করতে চাই।


দ্বি-মুখী আনোভা বিবেচনা করুন (ফ্যাক্টর এ এর ​​তিনটি স্তর রয়েছে, ফ্যাক্টর বি এর দুটি স্তর রয়েছে) উভয় কারণই স্পষ্টতই অত্যন্ত তাৎপর্যপূর্ণ:

ফ্যাক্টরিয়াল আনোভা বর্গক্ষেত্রের যোগফল

এস ফ্যাক্টর এ এর ​​জন্য বিশাল। বি ফ্যাক্টর বি এর জন্য এসএস অনেক ছোট, তবে শীর্ষ চিত্র থেকে এটি স্পষ্ট যে ফ্যাক্টর বি তবুও খুব তাত্পর্যপূর্ণ।

উভয় উপাদান সমন্বিত মডেলটির জন্য ত্রুটি এসএস ছয়টি গাউসিয়ানদের মধ্যে একটির দ্বারা প্রতিনিধিত্ব করা হয়, এবং এসএসকে এই ত্রুটি এসএসের সাথে ফ্যাক্টর বিয়ের সাথে তুলনা করার সময়, পরীক্ষাটি এই সিদ্ধান্তে পৌঁছায় যে ফ্যাক্টর বি তাৎপর্যপূর্ণ।

ত্রুটি এসএস কেবলমাত্র ফ্যাক্টর বিযুক্ত মডেলটির জন্য, তবে এটি বিশাল! এই বৃহত ত্রুটি এসএসের সাথে ফ্যাক্টর বি এর সাথে এসএসের তুলনা করলে বি অবশ্যই ফলস্বরূপ তাত্পর্যপূর্ণ নয় বলে প্রদর্শিত হবে। যা স্পষ্টভাবে ক্ষেত্রে হয় না।

এজন্য সম্পূর্ণ মডেল থেকে ত্রুটি এসএস ব্যবহার করা বোধগম্য।


2

আপডেট: এখানে যাওয়ার সময় আমি যে কয়েকটি পয়েন্টটি করি তা স্পষ্ট করার জন্য, আমি সেই জায়গাগুলিতে কয়েকটি লিঙ্ক যুক্ত করেছি যেখানে আমি সম্পর্কিত ধারণাগুলি আরও পুরোপুরি আলোচনা করি।


এফ পরীক্ষাটি পরীক্ষা করে পরীক্ষা করে দেখা যায় যে সুযোগের দ্বারা প্রত্যাশার চেয়ে কোনও ফ্যাক্টরের সাথে সম্পর্কিত আরও পরিবর্তনশীলতা (বিশেষত মানে স্কোয়ারগুলি) রয়েছে কিনা। সম্ভাব্যতার দ্বারা আমরা কতটা বৈকল্পিকতা আশা করতে পারি সেটিকে স্কোয়ার ত্রুটির সমষ্টি থেকে অনুমান করা হয়, এটি কোন পরিচিত কারণের (সম্পর্কিত) কতটা পরিবর্তনশীলতার কারণে। এটি আপনার অবশিষ্টাংশগুলি, আপনার সম্পর্কে সমস্ত কিছুর জন্য অ্যাকাউন্টিং করার পরে কী বাকী রয়েছে। আপনার উদাহরণে, just এর মধ্যে কেবলমাত্র অবশিষ্টাংশের ত্রুটি রয়েছে, এটি জ্ঞাত কারণগুলির কারণেও পরিবর্তনশীলতা ধারণ করে। যদিও সুযোগ হিসাবে কিছুটা ডিগ্রি অর্জনের জন্য তাত্ত্বিক তৈরি করা হয়েছে, সেই পরিমাণটি অন্যান্য জ্ঞাত কারণগুলি 1 দ্বারা চালিত হয়ে তাত্ত্বিক হয় না । সুতরাং, use ব্যবহার করা অনুচিত হবে এস এস এম এস এম এস এম এস + বি + বিRSSASSAMSAআপনার F পরীক্ষায় ডিনোমিনেটর হিসাবে তদুপরি, ব্যবহার করা আপনাকে আরও শক্তি দেয়, দ্বিতীয় ধরণের ত্রুটির সম্ভাবনা হ্রাস করে এবং I টাইপ ধরণের ত্রুটি বাড়ানো উচিত নয়। MSA+B+AB

আপনার প্রশ্নে আরও কিছু সমস্যা রয়েছে। আপনি উল্লেখ যে সবসময় সর্বনিম্ন নয়, এবং আপনার উদাহরণে, । এটি কারণ ইন্টারঅ্যাকশনটি আসলে এর নিজস্ব কোনও পরিবর্তনশীলতার সাথে সম্পর্কিত নয়। সেই টি সুযোগের চেয়ে বেশি কিছু না বলে মনে হয়। একটি সুনির্দিষ্ট, তবে কিছুটা জটিল, সূত্র রয়েছে যা নির্দিষ্ট করে যে মডেল থেকে বিভিন্ন বিষয় অন্তর্ভুক্ত করা বা বাদ দেওয়া হলে শক্তি কীভাবে পরিবর্তিত হবে specif আমার নখদর্পণে এটি নেই, তবে এর সংক্ষিপ্ত সহজ: আপনি যখন অন্য একটি অন্তর্ভুক্ত করেন তখন আরএসএস হ্রাস পায় (আপনাকে আরও শক্তি দেয়), তবে এম এস + বি + বি > এম এস + বি এস এস বি = 14.19 ডি আরRSSfullMSA+B+AB>MSA+BSSAB=14.19dfRনিচে যায় (কম শক্তি উত্পাদন)। এই ট্রেড অফের ভারসাম্যটি মূলত নির্ধারণ করা হয় যে এসএসটির সাথে যুক্ত এসএসটি বাস্তব, বা কেবল সুযোগের কারণে, যা বাস্তবে, গুণকটি উল্লেখযোগ্য 2 কিনা তা স্বল্পতার সাথে নির্দেশিত হয় । তবে, সঠিক ত্রুটি শব্দটি পেতে মডেল থেকে যে উপাদানগুলি তাত্পর্যপূর্ণ নয় তা অপসারণ করা যৌক্তিকভাবে একটি স্বয়ংক্রিয় মডেল অনুসন্ধান পদ্ধতির সমতুল্য, এমনকি আপনার নিজের সফ্টওয়্যার না থাকলেও এটি স্বয়ংক্রিয়ভাবে এটি আপনার জন্য করে না। আপনার জানা উচিত যে এটি করার সাথে অনেকগুলি সমস্যা রয়েছে। এই সমস্যাগুলি এবং বিকল্প পদ্ধতিগুলি সিভি 3 তে অন্য কোথাও আলোচনা করা হয় ।

একটি চূড়ান্ত বিষয় বিভিন্ন ধরণের এসএস নিয়ে উদ্বেগ প্রকাশ করে। প্রথমত, বিভিন্ন ধরণের এসএস ব্যবহার আপনার বিশ্লেষণের যৌক্তিক ন্যায়সঙ্গততার প্রয়োজন থেকে বেরিয়ে আসে না। তবে আরও, টাইপ করুন I - III এসএস একটি ভিন্ন সমস্যার সাথে সম্পর্কিত। আপনার উদাহরণে, আমি আপনার উপাদানগুলি অর্থোগোনাল হিসাবে সংগ্রহ করি, অর্থাত আপনি একটি পরীক্ষা চালিয়েছেন যেখানে আপনি ফ্যাক্টর স্তরের প্রতিটি সংমিশ্রণের জন্য সমান n নির্ধারণ করেছেন। তবে, আপনি যদি পর্যবেক্ষণমূলক গবেষণা করেন বা আপনার যদি ড্রপআউট সংক্রান্ত সমস্যা থাকে তবে আপনার কারণগুলি পরস্পর সম্পর্কযুক্ত হবে। এর প্রভাবগুলি হ'ল এসএস বিভাজনের কোনও অনন্য উপায় নেই এবং তাই আপনার বিশ্লেষণগুলির উত্পাদন করার জন্য কোনও অনন্য উত্তর নেই। অন্য কথায়, এসএসের বিভিন্ন ধরণের আপনার এফ পরীক্ষার জন্য বিভিন্ন সম্ভাব্য সংখ্যার সাথে করতে হয় যখন আপনার উপাদানগুলি 4 টি সম্পর্কিত হয়

১. নোট করুন যে মাল্টি-লেভেল মডেলগুলির সাথে, মডেলটি কীভাবে নির্দিষ্ট করা হয়েছে তার উপর নির্ভর করে অন্য উপাদানগুলির থেকে পরিবর্তনশীলতা অন্তর্ভুক্ত করার জন্য একটি ফ্যাক্টর তাত্ত্বিক করা যেতে পারে। আমি এখানে সাধারণ আনোভা নিয়ে আলোচনা করছি, এটিই আপনি জিজ্ঞাসা করছেন বলে মনে হচ্ছে।
২. দেখুন: দ্বিতীয় চতুর্থ সংযুক্তি কীভাবে প্রথম চতুর্থকে তাৎপর্যপূর্ণ করে তুলতে পারে?
৩. দেখুন: স্বয়ংক্রিয় মডেল নির্বাচনের জন্য অ্যালগরিদম
৪. দেখুন: আইও (অনুক্রমিক) আনোভা এবং মানোভা কীভাবে ব্যাখ্যা করবেন?


1
আপনার উত্তরের জন্য ধন্যবাদ! যদিও আমি ১০০% বিশ্বাসী নই: আপনি বলছেন যে "আরএসএস (এ) এর মধ্যে কেবলমাত্র অবশিষ্টাংশের ত্রুটি বেশি রয়েছে, এটি পরিচিত কারণগুলির কারণে পরিবর্তনশীলতাও ধারণ করে।" তবে এটি নির্ভর করে সঠিক মডেলটি কী। সম্ভবত এবং কোনও প্রভাব নেই - আমরা এটি জানি না, এটি কেবল একটি অনুমান যা আমরা পরীক্ষা করছি। অনুমান প্রভাব ছাড়াও অজানা কিছু থাকতে পারে। সুতরাং কোন মডেলটি সত্যের নিকটে আমরা কীভাবে একটি অগ্রাধিকার প্রমাণ করব? রিগ্রেশনে পরিস্থিতি সমান। আপনার কাছে কি এমন কিছু সাহিত্যের উত্স রয়েছে যা আমি পরামর্শ করতে পারি? : BA:B
করাকাল

1
+1 এবং আমি আপনার প্রথম বড় অনুচ্ছেদে একটি চিত্র সরবরাহ করার চেষ্টা করে একটি উত্তর পোস্ট করেছি।
অ্যামিবা বলেছেন মোনিকা

0

সমর্থনযোগ্যতা হ'ল ফ্যাক্টর এ, এ + বি মডেলের তুলনায় এ-বি মডেলের অব্যক্ত পরিবর্তনের একটি বৃহত্তর শতাংশকে ব্যাখ্যা করছে, যেহেতু ফ্যাক্টর বি একটি উল্লেখযোগ্য অংশ ব্যাখ্যা করে (এবং এটি বিশ্লেষণ থেকে এটি 'মুছে ফেলে)'।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.