রিগ্রেশন বনাম আনোভা তাত্পর্য (আরভ বনাম এলএম)


21

আমি সর্বদা এই ধারণাটিতে ছিলাম যে রিগ্রেশন আনোভার একটি আরও সাধারণ ফর্ম এবং ফলাফলগুলি অভিন্ন হবে। তবে সম্প্রতি, আমি একই ডেটাতে একটি রিগ্রেশন এবং একটি আনোভা উভয়ই চালিত করেছি এবং ফলাফলগুলি উল্লেখযোগ্যভাবে পৃথক। এটি হ'ল, রিগ্রেশন মডেলটিতে উভয় প্রধান প্রভাব এবং মিথস্ক্রিয়া উল্লেখযোগ্য, তবে আনোভাতে একটি প্রধান প্রভাব তাৎপর্যপূর্ণ নয়। আমি ইন্টারঅ্যাকশনটির সাথে এর কিছু আছে বলে আশা করি, তবে একই প্রশ্নের মডেলিংয়ের এই দুটি উপায়ের মধ্যে কী আলাদা তা আমার কাছে স্পষ্ট নয় not যদি এটি গুরুত্বপূর্ণ, নীচের সিমুলেশনটিতে ইঙ্গিত হিসাবে একটি ভবিষ্যদ্বাণীকারী শ্রেণিবদ্ধ এবং অন্যটি ক্রমাগত হয়।

এখানে আমার ডেটা কেমন দেখাচ্ছে এবং বিশ্লেষণ করে যাচ্ছি যে আমি চালিয়ে যাচ্ছি তার উদাহরণ, তবে একই পি-মান বা প্রভাবগুলি ফলাফলের মধ্যে উল্লেখযোগ্য না হয়ে থাকতে পারে (আমার আসল ফলাফল উপরে বর্ণিত হয়েছে):

group<-c(1,1,1,0,0,0)
moderator<-c(1,2,3,4,5,6)
score<-c(6,3,8,5,7,4)

summary(lm(score~group*moderator))
summary(aov(score~group*moderator))

সংক্ষিপ্তসার (এলএম ()) আপনাকে নির্দিষ্ট করা বৈসাদৃশ্যগুলির জন্য সহগগুলি আপনাকে দিচ্ছে, যা এখানে নির্দিষ্টকরণের অভাবে চিকিত্সার বিপরীতে রয়েছে। সারসংক্ষেপ (এওভ ()) আপনাকে আনোভা সারণী দিচ্ছে। আপনি যদি এলএম মডেলের জন্য আনোভা চান তবে আপনার প্রয়োজন আনোভা (এলএম ())
ম্যাট অ্যালব্র্যাচট

groupএকটি সংখ্যার ভেক্টর, এটি উদ্দেশ্যমূলক? সাধারণত, গ্রুপিং ফ্যাক্টরগুলির ক্লাস থাকা উচিত factor, যেমন বিপরীতে রূপান্তরগুলি যেমন ফাংশনগুলির মাধ্যমে স্বয়ংক্রিয়ভাবে পরিচালনা করা যায় lm()। আপনার দুটি গ্রুপের বেশি হয়ে গেলে, বা আপনার groupভেরিয়েবলের জন্য 0/1 ব্যতীত কোনও কোডিং ব্যবহার করার পরে এটি স্পষ্ট হয়ে যাবে ।
কারাকাল

উত্তর:


17

summaryফাংশন বস্তুর বর্গ উপর নির্ভর করে বিভিন্ন পদ্ধতি কল। পার্থক্য aovবনাম নয় lm, মডেলগুলি সম্পর্কে উপস্থাপিত তথ্যগুলিতে। উদাহরণস্বরূপ, আপনি যদি ব্যবহার করেন anova(mod1)এবং anova(mod2)পরিবর্তে, আপনার একই ফলাফল পাওয়া উচিত।

@ গ্লেন যেমন বলেছে, রিপোর্ট করা পরীক্ষাগুলি টাইপ 1 বা টাইপ 3 স্কোমের স্কোমের উপর ভিত্তি করে কিনা তা কী। আপনার বর্ণনাকারী ভেরিয়েবলের মধ্যে পারস্পরিক সম্পর্ক ঠিক 0 না হলে এগুলি পৃথক হবে যখন সেগুলি সংযুক্ত হয়, কিছু এসএস একটি ভবিষ্যদ্বাণীকের কাছে অনন্য এবং কিছু অন্যের সাথে থাকে তবে কিছু এসএস উভয়ই বা উভয়কেই দায়ী করা যেতে পারে। ( আপনি মাস্টারকার্ড প্রতীকটি কল্পনা করে এটি কল্পনা করতে পারেন- কেন্দ্রে ওভারল্যাপের একটি ছোট অঞ্চল)) এই পরিস্থিতিতে কোনও অনন্য উত্তর নেই, এবং দুর্ভাগ্যক্রমে, এটি অ-পরীক্ষামূলক তথ্যগুলির আদর্শ। একটি পদ্ধতি হ'ল বিশ্লেষককে তাদের রায়টি ব্যবহার করতে এবং ওভারল্যাপিং এসএসকে ভেরিয়েবলগুলির মধ্যে একটিতে নির্ধারণ করুন। সেই পরিবর্তনশীলটি প্রথমে মডেলটিতে যায়। অন্যান্য ভেরিয়েবলটি দ্বিতীয়টি মডেলটির মধ্যে চলে যায় এবং এসএস পায় যা দেখে মনে হয় একটি কুকি এটির বাইরে নিয়ে গেছে। এর প্রভাবটি কখনও কখনও আর 2 নামে পরিচিত যা দ্বারা পরীক্ষা করা যেতে পারেআর2পরিবর্তন বা এফ পরিবর্তন। এই পদ্ধতির মধ্যে টাইপ 1 এসএস ব্যবহার করা হয়। বিকল্পভাবে, আপনি প্রতিটি প্রথমে প্রবেশের সাথে এটি দুবার করতে পারেন, এবং উভয় ভবিষ্যদ্বাণীকের জন্য এফ পরিবর্তন পরীক্ষার রিপোর্ট করতে পারেন। এইভাবে, ওভারল্যাপের কারণে কোনও ভেরিয়েবল এসএস পায় না। এই পদ্ধতির মধ্যে টাইপ 3 এসএস ব্যবহার করা হয়। (আমার এও আপনাকে বলা উচিত যে পরবর্তী পদ্ধতিটি কম বিবেচনায় অনুষ্ঠিত হয়))

নীচের মন্তব্যে @ ব্র্যাটম্যাগিলের পরামর্শ অনুসরণ করে, আমি এটিকে আরও পরিষ্কার করার চেষ্টা করতে পারি। (মনে রাখবেন যে, আমার উদাহরণে, আমি মাত্র 2 ভবিষ্যদ্বাণী ব্যবহার করছি এবং কোনও মিথস্ক্রিয়া নেই, তবে আপনি যা পছন্দ করেন তা অন্তর্ভুক্ত করার জন্য এই ধারণাটি ছোট করা যেতে পারে))

প্রকার 1: এসএস (এ) এবং এসএস (বি | এ)

প্রকার 3: এসএস (এ | বি) এবং এসএস (বি | এ)


1
এটি সমস্যার সুন্দর বর্ণনা description আপনি এর সাহায্যে পাঠ্যটি কিছুটা স্পষ্ট করতে পারেন: টাইপ আমি: এসএস_এ = এসএস (এ) এসএস_বি = এসএস (বি | এ) এবং এসএস_এবি = এসএস (এবি বি, এ) প্রকারের তৃতীয়: এসএস_এ = এসএস (এ | বি, এবি) ) এবং এসএস_বি = এসএস (বি | এ, এবি) এবং এসএস_এবি = এসএস (এবি | এ, বি)
ব্রেট

1
আপনার সাহায্যের জন্য আপনাকে অনেক ধন্যবাদ। আমি বুঝতে পারছি যে কীভাবে এই মডেলগুলি পৃথক হয় তার পদে কী চলছে তবে আমি এখনও স্পষ্ট নই যে কখন কোন আনোভা বা রিগ্রেশন মডেল ব্যবহার করা উপযুক্ত। আমার উপদেষ্টা আনোভা পরামর্শ দিচ্ছেন, তবে আমাকে সর্বদা রিগ্রেশন ব্যবহার করতে শিখানো হয়েছে এবং ফলাফলগুলি যখন ডাইভারজেন্ট হয় তখন কোনটি ব্যবহার করা আরও উপযুক্ত তা আমি নিশ্চিত নই। আপনার যখন কোনটি উপযুক্ত হবে বা পরামর্শ দেওয়ার জন্য কোনও উদাহরণ বা সংস্থান আছে? আপনার সাহায্যের জন্য আবার ধন্যবাদ।
রেবেকা

1
আমি দুঃখিত, আমি বেশিরভাগ অনুসরণ করি না। আমার পয়েন্ট মডেল হয় না আসলে আলাদা। একটি আনোভা হ'ল সমস্ত গুণগত ভবিষ্যদ্বাণী নিয়ে একটি প্রতিরোধ। যদি অবিচ্ছিন্ন এবং গুণগত ভবিষ্যদ্বাণী নিয়ে আপনার কাছে একটি রিগ্রেশন মডেল থাকে এবং আপনি অবিচ্ছিন্ন ভবিষ্যদ্বাণীকে প্রথমে প্রবেশ করেন, তবে গুণগত ভবিষ্যদ্বাণী (তবে ইন্টারঅ্যাকশন শব্দ ছাড়া) এটি আনকোভা। উভয়ই পন্থা ঠিক আছে, যেহেতু 'পর্দার আড়ালে' তারা অভিন্ন। আমি সাধারণত এটি একটি রিগ্রেশন হিসাবে কোড করি তবে এটি স্টাইলের বিষয়। ওতো, যদি আপনার পরামর্শদাতা এটি আনোভা স্টাইলটি চালাতে চান তবে কোনও পথ নেই বলেই সেই পথে চলে যান।
গুং - মনিকা পুনরায়

2
কয়েকটি জিনিস: (3 আপ) একটি মিথস্ক্রিয়াটির অর্থ এই নয় যে আপনার স্বাধীন ভেরিয়েবলগুলি পারস্পরিক সম্পর্কযুক্ত, এগুলি কেবল ভিন্ন জিনিস; (২ টি আপ) যদি মডেল 3 মডেল 2 এর তুলনায় উল্লেখযোগ্যভাবে ভাল হয়, তবে হ্যাঁ, এটি ইন্টারঅ্যাকশনটি উল্লেখযোগ্য তা বোঝায় (যেহেতু মিথস্ক্রিয়াটি কেবল তাদের মধ্যে পৃথক হয়); (1 আপ) আপনি উল্লেখযোগ্য প্রভাবের জন্য কেবল মাছ ধরা এড়াতে চান যদি না আপনি পাইলট হিসাবে আপনার অধ্যয়নের কথা চিন্তা না করেন যা আপনি পরবর্তী নিশ্চিতকরণ স্টাডির পরিকল্পনা করতে ব্যবহার করবেন (এই ক্ষেত্রে আমি মনে করি আপনি ঠিক আছেন); আমি আপনি সব তিন তাকান এই গবেষণায় দৌড়ে এইভাবে মডেল 3. সঙ্গে যেতে জড়ো করা
পুনর্বহাল মনিকা - gung

2
তদ্ব্যতীত, একটি মিথস্ক্রিয়া সূচিত করে যে আপনার প্রধান প্রভাবগুলির ব্যাখ্যা করা উচিত নয়, সুতরাং কেবলমাত্র 1 টি মডেল উপস্থাপন করা বিপজ্জনকভাবে বিভ্রান্তিকর হতে পারে। আপনি যদি এসএসের ধরণের বিষয়ে আরও তথ্য চান তবে আমি এখানে মোটামুটি বিস্তৃত উত্তর লিখেছি: stats.stackexchange.com/questions/20452/… এছাড়াও, আপনার উত্তরগুলির মধ্যে একটিটি গ্রহণ করা উচিত, পরবর্তী সময়ে চেক চিহ্নটি ক্লিক করে তাদের একজন.
গুং - মনিকা পুনরায়

10

এওভ আউটপুট থেকে প্রাপ্ত ফলাফলগুলি স্কোয়ারের টাইপ 1 যোগফলের ভিত্তিতে আপনাকে সম্ভাব্যতা দিচ্ছে। এজন্য মিথস্ক্রিয়া ফলাফল একই এবং প্রধান প্রভাবগুলি পৃথক হয়।

আপনি যদি স্কোয়ারের 3 টি যোগফলের ভিত্তিতে সম্ভাব্যতা ব্যবহার করেন তবে তারা লিনিয়ার রিগ্রেশন ফলাফলের সাথে মেলে।

library(car)
Anova(aov(score~group*moderator),type=3)

5
যখন মডেলগুলি একই অনুমানগুলি পরীক্ষা করে থাকে এবং যখন কারণগুলির প্যারামিটারাইজেশন সমতুল্য হয় লিনিয়ার মডেল এবং আনোভা সমতুল্য হবে। তথাকথিত "টাইপ আই" এবং "টাইপ তৃতীয়" যোগফলগুলি হ'ল স্কোয়ারগুলি হ'ল বিভিন্ন অন্তর্নিহিত অনুমানের পরীক্ষা (স্কোয়ারের ক্রমিক অঙ্কগুলির তুলনায় স্কোয়ারের প্রান্তিক অঙ্কের বিপরীতে)। আনোভা অনেকগুলি প্যাকেজগুলিতে প্রয়োগিত হিসাবে এই সিদ্ধান্তগুলির মধ্যে কিছু আড়াল করে fact এমন একটি সত্য যা আমাকে বিশ্বাস করে যে GLM এ ফ্যাক্টর প্যারামিটারাইজেশন এবং মডেল তুলনা করার মাধ্যমে আগ্রহের হাইপোথিসিগুলি সেটআপ এবং পরীক্ষা করা একটি উচ্চতর পদ্ধতি।
ব্রেট

+1, আমি মনে করি আপনার কাছে টাইপ রয়েছে have lm টাইপ 1 এসএস ব্যবহার করছে এবং আওভ টাইপ 3 এসএস ব্যবহার করছে।
গুং - মনিকা পুনরায়

2
প্রকারের তৃতীয় (প্রান্তিক) স্কোমের সমষ্টি lm এ ডিফল্টরূপে ব্যবহৃত হয়। AOV ডিফল্টরূপে I টাইপ I (সিক্যুয়েনাল) ব্যবহার করবে। এলএম ফলাফলগুলি অর্ডার দেওয়ার জন্য অবিস্মরণীয় হয় যখন এওও ফলাফল ফলাফলগুলির ক্রমের উপর নির্ভর করে।
ব্রেট

আমি ভাবলাম এলএম এবং আওভ উভয়ই ডিফল্টরূপে টাইপ আই ব্যবহার করে, সুতরাং দ্বিতীয় এবং তৃতীয় ধরণের জন্য মূলধন এ আনোভা () ব্যবহার করুন।
ম্যাট অ্যালব্রেক্ট

6
সাধারণভাবে, Anova(..., type=3)হবে না আপনি সঠিক টাইপ তৃতীয় এস এস দিতে, যদি না আপনার কাছে (unordered কারণের জন্য কোডিং মর্মে (রাঃ মধ্যে ডিফল্ট) চিকিত্সা বৈপরীত্য থেকে সুইচ options(contrasts=c("contr.sum", "contr.poly"))) অথবা অন্য কোনো সমষ্টি-টু-শূন্য বিপরীতে কোড (যেমন, Helmert)। আপনার ভারসাম্যহীন কক্ষের আকার এবং দু'রও বেশি গোষ্ঠী উপস্থিত হয়ে গেলে এটি স্পষ্ট হয়ে যাবে এবং এর জন্য সহায়তা পৃষ্ঠায়ও উল্লেখ করা হয়েছে Anova()
কারাকাল

-2

লিনিয়ার রিগ্রেশন এবং আনোভা-র মধ্যে প্রধান পার্থক্য হ'ল, আনোভাতে ভবিষ্যদ্বাণীকারী ভেরিয়েবলগুলি বিচ্ছিন্ন হয় (এটিতে তাদের বিভিন্ন স্তর রয়েছে)। লিনিয়ার রিগ্রেশন-এ, ভবিষ্যদ্বাণীকারী ভেরিয়েবলগুলি অবিচ্ছিন্ন।


3
এটি সাধারণত সত্য নয়।
মাইকেল আর। চেরনিক 12 '10

আমি এটি ইন্টারনেটে কোথাও পড়েছি। আপনি কি দয়া করে মূল পার্থক্যটি ব্যাখ্যা করতে পারেন। আমি নবাগত।
বিবেক
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.