নেভাল মডেলগুলির সাথে তুলনা করার জন্য কয়েকটি গ্রুপ এবং আনোভার সাথে তুলনা করতে আনোভা এর মধ্যে কী সম্পর্ক?


12

আমি এখনও এএনওওয়াকে দুটি উপায়ে ব্যবহার করতে দেখেছি:

প্রথমত , আমার সূচনাসংখ্যার পরিসংখ্যান পাঠ্যে, আনোভা তিনটি বা ততোধিক গোষ্ঠীর সাথে তুলনামূলকভাবে তুলনামূলকভাবে তুলনামূলক উন্নয়নের জন্য উপস্থাপিত হয়েছিল, যাতে কোনও একটিটির পরিসংখ্যানগতভাবে তাত্পর্য রয়েছে কিনা তা নির্ধারণ করতে।

দ্বিতীয়ত , আমার পরিসংখ্যানগত পাঠ্য পাঠে, আমি অ্যানোভা দুটি (বা আরও) নেস্টেড মডেলের তুলনা করতে দেখেছি মডেল 1, যা মডেল 2 এর ভবিষ্যদ্বাণীগুলির একটি উপসেট ব্যবহার করে, ডেটা সমানভাবে ফিট করে, বা পুরোটি মডেল 2 উচ্চতর।

এখন আমি ধরে নিয়েছি যে কোনওভাবে বা অন্য কোনওভাবে এই দুটি জিনিস আসলে খুব মিল কারণ তারা উভয়ই এনোভা পরীক্ষা ব্যবহার করছে তবে পৃষ্ঠে তারা আমার কাছে একেবারেই আলাদা বলে মনে হচ্ছে। একটির জন্য, প্রথম ব্যবহারটি তিন বা ততোধিক গোষ্ঠীর সাথে তুলনা করে, যখন দ্বিতীয় পদ্ধতিটি মাত্র দুটি মডেলের তুলনা করতে ব্যবহার করা যেতে পারে। কেউ কি এই দুটি ব্যবহারের মধ্যে সংযোগটি বর্ণনা করতে দয়া করে চান?


3
সংক্ষেপে, আমি মনে করি দ্বিতীয় "anova" সব একটি ANOVA (যদি আপনি পড়তে হয় en.wikipedia.org/wiki/Analysis_of_variance আপনি দেখতে হবে না নেস্টেড মডেলের তুলনা কোন উল্লেখ)। এটি একটি এন.ইউইকিপিডিয়া.আর্গ / উইকি / এফ- টেষ্ট এবং এটি আর হিসাবে anova()ফাংশন হিসাবে প্রয়োগ করা হয়েছে , কারণ প্রথম, আসল, আনোভাও একটি এফ-পরীক্ষা ব্যবহার করছে। এটি পরিভাষা বিভ্রান্তির দিকে নিয়ে যায়।
অ্যামিবা

ধন্যবাদ আমার মনে হয় আপনি মাথায় পেরেক মারছেন! আমি বিবেচনা করি নি যে anova()ফাংশনটি কেবল আনোভা ছাড়াও আরও কিছু করতে পারে। এই পোস্টটি আপনার উপসংহারটিকে সমর্থন করে: stackoverflow.com/questions/20128781/f-test-for-two-models-in-r
অস্টিন

1
একজন গ্রেড স্ট্যাটিস্টিশিয়ান আমাকে শিখিয়েছিলেন যে মাল্টিমামাল টেস্ট হিসাবে আনোভা যেমন নেওডের মডেল আধিপত্য পরীক্ষা হিসাবে আনোভার কাছে একই জিনিস। একই জিনিসটির অর্থ আমার বোধগম্যতার সাথে বোঝা যাচ্ছে যে আমরা কোনও মডেল বা সহজ মডেল থেকে কোনও মডেল থেকে প্রাপ্ত রেসিডুয়ালের তুলনায় অবশিষ্টাংশের যোগফল (বা গড়) তুলনা করি এবং অনুমানগুলি পূরণ করা হয় এফ-টেস্ট উভয় পরিস্থিতিতেই প্রযোজ্য। আমি যে উত্তরটি চেষ্টা করেছি তা একেবারেই about আমি নিজেও কমপক্ষে একটি এলএম সহগের শূন্য (এক-মডেল এফ-পরিসংখ্যান) এবং অবশিষ্টাংশের যোগফলের চেয়ে আলাদা সংযোগ বুঝতে আগ্রহী would
আলেক্সি বার্নাকভ

উত্তর:


11

আমার উপলব্ধিতে, আনোভা-এর বিমূর্ত অন্তর্নিহিততাটি নিম্নরূপ: এক ব্যক্তি পর্যবেক্ষণের পরিবর্তনশীলের বিভিন্নতার উত্সকে বিভিন্ন দিকগুলিতে ক্ষয় করে এবং সংশ্লিষ্ট অবদানগুলি অনুসন্ধান করে। আরও সুনির্দিষ্টভাবে বলতে গেলে, কোনও ব্যক্তি পরিচয়ের মানচিত্রটিকে একটি অনুমানের পরিমাণে বিভক্ত করে এবং অনুসন্ধান করে যে কোন প্রজেকশনগুলি / দিকনির্দেশগুলি প্রকরণটি ব্যাখ্যা করতে গুরুত্বপূর্ণ অবদান রাখে এবং কোনটি তা নয়। তাত্ত্বিক ভিত্তি হ'ল কোচরানের উপপাদ্য

কম বিমূর্ত হতে, আমি ওপি দ্বারা উল্লিখিত দ্বিতীয় ফর্মটি স্রেফ বর্ণিত ফ্রেমওয়ার্কে কাস্ট করেছি । পরবর্তীকালে, আমি দ্বিতীয়টির বিশেষ কেস হিসাবে প্রথম ফর্মটি ব্যাখ্যা করি ।

আসুন আমরা ব্যাখ্যামূলক ভেরিয়েবল (সম্পূর্ণ মডেল) সহ একটি রিগ্রেশন মডেল বিবেচনা করি এবং কে - জে ভেরিয়েবলের সাথে এটি সীমাবদ্ধ মডেলের সাথে তুলনা করি । ডাব্লুএলওজি, সম্পূর্ণ মডেলের শেষ জে ভেরিয়েবলগুলি সীমাবদ্ধ মডেলটিতে অন্তর্ভুক্ত করা হয়নি। আনোভা উত্তরটি দেওয়া হয়কেকে-জেজে

"যদি আমরা অতিরিক্ত ভেরিয়েবলগুলি অন্তর্ভুক্ত করি তবে আমরা পর্যবেক্ষণের পরিবর্তনশীলটিতে উল্লেখযোগ্যভাবে আরও বৈকল্পিকতা ব্যাখ্যা করতে পারি "জে ?

এই প্রশ্নের উত্তর প্রথম ভেরিয়েবল, পরবর্তী জে ভেরিয়েবল এবং অন্যান্য / অব্যক্ত অংশ (বর্গের অবশিষ্টাংশ) এর বৈকল্পিক অবদানের সাথে তুলনা করে উত্তর দেওয়া হবে । এই পচন (যেমন কোচরানের উপপাদ্য থেকে প্রাপ্ত) এফ-পরীক্ষাটি নির্মাণের জন্য ব্যবহৃত হয়। সুতরাং, একটি সীমাবদ্ধ মডেলটির স্কোয়ারের অবশিষ্টাংশগুলিতে (আরও ভেরিয়েবলগুলি অন্তর্ভুক্ত করে) হ্রাসকে বিশ্লেষণ করে ( এইচ 0 এর সাথে সামঞ্জস্য করে : শেষ জে ভেরিয়েবলের সাথে সম্পর্কিত সমস্ত সহগ শূণ্য ) আরও ভেরিয়েবলগুলি অন্তর্ভুক্ত করে এবং এফ-স্ট্যাটিস্টিক প্রাপ্ত করে আর এস এস আর এস টি আর - আরকে-জেজেএইচ0: জে মানটি যথেষ্ট পরিমাণে বড় হয়, তবে অতিরিক্তজেভেরিয়েবলগুলিরদ্বারা ব্যাখ্যা করা বৈকল্পিকতাৎপর্যপূর্ণ।

আরএসএসRগুলিটিR-আরএসএসতোমার দর্শন লগ করাজেআরএসএসতোমার দর্শন লগ করাএন-কে
জে

এখন, ওপি দ্বারা উল্লিখিত প্রথম ফর্মটি দ্বিতীয় ফর্মের একটি বিশেষ কেস হিসাবে ব্যাখ্যা করা হয়েছে । তিনটি ভিন্ন গ্রুপ এ, বি, ও সি সঙ্গে উপায়ে বিবেচনা করুন , μ বি , এবং μ সিএইচ 0 : μ একটি = μ বি = μ সি ভ্যারিয়েন্স তুলনা করে পরীক্ষা করা হয় একটি পথিমধ্যে উপর রিগ্রেশন (সীমাবদ্ধ মডেল) সঙ্গে ভ্যারিয়েন্স একটি পথিমধ্যে, গ্রুপ একটি জন্য একটি ডামি ধারণকারী পূর্ণ মডেল দ্বারা ব্যাখ্যা, এবং একটি দ্বারা ব্যাখ্যা বি গ্রুপের জন্য ডামি ফলাফল এফ-পরিসংখ্যান আর এস এস আই এন টি টিμএকজনμবিμসিএইচ0:μএকজন=μবি=μসি উইকিপিডিয়ায়আনোভা-পরীক্ষার সমতুল্য। বিভাজনগুলি গ্রুপগুলির মধ্যে পরিবর্তনের সমান, সংখ্যাগুলি গ্রুপগুলির মধ্যে পরিবর্তনের সমান। গ্রুপগুলির মধ্যে পার্থক্য যদি গ্রুপগুলির মধ্যে পরিবর্তনের চেয়ে বড় হয় তবে কেউ এই অনুমানটিকে প্রত্যাখ্যান করে যে সমস্ত উপায় সমান।

আরএসএসআমিএনটিRপিটি-আরএসএসতোমার দর্শন লগ করামিমিআমিগুলি2আরএসএসতোমার দর্শন লগ করামিমিআমিগুলিএন-3

+1 টি। আমি আশ্চর্য হয়েছি যদি আপনি এখানে মন্তব্যে পরিভাষা সম্পর্কে আমার মন্তব্যের সাথে একমত হন: stats.stackexchange.com/questions/315979/#comment602611_315979
অ্যামিবা

আমি অবশ্যই নিশ্চিত হয়েছি যে পরিভাষা ;-) এ প্রচুর বিভ্রান্তি রয়েছে। কোলকুইয়ালি, আমি এএনওওয়াকে কেবল ওপির প্রথম ফর্মের সাথে যুক্ত করি। আমি কেবল শেফির "দ্য অ্যানালাইসিস অফ ভারিয়েন্স" বইটিতে একটি নজর রেখেছি যেখানে "নেস্টেড ডিজাইন" উল্লেখ করা হয়েছে।
বিএমবিবি

@ বিএমবিবি, আমি আপনার শেষ মন্তব্যে এটি যুক্ত করব: একটি সাধারণ ক্ষেত্রে যেখানে আমরা নেস্টেড এলএম মডেলগুলির তুলনা করি, তার মধ্যে একটি কেবল বিরতি। মডেলটি সম্পর্কে বাধা দিয়ে আমাকে যে ঘটনাটি ঘটিয়েছিল তা হ'ল আমরা যখন এর অবশিষ্টাংশগুলি উল্লেখ করি তখন আমরা প্রকৃতপক্ষে এর প্রকরণটি উল্লেখ করি, যেহেতু অবশিষ্টাংশগুলি একটি পরিবর্তনশীল গড় (যা মডেলটির বিরতি) এর তুলনায় গণনা করা হয়, এবং সেগুলি থেকে বিচ্যুতি হয় নমুনা গড়. এইভাবে আমরা নেস্টেড মডেলগুলির ক্ষেত্রে বৈকল্পিক বিশ্লেষণটি এখনও করি, এমনকি যদি আমরা আনুষ্ঠানিকভাবে অবশিষ্টাংশগুলি বিশ্লেষণ করি।
আলেক্সি বার্নাকভ

6

আপনি যদি গ্রুপগুলির মধ্যে উল্লেখযোগ্য পার্থক্য রয়েছে কিনা তা পরীক্ষা করার জন্য যদি একমুখী আনোভা করছেন, তবে স্পষ্টতই আপনি দুটি নেস্টেড মডেল তুলনা করছেন (সুতরাং নীড়ের মাত্র একটি স্তর রয়েছে, তবে এটি এখনও বাসা বাঁধছে)।

এই দুটি মডেল হ'ল:

  • Yআমিআমিβ^0
    Yআমি=β^0+ +εআমি
  • মডেল 1: মানগুলি দলগুলির আনুমানিক উপায়ে মডেল করা হয়।

    β^

    Yআমি=β^0+ +β^+ +εআমি

নেস্টেড মডেলগুলির সাথে তুলনা করার অর্থ এবং সমতার একটি উদাহরণ: আসুন আইরিস ডেটা সেট থেকে সেপালের দৈর্ঘ্য (সেমি) নেওয়া যাক (আমরা যদি চারটি ভেরিয়েবল ব্যবহার করি তবে আমরা আসলে এলডিএ বা মানোভা করতে পারি যেমন ফিশার 1936 সালে করেছিলেন)

পর্যবেক্ষণকৃত মোট এবং গ্রুপের অর্থ হ'ল:

μটিটিএকটি=5.83μগুলিটিগুলিএকটি=5,01μবনামRগুলিআমিR=5.94μবনামআমিRআমিএনআমিএকটি=6.59

যা মডেল আকারে:

মডেল 1: Yআমি=5.83+ +εআমিমডেল 2: Yআমি=5,01+ +[00.931.58]+ +εআমি

Σεআমি2=102.1683

Σεআমি2=38,9562

এবং এএনওওএ টেবিলটি হবে (এবং স্পষ্টভাবে পার্থক্যটি গণনা করুন যা 2 ডিগ্রি স্বাধীনতার সাথে সারণীতে 63.212 এর স্কোয়ারের সমষ্টিগুলির মধ্যে পার্থক্য) is

> model1 <- lm(Sepal.Length ~ 1 + Species, data=iris)
> model0 <- lm(Sepal.Length ~ 1, data=iris)
> anova(model0, model1)
Analysis of Variance Table

Model 1: Sepal.Length ~ 1
Model 2: Sepal.Length ~ 1 + Species
  Res.Df     RSS Df Sum of Sq      F    Pr(>F)    
1    149 102.168                                  
2    147  38.956  2    63.212 119.26 < 2.2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

এফ=আরএসএসআমিRএনডিএফআমিRএনআরএসএসএনWডিএফএনW=63,212238,956147=119,26

উদাহরণে ব্যবহৃত ডেটা সেট:

আইরিস ফুলের তিনটি ভিন্ন প্রজাতির পাপড়ি দৈর্ঘ্য (সেমি)

Iris setosa            Iris versicolor      Iris virginica
5.1                    7.0                    6.3
4.9                    6.4                    5.8
4.7                    6.9                    7.1
4.6                    5.5                    6.3
5.0                    6.5                    6.5
5.4                    5.7                    7.6
4.6                    6.3                    4.9
5.0                    4.9                    7.3
4.4                    6.6                    6.7
4.9                    5.2                    7.2
5.4                    5.0                    6.5
4.8                    5.9                    6.4
4.8                    6.0                    6.8
4.3                    6.1                    5.7
5.8                    5.6                    5.8
5.7                    6.7                    6.4
5.4                    5.6                    6.5
5.1                    5.8                    7.7
5.7                    6.2                    7.7
5.1                    5.6                    6.0
5.4                    5.9                    6.9
5.1                    6.1                    5.6
4.6                    6.3                    7.7
5.1                    6.1                    6.3
4.8                    6.4                    6.7
5.0                    6.6                    7.2
5.0                    6.8                    6.2
5.2                    6.7                    6.1
5.2                    6.0                    6.4
4.7                    5.7                    7.2
4.8                    5.5                    7.4
5.4                    5.5                    7.9
5.2                    5.8                    6.4
5.5                    6.0                    6.3
4.9                    5.4                    6.1
5.0                    6.0                    7.7
5.5                    6.7                    6.3
4.9                    6.3                    6.4
4.4                    5.6                    6.0
5.1                    5.5                    6.9
5.0                    5.5                    6.7
4.5                    6.1                    6.9
4.4                    5.8                    5.8
5.0                    5.0                    6.8
5.1                    5.6                    6.7
4.8                    5.7                    6.7
5.1                    5.7                    6.3
4.6                    6.2                    6.5
5.3                    5.1                    6.2
5.0                    5.7                    5.9

1
+1 তবে ল্যাটেক্স টেবিল হিসাবে ডেটা টেবিল ফর্ম্যাট করা সত্যিই খারাপ অভ্যাস !! এটি যে কোনও জায়গায় কপি-পেস্ট করতে পারে না! আপনি যদি সত্যিই ডেটা অন্তর্ভুক্ত করতে চান তবে কেন এটি একটি কোড ব্লক হিসাবে ফর্ম্যাট করবেন না? তবে এক্ষেত্রে আপনি উইকিপিডিয়া ফিশার আইরিস নিবন্ধের সাথে লিঙ্ক করতে পারেন যাতে ডেটা রয়েছে।
অ্যামিবা

বাদে, আমি এই মন্তব্যে উল্লেখ করেছি যে পরিভাষা ইস্যুতে আপনার কী গ্রহণযোগ্যতা আছে ? Stac.stackexchange.com/questions/315979/#comment602611_315979 ?
অ্যামিবা

1
আমি বিশ্বাস করি না যে অস্পষ্ট পরিভাষা একটি বড় সমস্যা। আমার মনে আমি আনোভাকে কখনই গ্রুপের মধ্যে এবং মধ্যে পার্থক্যের তুলনা হিসাবে এতটা বিবেচনা করি না এবং সর্বদা দুটি মডেলের তুলনা করার জন্য মানসিক অভিক্ষেপ করি। আমি বিশ্বাস করি না যে এফ-ডিস্ট্রিবিউশন, দুটি স্বতন্ত্র চি-স্কোয়ার ডিস্ট্রিবিউটেড ভেরিয়েবলের একটি অনুপাত একটি নির্দিষ্ট অর্থে, পরিবর্তনের একটি অনুপাতের পরে এটি একটি বড় সমস্যা। নেস্টেড মডেলগুলি অধ্যয়নের জন্য এফ-টেস্ট প্রয়োগ করা বিভিন্ন প্রকারের তুলনা করা, বিভিন্নতা বিশ্লেষণ করা, অতএব আনোভা আমার কাছে ঠিক বলে মনে হয় (আমি বর্তমানে কিছু historicalতিহাসিক তথ্যসূত্রগুলি সন্ধান করার চেষ্টা করছি)।
সেক্সটাস এম্পেরিকাস

আমি বলছি না এটি একটি সমস্যা। তবে আমি ভাবছি যে "আনোভা" শব্দটি কেবল আরে নেস্টেড মডেলগুলির তুলনা করে এফ-টেস্টকে বোঝায় কিনা (যেমন আমি আমার লিঙ্কযুক্ত মন্তব্যে পরামর্শ দিয়েছি) অথবা এটি যদি বৃহত্তর স্বীকৃত পরিভাষা হয়। আমি পাঠ্যপুস্তকগুলি চেক করিনি, সুতরাং আমার প্রমাণগুলি কেবল উইকিপিডিয়া থেকে আসে।
অ্যামিবা

ফিশারের গবেষণা কর্মীদের জন্য 1925 এর পরিসংখ্যান পদ্ধতিতে, যখন তিনি 'বৈকল্পিক বিশ্লেষণ' ব্যাখ্যা করেন তখন তিনি এমন উদাহরণ অন্তর্ভুক্ত করেন যা কৌশলটি রিগ্রেশন লাইনে প্রয়োগ করে (তবে কোনও নেস্টেড মডেল নয়)।
সেক্সটাস এম্পেরিকাস

1

বেশ কয়েকটি মডেলের মধ্যে তুলনা করে আনোভা ব্যবহারের অর্থ হ'ল উচ্চতর অর্ডারের (এবং নিম্ন অর্ডার সহ মডেলটিতে অনুপস্থিত) মডেলটিতে কমপক্ষে কোন সহগগুলি ব্যবহার করা হয়েছে তা পরীক্ষা করা শূন্যের থেকে উল্লেখযোগ্য আলাদা whether

এটি উচ্চতর অর্ডার মডেলের অবশিষ্টাংশের যোগফল নিম্ন অর্ডার মডেলের তুলনায় উল্লেখযোগ্যভাবে কম বলে বলার সমান।

এটি প্রায় দুটি মডেল যেহেতু ব্যবহৃত বেসিক সমীকরণটি

MSM/MSE

যেখানে এমএসএম হ'ল নিম্ন আদেশের মডেলের স্কোয়ার অবশিষ্টাংশগুলির গড় (যেখানে সর্বনিম্ন ক্রমটি টার্গেট ভেরিয়েবলের অর্থ, অর্থাত্ বিরতি)।

( http://www.stat.yale.edu/Courses/1997-98/101/anovareg.htm )

আপনি যেমন সিভিতে একই বিষয়গুলি পড়তে পারেন

দুটি মডেলের তুলনায় আনোভা কীভাবে ব্যবহার করবেন?


আইএমএইচও এটি প্রশ্নের উত্তর দেয় না।
অ্যামিবা

1

আমি যা শিখেছি তা থেকে,

আপনার ব্যাখ্যামূলক ভেরিয়েবলগুলি প্রতিক্রিয়ার ভেরিয়েবলের প্রকৃতপক্ষে কোনও উল্লেখযোগ্য প্রভাব ফেলবে কিনা তা নির্ধারণ করতে আপনি এএনওওয়া টেবিলগুলি ব্যবহার করতে পারেন এবং এইভাবে উপযুক্ত মডেলের সাথে মানানসই।

এক্স1এক্স2এক্স2

Y=β0+ +β1এক্স1+ +β2এক্স2+ +ε
Y=β0+ +β1এক্স1+ +ε

আপনি দিয়ে একটি অনুমান পরীক্ষা করেন এক্স1

আমি আর-তে কাজ করছি এমন একটি প্রকল্পের একটি আনোভা আউটপুট উদাহরণ এখানে দেওয়া হয়েছে, যেখানে আমি দুটি মডেল পরীক্ষা করি (একটি ভেরিয়েবল ডেগুলির সাথে এবং একটি ভেরিয়েবল দিন ছাড়া):

এখানে চিত্র বর্ণনা লিখুন

আপনি দেখতে পাচ্ছেন, এফ-টেস্টের সাথে সম্পর্কিত পি-মানটি 0.13, যা 0.05 এর চেয়ে বেশি। সুতরাং, আমরা নাল অনুমানকে প্রত্যাখ্যান করতে পারি না যে দিনগুলির ওয়াইয়ের উপর কোনও প্রভাব নেই So সুতরাং, আমি মডেল 1 ওভারের মডেল 2 পছন্দ করি।


আইএমএইচও এটি প্রশ্নের উত্তর দেয় না।
অ্যামিবা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.