রিগ্রেশন, টি-টেস্ট এবং আনোভা সাধারণ রৈখিক মডেলের সমস্ত সংস্করণ কীভাবে রয়েছে?


49

উত্তর:


47

বিবেচনা করুন যে এগুলি সমস্ত একটি রিগ্রেশন সমীকরণ হিসাবে লেখা যেতে পারে (সম্ভবত তাদের traditionalতিহ্যগত ফর্মগুলির তুলনায় কিছুটা পৃথক ব্যাখ্যার সাথে)।

:

Y=β0+β1X(continuous)+εwhere εN(0,σ2)

t- পরীক্ষা:

Y=β0+β1X(dummy code)+εwhere εN(0,σ2)

:

Y=β0+β1X(dummy code)+εwhere εN(0,σ2)

প্রোটোটাইপিকাল রিগ্রেশন দিয়ে অবিচ্ছিন্ন পরিবর্তনশীল হিসাবে ধারণাগত হয় । যাইহোক, সম্পর্কে প্রকৃতপক্ষে একমাত্র অনুমান করা হ'ল এটি পরিচিত ধ্রুবকের ভেক্টর। এটি একটি অবিচ্ছিন্ন পরিবর্তনশীল হতে পারে তবে এটি একটি ডামি কোড (যেমন, 'র & ' এর ভেক্টরও হতে পারে যা কোনও পর্যবেক্ষণ নির্দেশিত গোষ্ঠীর সদস্য কিনা - উদাহরণস্বরূপ, চিকিত্সা গোষ্ঠী)। সুতরাং, দ্বিতীয় সমীকরণে, মতো একটি ডামি কোড হতে পারে এবং পি-মানটি তার আরও traditionalতিহ্যগত আকারে টি-টেস্ট থেকে সমান হবে। XX01X

যদিও এখানে বিতার অর্থ আলাদা হবে। এই ক্ষেত্রে, হবে নিয়ন্ত্রণ গোষ্ঠীর গড় (যার জন্য ডামি ভেরিয়েবলের এন্ট্রিগুলি ' হবে ), এবং চিকিত্সা গ্রুপের গড় এবং নিয়ন্ত্রণের গড়ের মধ্যে পার্থক্য হবে গ্রুপ। β00β1

এখন, মনে রাখবেন যে কেবলমাত্র দুটি গোষ্ঠী (যদিও একটি টি-পরীক্ষা আরও সাধারণ হবে) নিয়ে একটি আনোভা রাখা / চালানো পুরোপুরি যুক্তিসঙ্গত এবং আপনার তিনটিই সংযুক্ত রয়েছে। আপনি যদি 3 টি গ্রুপ সহ একটি আনোভা রাখেন তবে এটি কীভাবে কাজ করবে তা যদি আপনি পছন্দ করেন; এটি হবে: নোট করুন যে আপনার যখন গ্রুপ রয়েছে তখন তাদের প্রতিনিধিত্ব করার জন্য আপনার কাছে ডামি কোড রয়েছে। রেফারেন্স গ্রুপ (সাধারণত নিয়ন্ত্রণ গ্রুপ) সবার জন্য থাকার মাধ্যমে নির্দেশিত হয়

Y=β0+β1X(dummy code 1)+β2X(dummy code 2)+εwhere εN(0,σ2)
gg10ডামি কোড (এই ক্ষেত্রে, উভয় ডামি কোড 1 এবং ডামি কোড 2)। এই ক্ষেত্রে, এইসব বিটাগুলির যে আদর্শ পরিসংখ্যানগত আউটপুট সঙ্গে আসা জন্য টি-পরীক্ষার P-মান ব্যাখ্যা চাইবেন না - তারা শুধুমাত্র ইঙ্গিত কিনা নির্দেশিত গ্রুপ নিয়ন্ত্রণ গ্রুপ থেকে পৃথক যখন একলা মূল্যায়ন । অর্থাৎ এই পরীক্ষাগুলি স্বতন্ত্র নয়। পরিবর্তে, আপনি একটি আনোভা টেবিল তৈরি করে এবং একটি এফ-পরীক্ষা পরিচালনা করে গ্রুপটির অর্থ ভিন্ন হয় কিনা তা আপনি মূল্যায়ণ করতে চান। কি এটা মূল্য জন্য, বিটাগুলির শুধু t-test এর সংস্করণ উপরে বর্ণিত সঙ্গে হিসেবে ব্যাখ্যা করা হয়: নিয়ন্ত্রণ / রেফারেন্স গ্রুপ গড় হল গ্রুপ 1 মাধ্যম এবং রেফারেন্স গ্রুপ, মধ্যে পার্থক্য নির্দেশ করেβ0β1β2গ্রুপ 2 এবং রেফারেন্স গ্রুপের মধ্যে পার্থক্য নির্দেশ করে।

নীচে @ হোবারের মন্তব্যের আলোকে এগুলি ম্যাট্রিক্স সমীকরণের মাধ্যমেও উপস্থাপন করা যেতে পারে: বোল্ডসিমবোল are ওয়ারেপসিলন এইভাবে উপস্থাপন করেছেন , এবং & are ওয়ারেপসিলন দৈর্ঘ্যের এর ভেক্টর , এবং দৈর্ঘ্যের একটি ভেক্টর । এখন সারি এবং কলাম সহ একটি ম্যাট্রিক্স । প্রোটোটাইপিকাল রিগ্রেশনে আপনার ক্রমাগত ভেরিয়েবল এবং ইন্টারসেপ্ট থাকে। সুতরাং, আপনার ম্যাট্রিক্স পাশাপাশি প্রতিটি কলামের জন্য কলামের ভেক্টরগুলির পাশাপাশি তৈরি হয়েছে, প্রতিটি জন্য একটি করে

Y=Xβ+ε
YεNβp+1XN(p+1)pXXXভেরিয়েবল, বিরতিটির জন্য খুব বাম দিকে কলাম সহ । 1

আপনি যদি এইভাবে গ্রুপগুলির সাথে কোনও এনওওএর প্রতিনিধিত্ব করছেন , তবে মনে রাখবেন যে আপনার ডামি ভেরিয়েবলগুলি গ্রুপগুলি নির্দেশ করবে, রেফারেন্স গ্রুপটির সাথে প্রতিটি ডামি ভেরিয়েবলের পর্যবেক্ষণ দ্বারা নির্দেশিত । উপরে হিসাবে, আপনার এখনও একটি বাধা আছে। এইভাবে, । gg10p=g1


1
আনোভা সমীকরণটি আনোভা (এবং কোনও টি-টেস্ট নয়) হিসাবে কেবল তখনই করতে পারে যদি কে ভেক্টর হিসাবে ব্যাখ্যা করা হয় এবং ডানদিকে গুণিত হয়। β1
whuber

এগুলি ম্যাট্রিক্স সমীকরণ নয়; আমি এখানে খুব কমই ব্যবহার করি, কারণ অনেকে এগুলি পড়েন না। 1 ম ANOVA পূর্ববর্তী টি-টেস্ট হিসাবে একটি অভিন্ন পরিস্থিতি উপস্থাপন করে। আমি কেবল এটিই ইঙ্গিত করছি যে আপনি যদি 2-নমুনা স্বতন্ত্র টি-পরীক্ষা চালাতে পারেন তবে আপনি আনোভা হিসাবে একই ডেটা চালাতে পারেন (যা অনেকেরই তাদের পরিসংখ্যান 101 এর ক্লাস থেকে স্বীকৃত / মনে রাখা উচিত)। আমি আরও একটি আনোভা সংস্করণ ডাব্লু / 3 গোষ্ঠীগুলিকে যুক্ত করে নীচে স্পষ্ট করে বললাম যে 2-গ্রুপ পরিস্থিতি একমাত্র আনোভা ক্ষেত্রে নয় যা প্রতিরোধ হিসাবে বোঝা যায়; তবে রেগ সমীকরণ এখন অন্যরকম দেখাচ্ছে - আমি উপরে আরও স্পষ্টত সমান্তরাল বজায় রাখার চেষ্টা করছিলাম।
গুং - মনিকা পুনরায়

আমার বক্তব্যটি হ'ল আপনি যদি এটিকে ম্যাট্রিক্স সমীকরণ না করেন তবে আপনার এএনওভা-র বৈশিষ্ট্যটি ব্যবহারের পক্ষে খুব সীমিত it এটি টি-টেস্টের আপনার বৈশিষ্ট্যের সাথে সমান এবং তাই এটি সহায়ক হওয়ার চেয়ে বিভ্রান্তিকর। আপনি যখন আরও গোষ্ঠী প্রবর্তন শুরু করেন, আপনি হঠাৎ সমীকরণটি পরিবর্তন করেন, এটিও পরিষ্কারের চেয়ে কম হতে পারে। আপনি ম্যাট্রিক্স স্বরলিপিটি ব্যবহার করতে চান তা অবশ্যই আপনার উপর নির্ভর করে তবে ভালভাবে যোগাযোগের স্বার্থে আপনার ধারাবাহিকতার জন্য প্রচেষ্টা করা উচিত।
whuber

আপনি কীভাবে টি-টেস্টের জনপ্রিয় সংজ্ঞা থেকে আপনি যে সমীকরণটি দেখিয়েছেন সে সম্পর্কে আপনি কীভাবে আরও কিছু ব্যাখ্যা করতে পারেন as মূলত আমি এখানে ওয়াই কী তা বুঝতে পারি না (এটি পরিসংখ্যানগুলির জন্য নবীনতা বা কম আইকিউ হতে পারে)। তবে কীভাবে t = (yx-u0) / s থেকে এই সমীকরণে পৌঁছাবেন।
গৌরব সিংহল

এটি নয়, যদিও এটি আপনার অপরিচিত হতে পারে। তালিকাভুক্ত সমস্ত ক্ষেত্রে অবিচ্ছিন্ন (এবং শর্তসাপেক্ষে স্বাভাবিক ধরে নেওয়া)। সম্পর্কে কোনও বিতরণের অনুমান নেই , এটি ক্রমাগত, দ্বিধাত্বক বা বহু-স্তরের শ্রেণিবদ্ধ পরিবর্তনশীল হতে পারে। YX
গুং - মনিকা পুনরায়

16

এগুলি সমস্ত সাধারণ রৈখিক মডেলের বিশেষ ক্ষেত্রে হিসাবে লেখা যেতে পারে।

টি-টেস্টটি আনোভা একটি দ্বি-নমুনা কেস। যদি আপনি টি-পরীক্ষার পরিসংখ্যানগুলি বর্গক্ষেত্র করেন তবে আপনি আনোভাতে সংশ্লিষ্ট পাবেন ।F

একটি আনোভা মডেল মূলত কেবলমাত্র একটি রিগ্রেশন মডেল যেখানে ফ্যাক্টরের স্তরগুলি ডামি (বা সূচক ) ভেরিয়েবল দ্বারা প্রতিনিধিত্ব করা হয় ।

সুতরাং যদি টি-টেস্টের মডেলটি আনোভা মডেলের একটি উপসেট হয় এবং আনোভা একাধিক রিগ্রেশন মডেলের একটি উপসেট হয় তবে রিগ্রেশন নিজেই (এবং রিগ্রেশন ব্যতীত অন্যান্য জিনিসগুলি) সাধারণ লিনিয়ার মডেলের একটি উপসেট হয় , যা রেগ্রেশনকে প্রসারিত করে স্বাভাবিক রিগ্রেশন কেসের চেয়ে ত্রুটি শর্তটির আরও সাধারণ স্পেসিফিকেশন (যা 'স্বতন্ত্র' এবং 'সমান-বৈচিত্র্য'), এবং বহিরাগত হয় ।Y


এখানে সাধারণ (সমান-ভ্যারিয়েন্স) এর সমানতা দুই sample- দেখাচ্ছে একটি উদাহরণ বিশ্লেষণ ও একটি রিগ্রেশন মডেল একটি হাইপোথিসিস পরীক্ষা, আর মধ্যে সম্পন্ন (প্রকৃত তথ্য যুক্ত করা হয়েছে বলে মনে হচ্ছে, তাই এই সত্যিই একটি উপযুক্ত বিশ্লেষণ নয়) :t

> t.test(extra ~ group, var.equal=TRUE, data = sleep) 

    Two Sample t-test

data:  extra by group
t = -1.8608, df = 18, p-value = 0.07919   
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -3.363874  0.203874
sample estimates:
mean in group 1 mean in group 2 
           0.75            2.33 

উপরে 0.079 এর পি-মানটি নোট করুন। এখানে এক উপায় আনোভা:

> summary(aov(extra~group,sleep))
            Df Sum Sq Mean Sq F value Pr(>F)  
group        1  12.48  12.482   3.463 0.0792 
Residuals   18  64.89   3.605                 

এখন প্রতিরোধের জন্য:

> summary(lm(extra ~ group, data = sleep))

(কিছু আউটপুট সরানো হয়েছে)

Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept)   0.7500     0.6004   1.249   0.2276  
group2        1.5800     0.8491   1.861   0.0792 .
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.899 on 18 degrees of freedom
Multiple R-squared:  0.1613,    Adjusted R-squared:  0.1147 
F-statistic: 3.463 on 1 and 18 DF,  p-value: 0.07919

'গ্রুপ 2' সারির পি-মান এবং শেষ সারিতে F-পরীক্ষার জন্য পি-মানের তুলনা করুন। দ্বি-পুচ্ছ পরীক্ষার জন্য, এটি একই এবং উভয়ই টি-পরীক্ষার ফলাফলের সাথে মেলে।

আরও, 'গ্রুপ 2' এর সহগ দুটি গ্রুপের জন্য পার্থক্য উপস্থাপন করে represents


সমস্ত 3 পরিস্থিতিতে একই পি মান থাকা যাদু এবং চিত্তাকর্ষক, তবে আপনি যদি এই পি-মানগুলি কীভাবে গণনা করা হয় সে সম্পর্কে যদি আপনি আরও কিছুটা ব্যাখ্যা করতে পারেন তবে অবশ্যই এই উত্তরটি আরও আকর্ষণীয় করে তুলবে । আমি জানি না যে পি-মান গণনাগুলি দেখানোও এটি আরও কার্যকর করে তুলবে , তাই এটিই আপনি সিদ্ধান্ত নিতে পারেন।
গৌরব সিংহল

@ গৌরব পি-মানগুলি একই কারণ আপনি একই মডেলের উপর একই অনুমানটি পরীক্ষা করছেন, কিছুটা ভিন্নভাবে উপস্থাপন করেছেন। আপনি যদি কিছু নির্দিষ্ট পি-মান গণনা করাতে আগ্রহী হন তবে এটি একটি নতুন প্রশ্ন হবে (এটি এখানে প্রশ্নের উত্তর হবে না)। আপনি ইতিমধ্যে একটি প্রশ্ন জিজ্ঞাসা করতে পারেন যদিও প্রথমে অনুসন্ধানের চেষ্টা করুন কারণ এটি ইতিমধ্যে উত্তর দেওয়া হতে পারে।
Glen_b

ধন্যবাদ @ গ্লেন_ বি, একটি সুস্পষ্ট প্রশ্ন জিজ্ঞাসা করার জন্য দুঃখিত এবং এটিও সবচেয়ে ভাল উপায় নয়। এবং আপনি এখনও আমার প্রশ্নের উত্তর দিয়েছেন - "একই মডেলের (এবং / অথবা ডেটা) একই অনুমান"। তারা কীভাবে একই অনুমানের পরীক্ষা করছে তা নিয়ে আমি যথেষ্ট ধারণা দেয়নি। ধন্যবাদ
গৌরব সিংহল

2

আমি আগে পোস্ট করা এই উত্তরটি কিছুটা প্রাসঙ্গিক, তবে এই প্রশ্নটি কিছুটা আলাদা।

আপনি নিম্নলিখিত লিনিয়ার মডেলগুলির মধ্যে পার্থক্য এবং সাদৃশ্য সম্পর্কে ভাবতে চাইতে পারেন:

[Y1Yn]=[1x11x21x31xn][α0α1]+[ε1εn]
[Y1Yn]=[10001000010001000010][α0αk]+[ε1εn]

2
প্রশ্নগুলির কিছু বর্ণনা এবং মন্তব্য পাঠকদের জন্য উপকারী হবে কারণ এখন থেকে তারা অনুমান করতে হবে যে তারা কোথা থেকে এসেছে এবং তারা কীভাবে প্রশ্নের সাথে সম্পর্কিত ...
টিম

0

চিকিত্সাগুলির মধ্যে অজানা তবে সমান বৈচিত্রের ধারণা ধরে আনোভা মানে সমতার জন্য টি-টেস্টের অনুরূপ। এটি কারণ এনোভাতে এমএসই টি-পরীক্ষায় ব্যবহৃত পুল-ভেরিয়েন্সের সমান। টি-টেস্টের অন্যান্য সংস্করণ রয়েছে যেমন আন-সম-বৈকল্পিকের জন্য একটি এবং জোড়া-ভিত্তিক টি-টেস্ট। এই দর্শন থেকে, টি-পরীক্ষা আরও নমনীয় হতে পারে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.