তারা কীভাবে একই বেসিক পরিসংখ্যান পদ্ধতির সমস্ত সংস্করণ?
তারা কীভাবে একই বেসিক পরিসংখ্যান পদ্ধতির সমস্ত সংস্করণ?
উত্তর:
বিবেচনা করুন যে এগুলি সমস্ত একটি রিগ্রেশন সমীকরণ হিসাবে লেখা যেতে পারে (সম্ভবত তাদের traditionalতিহ্যগত ফর্মগুলির তুলনায় কিছুটা পৃথক ব্যাখ্যার সাথে)।
:
t- পরীক্ষা:
:
প্রোটোটাইপিকাল রিগ্রেশন দিয়ে অবিচ্ছিন্ন পরিবর্তনশীল হিসাবে ধারণাগত হয় । যাইহোক, সম্পর্কে প্রকৃতপক্ষে একমাত্র অনুমান করা হ'ল এটি পরিচিত ধ্রুবকের ভেক্টর। এটি একটি অবিচ্ছিন্ন পরিবর্তনশীল হতে পারে তবে এটি একটি ডামি কোড (যেমন, 'র & ' এর ভেক্টরও হতে পারে যা কোনও পর্যবেক্ষণ নির্দেশিত গোষ্ঠীর সদস্য কিনা - উদাহরণস্বরূপ, চিকিত্সা গোষ্ঠী)। সুতরাং, দ্বিতীয় সমীকরণে, মতো একটি ডামি কোড হতে পারে এবং পি-মানটি তার আরও traditionalতিহ্যগত আকারে টি-টেস্ট থেকে সমান হবে।
যদিও এখানে বিতার অর্থ আলাদা হবে। এই ক্ষেত্রে, হবে নিয়ন্ত্রণ গোষ্ঠীর গড় (যার জন্য ডামি ভেরিয়েবলের এন্ট্রিগুলি ' হবে ), এবং চিকিত্সা গ্রুপের গড় এবং নিয়ন্ত্রণের গড়ের মধ্যে পার্থক্য হবে গ্রুপ।
এখন, মনে রাখবেন যে কেবলমাত্র দুটি গোষ্ঠী (যদিও একটি টি-পরীক্ষা আরও সাধারণ হবে) নিয়ে একটি আনোভা রাখা / চালানো পুরোপুরি যুক্তিসঙ্গত এবং আপনার তিনটিই সংযুক্ত রয়েছে। আপনি যদি 3 টি গ্রুপ সহ একটি আনোভা রাখেন তবে এটি কীভাবে কাজ করবে তা যদি আপনি পছন্দ করেন; এটি হবে: নোট করুন যে আপনার যখন গ্রুপ রয়েছে তখন তাদের প্রতিনিধিত্ব করার জন্য আপনার কাছে ডামি কোড রয়েছে। রেফারেন্স গ্রুপ (সাধারণত নিয়ন্ত্রণ গ্রুপ) সবার জন্য থাকার মাধ্যমে নির্দেশিত হয়
নীচে @ হোবারের মন্তব্যের আলোকে এগুলি ম্যাট্রিক্স সমীকরণের মাধ্যমেও উপস্থাপন করা যেতে পারে: বোল্ডসিমবোল are ওয়ারেপসিলন এইভাবে উপস্থাপন করেছেন
, এবং & are ওয়ারেপসিলন দৈর্ঘ্যের এর ভেক্টর , এবং দৈর্ঘ্যের একটি ভেক্টর । এখন সারি এবং কলাম সহ একটি ম্যাট্রিক্স । প্রোটোটাইপিকাল রিগ্রেশনে আপনার ক্রমাগত ভেরিয়েবল এবং ইন্টারসেপ্ট থাকে। সুতরাং, আপনার ম্যাট্রিক্স পাশাপাশি প্রতিটি কলামের জন্য কলামের ভেক্টরগুলির পাশাপাশি তৈরি হয়েছে, প্রতিটি জন্য একটি করে
আপনি যদি এইভাবে গ্রুপগুলির সাথে কোনও এনওওএর প্রতিনিধিত্ব করছেন , তবে মনে রাখবেন যে আপনার ডামি ভেরিয়েবলগুলি গ্রুপগুলি নির্দেশ করবে, রেফারেন্স গ্রুপটির সাথে প্রতিটি ডামি ভেরিয়েবলের পর্যবেক্ষণ দ্বারা নির্দেশিত । উপরে হিসাবে, আপনার এখনও একটি বাধা আছে। এইভাবে, ।
এগুলি সমস্ত সাধারণ রৈখিক মডেলের বিশেষ ক্ষেত্রে হিসাবে লেখা যেতে পারে।
টি-টেস্টটি আনোভা একটি দ্বি-নমুনা কেস। যদি আপনি টি-পরীক্ষার পরিসংখ্যানগুলি বর্গক্ষেত্র করেন তবে আপনি আনোভাতে সংশ্লিষ্ট পাবেন ।
একটি আনোভা মডেল মূলত কেবলমাত্র একটি রিগ্রেশন মডেল যেখানে ফ্যাক্টরের স্তরগুলি ডামি (বা সূচক ) ভেরিয়েবল দ্বারা প্রতিনিধিত্ব করা হয় ।
সুতরাং যদি টি-টেস্টের মডেলটি আনোভা মডেলের একটি উপসেট হয় এবং আনোভা একাধিক রিগ্রেশন মডেলের একটি উপসেট হয় তবে রিগ্রেশন নিজেই (এবং রিগ্রেশন ব্যতীত অন্যান্য জিনিসগুলি) সাধারণ লিনিয়ার মডেলের একটি উপসেট হয় , যা রেগ্রেশনকে প্রসারিত করে স্বাভাবিক রিগ্রেশন কেসের চেয়ে ত্রুটি শর্তটির আরও সাধারণ স্পেসিফিকেশন (যা 'স্বতন্ত্র' এবং 'সমান-বৈচিত্র্য'), এবং বহিরাগত হয় ।
এখানে সাধারণ (সমান-ভ্যারিয়েন্স) এর সমানতা দুই sample- দেখাচ্ছে একটি উদাহরণ বিশ্লেষণ ও একটি রিগ্রেশন মডেল একটি হাইপোথিসিস পরীক্ষা, আর মধ্যে সম্পন্ন (প্রকৃত তথ্য যুক্ত করা হয়েছে বলে মনে হচ্ছে, তাই এই সত্যিই একটি উপযুক্ত বিশ্লেষণ নয়) :
> t.test(extra ~ group, var.equal=TRUE, data = sleep)
Two Sample t-test
data: extra by group
t = -1.8608, df = 18, p-value = 0.07919
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-3.363874 0.203874
sample estimates:
mean in group 1 mean in group 2
0.75 2.33
উপরে 0.079 এর পি-মানটি নোট করুন। এখানে এক উপায় আনোভা:
> summary(aov(extra~group,sleep))
Df Sum Sq Mean Sq F value Pr(>F)
group 1 12.48 12.482 3.463 0.0792
Residuals 18 64.89 3.605
এখন প্রতিরোধের জন্য:
> summary(lm(extra ~ group, data = sleep))
(কিছু আউটপুট সরানো হয়েছে)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.7500 0.6004 1.249 0.2276
group2 1.5800 0.8491 1.861 0.0792 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 1.899 on 18 degrees of freedom
Multiple R-squared: 0.1613, Adjusted R-squared: 0.1147
F-statistic: 3.463 on 1 and 18 DF, p-value: 0.07919
'গ্রুপ 2' সারির পি-মান এবং শেষ সারিতে F-পরীক্ষার জন্য পি-মানের তুলনা করুন। দ্বি-পুচ্ছ পরীক্ষার জন্য, এটি একই এবং উভয়ই টি-পরীক্ষার ফলাফলের সাথে মেলে।
আরও, 'গ্রুপ 2' এর সহগ দুটি গ্রুপের জন্য পার্থক্য উপস্থাপন করে represents
আমি আগে পোস্ট করা এই উত্তরটি কিছুটা প্রাসঙ্গিক, তবে এই প্রশ্নটি কিছুটা আলাদা।
আপনি নিম্নলিখিত লিনিয়ার মডেলগুলির মধ্যে পার্থক্য এবং সাদৃশ্য সম্পর্কে ভাবতে চাইতে পারেন:
চিকিত্সাগুলির মধ্যে অজানা তবে সমান বৈচিত্রের ধারণা ধরে আনোভা মানে সমতার জন্য টি-টেস্টের অনুরূপ। এটি কারণ এনোভাতে এমএসই টি-পরীক্ষায় ব্যবহৃত পুল-ভেরিয়েন্সের সমান। টি-টেস্টের অন্যান্য সংস্করণ রয়েছে যেমন আন-সম-বৈকল্পিকের জন্য একটি এবং জোড়া-ভিত্তিক টি-টেস্ট। এই দর্শন থেকে, টি-পরীক্ষা আরও নমনীয় হতে পারে।