আনোভা অনুমানের স্বাভাবিকতা / অবশিষ্টাংশের স্বাভাবিক বিতরণ


52

ANOVA উইকিপিডিয়ার পৃষ্ঠা তিন অনুমানের তালিকা , যথা:

  • মামলার স্বাতন্ত্র্য - এটি পরিসংখ্যান বিশ্লেষণকে সহজতর করে এমন মডেলের একটি অনুমান।
  • স্বাভাবিকতা - অবশিষ্টাংশের বিতরণ স্বাভাবিক।
  • সমতা (বা "একজাতীয়তা") বৈকল্পিক, যাকে হোমোসেসেস্টাস্টিটি বলা হয় ...

আগ্রহের বিষয় এখানে দ্বিতীয় ধারণা। বেশ কয়েকটি উত্স অনুমানকে আলাদাভাবে তালিকাবদ্ধ করে। কেউবা কাঁচা তথ্যের স্বাভাবিকতা বলেন, কেউবা অবশিষ্টের দাবি।

বেশ কয়েকটি প্রশ্ন পপ আপ:

  • একই ব্যক্তির স্বাভাবিকতা এবং অবশিষ্ট বিতরণগুলি কি একই ব্যক্তির (উইকিপিডিয়ায় প্রবেশের ভিত্তিতে, আমি দাবি করবো যে স্বাভাবিকতা একটি সম্পত্তি, এবং সরাসরি অবশিষ্টাংশের অধিকারী হয় না (তবে অবশিষ্টাংশের সম্পত্তি হতে পারে (বন্ধুর মধ্যে গভীরভাবে নেস্টেড টেক্সট, freaky)))?
  • যদি না হয়, কোন অনুমান রাখা উচিত? এক? উভয়?
  • যদি সাধারণত বিতরণকৃত অবশিষ্টাংশগুলির অনুমানটি সঠিক হয় তবে আমরা কি কেবলমাত্র স্বাভাবিকতার জন্য কাঁচা মানগুলির হিস্টগ্রাম পরীক্ষা করে গুরুতর ভুল করছি?

আপনি সেই উত্সগুলিতে অন্য যে কোনও কিছু উপেক্ষা করতে পারেন যা যদি দাবি করে যে যদি কাঁচা ডেটা সাধারণত বিতরণ করা প্রয়োজন। এবং কে বলেছিল যে "আমরা" কেবল হিস্টোগ্রামের সাথে কাঁচা মানগুলি যাচাই করে দেখছি। আপনি কি সেই ছয় সিগমা ক্লাসের একটিতে আছেন ???
DWin

1
@ অ্যান্ডি ডাব্লু: আনোভা-তে উইকিপিডিয়া নিবন্ধের প্রাসঙ্গিক বিভাগ হিসাবে উপস্থিত বলে মনে হচ্ছে আমি একটি লিঙ্ক যুক্ত করেছি।
onestop

@ ডিউইন: ব্লগ.মার্কনেথনিলাওসন ::? p = 296 (দুঃখিত, পুরোপুরি অফ-টপিক কিন্তু প্রতিহত করতে পারেনি)
অনস্টেট

নিঃসন্দেহে আপনাকে ধন্যবাদ আমি কেবল এই লিঙ্কটিই অনুরোধ করেছি কারণ আমি অলস এবং আমি নিজে উইকিপিডিয়ায় আনোভা দেখতে চাইনি, কারণ এটি প্রশ্নের প্রয়োজনীয় নয়।
অ্যান্ডি ডাব্লু

উত্তর:


35

আসুন ধরে নেওয়া যাক এটি একটি স্থির প্রভাবগুলির মডেল। (এলোমেলো-প্রভাবের মডেলগুলির জন্য পরামর্শটি আসলেই পরিবর্তিত হয় না, এটি আরও খানিকটা জটিল হয়ে ওঠে))

  1. না, অবশিষ্টের স্বাভাবিকতা এবং স্বাভাবিক বিতরণ এক নয় । মনে করুন আপনি কোনও সার প্রয়োগ ছাড়াই এবং ছাড়াই একটি ফসল থেকে ফলন পরিমাপ করেছেন। সারবিহীন প্লটে ফলন 70০ থেকে ১৩০ অবধি ছিল। সারের সাথে দুটি প্লটে ফলন 470 থেকে 530 অবধি ছিল from ফলাফল বিতরণ দৃ of়ভাবে অস্বাভাবিক: এটি সার প্রয়োগ সম্পর্কিত দুটি স্থানে গুচ্ছ us ধরুন, আরও গড় ফলন যথাক্রমে 100 এবং 500 হয়। তারপরে সমস্ত অবশিষ্টাংশের -30 থেকে +30 অবধি। এগুলি সাধারণত বিতরণ করা হতে পারে (বা নাও হতে পারে) তবে স্পষ্টতই এটি সম্পূর্ণ আলাদা বিতরণ।

  2. অবশিষ্টাংশগুলির বিতরণ গুরুত্বপূর্ণ , কারণ তারা মডেলের এলোমেলো অংশ প্রতিবিম্বিত করে। এও নোট করুন যে পি-মানগুলি F (বা t) পরিসংখ্যান থেকে গণনা করা হয় এবং যা অবশিষ্ট মানের উপর নির্ভর করে, মূল মানগুলির উপর নির্ভর করে না।

  3. যদি ডেটাতে (যেমন এই উদাহরণ হিসাবে) উল্লেখযোগ্য এবং গুরুত্বপূর্ণ প্রভাব থাকে তবে আপনি সম্ভবত একটি "গুরুতর" ভুল করছেন । আপনি, ভাগ্যক্রমে, সঠিক সংকল্পটি তৈরি করতে পারেন: অর্থাত, কাঁচা ডেটা দেখে আপনি বিতরণের মিশ্রণটি সিল করতে পারেন এবং এটি স্বাভাবিক (বা না) দেখতে পারে। মুল বক্তব্যটি আপনি যা খুঁজছেন তা প্রাসঙ্গিক নয়।

মডেল ফিট করার জন্য আনোভা অবশিষ্টাংশগুলিকে কোথাও স্বাভাবিকের কাছাকাছি থাকতে হবে না। তবে, এফ-ডিস্ট্রিবিউশন থেকে গণনা করা পি-ভ্যালুগুলি অর্থবহ হওয়ার জন্য অবশিষ্টাংশগুলির নিকট-স্বাভাবিকতা অপরিহার্য


6
আমি মনে করি যে এখানে গুরুত্বপূর্ণ পয়েন্ট রয়েছে: একটি আনোভাতে প্রতিটি গ্রুপের মধ্যে স্বাভাবিকতা (সামগ্রিকভাবে নয়) অবশিষ্টাংশের স্বাভাবিকতার সমান।
আনিকো

2
@ অ্যানিকো আপনি কি আপনার মন্তব্যে "সমতুল্য" বলতে কী বোঝাতে চেয়েছেন তা ব্যাখ্যা করতে পারেন? এটি প্রায় টোটোলজিক্যাল যে একটি গোষ্ঠীর মধ্যে স্বাভাবিকতা সেই গোষ্ঠীর অবশিষ্টাংশের স্বাভাবিকতার সমান, তবে এটি সত্য যে প্রতিটি গ্রুপের মধ্যে পৃথক পৃথকভাবে স্বাভাবিকতা অবশিষ্টাংশের স্বাভাবিকতা বোঝায় (বা বোঝানো হয়)।
whuber

7
আমি প্রকৃতপক্ষে টোটোলজিকাল অর্থে বোঝাতে চাইছিলাম: গ্রুপগুলি যদি স্বাভাবিক থাকে তবে অবশিষ্টাংশগুলি স্বাভাবিক থাকে। বিপরীতটি কেবল তখনই সত্য হয় যদি সমকামিতা যুক্ত হয় (আনোভা হিসাবে)। আমার অর্থ অবশিষ্টাংশগুলির পরিবর্তে দলগুলি পরীক্ষা করার পক্ষে উকিল করার অর্থ নেই, তবে আমি মনে করি এটি অনুমানগুলির বিবিধ বাক্যকরণের মূল কারণ।
অনিকো

2
আমি লক্ষ্য করেছি যে একটি আনোভা করা লোকেরা সাধারণত পি-ভ্যালুগুলি গণনা করতে আগ্রহী বলে মনে হয় এবং তাই অবশিষ্টাংশগুলির স্বাভাবিকতা তাদের জন্য গুরুত্বপূর্ণ। যদি আমরা এফ-ডিস্ট্রিবিউশন থেকে পি-ভ্যালু গণনা করতে আগ্রহী না হই তবে কোনও আনোভা মডেল ফিট করার কোনও সাধারণ কারণ আছে কি? এই প্রশ্ন একটি মন্তব্য করার জন্য খুব বিস্তৃত হলে দুঃখিত।
ব্যবহারকারী1205901 - মনিকা

3
@ user1205901 এটি একটি খুব ভাল পয়েন্ট। আনোভা-র দুটি সাধারণ ব্যবহার যা এফ পরীক্ষার উপর নির্ভর করে না সেগুলি হ'ল (1) এটি প্রভাব অনুমানের প্রাপ্তির একটি সুবিধাজনক উপায় এবং (২) এটি ভেরিয়েন্স গণনার কোনও অংশ এবং অংশ।
হোবার

8

স্ট্যান্ডার্ড ক্লাসিকাল ওয়ানওয়ে এএনওওয়াকে ক্লাসিকাল "2-নমুনা টি-পরীক্ষা" "এন-নমুনা টি-টেস্ট" এর এক্সটেনশন হিসাবে দেখা যায়। ক্লাসিকাল 2-নমুনা টি-পরীক্ষার সাথে কেবল দুটি গোষ্ঠীর সাথে একমুখী আনোভা তুলনা করা থেকে এটি দেখা যায়।

আমি মনে করি আপনি কোথায় বিভ্রান্ত হচ্ছেন তা হ'ল (মডেলের অনুমানের অধীনে) অবশিষ্টাংশ এবং কাঁচা তথ্য দুটি সাধারণত বিতরণ করা হয়। তবে কাঁচা ডেটাতে বিভিন্ন উপায়ে সাধারণ বিতরণ থাকে (যতক্ষণ না সমস্ত প্রভাবগুলি একই রকম হয়) তবে একই বৈকল্পিক। অন্যদিকে অবশিষ্টাংশগুলির একই সাধারণ বিতরণ রয়েছে । এটি সমকামিতার তৃতীয় ধারণা থেকে আসে।

Yijμjσ2Yij=μj+σϵijϵij

ϵij

Yij


1
(শেষ অনুচ্ছেদে) সমকামী ধারণা গ্রহণের জন্য +1।
শুক্র

এর অর্থ কি এই যে যদি আমরা n নির্ভরশীল গ্রুপগুলির তুলনা করতে বলে থাকি তবে আমরা তাদের অবশিষ্টাংশগুলি পৃথকভাবে পরীক্ষা করতে হবে (ফলস্বরূপ অবশিষ্টাংশগুলির এন গ্রুপ)?
stan

5

pnjF=SSb/dfbSSw/dfw

SSb=j=1pnj(MMj)2

SSw=j=1pi=1nj(yijMj)2

FFSSb/dfbSSw/dfwχ2dfbdfwSSbSSw0MMjyijMj

yi(j)MjY=μj+ϵ=μ+αj+ϵyi(j)MY=μ+ϵMMj

H0Myi(j)MjMMj


2
SSχ2Mj=MjyijMjMjM

আপনার স্পষ্টতাকে প্রতিবিম্বিত করার জন্য @ ইউনেস্টপ এডিট করা হয়েছে, ধন্যবাদ!
কারাকাল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.