শাপিরো-উইলক পরীক্ষার ব্যাখ্যা


29

আমি পরিসংখ্যানে বেশ নতুন এবং আমার আপনার সহায়তা দরকার।
আমার নীচে একটি ছোট নমুনা রয়েছে:

  H4U
  0.269
  0.357
  0.2
  0.221
  0.275
  0.277
  0.253
  0.127
  0.246

আমি আরপি ব্যবহার করে শাপিরো-উইলক পরীক্ষা চালিয়েছি:

shapiro.test(precisionH4U$H4U)

এবং আমি নিম্নলিখিত ফলাফল পেয়েছি:

 W = 0.9502, p-value = 0.6921

এখন, আমি যদি পি-মানের চেয়ে 0.05 এর তাত্পর্য স্তরটি ধরে নিয়ে যাই তবে আলফা (0.6921> 0.05) এবং আমি সাধারণ বন্টন সম্পর্কে নাল অনুমানটি বাতিল করতে পারি না, তবে এটি কি আমাকে বলতে দেয় যে নমুনার একটি সাধারণ বিতরণ আছে ?

ধন্যবাদ!

উত্তর:


28

না - আপনি "নমুনার একটি সাধারণ বিতরণ আছে" বা "নমুনাটি একটি সাধারণ বন্টন রয়েছে এমন একটি জনসংখ্যার কাছ থেকে আসে" বলতে পারবেন না তবে কেবল "নমুনাটি এমন একটি জনগোষ্ঠীর থেকে আসে যা একটি সাধারণ বন্টন রয়েছে" এই অনুমানটিকে আপনি অস্বীকার করতে পারবেন না "।

প্রকৃতপক্ষে নমুনার একটি সাধারণ বিতরণ নেই ( নীচের কিউকিপ্লট দেখুন) তবে এটি কেবলমাত্র নমুনা হওয়ায় আপনি এটি আশা করবেন না। অন্তর্নিহিত জনসংখ্যার বন্টনের প্রশ্নটি এখনও খোলা রয়েছে।

qqnorm( c(0.269, 0.357, 0.2, 0.221, 0.275, 0.277, 0.253, 0.127, 0.246) )

qqplot


2
qqplot সৌন্দর্য প্রশংসনীয় স্বাভাবিক মত আমি মনে করি ... আপনি চেষ্টা করতে পারেন qqnorm(rnorm(9))বেশ কয়েকবার ...
অদ্ভুত

2
@ টমাস: সম্ভবত "কিউপিপ্লট দেখে মনে হচ্ছে এটি সাধারণ জনসংখ্যার থেকে আসতে পারত" better পরিবর্তে এটি ভারী লেজযুক্ত বিতরণ থেকে আসতে পারে।
হেনরি

হ্যাঁ, qqnorm(runif(9))অনুরূপ ফলাফল আনতে পারে। সুতরাং আমরা আসলে কিছুই বলতে পারি না ...
কৌতূহলী

"নমুনার একটি সাধারণ বন্টন আছে" এবং "নমুনা একটি সাধারণ বন্টন আছে এমন একটি জনগোষ্ঠীর থেকে আসে" এর মধ্যে পার্থক্য কী?
আওরহাম

1
একটি সাধারণ বন্টন সমস্ত বাস্তবের উপর অবিচ্ছিন্ন বিতরণ is একটি নমুনা (সীমাবদ্ধ বা এমনকি যথেষ্ট অসীম) এরও এই ধরণের বিতরণ নিজেই থাকতে পারে না, এমনকি যদি এটি এই বন্টনযুক্ত জনগোষ্ঠীর দ্বারা আঁকানো হয়।
হেনরি

17

নাল হাইপোথিসিসটি প্রত্যাখ্যান করতে ব্যর্থ হওয়া ইঙ্গিত দেয় যে আপনার কাছে থাকা নমুনাটি আপনার কাছে স্বাভাবিক থেকে যে কোনও বিচ্যুতি বাছাই করতে খুব সামান্য - তবে আপনার নমুনা এতটাই ছোট যে স্বাভাবিকতা থেকে যথেষ্ট যথেষ্ট বিচ্যুতিও সনাক্ত করা যায় না।

তবে একটি হাইপোথিসিস পরীক্ষা বেশিরভাগ ক্ষেত্রে লোকেরা স্বাভাবিকতার জন্য একটি পরীক্ষা ব্যবহার করে সেই বিন্দুটির পাশে - আপনি যে প্রশ্নটি পরীক্ষা করছেন তার উত্তরটি আপনি আসলেই জানেন - আপনার ডেটা থেকে জনসংখ্যার বন্টন স্বাভাবিক হবে না । (এটি কখনও কখনও খুব কাছাকাছি হতে পারে, তবে আসলে স্বাভাবিক?)

আপনার যে প্রশ্নটি করা উচিত তা হ'ল 'তারা সাধারণ থেকে আঁকানো বিতরণ' (এটি হবে না)। আপনার যে প্রশ্নটি প্রকৃতপক্ষে করা উচিত সেগুলি হ'ল 'আমি স্বাভাবিকভাবেই আমার ফলাফলগুলিকে প্রভাবিত করতে চলেছি তা থেকে বিচ্যুতি?' যদি এটি সম্ভাব্য সমস্যা হয় তবে আপনি এমন কোনও বিশ্লেষণ বিবেচনা করতে পারেন যা সম্ভবত এই সমস্যা হওয়ার সম্ভাবনা কম।


10

t

tt

আমি আরও অনুমান করছি যে আপনি অনুপাতের দিকে তাকিয়ে আছেন, যদি আপনি অনুমানের লঙ্ঘনের বিষয়ে উদ্বিগ্ন হন তবে আপনি দ্বিপদী বিতরণ ব্যবহার করতে পারেন।

এটি যদি শাপিরো পরীক্ষায় আপনাকে নিয়ে আসে তবে যদি আপনি উদ্বিগ্ন হন তবে আমি যা বলেছি তা আপনি এড়িয়ে যেতে পারেন।


আপনি এটি সঠিকভাবে পেয়েছেন, আমি জানতে চেয়েছিলাম যে আমি আমার নমুনার জন্য টি পরীক্ষা ব্যবহার করতে পারি কিনা। ধন্যবাদ!
জাকুব

4

হেনরি যেমন ইতিমধ্যে বলেছিল আপনি এটিকে সাধারণ বলতে পারবেন না। নিম্নলিখিত কমান্ডটি কয়েকবার আরে চালানোর চেষ্টা করুন:

shapiro.test(runif(9)) 

এটি ইউনিফর্ম বিতরণ থেকে 9 সংখ্যার নমুনা পরীক্ষা করবে। অনেক সময় পি-মান 0.05 এর থেকে অনেক বড় হবে - যার অর্থ আপনি বিতরণটি স্বাভাবিক যে সিদ্ধান্ত নিতে পারবেন না cannot


4

আমি শাপিরো-উইলক পরীক্ষায় ডব্লু মানকে কীভাবে সঠিকভাবে ব্যাখ্যা করতে হবে তাও দেখছিলাম এবং এমিল ওডাব্লু কির্কেগার্ডের নিবন্ধ অনুসারে " শাপিরো-উইলক পরীক্ষা থেকে ডাব্লু মানগুলি বিভিন্ন ডেটাসেটের সাথে ভিজ্যুয়ালাইজ করা হয়েছে " এটির স্বাভাবিকতা সম্পর্কে কিছু বলা খুব কঠিন বন্টন একা ডাব্লু মান খুঁজছেন ।

তিনি যেমন উপসংহারে বলেছেন:

সাধারণত আমরা দেখতে পাই যে একটি বৃহত নমুনা দেওয়া, এসডাব্লু অ-স্বাভাবিকতা থেকে প্রস্থান করার জন্য সংবেদনশীল। প্রস্থানটি যদি খুব সামান্য হয় তবে এটি খুব গুরুত্বপূর্ণ নয়।

আমরা আরও দেখতে পাই যে ডাব্লু মান হ্রাস করা শক্ত এমনকি যদি কেউ ইচ্ছাকৃতভাবে চেষ্টা করেও। এটি প্রশংসনীয়ভাবে নীচে নেমে যাওয়ার জন্য একটিকে অত্যন্ত অ-স্বাভাবিক বিতরণ পরীক্ষা করা দরকার 99

আরও তথ্যের জন্য মূল নিবন্ধ দেখুন।


1

পূর্বের উত্তরে উল্লেখ না করা একটি গুরুত্বপূর্ণ বিষয় হ'ল পরীক্ষার সীমাবদ্ধতা:

পরীক্ষার সীমাবদ্ধতা রয়েছে, সর্বাগ্রে গুরুত্বপূর্ণ যে পরীক্ষার নমুনা আকারের পক্ষপাত রয়েছে । নমুনাটি যত বড় হবে আপনি সম্ভবত পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ ফল পাবেন significant

মূল প্রশ্নের উত্তর দেওয়ার জন্য (খুব ছোট নমুনার আকার): এই নির্দিষ্ট ক্ষেত্রে কিউকিউ প্লট এবং হিস্টগ্রামের মতো আরও ভাল বিকল্প সম্পর্কে নিম্নলিখিত নিবন্ধগুলি দেখুন ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.