আমি শাপিরো-উইলকের স্বাভাবিকতা পরীক্ষা করার পরে এটির পরিকল্পনা করেছি। পরীক্ষায় দেখা গেছে যে সম্ভবত জনসংখ্যার সাধারণত বিতরণ করা হয়। তবে এই প্লটটিতে এই "আচরণ" কীভাবে দেখবেন?
হালনাগাদ
ডেটার একটি সাধারণ হিস্টোগ্রাম:

হালনাগাদ
শাপিরো-উইলক পরীক্ষা বলে:

আমি শাপিরো-উইলকের স্বাভাবিকতা পরীক্ষা করার পরে এটির পরিকল্পনা করেছি। পরীক্ষায় দেখা গেছে যে সম্ভবত জনসংখ্যার সাধারণত বিতরণ করা হয়। তবে এই প্লটটিতে এই "আচরণ" কীভাবে দেখবেন?
হালনাগাদ
ডেটার একটি সাধারণ হিস্টোগ্রাম:

হালনাগাদ
শাপিরো-উইলক পরীক্ষা বলে:

উত্তর:
" পরীক্ষায় দেখা গেছে যে সম্ভবত জনসংখ্যার সাধারণত বিতরণ করা হতে পারে " "
না; এটি এটি দেখায় নি।
হাইপোথিসিস পরীক্ষাগুলি আপনাকে জানায় না যে নালটি কতটা সম্ভব। আসলে আপনি এই নালটি বাজি ধরতে পারেন এটি মিথ্যা।
কিউকিউ প্লটটি অ-স্বাভাবিকতার দৃ strong় ইঙ্গিত দেয় না (প্লটটি মোটামুটি সোজা); আপনি যেটা আশা করেছিলেন তার চেয়ে কিছুটা ছোট বাম লেজ রয়েছে তবে এটি আসলে খুব বেশি গুরুত্ব পাবে না।
হিস্টগ্রাম সম্ভবত হিসাবে খুব বেশি কিছু বলে না; এটি সামান্য খাটো বাম লেজের দিকেও ইঙ্গিত দেয়। তবে এখানে দেখুন
আপনার ডেটা যে জনসংখ্যার বিতরণ থেকে এসেছে তা হুবহু স্বাভাবিক হতে পারে না। তবে কিউকিউ প্লটটি দেখায় যে স্বাভাবিকতা সম্ভবত যুক্তিসঙ্গতভাবে ভাল আনুমানিকতা।
যদি নমুনার আকার খুব ছোট না হয়, তবে শাপিরো-উইলকের প্রত্যাখ্যানের অভাব সম্ভবত এটি একইভাবে বলত।
আপডেট: প্রকৃত শাপিরো-উইলক পি-মান অন্তর্ভুক্ত করার জন্য আপনার সম্পাদনাটি গুরুত্বপূর্ণ কারণ বাস্তবে এটি নির্দেশ করবে যে আপনি সাধারণ গুরুত্বপূর্ণ স্তরে নালটিকে প্রত্যাখাত করবেন। এই পরীক্ষাটি নির্দেশ করে যে আপনার ডেটা সাধারণত বিতরণ করা হয় না এবং প্লটগুলি দ্বারা নির্দেশিত হালকা স্কিউনেস সম্ভবত এটিই পরীক্ষা দ্বারা গ্রহণ করা হয়। সাধারণ পদ্ধতির জন্য যা নিজেই পরিবর্তনশীলটির স্বাভাবিকতা ধরে নিতে পারে (এক-নমুনা টি-টেস্টটি মনে মনে আসে), এতে মোটামুটি বৃহত্তর নমুনার আকার বলে মনে হয়, এই হালকা অ-স্বাভাবিকতা প্রায় কোনও ফলশ্রুতি হবে না সর্বোপরি - ফিট পরীক্ষাগুলির ধার্মিকতার মধ্যে অন্যতম সমস্যা হ'ল তারা যখন অস্বীকার করতে পারে তখনই তার পক্ষে বেশি সমস্যা হয় (যখন নমুনার আকারটি কিছু পরিমিত অস্বাভাবিকতা সনাক্ত করতে যথেষ্ট বড় হয়); একইভাবে তারা যখন বিষয়টি সর্বাধিক গুরুত্বপূর্ণ হয় তখন তা প্রত্যাখ্যান করতে ব্যর্থ হওয়ার সম্ভাবনা বেশি থাকে (যখন নমুনার আকার ছোট হয়)।
যদি তথ্যটি সাধারণত বিতরণ করা হয় তবে কিউকিউ-নমনীয় প্লটের বিন্দুগুলি একটি সরল তির্যক রেখায় থাকে। আপনি কমান্ডটি দিয়ে QQ প্লটে এই লাইনটি যুক্ত করতে পারেন qqline(x)যেখানে xমানগুলির ভেক্টর is
সাধারণ এবং অ-সাধারণ বিতরণের উদাহরণ:
স্বাভাবিক বন্টন
set.seed(42)
x <- rnorm(100)
লাইনের সাথে কিউকিউ-র সাধারণ প্লট:
qqnorm(x); qqline(x)

সরলরেখা থেকে বিচ্যুতিগুলি ন্যূনতম। এটি স্বাভাবিক বন্টন নির্দেশ করে।
হিস্টোগ্রাম:
hist(x)

নরমাল (গামা) বিতরণ distribution
y <- rgamma(100, 1)
কিউকিউ-র সাধারণ প্লট:
qqnorm(y); qqline(y)

পয়েন্টগুলি স্পষ্টভাবে সরলরেখার চেয়ে অন্য আকারকে অনুসরণ করে।
হিস্টগ্রাম অ-স্বাভাবিকতা নিশ্চিত করে। বিতরণটি বেল-আকারের নয় তবে ইতিবাচকভাবে স্কিউড হয় (যেমন, বেশিরভাগ ডেটা পয়েন্টগুলি নীচের অর্ধেক থাকে)। ইতিহাসের সাধারণ বিতরণ বিতরণের কেন্দ্রে সর্বোচ্চ ফ্রিকোয়েন্সি দেখায়।
hist(y)

qqPlotফাংশনটি দেখুন car।
আর-এ স্বাভাবিকতা অনুমানের বৈধতা যাচাইয়ের জন্য কয়েকটি সরঞ্জাম
library(moments)
library(nortest)
library(e1071)
set.seed(777)
x <- rnorm(250,10,1)
# skewness and kurtosis, they should be around (0,3)
skewness(x)
kurtosis(x)
# Shapiro-Wilks test
shapiro.test(x)
# Kolmogorov-Smirnov test
ks.test(x,"pnorm",mean(x),sqrt(var(x)))
# Anderson-Darling test
ad.test(x)
# qq-plot: you should observe a good fit of the straight line
qqnorm(x)
qqline(x)
# p-plot: you should observe a good fit of the straight line
probplot(x, qdist=qnorm)
# fitted normal density
f.den <- function(t) dnorm(t,mean(x),sqrt(var(x)))
curve(f.den,xlim=c(6,14))
hist(x,prob=T,add=T)
আপনার অন্তর্দৃষ্টি কিছু পরীক্ষার ফলাফলের সাথে মেলে কিনা তা দৃষ্টিভঙ্গি যাচাই করা ভাল ধারণা, আপনি প্রতিবার এটি সহজ হওয়ার আশা করতে পারবেন না । লোকেরা যদি হিগস বোসন সনাক্ত করতে চেষ্টা করে তবে তারা যদি তাদের দৃষ্টিভঙ্গিগুলি মূল্যায়ণ করতে পারে তবে কেবল তাদের ফলাফলগুলিতে বিশ্বাস করবে, তাদের খুব তীক্ষ্ণ চোখের প্রয়োজন হবে।
বিশেষত বড় ডেটাসেটের (এবং এইভাবে, সাধারণত ক্রমবর্ধমান শক্তির সাথে), পরিসংখ্যানগুলি ন্যূনতম চোখের সাথে খুব সহজেই স্পষ্ট হয়ে ওঠার পরেও স্বল্পতম পার্থক্য তুলতে ঝোঁক।
এটি বলা হচ্ছে: স্বাভাবিকতার জন্য, আপনার কিউকিউ-প্লটটি একটি সরল রেখা প্রদর্শন করবে: আমি বলব এটি তা নয়। লেজগুলিতে স্পষ্টভাবে বাঁকানো রয়েছে, এমনকি মাঝের কাছে কিছুটা হৈচৈ রয়েছে। দৃশ্যত, আমি এখনও বলতে রাজি হতে পারি (স্বাভাবিকতা পরীক্ষা করার লক্ষ্যের উপর নির্ভর করে) যদিও এই তথ্যটি "যুক্তিসঙ্গতভাবে" স্বাভাবিক।
তবে নোট করুন: বেশিরভাগ উদ্দেশ্যে যেখানে আপনি স্বাভাবিকতা পরীক্ষা করতে চান সেখানে আপনার পর্যবেক্ষণের স্বাভাবিকতার পরিবর্তে কেবলমাত্র উপায়ের স্বাভাবিকতা প্রয়োজন, তাই কেন্দ্রীয় সীমাবদ্ধতা উপপাদ্য আপনাকে উদ্ধার করার জন্য যথেষ্ট হতে পারে। এছাড়াও: যদিও স্বাভাবিকতা প্রায়শই একটি অনুমান যে আপনাকে "সরকারীভাবে" চেক করা দরকার, অনেক পরীক্ষা এই ধারণা অনুমান না করায় বেশ সংবেদনশীল বলে প্রমাণিত হয়েছে।
আমি 'আর' গ্রন্থাগার 'গাড়ি'র বাইরে সংস্করণটি পছন্দ করি কারণ এটি কেবল কেন্দ্রীয় প্রবণতাই নয়, আত্মবিশ্বাসের অন্তর অন্তর্ভুক্ত করে। এটি উপাত্তের আচরণ অনুমানমূলক বিতরণের সাথে সামঞ্জস্যপূর্ণ কিনা তা নিশ্চিত করতে ভিজ্যুয়াল গাইডেন্স দেয়।
library(car)
qqPlot(lm(prestige ~ income + education + type, data=Duncan),
envelope=.99)
কিছু লিঙ্ক: