খুব সামান্য নমুনার আকারের (যেমন, এন = 6) দিয়ে স্বাভাবিকতার জন্য পরীক্ষা করা কি অর্থবহ?


26

আমার একটি নমুনা আকার 6.. এরকম ক্ষেত্রে কোলমোগোরভ-স্মারনভ পরীক্ষাটি ব্যবহার করে স্বাভাবিকতার জন্য পরীক্ষা করা কি বোধগম্য? আমি এসপিএস ব্যবহার করেছি। আমার একটি খুব ছোট নমুনা আকার রয়েছে কারণ এটি প্রতিটি পেতে সময় লাগে। যদি এটি বোধগম্য হয় না, তবে কতটি নমুনা সর্বনিম্ন সংখ্যা যা পরীক্ষার জন্য বোঝায়?

দ্রষ্টব্য: উত্স কোড সম্পর্কিত কিছু পরীক্ষা করেছি। সফ্টওয়্যার (সংস্করণ এ) এর সংস্করণে কোডিংয়ের জন্য এই নমুনাটি ব্যয় করা হয়েছে আসলে, আমার কাছে আরও একটি নমুনা আকার রয়েছে যা সফ্টওয়্যারটির অন্য সংস্করণে কোডিং করার জন্য সময় ব্যয় করে (সংস্করণ বি)

কোড সংস্করণ A এ ব্যয় করা সময়টি কোড সংস্করণ বিতে ব্যয় করা সময়ের চেয়ে আলাদা কিনা (এটি আমার এইচ 1) যাচাই করার জন্য আমি এক-নমুনা টি-পরীক্ষা ব্যবহার করে হাইপোথিসিস টেস্টিং করতে চাই । এক-নমুনা টি-পরীক্ষার পূর্বশর্ত হ'ল পরীক্ষার জন্য ডেটাগুলি সাধারণত বিতরণ করতে হয়। এজন্য আমার স্বাভাবিকতার জন্য পরীক্ষা করা দরকার।


6
আমি, একজনের জন্য, এমন একটি প্রসঙ্গে কল্পনা করতে অসুবিধা বোধ করছি যাতে এন = 6 এবং স্বাভাবিকতা পরীক্ষা করার মতো একটি অনুমান হবে। আমি আশঙ্কা করি যে এটি অনভিজ্ঞ ব্যবহারকারী একাধিক হাইপোথিসিস টেস্টিংয়ের একটি ঘটনা (বাকী অংশগুলির স্বাভাবিকতার জন্য একটি রিগ্রেশন পরিচালনা করুন) এবং আমরা লক্ষণগুলি সম্বোধন করছি তবে কক্ষের কঙ্কালের উপেক্ষা করছি, তাই কথা বলার জন্য।
ব্যবহারকারী 60

3
@ ব্যবহারকারী প্রশ্নকর্তা সম্পর্কে অনুমান করা অনুচিত। আসুন প্রশ্নটি সম্বোধন করা যাক, আমরা কি? সুতরাং, ধরুন আপনি একটি ব্যয়বহুল সিদ্ধান্ত নিতে ব্যবহৃত হবে এমন কোনও মানের জন্য একটি উচ্চ ভবিষ্যদ্বাণী সীমা গণনা করার পরিকল্পনা করছেন। পিএল এর মান স্বাভাবিকতা অনুমানের জন্য সংবেদনশীল হবে। আপনি নিশ্চিত যে ডেটা তৈরির প্রক্রিয়াটি স্বাভাবিক নয়, তবে ডেটা উত্পন্ন করার জন্য ব্যয়বহুল এবং সময় সাপেক্ষ। পূর্ববর্তী পরীক্ষাগুলি পরামর্শ দেয় যে স্বাভাবিকতা প্রত্যাখ্যান করতে যথেষ্ট শক্তিশালী হবে। (আমি শুধু মার্কিন যুক্তরাষ্ট্রে ভূ পর্যবেক্ষণ প্রোগ্রামের জন্য একটি প্রমিত কাঠামো বর্ণিত আছে।)এন=6
whuber

3
ব্যবহারকারীর 3০৩ (আপনার প্রথম মন্তব্যটি আবার): আমি উল্লেখ করতে চাই যে @ জরিস কোনও উত্তর সরবরাহ করেননি, বা তাঁর মন্তব্যটি কোনও ন্যায়সঙ্গততার সাথে নেই। যদি জোরালো "না" এই প্রশ্নের যথাযথ সাধারণ উত্তর হয় তবে আসুন এটি সমর্থনযোগ্য যুক্তি সহ এটি লিখিতভাবে দেখি, সুতরাং এটি সম্প্রদায় দ্বারা মূল্যায়ন করতে পারে।
whuber

2
@ শুভ: আমি জোরালো "না" এর পক্ষে যুক্তি যুক্ত করেছি।
জোরিস মাইস

1
@ জোরিস আপনাকে ধন্যবাদ! এটি সহায়ক ও আলোকিত।
whuber

উত্তর:


38

হ্যাঁ।

সমস্ত অনুমান পরীক্ষার দুটি প্রধান বৈশিষ্ট্য রয়েছে : তাদের আকার (বা "তাত্পর্যপূর্ণ স্তর"), এমন একটি সংখ্যা যা প্রত্যক্ষ আত্মবিশ্বাসের সাথে সম্পর্কিত এবং প্রত্যাশিত মিথ্যা ইতিবাচক হার এবং তাদের শক্তি, যা মিথ্যা নেতিবাচক হওয়ার সম্ভাবনা প্রকাশ করে। যখন নমুনার আকারগুলি ছোট হয় এবং আপনি একটি ছোট আকারের (উচ্চ আত্মবিশ্বাসের) জন্য জেদ চালিয়ে যান, শক্তিটি আরও খারাপ হয়। এর অর্থ হ'ল ছোট-নমুনা পরীক্ষাগুলি সাধারণত ছোট বা মাঝারি পার্থক্য সনাক্ত করতে পারে না। তবে তারা এখনও অর্থবহ

কেএস পরীক্ষাটি নির্ধারণ করে যে নমুনাটি কোনও সাধারণ বিতরণ থেকে এসেছে কিনা। এই পরীক্ষায় ব্যর্থ হওয়ার জন্য ছয়টি মানের একটি নমুনাকে প্রকৃতপক্ষে অত্যন্ত অস্বাভাবিক দেখতে হবে। তবে যদি এটি হয় তবে আপনি নালকে এই প্রত্যাখ্যানটি ঠিক তেমনি উচ্চতর নমুনা আকারের সাথে ব্যাখ্যা করতে পারবেন interpret অন্যদিকে, যদি পরীক্ষাটি নাল অনুমানটিকে প্রত্যাখ্যান করতে ব্যর্থ হয়, যা উচ্চ মিথ্যা নেতিবাচক হারের কারণে আপনাকে সামান্যই বলে দেয়। বিশেষত, অন্তর্নিহিত বিতরণটি স্বাভাবিক হিসাবে কাজ করা তুলনামূলকভাবে ঝুঁকিপূর্ণ হবে।

এখানে আরও একটি বিষয় লক্ষ্যণীয়: কিছু সফ্টওয়্যার পরীক্ষার পরিসংখ্যান থেকে পি-মানগুলি গণনা করতে অনুমান ব্যবহার করে। প্রায়শই এই অনুমানগুলি বড় নমুনা আকারগুলির জন্য ভাল কাজ করে তবে খুব ছোট নমুনা আকারের জন্য খারাপ আচরণ করে। যখন এটি হয়, আপনি বিশ্বাস করতে পারবেন না যে পি-মানটি সঠিকভাবে গণনা করা হয়েছে, যার অর্থ আপনি পছন্দ করতে পারবেন না যে কাঙ্ক্ষিত পরীক্ষার আকার অর্জিত হয়েছে। বিশদ জন্য, আপনার সফ্টওয়্যার ডকুমেন্টেশন পরামর্শ।

কিছু পরামর্শ: এই উদ্দেশ্যে বিশেষত নির্মিত অন্যান্য পরীক্ষার তুলনায় কেএস পরীক্ষা স্বাভাবিকতা পরীক্ষা করার জন্য যথেষ্ট কম শক্তিশালী। এর মধ্যে সম্ভবত সম্ভবত শাপিরো-উইলক পরীক্ষা, তবে অন্যরা সাধারণত ব্যবহৃত হয় এবং প্রায় শক্তিশালী হলেন শাপিরো-ফ্রান্সিয়া এবং অ্যান্ডারসন-ডার্লিং

এই প্লটটি কোলমোগোরভ-স্মারনভ পরীক্ষার পরিসংখ্যানের ছয়টি সাধারণ-বিতরণকৃত পরিবর্তনের 10,000 টি নমুনায় বিতরণ করে:

কেএস পরিসংখ্যানের হিস্টোগ্রাম

100,000 অতিরিক্ত নমুনার উপর ভিত্তি করে, উপরের 95 তম পার্সেন্টাইল (যা আকার- পরীক্ষার জন্য এই পরিসংখ্যানটির জন্য সমালোচনামূলক মানের অনুমান করে ) হয় 0.520। এই পরীক্ষায় উত্তীর্ণ একটি নমুনার উদাহরণ হ'ল ডেটাसेटα=5%

0.000, 0.001, 0.002, 1.000, 1.001, 1000000

পরীক্ষার পরিসংখ্যান 0.5 (যা সমালোচনামূলক মানের চেয়ে কম)। এই জাতীয় নমুনা স্বাভাবিকতার অন্যান্য পরীক্ষা ব্যবহার করে প্রত্যাখ্যান করা হবে।


10
আমি মনে করি যে কোনও বিতরণ যা একটি সিগ দেয়। এন = 6 এর ফলাফল এতটাই স্বাভাবিক হবে যে এটি উড়ন্ত রঙের সাথে আইওটিটি পাস করবে - এটি আন্তঃকোষীয় ট্রমা পরীক্ষা। এটি আপনাকে চোখের মাঝে মারবে।
পিটার ফ্লুম - মনিকা পুনরায়

2
এন=6এন=6

শুধু মজাদার জন্য, আমি সেট.সীড চেষ্টা করেছি (3833782) x <- রানিফ (6) কেএস.টেস্ট (এক্স, পিএনরম) এটি পি = .04 এ উল্লেখযোগ্য ছিল। সুতরাং এটি ঘটতে পারে
পিটার ফ্লুম - মনিকা

4
@ পিটার ভাল! স্বাভাবিকতার জন্য একটি কেএস পরীক্ষা একটি অভিন্ন নমুনা প্রত্যাখ্যান করেছে। এটাই প্রত্যাশা
whuber

3
set.seed(140);x=rnorm(6);ks.test(x,pnorm)উত্পাদন p-value = 0.0003255। অবশ্যই এটি আবিষ্কার করার আগে আমাকে 140 টি বীজ দিয়ে চেষ্টা করে দেখতে হয়েছিল ...
স্পেসডম্যান

20

@ শুভর মন্তব্যগুলিতে যেমন জিজ্ঞাসা করেছেন, আমার শ্রেণিবদ্ধ কোনটির জন্য একটি বৈধতা। সম্পাদনা: শাপিরো পরীক্ষার সাথে, যেমন এক-নমুনা কেএস পরীক্ষাটি আসলে ভুলভাবে ব্যবহৃত হয়। হুইপার সঠিক: কোলমোগোরভ-স্মারনভ পরীক্ষার সঠিক ব্যবহারের জন্য, আপনাকে বিতরণযোগ্য পরামিতিগুলি নির্দিষ্ট করতে হবে এবং সেগুলি ডেটা থেকে বের করতে হবে না। একি-নমুনা কেএস-পরীক্ষার জন্য এসপিএসএসের মতো পরিসংখ্যান প্যাকেজগুলিতে এটি করা হয়।

আপনি বিতরণ সম্পর্কে কিছু বলার চেষ্টা করেছেন এবং আপনি টি-টেস্ট প্রয়োগ করতে পারেন কিনা তা পরীক্ষা করতে চান। সুতরাং বিশ্লেষণের অন্তর্নিহিত অনুমানগুলি অবৈধ করার জন্য ডেটা স্বাভাবিকতা থেকে উল্লেখযোগ্য পরিমাণে প্রস্থান করে না তা নিশ্চিত করার জন্য এই পরীক্ষাটি করা হয় । সুতরাং, আপনি আই-ত্রুটি টাইপ করতে আগ্রহী নন, তবে দ্বিতীয় ধরণের ত্রুটিতে আগ্রহী।

গ্রহণযোগ্য পাওয়ারের জন্য ন্যূনতম এন গণনা করতে সক্ষম হতে এখন একটিকে "উল্লেখযোগ্যভাবে আলাদা" সংজ্ঞা দিতে হবে (বলুন 0.8)) বিতরণ সহ, এটি সংজ্ঞায়িত করা সহজ নয় not সুতরাং, আমি প্রশ্নের উত্তর দিলাম না, যেহেতু আমি যে থাম্বটি ব্যবহার করি সেগুলি বাদ দিয়ে আমি কোনও বুদ্ধিমান উত্তর দিতে পারি না: এন> 15 এবং এন <50. কিসের ভিত্তিতে? মূলত অনুভূতি অনুভব করছি, তাই আমি অভিজ্ঞতা বাদে এই পছন্দটি ডিফেন্ড করতে পারি না।

তবে আমি জানি যে কেবলমাত্র 6 টি মান সহ আপনার টাইপ II-ত্রুটিটি প্রায় 1 হিসাবে আবদ্ধ, আপনার পাওয়ার 0 এর কাছাকাছি করে 6 টি পর্যবেক্ষণের সাথে শাপিরো পরীক্ষাটি কোনও সাধারণ, পোয়েসন, ইউনিফর্ম বা এমনকি তাত্পর্যপূর্ণ বিতরণের মধ্যে পার্থক্য করতে পারে না। একটি ধরণের II-ত্রুটি প্রায় 1 হওয়ার সাথে সাথে আপনার পরীক্ষার ফলাফল অর্থহীন।

শাপিরো-পরীক্ষার মাধ্যমে স্বাভাবিকতা পরীক্ষা করার চিত্রণ:

shapiro.test(rnorm(6)) # test a the normal distribution
shapiro.test(rpois(6,4)) # test a poisson distribution
shapiro.test(runif(6,1,10)) # test a uniform distribution
shapiro.test(rexp(6,2)) # test a exponential distribution
shapiro.test(rlnorm(6)) # test a log-normal distribution

কেবলমাত্র যেখানে মানগুলির প্রায় অর্ধেকটি 0.05 এর চেয়ে ছোট, এটি সর্বশেষতম। যা সবচেয়ে চরম ঘটনাও।


আপনি যদি শপিরো পরীক্ষার মাধ্যমে ন্যূনতম এনটি আপনাকে পছন্দ করে এমন শক্তি দেয় তা সন্ধান করতে চান তবে কেউ এই জাতীয় সিমুলেশন করতে পারেন:

results <- sapply(5:50,function(i){
  p.value <- replicate(100,{
    y <- rexp(i,2)
    shapiro.test(y)$p.value
  })
  pow <- sum(p.value < 0.05)/100
  c(i,pow)
})

যা আপনাকে এ জাতীয় শক্তি বিশ্লেষণ করে:

এখানে চিত্র বর্ণনা লিখুন

যার থেকে আমি এই সিদ্ধান্তে পৌঁছেছি যে 80% ক্ষেত্রে একটি সাধারণ বিতরণ থেকে একটি সূচককে আলাদা করতে আপনার মোটামুটি সর্বনিম্ন 20 টি মান দরকার values

কোড প্লট:

plot(lowess(results[2,]~results[1,],f=1/6),type="l",col="red",
    main="Power simulation for exponential distribution",
    xlab="n",
    ylab="power"
)

2
@ হুইবার: এর মাথায় অনুমানের পরীক্ষার যুক্তি সম্পর্কিত: কোন ক্ষেত্রে আপনি বিকল্প অনুমানের বিষয়ে আগ্রহী? এই পরীক্ষাগুলির সমস্ত অ্যাপ্লিকেশনগুলিতে আমি দেখেছি, লোকেরা নালীর নিশ্চিতকরণে আগ্রহী: আমার ডেটা একটি সাধারণ বিতরণ থেকে উল্লেখযোগ্যভাবে আলাদা হয় না। যে কারণে আমি II-ত্রুটি টাইপের উপর জোর দিয়েছি।
জোরিস মেয়েস

4
এন5

4
এন=8এন

3
@ শুভ: আমাদের আলাদা হতে সম্মত হতে হবে। আমি ইপিএ (এবং অবশ্যই এফডিএর নয়) এর সম্পূর্ণ ভক্ত নই। আমি এটির ব্যবহারিকতায় বিশ্বাস করার জন্য এটি প্রায়শই ঘৃণা করেছি। চান্স একটি অদ্ভুত জিনিস, এবং কেবল 6 টি ক্ষেত্রে অত্যন্ত অনাকাঙ্ক্ষিত। আমি বিশ্বাস করি না যে আপনি পিডিএফের মতো জটিল ফাংশন সম্পর্কে কেবলমাত্র 6 টি পর্যবেক্ষণের ভিত্তিতে কিছু বলতে পারবেন। YMMV
Joris Meys

5
@ ইমলসো টি-টেস্টটি অনেকটা অ-স্বাভাবিকতা সহ্য করতে পারে যদি এটি মোটামুটি প্রতিসম হয় তবে এটি অত্যধিক অসামঞ্জস্যতা সহ্য করতে পারে না। (প্রকৃতপক্ষে, কেবলমাত্র এই কারণে কেএস পরীক্ষার তুলনায় স্বাভাবিকের জন্য একটি স্কিউনেস পরীক্ষা আসলে ওপিতে একটি ভাল বিকল্প হতে পারে)) এটি ফিট টেস্ট এবং অন্যান্য হাইপোথিসিস পরীক্ষাগুলির ধার্মিকতার মধ্যে একটি বৃহত্তম পার্থক্য নির্দেশ করে: একটি বিশাল পরিমাণ রয়েছে সম্ভাব্য বিকল্পের স্থান এবং জিওএফ পরীক্ষাগুলি তাদের কিছুগুলির বিরুদ্ধে ভাল তবে অন্যদের বিরুদ্ধে নয়। আপনি সমস্ত বিকল্পের বিরুদ্ধে তাদের ভাল কাজ করতে পারবেন না।
whuber

-2

এখানে উত্থাপিত প্রশ্নটির কিছু ভুল ধারণা রয়েছে যে 6..র নমুনার আকারের জন্য কেন স্বাভাবিকতা পরীক্ষা করা দরকার Here এখানে মূল উদ্দেশ্যটি হচ্ছে "কোড সংস্করণ এতে ব্যয় করা সময়টি কোড সংস্করণ বিতে ব্যয় করা সময়ের চেয়ে আলাদা কিনা তা পরীক্ষা করা ( এটি আমার এইচ 1) ”। যখন "পৃথক" শব্দটি ব্যবহৃত হয়, তখন এটি কি একটি পুচ্ছ পরীক্ষা হয় ?. তবে নরমালটির পরীক্ষা দ্বিতীয় ধাপ। প্রথম পদক্ষেপটি একটি নির্দিষ্ট নমুনা আকারের জন্য পরীক্ষার পূর্বনির্ধারিত (1-β) পাওয়ারের পর্যাপ্ততা পরীক্ষা করা হয় যখন শক্তি খুব খারাপ হয় তবে স্বাভাবিকতা শর্ত পরীক্ষা করার জন্য কী ব্যবহার করা যায় ?. সাধারণ অবস্থা শর্ত যাচাই করা আমাদের প্যারামেট্রিক বা নন-প্যারামেট্রিক পরীক্ষা করবেন কিনা তা সিদ্ধান্ত নিতে সহায়তা করবে। যদি আপনার নমুনার আকারের পর্যাপ্ত শক্তি না থাকে তবে সাধারণের পরীক্ষা করার বিষয়ে কেন ভাবা উচিত?।


(-1) এটি খুব অস্পষ্ট। প্রশ্নের উত্তর দেওয়ার জন্য দয়া করে এই পৃষ্ঠাটি পড়ুন: stats.stackexchange.com/help/how-to-answer
মনিকা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.