স্বাভাবিকতা পরীক্ষা করা কি 'প্রয়োজনীয়ভাবে অকেজো'?


297

একজন প্রাক্তন সহকর্মী একবার নীচে আমার সাথে তর্ক করেছিলেন:

আমরা সাধারণত প্রক্রিয়াগুলির ফলাফলগুলিতে স্বাভাবিকতা পরীক্ষার প্রয়োগ করি যা শূন্যের অধীনে, কেবলমাত্র অ্যাসেম্পোটোটিকাল বা প্রায় স্বাভাবিক (এ্যাসেম্পোটোটিকভাবে) কিছু অংশের উপর নির্ভর করে যা আমরা বড় করতে পারি না) র্যান্ডম ভেরিয়েবল তৈরি করে ; সস্তা মেমোরি, বড় ডেটা এবং দ্রুত প্রসেসরের যুগে স্বাভাবিকতা পরীক্ষাগুলি সর্বদা বড় (যদিও অত্যধিকভাবে বড় নয়) নমুনাগুলির জন্য সাধারণ বিতরণের নালকে সর্বদা প্রত্যাখ্যান করা উচিত । এবং সুতরাং, বিপরীতভাবে, স্বাভাবিকতা পরীক্ষাগুলি কেবলমাত্র ছোট নমুনাগুলির জন্যই ব্যবহার করা উচিত, যখন তাদের মধ্যে সম্ভবত টাইপ আই হারের চেয়ে কম শক্তি এবং কম নিয়ন্ত্রণ থাকে।

এটি কি বৈধ যুক্তি? এটি কি সুপরিচিত যুক্তি? স্বাভাবিকতার চেয়ে 'ফাজিয়ার' নাল অনুমানের জন্য কি সুপরিচিত পরীক্ষা রয়েছে?


23
রেফারেন্সের জন্য: আমি মনে করি না এটি সম্প্রদায়ের উইকি হওয়া দরকার।
শেন

2
আমি নিশ্চিত ছিলাম না যে এখানে একটি 'সঠিক উত্তর' ছিল ...
shabbychef

5
একটি নির্দিষ্ট অর্থে, এটি সীমাবদ্ধ সংখ্যার পরামিতির সমস্ত পরীক্ষার ক্ষেত্রে সত্য। সঙ্গে সংশোধন (পরামিতি সংখ্যা যার উপর পরীক্ষা caried হয়) এবং কিছু সময়ে নাল সীমা ছাড়া growthing, দুই দলের মধ্যে কোনো পার্থক্য (তা সে যত ছোট) সবসময় ভঙ্গ করবে। আসলে, এটি বেইসিয়ান পরীক্ষার পক্ষে একটি যুক্তি। এনkn
ব্যবহারকারী 60

2
আমার জন্য, এটি কোনও বৈধ যুক্তি নয়। যাইহোক, কোনও উত্তর দেওয়ার আগে আপনার জিনিসগুলিকে কিছুটা আনুষ্ঠানিক করা দরকার। আপনি ভুল হতে পারেন এবং আপনি নাও হতে পারেন তবে এখন যা আপনার কাছে রয়েছে তা অন্তর্দৃষ্টি ছাড়া আর কিছুই নয়: আমার কাছে এই বাক্যটি "সস্তা স্মৃতি, বড় ডেটা এবং দ্রুত প্রসেসরের যুগে, স্বাভাবিকতা পরীক্ষাগুলি সর্বদা স্বাভাবিকের নালকে প্রত্যাখ্যান করা উচিত" স্পষ্টকরণের প্রয়োজন :) আমি মনে করি আপনি আরও আনুষ্ঠানিক নির্ভুলতা দেওয়ার চেষ্টা করলে উত্তরটি সহজ হবে।
রবিন গিরার্ড

8
"হাইপোথিসিস পরীক্ষার জন্য বড় ডেটাসেটগুলি অনুপযুক্ত" এর থ্রেডটি এই প্রশ্নের সাধারণীকরণ নিয়ে আলোচনা করে। ( stats.stackexchange.com/questions/2516/… )
হোয়াট

উত্তর:


229

এটা কোন যুক্তি নয়। এটি একটি (কিছুটা দৃ strongly়ভাবে বলা হয়েছে) সত্য যে আনুষ্ঠানিক স্বাভাবিকতা পরীক্ষাগুলি সর্বদা আমরা আজ যে বিশাল আকারের নমুনা আকারের সাথে কাজ করি তা প্রত্যাখ্যান করে। এমনকি এটি প্রমাণ করাও সহজ যে এন যখন বড় হয়, এমনকি সিদ্ধ স্বাভাবিক থেকে ক্ষুদ্রতম বিচ্যুতিও একটি উল্লেখযোগ্য ফলাফলের দিকে নিয়ে যায়। এবং প্রতিটি ডেটাসেটে কিছুটা এলোমেলোভাবে থাকার কারণে কোনও একক ডেটাসেটের পুরোপুরি সাধারণভাবে বিতরণ করা নমুনা হবে না। তবে প্রয়োগিত পরিসংখ্যানগুলিতে প্রশ্নটি ডেটা / অবশিষ্টাংশগুলি ... পুরোপুরি স্বাভাবিক, তবে অনুমানগুলি ধরে রাখার পক্ষে যথেষ্ট স্বাভাবিক কিনা তা নয়।

আমাকে শাপিরো-উইলক পরীক্ষা দিয়ে চিত্রিত করুন । নীচের কোডটি এমন একটি বিতরণের সেট তৈরি করে যা স্বাভাবিকতার দিকে যায় তবে সম্পূর্ণ স্বাভাবিক নয়। এরপরে, আমরা shapiro.testপ্রায় সাধারণ-বিতরণ থেকে প্রাপ্ত নমুনাটি স্বাভাবিকতা থেকে বিচ্যুত হয় কিনা তা দিয়ে আমরা পরীক্ষা করি । আর তে:

x <- replicate(100, { # generates 100 different tests on each distribution
                     c(shapiro.test(rnorm(10)+c(1,0,2,0,1))$p.value,   #$
                       shapiro.test(rnorm(100)+c(1,0,2,0,1))$p.value,  #$
                       shapiro.test(rnorm(1000)+c(1,0,2,0,1))$p.value, #$
                       shapiro.test(rnorm(5000)+c(1,0,2,0,1))$p.value) #$
                    } # rnorm gives a random draw from the normal distribution
               )
rownames(x) <- c("n10","n100","n1000","n5000")

rowMeans(x<0.05) # the proportion of significant deviations
  n10  n100 n1000 n5000 
 0.04  0.04  0.20  0.87 

সর্বশেষ লাইনটি প্রতিটি নমুনা আকারের সিমুলেশনের কোন ভগ্নাংশটি স্বাভাবিকতা থেকে উল্লেখযোগ্যভাবে বিচ্যুত হয় তা পরীক্ষা করে। সুতরাং 87% ক্ষেত্রে, 5000 পর্যবেক্ষণের একটি নমুনা শাপিরো-উইলাক্স অনুসারে স্বাভাবিকতা থেকে উল্লেখযোগ্যভাবে বিচ্যুত হয়। তবুও, আপনি যদি কিউকিউ প্লট দেখতে পান তবে আপনি কখনও কখনও স্বাভাবিকতা থেকে বিচ্যুতি নিয়ে সিদ্ধান্ত নেবেন না। নীচে আপনি উদাহরণ হিসাবে দেখতে পাবেন এলোমেলো নমুনার এক সেট জন্য কিউ-প্লটগুলি

বিকল্প পাঠ

পি-মান সহ

  n10  n100 n1000 n5000 
0.760 0.681 0.164 0.007 

40
পার্শ্ব নোটে, কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি অনেক ক্ষেত্রে এন বড় হয়ে গেলে আনুষ্ঠানিক স্বাভাবিকতা পরীক্ষা করে তোলে।
জোরিস মেজ

31
হ্যাঁ, আসল প্রশ্নটি এই নয় যে ডেটাগুলি আসলে সাধারণত বিতরণ করা হয় তবে তারা বিশ্লেষণের ব্যবহারিক উদ্দেশ্যটির জন্য স্বাভাবিকতার অন্তর্নিহিত অনুমিতিটি যুক্তিসঙ্গত হওয়ার পক্ষে যথেষ্ট স্বাভাবিক, এবং আমি ভাবতাম যে সিএলটি ভিত্তিক যুক্তিটি সাধারণত [sic] তার জন্য যথেষ্ট
ডিকরান মার্শুপিয়াল

53
এই উত্তরটি প্রশ্নটির দিকে নজর দেয় না বলে প্রতীয়মান হয় : এটি কেবল প্রমাণ করে যে এসডাব্লু পরীক্ষাটি তার নামমাত্র আত্মবিশ্বাসের স্তর অর্জন করে না, এবং সুতরাং এটি সেই পরীক্ষার (বা অন্তত এটি Rবাস্তবায়নের ক্ষেত্রে) ত্রুটি চিহ্নিত করে। তবে এগুলি সবই - সাধারণভাবে এটির স্বাভাবিকতা পরীক্ষা করার উপযোগিতার সুযোগটি নিয়ে কোনও প্রভাব নেই। প্রাথমিক নমুনা যে স্বাভাবিকতা পরীক্ষা সর্বদা বড় নমুনা মাপে প্রত্যাখ্যান করা সহজভাবে ভুল।
whuber

19
@ শুভ এই উত্তরটি প্রশ্নের উত্তর দেয়। প্রশ্নের পুরো বিন্দুটি "নিকটে-স্বাভাবিকতা" এর "কাছাকাছি"। SW পরীক্ষা করে যে নমুনাটি একটি সাধারণ বিতরণ থেকে আঁকার সম্ভাবনা কী। যেহেতু আমি নির্মিত বিতরণগুলি ইচ্ছাকৃতভাবে স্বাভাবিক নয়, আপনি এসডাব্লু টেস্টটি যে প্রতিশ্রুতি দিয়েছিলেন তা করবে বলে আপনি আশা করবেন: নাল বাতিল করুন। পুরো বিষয়টি হ'ল বড় আকারের নমুনাগুলিতে এই প্রত্যাখ্যান অর্থহীন, কারণ স্বাভাবিকতা থেকে বিচ্যুতির ফলে সেখানে শক্তি হ্রাস হয় না। সুতরাং পরীক্ষাটি সঠিক, তবে অর্থহীন, যেমন QQplots দ্বারা দেখানো হয়েছে
Joris Meys

11
আপনি যা লিখেছিলেন তার উপরে আমি নির্ভর করেছিলাম এবং "প্রায়-সাধারণ" বিতরণ দ্বারা আপনি কী বোঝাতে চেয়েছিলেন তা ভুল বুঝেছিলাম। আমি এখন দেখতে পাচ্ছি - তবে কেবল কোডটি পড়ে এবং সাবধানতার সাথে এটি পরীক্ষা করে - আপনি তিনটি মানক সাধারণ বিতরণ থেকে এবং সাথে সিমুলেট করছেন এবং ফলাফলগুলিকে অনুপাতের সাথে সংমিশ্রণ করছেন । আপনি কি আশা করেন না যে নরমালটির একটি ভাল পরীক্ষা এই ক্ষেত্রে শূন্যতা প্রত্যাখ্যান করবে? আপনি কার্যকরভাবে যা দেখিয়েছেন তা হল যে কিউকিউ প্লটগুলি এই জাতীয় মিশ্রণগুলি সনাক্ত করতে খুব ভাল নয়, এগুলিই! 1 , 2 2 : 2 : 10, 1,22:2:1
whuber

172

স্বাভাবিকতা পরীক্ষাটি 'প্রয়োজনীয়ভাবে অকেজো' কিনা তা নিয়ে চিন্তা করার সময়, প্রথমে এটির জন্য কী কার্যকর হবে বলে মনে করা উচিত। অনেক লোক (ভাল ... কমপক্ষে, অনেক বিজ্ঞানী) প্রশ্নটির স্বাভাবিকতা পরীক্ষার উত্তরগুলি ভুল বুঝে।

প্রশ্নের স্বাভাবিকতা পরীক্ষাগুলির উত্তর: গাউসীয় আদর্শ থেকে কোনও বিচ্যুত হওয়ার দৃinc় প্রমাণ রয়েছে কি? মাঝারিভাবে বড় রিয়েল ডেটা সেট সহ উত্তরটি প্রায় সর্বদা হ্যাঁ।

বিজ্ঞানীরা যে প্রশ্নটি প্রায়শই স্বাভাবিকতা পরীক্ষার উত্তরের প্রত্যাশা করেন: ডেটাগুলি কি গাউসীয় আদর্শ থেকে এমন কোনও পরীক্ষার ব্যবহারকে "নিষেধ" করতে যথেষ্ট পরিমাণে বিচ্যুত হয় যা কোনও গাউসীয় বন্টনকে ধরে নেয়? বিজ্ঞানীরা প্রায়শই চান যে স্বাভাবিকতা পরীক্ষাটি রেফারি হয়ে যায় যে সিদ্ধান্ত নেয় কখন প্রচলিত (আনোভা ইত্যাদি) পরীক্ষা ছেড়ে দেওয়া উচিত এবং পরিবর্তে পরিবর্তিত ডেটা বিশ্লেষণ করতে বা র‌্যাঙ্ক-ভিত্তিক ননপ্যারামেট্রিক পরীক্ষা বা পুনরায় মডেলিং বা বুটস্ট্র্যাপ পদ্ধতির ব্যবহার করা উচিত। এই উদ্দেশ্যে, স্বাভাবিকতা পরীক্ষা খুব দরকারী নয়।


16
একটি ভাল এবং তথ্যমূলক উত্তরের জন্য +1। আমি একটি সাধারণ ভুল বোঝাবুঝির (যা আমি ঘটনাক্রমে নিজেই অভিজ্ঞতা অর্জন করে যাচ্ছি: stats.stackexchange.com/questions/7022/… ) এর জন্য ভাল ব্যাখ্যাটি দেখতে সুবিধাজনক বলে মনে করি । আমি যা মিস করছি তা হ'ল এই সাধারণ ভুল বোঝাবুঝির বিকল্প সমাধান। আমি বলতে চাইছি, যদি স্বাভাবিকতা পরীক্ষাগুলি যদি ভুল পথে যায়, তবে কোনও সাধারণ আনুমানিক গ্রহণযোগ্য / ন্যায়সঙ্গত কিনা তা পরীক্ষা করে কীভাবে চলবে?
পোস্টাদেফ

6
বিশ্লেষক (বা, ভাল, গবেষক / বিজ্ঞানী) এর (সাধারণ) জ্ঞানের বিকল্প নেই। এবং অভিজ্ঞতা (চেষ্টা করে দেখে শিখেছি: আমি যদি এটি সাধারণ বলে ধরে নিই তবে আমি কী সিদ্ধান্তে নেব? যদি না হয় তবে পার্থক্য কী?)। গ্রাফিক্স আপনার সেরা বন্ধু।
ফেয়ারমাইলস

2
আমি এই কাগজটি পছন্দ করি, যা আপনি তৈরি করেছেন: মাইক্রি, টি। (1989)। ইউনিকর্ন, সাধারণ বক্ররেখা এবং অন্যান্য অসম্ভব প্রাণীরা। মনস্তাত্ত্বিক বুলেটিন, 105 (1), 156-166।
জেরেমি মাইলস

4
গ্রাফিক্সের দিকে তাকানো দুর্দান্ত, তবে যদি ম্যানুয়ালি পরীক্ষা করার মতো অনেকগুলি থাকে? সম্ভাব্য সমস্যার দাগগুলি চিহ্নিত করার জন্য আমরা কি যুক্তিসঙ্গত পরিসংখ্যানগুলি কার্যকর করতে পারি? আমি বড় আকারে এ / বি পরীক্ষার্থীর মতো পরিস্থিতিগুলি নিয়ে ভাবছি: এক্সপ্লোরপ্ল্যাটফর্ম / পৃষ্ঠাগুলি /
dfrankow

118

আমি মনে করি স্বাভাবিকতার জন্য পরীক্ষাগুলি গ্রাফিকাল পরীক্ষার সহযোগী হিসাবে কার্যকর হতে পারে। যদিও এগুলি সঠিক উপায়ে ব্যবহার করতে হবে। আমার মতে, এর অর্থ হ'ল শাপিরো-উইলক, অ্যান্ডারসন-ডার্লিং এবং জার্কে-বেরা পরীক্ষার মতো অনেক জনপ্রিয় পরীক্ষা কখনও ব্যবহার করা উচিত নয়।

আমি আমার অবস্থানটি ব্যাখ্যা করার আগে আমাকে কয়েকটি মন্তব্য করা যাক:

  • একটি আকর্ষণীয় সাম্প্রতিক পেপারে রচন এট আল। দুটি নমুনা টি-পরীক্ষার উপর শাপিরো-উইলক পরীক্ষার প্রভাব অধ্যয়ন করে। উদাহরণস্বরূপ টি-টেস্ট চালানোর আগে স্বাভাবিকতার জন্য পরীক্ষার দ্বি-পদক্ষেপ প্রক্রিয়াটি সমস্যা ছাড়াই নয়। তারপরে আবার কোনওটি -টেস্ট চালানোর আগে গ্রাফিক্যালি স্বাভাবিকতা তদন্তের দ্বি-পদক্ষেপের প্রক্রিয়াও নয় । পার্থক্যটি হ'ল পরেরটির প্রভাবগুলি তদন্ত করা আরও বেশি কঠিন (কারণ এটি কোনও পরিসংখ্যানবিদকে গ্রাফিকভাবে স্বাভাবিকতা 100,000 বা এত বার তদন্ত করতে হবে ...)।
  • এটা তোলে দরকারী অ স্বাভাবিক পরিমাণ নির্ণয় , কম্পিউটিং নমুনা বক্রতা দ্বারা, উদাহরণস্বরূপ এমনকি যদি আপনি একটি আনুষ্ঠানিক পরীক্ষা সম্পাদন করতে চান না।
  • বহুবৃত্তীয় স্বাভাবিকতা গ্রাফিকভাবে মূল্যায়ন করা কঠিন হতে পারে এবং অ্যাসিপটোটিক বিতরণে রূপান্তরটি বহুবিধ পরিসংখ্যানের জন্য ধীর হতে পারে। স্বাভাবিকতার জন্য টেস্টগুলি বহুবিধ সেটিংয়ে আরও কার্যকর।
  • স্বাভাবিক জন্য টেস্ট সম্ভবত হয় অনুশীলনকারীদের যারা কালো বাক্স পদ্ধতির একটি সেট হিসাবে পরিসংখ্যান ব্যবহার বিশেষভাবে । যখন স্বাভাবিকতা প্রত্যাখ্যান করা হয়, তখন চিকিত্সককে সতর্ক করা উচিত এবং স্বাভাবিকতা অনুমানের উপর ভিত্তি করে একটি মানক পদ্ধতি চালানোর পরিবর্তে, একটি ননপ্যারমেট্রিক পদ্ধতি ব্যবহার করা, একটি রূপান্তর প্রয়োগ করা বা আরও অভিজ্ঞ পরিসংখ্যানবিদদের সাথে পরামর্শ করা উচিত।
  • n

(আমার সংজ্ঞা অনুসারে) স্বাভাবিকতার জন্য পরীক্ষাটি কোনও শ্রেণির বিকল্পের বিরুদ্ধে পরিচালিত হয় যদি সে শ্রেণীর বিকল্পগুলির সাথে সংবেদনশীল তবে অন্য শ্রেণীর বিকল্পগুলির সংবেদনশীল না হয়। সাধারণ উদাহরণগুলি টেস্টগুলি যা স্কিউ বা কুরোটিক বিকল্পগুলির দিকে পরিচালিত হয় । সবচেয়ে সহজ উদাহরণগুলি পরীক্ষার পরিসংখ্যান হিসাবে নমুনা স্কিউনেস এবং কুর্তোসিস ব্যবহার করে।

স্বাভাবিকতার দিকনির্দেশিত পরীক্ষাগুলি তত্ক্ষণাত্ বহুবিধ পরীক্ষাগুলি (যেমন শাপিরো-উইলক এবং জার্কে-বেরা পরীক্ষাগুলি) হিসাবে প্রায়শই পছন্দনীয় কারণ এটি সাধারণ যে কেবলমাত্র কিছু ধরণের অ-স্বাভাবিকতা কোনও নির্দিষ্ট অনুমানমূলক পদ্ধতির জন্য উদ্বেগের বিষয়

γ=E(Xμ)3σ3κ=E(Xμ)4σ43.Xγ=0γκ

Tn

P(Tnx)=Φ(x)+n1/216γ(2x2+1)ϕ(x)n1x(112κ(x23)118γ2(x4+2x23)14(x2+3))ϕ(x)+o(n1),

Φ()ϕ()

γn1/2κn1Tn

n

থাম্বের একটি নিয়ম হিসাবে ( প্রকৃতির কোনও আইন নয় ), উপায় সম্পর্কে অনুভূতি স্কিউনেসের সংবেদনশীল এবং বৈকল্পগুলির সম্পর্কে অনুভূতি কুর্তোসিসের প্রতি সংবেদনশীল।

স্বাভাবিকের জন্য নির্দেশিত পরীক্ষা ব্যবহার করা '' বিপজ্জনক '' বিকল্পগুলির বিরুদ্ধে উচ্চ ক্ষমতা পাওয়ার এবং বিকল্পগুলির বিরুদ্ধে কম '' বিপজ্জনক '' এর চেয়ে কম পাওয়ার সুবিধা রয়েছে যার অর্থ আমরা স্বাভাবিকতা থেকে বিচ্যুত হওয়ার কারণে স্বাভাবিকতা প্রত্যাখাত হওয়ার সম্ভাবনা কম less আমাদের অনুমানমূলক পদ্ধতির কার্যকারিতা প্রভাবিত করবে না। অ-স্বাভাবিকতা এমনভাবে পরিমাপ করা হয় যা হাতের সমস্যার সাথে প্রাসঙ্গিক। গ্রাফিকভাবে এটি করা সর্বদা সহজ নয়।

n|γ|1

|n1/216γ(2zα/22+1)ϕ(zα/2)|0.01
γ=0n


2
এখন এটি দুর্দান্ত উত্তর!
ব্যবহারকারী 60

10
হ্যাঁ এটি গ্রহণযোগ্য, সত্যই চমত্কার উত্তর হওয়া উচিত
জেনেসেসকুই

2
"এটি সাধারণ যে কেবল কিছু ধরণের অ-স্বাভাবিকতা কোনও নির্দিষ্ট অনুমানমূলক পদ্ধতির জন্য উদ্বেগের বিষয়" " - অবশ্যই অবশ্যই সেই ধরণের অ-স্বাভাবিকতার দিকে পরিচালিত একটি পরীক্ষা ব্যবহার করা উচিত। তবে একজন যে স্বাভাবিকতা পরীক্ষা ব্যবহার করছেন তা বোঝা যায় যে তিনি স্বাভাবিকতার সমস্ত দিক সম্পর্কে চিন্তা করেন । প্রশ্নটি হ'ল: সেই ক্ষেত্রে একটি স্বাভাবিক বিকল্প হ'ল একটি ভাল বিকল্প।
আরবিএম

নির্দিষ্ট পরীক্ষার জন্য অনুমানের পর্যাপ্ততার জন্য পরীক্ষাটি সাধারণ হয়ে উঠছে, যা কৃতজ্ঞতার সাথে অনুমানের কিছুটা সরিয়ে দেয়।
কার্ল 21

1
@ কার্ল: আপনি কি এর জন্য কিছু উল্লেখ / উদাহরণ যুক্ত করতে পারেন?
কেজেটিল বি হালওয়ারসেন

58

আইএমএইচওর স্বাভাবিকতা পরীক্ষাগুলি নিম্নলিখিত কারণে একেবারে অকেজো:

  1. ছোট নমুনাগুলিতে, জনসংখ্যার প্রকৃত বন্টন যথেষ্ট পরিমাণে অস্বাভাবিক হওয়ার খুব ভাল সম্ভাবনা রয়েছে তবে স্বাভাবিকতা পরীক্ষাটি এটি গ্রহণ করার পক্ষে শক্তিশালী নয়।

  2. বড় নমুনাগুলিতে, টি-টেস্ট এবং আনোভা-এর মতো জিনিসগুলি অ-স্বাভাবিকতার পক্ষে বেশ মজবুত।

  3. সাধারণত বিতরণ করা জনগোষ্ঠীর পুরো ধারণাটি কোনও উপায়ে গণিতের আনুমানিক অনুমান। পরিসংখ্যানগতভাবে সাধারণত যে পরিমাণে মোকাবেলা করা হয় তার কোনওটিই বাস্তবিক সংখ্যার সমর্থন সহ বিতরণ করতে পারে না। উদাহরণস্বরূপ, লোকেদের নেতিবাচক উচ্চতা থাকতে পারে না। কোন কিছুতে মহাবিশ্বের চেয়ে নেতিবাচক ভর বা বেশি ভর থাকতে পারে না। অতএব, এটা বলতে চাই যে নিরাপদ কিছুই হয় ঠিক স্বাভাবিকভাবে বাস্তব জগতে বিতরণ করেন।


2
বৈদ্যুতিক সম্ভাব্য পার্থক্য একটি বাস্তব-বিশ্ব পরিমাণের একটি উদাহরণ যা নেতিবাচক হতে পারে।
নিকো

16
@নিকো: অবশ্যই এটি নেতিবাচক হতে পারে তবে এর কিছু সীমাবদ্ধতা রয়েছে কারণ ইউনিভার্সে কেবলমাত্র প্রচুর প্রোটন এবং ইলেকট্রন রয়েছে। অবশ্যই এটি অনুশীলনে অপ্রাসঙ্গিক, তবে এটি আমার বক্তব্য। কিছুই ঠিক স্বাভাবিকভাবে বিতরণ (মডেল ভুল), কিন্তু যে যথেষ্ট ঘনিষ্ঠ (মডেল দরকারী) হয় জিনিষ প্রচুর আছে। মূলত, আপনি ইতিমধ্যে জানতেন যে মডেলটি ভুল ছিল, এবং নালকে প্রত্যাখ্যান বা প্রত্যাখ্যান করা তা তবে এটি কার্যকর কিনা সে সম্পর্কিত কোনও তথ্য দেয় না।
dsimcha

1
@ ডিএসিমচা - আমি দেখতে পেয়েছি যে সত্যিই অন্তর্দৃষ্টিপূর্ণ, দরকারী প্রতিক্রিয়া।
রোল্যান্ডো

5
t

@dimcha "মডেলটি ভুল" সব মডেল যদিও "ভুল" না?
আতিরাগ

30

আমি মনে করি স্বাভাবিকতার জন্য প্রাক-পরীক্ষার (যার মধ্যে গ্রাফিক্স ব্যবহার করে অনানুষ্ঠানিক মূল্যায়ন অন্তর্ভুক্ত) বিন্দুটি মিস করে।

  1. এই পদ্ধতির ব্যবহারকারীরা ধরে নিয়েছেন যে স্বাভাবিকতা মূল্যায়নের কার্যকারিতা 1.0 এর কাছাকাছি রয়েছে।
  2. উইলকক্সন, স্পিয়ারম্যান এবং কুরস্কাল-ওয়ালিসের মতো ননপ্যারমেট্রিক পরীক্ষাগুলি যদি স্বাভাবিকতা ধরে রাখে তবে তার দক্ষতা ০.৯৯ রয়েছে।
  3. ২ এর দৃষ্টিতে কেউ একটি ননপ্যারমেট্রিক পরীক্ষা ব্যবহারের প্রাক-নির্দিষ্ট করতে পারে যদি কেউ এমনকি কোনও বিতরণ থেকে ডেটা না উঠার সম্ভাবনাও বঞ্চিত করে।
  4. YY

নোট করুন যে ০.৯৯ এর দক্ষতা অ্যাসিম্পটোটিক : এফডাব্লুআইডাব্লু আমি অনুমান করতে পারি যে সুনির্দিষ্ট সসীম নমুনার আকারগুলির জন্য দক্ষতা অনেক কম ... (যদিও স্বীকার করতে হবে যে আমি এটি অধ্যয়নকৃত দেখিনি, নিজেই এটি অনুসন্ধান করার চেষ্টাও করেছি না)
বেন বলকার

16

স্বাভাবিকতা জন্য পরীক্ষা বা কোনও ধরণের রুক্ষ চেক "দরকারী" কিনা তা জিজ্ঞাসার আগে আপনাকে এই প্রশ্নের পিছনে প্রশ্নের উত্তর দিতে হবে: "আপনি কেন জিজ্ঞাসা করছেন?"

উদাহরণস্বরূপ, আপনি যদি কেবলমাত্র ডেটা সেটের গড়ের চারপাশে একটি আত্মবিশ্বাসের সীমা রাখতে চান , আপনার কতটা ডেটা থাকবে এবং কতটা বড় প্রস্থান হবে তার উপর নির্ভর করে স্বাভাবিকতা থেকে প্রস্থানগুলি গুরুত্বপূর্ণ হতে পারে বা নাও পারে। তবে, ভবিষ্যতের পর্যবেক্ষণে বা আপনি যে জনসংখ্যার নমুনা নিয়ে এসেছেন তার মধ্যে সবচেয়ে চূড়ান্ত মানটি কী হবে তা যদি আপনি ভবিষ্যদ্বাণী করতে চান তবে স্বাভাবিকতা থেকে প্রস্থানগুলি অত্যন্ত গুরুত্বপূর্ণ।


12

আমাকে একটি ছোট জিনিস যোগ করতে দাও:
আলফা-ত্রুটিটিকে বিবেচনায় না নিয়ে একটি স্বাভাবিকতা পরীক্ষা করা আলফা-ত্রুটি সম্পাদনের আপনার সামগ্রিক সম্ভাবনা আরও বাড়িয়ে তোলে।

আপনি কখনই ভুলে যাবেন না যতক্ষণ না আপনি আলফা-ত্রুটি সঞ্চারের জন্য নিয়ন্ত্রণ না করেন ততক্ষণ প্রতিটি অতিরিক্ত পরীক্ষা এটি করে। সুতরাং, স্বাভাবিকতা পরীক্ষা খারিজ করার আরও একটি ভাল কারণ।


আমি অনুমান করি আপনি এমন একটি পরিস্থিতির উল্লেখ করছেন যেখানে একজন প্রথমে একটি স্বাভাবিকতা পরীক্ষা করে এবং তারপরে কোন পরীক্ষাটি পরবর্তী পরীক্ষা করা উচিত তা সিদ্ধান্ত নিতে সেই পরীক্ষার ফলাফলটি ব্যবহার করে।
হার্ভে মোটুলস্কি

3
নির্দিষ্ট পদ্ধতি ব্যবহার করা উপযুক্ত কি না তা নির্ধারণের জন্য যখন পদ্ধতি হিসাবে ব্যবহৃত হয় তখন আমি স্বাভাবিকতা পরীক্ষার সাধারণ উপযোগিতা উল্লেখ করি। আপনি যদি এই ক্ষেত্রে তাদের প্রয়োগ করেন তবে এটি আলফা ত্রুটি সংঘটিত হওয়ার সম্ভাবনার শর্তে, আলফা ত্রুটি জমে যাওয়া এড়াতে আরও শক্তিশালী পরীক্ষা করা ভাল।
হেনরিক

4
H0

3
যদি আমরা "আলফা-ত্রুটি সম্পাদনের সামগ্রিক সম্ভাবনা" সম্পর্কে কথা বলি তবে একটি স্বাভাবিকতা পরীক্ষা অন্য ধরণের ত্রুটিগুলি বাড়িয়ে তুলতে পারে way পরীক্ষায় নিজেই একটি ত্রুটির হার থাকে, সুতরাং সামগ্রিকভাবে , ত্রুটি করার প্রতিশ্রুতি আমাদের সম্ভাবনা বৃদ্ধি পায়। উপর জোর দেওয়া এক ছোট জিনিস খুব আমি অনুমান ...
নিক Stauner

2
@ নিক স্টাটোনার ঠিক এটিই আমি জানাতে চেয়েছিলাম। এই বিষয়টি আরও পরিষ্কার করার জন্য ধন্যবাদ।
হেনরিক

11

এখানে উত্তরগুলি ইতিমধ্যে কয়েকটি গুরুত্বপূর্ণ পয়েন্ট সম্বোধন করেছে। দ্রুত সংক্ষেপ করতে:

  • কোনও ধারাবাহিক পরীক্ষা নেই যা নির্ধারণ করতে পারে যে ডেটার একটি সেট সত্যই কোনও বিতরণ অনুসরণ করে কিনা।
  • উচ্চ লিভারেজ, উচ্চ প্রভাব পর্যবেক্ষণ এবং মডেলগুলির উপর তার প্রভাব সম্পর্কে মন্তব্য করার জন্য ডেটা এবং মডেলগুলিকে দর্শনীয়ভাবে পরীক্ষা করার জন্য টেস্টগুলির বিকল্প নেই।
  • অনেক রিগ্রেশন রুটিনের জন্য অনুমানগুলি প্রায়শই সাধারণভাবে বিতরণকৃত "ডেটা" [অবশিষ্টাংশ] প্রয়োজন বলে বিশ্লেষণ করা হয় এবং বিশ্লেষণকারীরা বিশ্লেষণের সাথে এগিয়ে যাওয়ার আগে কিছুটা অর্থে এটি আনুষ্ঠানিকভাবে মূল্যায়ন করার প্রয়োজন বলে মনে করেন।

আমি প্রথমে আমার, ব্যক্তিগতভাবে, সর্বাধিক ঘন ঘন অ্যাক্সেস করা এবং পরিসংখ্যানিক নিবন্ধগুলি পড়ার একটি উত্তর দেওয়ার জন্য একটি উত্তর যুক্ত করছি: লুমলি এট দ্বারা " বড় জনস্বাস্থ্যের ডেটাসেটগুলিতে স্বাভাবিকতা অনুমানের গুরুত্ব "। অল। এটি সম্পূর্ণরূপে পড়া মূল্যবান। সংক্ষেপে বলা হয়েছে:

টি-পরীক্ষা এবং সর্বনিম্ন-স্কোয়ারের লিনিয়ার রিগ্রেশন পর্যাপ্ত পরিমাণে বড় নমুনায় সাধারণ বিতরণের কোনও অনুমানের প্রয়োজন হয় না। পূর্ববর্তী সিমুলেশন অধ্যয়নগুলি দেখায় যে "যথেষ্ট পরিমাণে বড়" প্রায়শই 100 এর নীচে থাকে এবং এমনকি আমাদের চিকিত্সাবিহীন চিকিত্সা ব্যয়ের ডেটার জন্য এটি 500 এরও কম হয়। এর অর্থ জনস্বাস্থ্য গবেষণায়, যেখানে নমুনা প্রায়শই এর চেয়ে যথেষ্ট বড় হয়, টেষ্ট এবং লিনিয়ার মডেল হ'ল সাধারন বিতরণগুলি নয়, বিভিন্ন ধরণের ডেটাতে পার্থক্য এবং প্রবণতা বিশ্লেষণের জন্য দরকারী ডিফল্ট সরঞ্জাম। সাধারণতার জন্য আনুষ্ঠানিক পরিসংখ্যানগত পরীক্ষাগুলি বিশেষত অনাকাঙ্ক্ষিত কারণ তাদের ক্ষুদ্রতর নমুনাগুলিতে কম বিদ্যুৎ থাকবে যেখানে বিতরণ গুরুত্বহীন যেখানে কেবলমাত্র বৃহত নমুনায় বিতরণ গুরুত্বপূর্ণ এবং উচ্চ ক্ষমতা power

লিনিয়ার রিগ্রেশন-এর বৃহত-নমুনার বৈশিষ্ট্যগুলি ভালভাবে বোঝা গেলেও সাধারণতা অনুমানকে গুরুত্বহীন হওয়ার জন্য প্রয়োজনীয় নমুনা আকারগুলির বিষয়ে খুব কম গবেষণা হয়েছে research বিশেষত, প্রয়োজনীয় নমুনার আকারটি কীভাবে মডেলটিতে ভবিষ্যদ্বাণীকারীদের সংখ্যার উপর নির্ভর করে তা স্পষ্ট নয়।

সাধারণ বিতরণগুলিতে ফোকাস এই পদ্ধতির আসল অনুমানগুলি থেকে বিভ্রান্ত করতে পারে। লিনিয়ার রিগ্রেশন ধরে নিচ্ছে যে ফলাফলের পরিবর্তনশীলের বৈকল্পিকতা প্রায় ধ্রুবক, তবে উভয় পদ্ধতির প্রাথমিক সীমাবদ্ধতা হ'ল তারা ধরে নেন যে ফলাফলের পরিবর্তনশীলের গড় পরিবর্তনগুলি পরীক্ষা করার পক্ষে এটি যথেষ্ট। বিতরণের আরও কিছু সংক্ষিপ্তসার যদি আরও আগ্রহী হয় তবে টি-টেস্ট এবং লিনিয়ার রিগ্রেশন উপযুক্ত নাও হতে পারে।

সংক্ষিপ্তসার হিসাবে: সাধারণত কোনও বৈজ্ঞানিক প্রশ্নের উত্তর দেওয়ার গুরুত্বের বিপরীতে স্বাভাবিকতা আলোচনার বা মনোযোগ পাওয়ার পক্ষে নয়। যদি আকাঙ্ক্ষা ডেটাগুলির মধ্যে পার্থক্যটির সংক্ষিপ্তসার করা হয় , তবে টি-টেস্ট এবং এএনওভা বা লিনিয়ার রিগ্রেশন অনেক বিস্তৃত অর্থে ন্যায়সঙ্গত। এই মডেলগুলির উপর ভিত্তি করে পরীক্ষাগুলি সঠিক আলফা স্তরের অবধি থাকে, এমনকি বিতরণী অনুমানগুলি পূরণ না করা সত্ত্বেও, বিদ্যুৎ বিরূপ প্রভাবিত হতে পারে।

সাধারণ বিতরণগুলি কেন তাদের মনোযোগ পেতে পারে সে কারণগুলি শাস্ত্রীয় কারণে থাকতে পারে, যেখানে আনোভা এবং টি-টেস্টের জন্য ছাত্র-টি-বিতরণের জন্য এফ-বিতরণের ভিত্তিতে সঠিক পরীক্ষা নেওয়া যেতে পারে obtained সত্য কথাটি হ'ল বিজ্ঞানের অনেক আধুনিক অগ্রগতির মধ্যে আমরা সাধারণত সংগ্রহ করা আগের তুলনায় বৃহত্তর ডেটাসেটগুলি নিয়ে কাজ করি। যদি কেউ আসলে একটি ছোট ডেটাসেটের সাথে ডিল করে, তবে সেই তথ্যগুলি যে তথ্যগুলি সাধারণত বিতরণ করা হয় সেগুলি সেই ডেটা থেকে নিজেরাই আসতে পারে না: কেবল পর্যাপ্ত শক্তি নেই। অন্যান্য গবেষণা, প্রতিরূপ, বা এমনকি পরিমাপ প্রক্রিয়াটির জীববিজ্ঞান বা বিজ্ঞানের বিষয়ে মন্তব্য করা, আমার মতে, পর্যবেক্ষণ করা ডেটার অন্তর্নিহিত সম্ভাব্যতা মডেলটি নিয়ে আলোচনার জন্য আরও অনেক ন্যায়সঙ্গত পদ্ধতি।

এই কারণে বিকল্প হিসাবে র‌্যাঙ্ক-ভিত্তিক পরীক্ষার বিকল্পটি পয়েন্টটি পুরোপুরি মিস করে। তবে, আমি সম্মত হব যে জ্যাকনিফ বা বুটস্ট্র্যাপের মতো শক্তিশালী বৈকল্পিক ব্যবহারগুলি গুরুত্বপূর্ণ গণ্য বিকল্পের প্রস্তাব দেয় যা মডেল স্পেসিফিকেশনের আরও অনেক গুরুত্বপূর্ণ লঙ্ঘনের অধীনে পরীক্ষা পরিচালনার অনুমতি দেয় যেমন স্বাধীনতা বা those ত্রুটিগুলির অভিন্ন বিতরণ।


10

আমি ব্যবহার মনে করেন যে স্বাভাবিকতার মধ্যে পরীক্ষার সম্পূর্ণ অকেজো ছিল।

তবে, এখন আমি অন্যান্য গবেষকদের জন্য পরামর্শ নিই। প্রায়শই, নমুনা নেওয়া অত্যন্ত ব্যয়বহুল, এবং তাই তারা এন = 8 এর সাথে অনুমান করতে চাইবে, বলুন।

এই জাতীয় ক্ষেত্রে, নন-প্যারাম্যাট্রিক পরীক্ষাগুলির সাথে পরিসংখ্যানগত তাত্পর্য খুঁজে পাওয়া খুব কঠিন তবে এন = 8 এর সাথে টি-পরীক্ষাগুলি স্বাভাবিকতা থেকে বিচ্যুত হওয়ার সংবেদনশীল। সুতরাং আমরা যা পাই তা হ'ল আমরা বলতে পারি "ভাল, স্বাভাবিকতা ধরে নেওয়ার শর্ত সাপেক্ষে, আমরা একটি পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ পার্থক্য খুঁজে পাই" (চিন্তা করবেন না, এগুলি সাধারণত পাইলট স্টাডি ...)।

তারপরে আমাদের সেই অনুমানকে মূল্যায়নের কিছু উপায় প্রয়োজন। আমি শিবিরে আধা-পথ যাচ্ছি যে প্লটগুলি দেখার পক্ষে যাওয়ার আরও ভাল উপায় তবে সত্য বলা যেতে পারে যে সে সম্পর্কে অনেক মতপার্থক্য থাকতে পারে, যদি আপনার সাথে একমত না হয় এমন লোকদের মধ্যে কেউ হ'ল আপনার পাণ্ডুলিপিটির পর্যালোচক।

বিভিন্ন উপায়ে, আমি এখনও মনে করি স্বাভাবিকতার পরীক্ষায় প্রচুর ত্রুটি রয়েছে: উদাহরণস্বরূপ, আমাদের ধরণের I টাইপের চেয়ে বেশি টাইপ ত্রুটি সম্পর্কে চিন্তা করা উচিত But তবে তাদের জন্য প্রয়োজন রয়েছে।


নোট করুন যে এখানে আর্গুমেন্টগুলি হ'ল পরীক্ষাগুলি কেবল তত্ত্বের ক্ষেত্রেই অকেজো। তত্ত্বের ক্ষেত্রে, আমরা সবসময় আমরা যতটা নমুনা পেতে পারি সবসময় পেতে পারি ... আপনার ডেটা কমপক্ষে কোনওভাবে স্বাভাবিকতার কাছাকাছি রয়েছে তা প্রমাণ করার জন্য আপনার এখনও পরীক্ষাগুলির প্রয়োজন হবে।
স্মলচিস

2
ভাল যুক্তি. আমি মনে করি আপনি যা বোঝাচ্ছেন, এবং অবশ্যই আমি যা বিশ্বাস করি তা হ'ল হাইপোথিসিস টেস্টের চেয়ে স্বাভাবিকতা থেকে বিচ্যুতিটি আরও গুরুত্বপূর্ণ।
ক্লিফ এবি

যতক্ষণ না তারা ততক্ষণ কোনও প্যারামিমেট্রিক পরীক্ষায় স্যুইচ করে না এবং p-মানগুলি ব্যাখ্যা করার চেষ্টা করে (যা শর্তসাপেক্ষে প্রাক-পরীক্ষার দ্বারা অবৈধ হয়), সম্ভবত এটি ঠিক আছে ?!
বিজার্ন

2
স্বাভাবিকতার পরীক্ষার শক্তি n = 8 এ খুব কম হবে; বিশেষত, স্বাভাবিকতা থেকে বিচ্যুতিগুলি একটি পরীক্ষার বৈশিষ্ট্যগুলিকে যথেষ্ট প্রভাবিত করবে যা ধরে নেয় যে ছোট নমুনা আকারগুলিতে (পরীক্ষা দ্বারা হোক বা দৃষ্টি দ্বারা) এটি সনাক্ত করা বেশ কঠিন হতে পারে।
Glen_b

1
@ গ্লেন_বি: আমি সম্মত; আমি মনে করি এই অনুভূতিটি টাইপ আইয়ের চেয়ে ধরণের দ্বিতীয় ত্রুটি সম্পর্কে আরও যত্নশীল হওয়ার সাথে সঙ্গতিপূর্ণ। আমার বক্তব্যটি হ'ল স্বাভাবিকতার জন্য পরীক্ষা করার সত্যিকারের বিশ্ব প্রয়োজন need আমাদের বর্তমান সরঞ্জামগুলি সত্যিই সেই প্রয়োজনটি পূরণ করে কিনা এটি একটি আলাদা প্রশ্ন।
ক্লিফ এবি

10

এটির মূল্যের জন্য, আমি ছাঁটাই হওয়া সাধারণ বিতরণের জন্য একবার একটি দ্রুত নমুনা তৈরি করেছি এবং ফাংশনটি ডিবাগ করার জন্য স্বাভাবিকতা পরীক্ষা (কেএস) খুব দরকারী ছিল। এই নমুনাটি বিশাল নমুনা আকারের সাথে পরীক্ষায় পাস করে তবে মজার বিষয় হল, জিএসএল এর জিগগুরাট নমুনা দেয় নি।


8

আপনি যে যুক্তি দিয়েছেন তা একটি মতামত। আমি মনে করি যে স্বাভাবিকতা থেকে টেস্টিংয়ের গুরুত্ব হ'ল এটি নিশ্চিত করা যে ডেটা স্বাভাবিক থেকে তীব্রভাবে চলে যায় না। আমার অনুমানের পদ্ধতির জন্য একটি ননপ্যারামেট্রিক পরীক্ষা বনাম প্যারাম্যাট্রিক ব্যবহারের মধ্যে সিদ্ধান্ত নেওয়ার জন্য আমি কখনও কখনও এটি ব্যবহার করি। আমি মনে করি পরীক্ষাটি মাঝারি ও বৃহত নমুনায় কার্যকর হতে পারে (যখন কেন্দ্রীয় সীমা তত্ত্বটি খেলায় না আসে)। আমি উইলক-শাপিরো বা অ্যান্ডারসন-ডার্লিং পরীক্ষা ব্যবহার করার ঝোঁক রাখি তবে এসএএস চালানো আমি তাদের সব পেয়েছি এবং তারা সাধারণত বেশ ভালভাবে একমত হয়। অন্য একটি নোটে আমি মনে করি যে কিউকিউ প্লটগুলির মতো গ্রাফিকাল পদ্ধতিগুলি সমানভাবে ভালভাবে কাজ করে। একটি আনুষ্ঠানিক পরীক্ষার সুবিধা হ'ল এটি উদ্দেশ্যমূলক। ছোট নমুনাগুলিতে এটি সত্য যে ফিটের পরীক্ষাগুলির এই ধার্মিকতার কার্যত কোনও শক্তি নেই এবং এটি স্বজ্ঞাত জ্ঞান তৈরি করে কারণ একটি সাধারণ বিতরণ থেকে একটি ছোট নমুনা সুযোগের পরিবর্তে অসাধারণ দেখাবে এবং এটি পরীক্ষায় দায়ী। এছাড়াও উচ্চ স্কিউনেস এবং কুর্তোসিস যা অনেকগুলি সাধারণ বিতরণকে সাধারণ বিতরণ থেকে আলাদা করে ছোট ছোট নমুনায় সহজে দেখা যায় না।


2
যদিও এটি অবশ্যই সেভাবে ব্যবহার করা যেতে পারে, আমি মনে করি না আপনি কিউকিউ-প্লটের চেয়ে বেশি উদ্দেশ্যসম্পন্ন হবেন। পরীক্ষাগুলির বিষয়বস্তুটি হ'ল কখন আপনার ডেটাটি অ-স্বাভাবিক হয় decide একটি বড় নমুনা পি = 0.05 এ প্রত্যাখ্যান করা খুব ভাল মাত্রাতিরিক্ত হতে পারে।
এরিক

4
প্রাক-পরীক্ষার (এখানে পরামর্শ হিসাবে) সামগ্রিক প্রক্রিয়াটির টাইপ আই ত্রুটির হারকে অকার্যকর করতে পারে; যে-কোনও নির্বাচনের ফলাফল বাছাইয়ের ফলাফল ব্যাখ্যা করার সময় একটি প্রাক-পরীক্ষা করা হয়েছিল তা বিবেচনা করা উচিত। আরও সাধারণভাবে, নাল অনুমানের পরীক্ষার জন্য অনুমানের পরীক্ষা রাখা উচিত যা প্রকৃত পক্ষে যত্নশীল, অর্থাৎ ভেরিয়েবলের মধ্যে কোনও মিল নেই। নাল অনুমান যে ডেটা ঠিক স্বাভাবিক হয় এই বিভাগে আসে না।
অতিথি

1
(+1) এখানে দুর্দান্ত পরামর্শ রয়েছে। এরিক, "অবজেক্টিভ" এর ব্যবহার আমাকে খুব অচল করে তুলেছিল, যতক্ষণ না আমি মাইকের অধিকারটি উপলব্ধি করেছিলাম: একই ডেটাতে সঠিকভাবে একই পরীক্ষা করানো দু'জন লোক সর্বদা একই পি-মান পাবে, তবে তারা একই কিউকিউ প্লটের ব্যাখ্যা অন্যভাবে করতে পারে। অতিথি: টাইপ আই ত্রুটি সম্পর্কে সতর্কতামূলক নোটের জন্য আপনাকে ধন্যবাদ। তবে কেন আমাদের ডেটা বিতরণ সম্পর্কে যত্ন নেওয়া উচিত নয়? প্রায়শই এটি আকর্ষণীয় এবং মূল্যবান তথ্য। আমি অন্তত জানতে চাই যে আমার পরীক্ষাগুলি সেগুলি সম্পর্কে ডেটাগুলি অনুমানের সাথে সামঞ্জস্যপূর্ণ কিনা!
whuber

1
আমি দৃ strongly়ভাবে একমত না। উভয় ব্যক্তি একই কিউকিউ-প্লট এবং একই পি-মান পান। পি-মানটি ব্যাখ্যা করার জন্য আপনাকে নমুনার আকার এবং আপনার পরীক্ষাটি বিশেষভাবে সংবেদনশীল এমন সাধারণতার লঙ্ঘন ધ્યાનમાં নিতে হবে। সুতরাং আপনার পি-মানটি দিয়ে কী করবেন তা ঠিক ঠিক বিষয়ভিত্তিক। আপনি পি-মানটি পছন্দ করতে পারেন তার কারণ হ'ল আপনি বিশ্বাস করেন যে ডেটা একটি নিখুঁত সাধারণ বিতরণ অনুসরণ করতে পারে - অন্যথায় এটি কেবলমাত্র একটি প্রশ্ন যা নমুনা আকারের সাথে পি-মানটি কতটা দ্রুত কমে যায়। যা বেশি, একটি সুনির্দিষ্ট নমুনা আকার দেওয়া কিউকিউ-প্লট দেখতে দেখতে অনেকটা একইরকম এবং আরও নমুনা সহ স্থিতিশীল থাকে remains
এরিক

1
এরিক, আমি সম্মত হই যে পরীক্ষার ফলাফল এবং গ্রাফিক্সের ব্যাখ্যা প্রয়োজন। তবে পরীক্ষার ফলাফলটি একটি সংখ্যা এবং এটি নিয়ে কোনও বিরোধ হবে না। কিউকিউ প্লটটি অবশ্য একাধিক বিবরণ স্বীকার করে। যদিও প্রত্যেকে উদ্দেশ্যমূলকভাবে সঠিক হতে পারে তবে কী মনোযোগ দিতে হবে তা হ'ল ... একটি পছন্দ। "সাবজেক্টিভ" এর অর্থ এটাই: ফলাফল বিশ্লেষকের উপর নির্ভর করে, কেবল প্রক্রিয়া নিজেই নয়। এ কারণেই, উদাহরণস্বরূপ, নিয়ন্ত্রণ চার্ট এবং সরকারী বিধিবিজ্ঞানের মতো বিভিন্ন সেটিংসে যেখানে "উদ্দেশ্যপ্রণালী" গুরুত্বপূর্ণ, মানদণ্ডগুলি সংখ্যাসূচক পরীক্ষাগুলির উপর ভিত্তি করে এবং কখনই গ্রাফিকাল ফলাফল হয় না।
whuber

7

আমি মনে করি এখানে সর্বাধিক এনট্রপি পদ্ধতি কার্যকর হতে পারে। আমরা একটি সাধারণ বিতরণ বরাদ্দ করতে পারি কারণ আমরা বিশ্বাস করি যে ডেটা "সাধারণভাবে বিতরণ" (যার অর্থ যাই হোক না কেন) বা আমরা কেবল একই ম্যাগনিটিউডের বিচ্যুতি দেখতে আশা করি। এছাড়াও, সাধারণ বিতরণে মাত্র দুটি পর্যাপ্ত পরিসংখ্যান রয়েছে, তাই এই পরিমাণগুলিতে কোনও পরিবর্তন হয় না এমন তথ্য পরিবর্তনের বিষয়ে সংবেদনশীল। সুতরাং এক অর্থে আপনি একই প্রথম এবং দ্বিতীয় মুহুর্তের সাথে সমস্ত সম্ভাব্য বিতরণে "গড়" হিসাবে একটি সাধারণ বন্টনকে ভাবতে পারেন। এই এক কারণে লিস্ট স্কোয়ার উপলব্ধ উচিত সেইসাথে এটা আছে কাজ করি।


ধারণাগুলির দুর্দান্ত ব্রিজিং। আমি এও সম্মত হই যে এই জাতীয় বিতরণ সম্পর্কিত ক্ষেত্রে, ডেটা কীভাবে উত্পন্ন হয় তা চিন্তা করা আরও বেশি আলোকিত । আমরা নীতিটি মেশানো মিশ্রিত মডেলগুলিতে প্রয়োগ করি। অন্যদিকে ঘনত্ব বা অনুপাত সর্বদা স্কিউড। আমি যুক্ত করতে পারি যে "স্বাভাবিক ... পরিবর্তনের প্রতি সংবেদনশীল না" বলতে আপনি আকার / স্কেলের পরিবর্তনগুলিকে আক্রমণকারী বলতে চাইছেন।
অ্যাডমো

7

আমি এটি অকেজো বলে বলব না, তবে এটি আবেদনের উপর নির্ভর করে। দ্রষ্টব্য, আপনি কখনই জানেন না যে ডেটা বিতরণটি ডেটা থেকে আসছে এবং আপনার সমস্ত কিছু উপলব্ধির একটি ছোট সেট। আপনার নমুনা গড়টি নমুনায় সর্বদা সসীম, তবে সম্ভাব্যতা ঘনত্বের কয়েকটি ধরণের কার্যকারিতার জন্য গড়টি অপরিজ্ঞাত বা অসীম হতে পারে। আসুন আমরা তিন ধরণের লেবির স্থিতিশীল বিতরণগুলি বিবেচনা করি অর্থাৎ সাধারণ বিতরণ, লেভি বিতরণ এবং কচির বিতরণ। আপনার বেশিরভাগ নমুনার লেজটিতে খুব বেশি পর্যবেক্ষণ নেই (যেমন স্যাম্পলটির অর্থ থেকে দূরে)। সুতরাং বুদ্ধিমানভাবে এই তিনটির মধ্যে পার্থক্য করা খুব কঠিন, সুতরাং কাচি (অনির্ধারিত গড়) এবং লেভি (অসীম মানে) একটি সাধারণ বন্টন হিসাবে সহজেই মাস্ক্রেড করতে পারে।


1
"... প্রায়োগিক এটা খুব কঠিন ..." তর্ক করা বলে মনে হয় বিরুদ্ধে বদলে, জন্য , distributional টেস্টিং। এটি অনুচ্ছেদে পড়ে আশ্চর্যজনক যার ভূমিকা সূচিত করে যে বিতরণের পরীক্ষার জন্য সত্যই ব্যবহার রয়েছে। তাহলে, আপনি এখানে সত্যিই কি বলতে চাইছেন?
whuber

3
আমি এর বিপক্ষে, তবে আমি কেবল এটি অযথা বলার চেয়েও সাবধানতা অবলম্বন করতে চাই কারণ আমি সেখানে সম্ভাব্য পরিস্থিতিগুলির পুরো সেটটি জানি না। অনেক পরীক্ষা আছে যা স্বাভাবিকতা অনুমানের উপর নির্ভর করে। স্বাভাবিকতা পরীক্ষা নিরর্থক তা বলা এই জাতীয় পরিসংখ্যানগত পরীক্ষাগুলি মূলত ডিবেঙ্ক করা কারণ আপনি বলছেন যে আপনি সঠিক জিনিসটি ব্যবহার করছেন / করছেন তা আপনি নিশ্চিত নন। সেক্ষেত্রে আপনার এটি করা উচিত নয়, আপনার পরিসংখ্যানের এই বৃহত অংশটি করা উচিত নয়।
কলোনেল

ধন্যবাদ. সেই মন্তব্যে থাকা মন্তব্যগুলি আপনার মূল উত্তরের চেয়ে প্রশ্নটিতে আরও ভাল ফোকাসযুক্ত বলে মনে হচ্ছে! আপনার মতামত এবং পরামর্শকে আরও সুস্পষ্ট করার জন্য আপনি কোনও সময়ে আপনার উত্তর আপডেট করার বিষয়ে বিবেচনা করতে পারেন।
whuber

@ হুইবার কোন সমস্যা নেই আপনি একটি সম্পাদনা সুপারিশ করতে পারেন?
কলোনেল

উত্তর এবং আপনার মন্তব্য - - এই দুটি পোস্টের সমন্বয়ে আপনি শুরু করতে পারেন এবং তারপরে স্পর্শকাতর হতে পারে এমন কোনও উপাদান আগাছা (বা একটি পরিশিষ্টে প্রত্যাখ্যান করা বা স্পষ্ট করা) about উদাহরণস্বরূপ, অপরিজ্ঞাত অর্থগুলির উল্লেখের বিষয়ে এখনও প্রশ্নের উপর স্পষ্ট কোন প্রভাব নেই এবং তাই এটি কিছুটা রহস্যজনক থেকে যায়।
whuber

7

আমি মনে করি প্রথম 2 টি প্রশ্নের পুরো উত্তর দেওয়া হয়েছে তবে আমি মনে করি না যে প্রশ্ন 3 করা হয়েছে। অনেক পরীক্ষাগুলি জ্ঞানমূলক বিতরণকে একটি পরিচিত অনুমানযুক্ত বিতরণের সাথে তুলনা করে। কোলমোগোরভ-স্মারনভ পরীক্ষার সমালোচনা মান এফের উপর নির্ভর করে সম্পূর্ণ নির্দিষ্ট করা হয়েছে। আনুমানিক পরামিতিগুলির সাথে প্যারাম্যাট্রিক বিতরণের বিরুদ্ধে পরীক্ষার জন্য এটি পরিবর্তন করা যেতে পারে। সুতরাং যদি ফাজিয়ার অর্থ দুটি পরামিতির বেশি অনুমান করা হয় তবে প্রশ্নের উত্তর হ্যাঁ। এই পরীক্ষাগুলি 3 টি প্যারামিটার পরিবার বা আরও বেশি প্রয়োগ করা যেতে পারে। কিছু পরীক্ষাগুলি বিতরণের নির্দিষ্ট পরিবারের বিরুদ্ধে পরীক্ষা করার সময় আরও ভাল পাওয়ার জন্য ডিজাইন করা হয়। উদাহরণস্বরূপ, যখন নরম হাইপোথিসাইজড বিতরণ স্বাভাবিক হয় তখন অ্যান্ডারসন-ডার্লিং বা শাপিরো-উইলক পরীক্ষার কেএস বা চি স্কোয়ারের চেয়ে বেশি ক্ষমতা থাকে testing


5

পরীক্ষাগুলি যেখানে বিশ্লেষণের জন্য গুরুত্বপূর্ণ কিছু "উচ্চ মানের" পি-ভ্যালু দ্বারা সমর্থিত তা কি আমি ভুল শিরোনাম বলে মনে করি। অন্যরা যেমন উল্লেখ করেছে, বড় ডেটা সেটগুলির জন্য, 0.05 এর নীচে একটি পি-মান নিশ্চিত করা হয়েছে। সুতরাং, পরীক্ষাটি ছোট এবং अस्पष्ट ডেটা সেটগুলির জন্য মূলত "পুরষ্কার" এবং প্রমাণের অভাবে "পুরষ্কার" দেয়। কিউকি প্লটের মতো কিছু আরও কার্যকর। সর্বদা (হ্যাঁ / কোনও স্বাভাবিক / সাধারণ নয়) এই জাতীয় জিনিসগুলি স্থির করার জন্য কঠোর সংখ্যার আকাঙ্ক্ষাটি মিস করে যে মডেলিং আংশিকভাবে একটি শিল্প এবং অনুমানগুলি আসলে কীভাবে সমর্থিত হয়।


2
এটি এখনও অবধি রয়ে গেছে যে প্রায় একটি সাধারণ নমুনার কম পি-ভ্যালু থাকবে যখন একটি ছোট নমুনা প্রায় স্বাভাবিকের মতো না প্রায়শই না। আমি মনে করি না যে বড় পি-মানগুলি কার্যকর। আবার প্রমাণের অভাবে তারা পুরস্কৃত করে। আমার কয়েক মিলিয়ন ডেটা পয়েন্ট সহ একটি নমুনা থাকতে পারে এবং এটি প্রায় সবসময় এই পরীক্ষাগুলির অধীনে স্বাভাবিকতা অনুমানটিকে প্রত্যাখ্যান করবে যখন একটি ছোট নমুনা তা করবে না। অতএব, আমি তাদের দরকারী না বলে মনে করি। যদি আমার চিন্তাভাবনা ত্রুটিযুক্ত থাকে তবে দয়া করে এটিকে কিছু অনুমানমূলক যুক্তি ব্যবহার করে দেখান।
wvguy8258

এটি প্রশ্নের কোনও উত্তর দেয় না।
স্মলচেস

-2

স্বাভাবিকতা পরীক্ষার একটি ভাল ব্যবহার যা আমি মনে করি না যে জেড-স্কোর ব্যবহার করা ঠিক আছে কিনা তা নির্ধারণ করা। ধরা যাক আপনি একটি জনসংখ্যার থেকে একটি এলোমেলো নমুনা নির্বাচন করেছেন এবং আপনি জনসংখ্যার থেকে একটি এলোমেলো পৃথক ব্যক্তিকে বেছে নেওয়ার সম্ভাবনাটি খুঁজে পেতে এবং 80 বা তার বেশি মানের একটি মান পেতে চান। বিতরণটি স্বাভাবিক হলেই এটি করা যেতে পারে, কারণ জেড স্কোর ব্যবহার করার জন্য, অনুমানটি হ'ল জনসংখ্যা বিতরণ স্বাভাবিক normal

তবে আমি অনুমান করি আমি এটিও তর্কযোগ্য হতে দেখছি ...


মূল্য কি? গড়, যোগফল, বৈকল্পিক, একটি পৃথক পর্যবেক্ষণ? কেবলমাত্র শেষটি বিতরণের অনুমিত স্বাভাবিকতার উপর নির্ভর করে।
হোবার

আমি ব্যক্তিগত বলতে
চাইছি

2
ধন্যবাদ। আপনার উত্তরটি এতটাই অস্পষ্ট রয়ে গেছে যে আপনি কোন পদ্ধতিগুলি উল্লেখ করছেন তা বলা মুশকিল এবং আপনার সিদ্ধান্তগুলি বৈধ কিনা তা নির্ধারণ করা অসম্ভব।
হোবার

2
এই ব্যবহারের সমস্যাটি অন্যান্য ব্যবহারের মতো একই: পরীক্ষাটি নমুনা আকারের উপর নির্ভর করবে, সুতরাং এটি মূলত অকেজো। আপনি z স্কোর ব্যবহার করতে পারবেন কিনা তা আপনাকে জানায় না।
পিটার Flom
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.