এখনও অবধি, আমি ছোট নমুনায় স্বাভাবিকতা অনুমানগুলি পরীক্ষা করার জন্য শাপিরো-উইলকের পরিসংখ্যানটি ব্যবহার করছি।
আপনি দয়া করে অন্য কৌশল প্রস্তাব করতে পারেন?
এখনও অবধি, আমি ছোট নমুনায় স্বাভাবিকতা অনুমানগুলি পরীক্ষা করার জন্য শাপিরো-উইলকের পরিসংখ্যানটি ব্যবহার করছি।
আপনি দয়া করে অন্য কৌশল প্রস্তাব করতে পারেন?
উত্তর:
FBasics আর (অংশ প্যাকেজ Rmetrics ) অন্তর্ভুক্ত বিভিন্ন স্বাভাবিক পরীক্ষার , জনপ্রিয় অনেক আচ্ছাদন frequentist পরীক্ষা - স্বাভাবিক পরীক্ষার জন্য একটি লেফাফা সহ - Kolmogorov-Smirnov, শাপিরো-Wilk, Jarque-বেড়া, এবং ডি Agostino মধ্যে nortest অ্যান্ডারসন-ওগো, Cramer-ভন মিসেস, Lilliefors (Kolmogorov-Smirnov), পিয়ারসন চি-বর্গাকার, এবং শাপিরো-Francia - প্যাকেজ। প্যাকেজ ডকুমেন্টেশন সমস্ত গুরুত্বপূর্ণ তথ্য সরবরাহ করে। এখানে একটি ডেমো যা দেখায় যে কীভাবে প্রথম থেকে পরীক্ষাগুলি ব্যবহার করতে হয় ।
একটি পদ্ধতির, যদি আপনার কাছে সময় থাকে তবে হ'ল একাধিক পরীক্ষা ব্যবহার করা এবং চুক্তির জন্য পরীক্ষা করা। পরীক্ষাগুলি বিভিন্ন উপায়ে পরিবর্তিত হয়, তাই "সেরা" বাছাই করা সম্পূর্ণ সোজা নয়। আপনার ক্ষেত্রের অন্যান্য গবেষকরা কী ব্যবহার করবেন? এটি পরিবর্তিত হতে পারে এবং গ্রহণযোগ্য পদ্ধতিগুলির সাথে লেগে থাকা ভাল তবে যাতে অন্যরা আপনার কাজ স্বীকার করে। আমি প্রায়শই জার্কে-বেরা পরীক্ষাটি ব্যবহার করি, আংশিকভাবে সেই কারণে এবং অ্যান্ডারসন – ডার্লিং তুলনার জন্য।
আপনি তাকান করতে পারেন "Univariate স্বাভাবিক জন্য টেস্ট তুলনা" (Seier 2002) এবং "স্বাভাবিকতার মধ্যে বিভিন্ন পরীক্ষার তুলনা" একটি তুলনামূলক এবং বিষয় আলোচনার জন্য; (Yolacan 2007 Yazici)।
সমস্ত ডিস্ট্রিবিউশন ফাংশনগুলির জন্য আর এর তুলনায় এই পদ্ধতিগুলি পরীক্ষা করাও তুচ্ছ । সিমুলেটেড ডেটা সহ একটি সাধারণ উদাহরণ এখানে রয়েছে (স্থান বাঁচাতে আমি ফলাফলগুলি প্রিন্ট করব না), যদিও আরও একটি পূর্ণ বিবরণ প্রয়োজন হবে:
library(fBasics); library(ggplot2)
set.seed(1)
# normal distribution
x1 <- rnorm(1e+06)
x1.samp <- sample(x1, 200)
qplot(x1.samp, geom="histogram")
jbTest(x1.samp)
adTest(x1.samp)
# cauchy distribution
x2 <- rcauchy(1e+06)
x2.samp <- sample(x2, 200)
qplot(x2.samp, geom="histogram")
jbTest(x2.samp)
adTest(x2.samp)
বিভিন্ন বিতরণে বিভিন্ন পরীক্ষার ফলাফল একবার হয়ে গেলে আপনি তুলনা করতে পারেন কোনটি কার্যকর ছিল। উদাহরণস্বরূপ, উপরের জার্কে-বেরা পরীক্ষার জন্য পি-মানটি স্বাভাবিক বিতরণ (গ্রহণযোগ্য) এর জন্য 0.276 এবং কৌচির জন্য <2.2e-16 (নাল অনুমানকে প্রত্যাখ্যান করে) ফেরত দিয়েছে।
স্বাভাবিকতার জন্য, প্রকৃত শাপিরো-উইলকের মোটামুটি ছোট নমুনায় ভাল শক্তি রয়েছে।
যে গবেষণাগুলি আমি দেখেছি তার মধ্যে প্রধান প্রতিদ্বন্দ্বী হলেন আরও সাধারণ অ্যান্ডারসন-ডার্লিং, যা মোটামুটি ভাল করে, তবে আমি বলব না এটি ভাল ছিল। আপনার কী কী বিকল্পের আগ্রহ রয়েছে তা আপনি যদি স্পষ্ট করে বলতে পারেন তবে সম্ভবত আরও ভাল পরিসংখ্যান আরও সুস্পষ্ট। [সম্পাদনা করুন: আপনি যদি প্যারামিটারগুলি অনুমান করেন তবে AD পরীক্ষাটি তার জন্য সামঞ্জস্য করা উচিত]]
[আমি ছোট নমুনায় জার্কে-বেরা বিবেচনা করার বিরুদ্ধে দৃ strongly়ভাবে পরামর্শ দিচ্ছি (যা সম্ভবত পরিসংখ্যানগত বৃত্তগুলিতে বোম্যান-শেনটন নামে পরিচিত - তারা ছোট নমুনা বিতরণটি অধ্যয়ন করেছেন)। স্কিউনেস এবং কুর্তোসিসের অ্যাসিম্পটোটিক যৌথ বন্টন ছোট-নমুনা বিতরণের মতো কিছুই নয় - একইভাবে একটি কলা কমলার মতো দেখায় না। কিছু আকর্ষণীয় বিকল্পের বিরুদ্ধে এর খুব কম শক্তিও রয়েছে - উদাহরণস্বরূপ এটি একটি প্রতিসম বিমোডাল বিতরণ বাছাই করার ক্ষমতা কম রাখে যা একটি সাধারণ বিতরণের সাথে কুরটোসিস থাকে]]
প্রায়শই লোকেরা বিশেষত-ভাল কারণ হতে পারে না তার জন্য ফিটের সার্থকতা পরীক্ষা করে, বা তারা আসলে উত্তর দিতে চায় এমন প্রশ্ন ছাড়া অন্য কোনও প্রশ্নের জবাব দিচ্ছে।
উদাহরণস্বরূপ, আপনি প্রায় নিশ্চিতভাবেই জানেন যে আপনার ডেটা সত্যিই স্বাভাবিক নয় (ঠিক নয়), সুতরাং যে প্রশ্নের উত্তর আপনি জানেন সেটির উত্তর দেওয়ার চেষ্টা করার কোনও অর্থ নেই - এবং হাইপোথিসিস টেস্টটি আসলে যাইহোক এর উত্তর দেয় না ।
আপনি জেনে গেছেন যে আপনার ইতিমধ্যে যথাযথ স্বাভাবিকতা নেই, আপনার স্বাভাবিকতার অনুমানের পরীক্ষাটি সত্যই আপনাকে নিকটে থাকা একটি প্রশ্নের উত্তর দিচ্ছে "আমার নমুনার আকারটি আমার কাছে যে নরমালিক্য আছে তার পরিমাণ তুলতে যথেষ্ট", যখন আপনি যে উত্তরটি দিতে আগ্রহী তা প্রকৃতপক্ষে "" আমি আগ্রহী এই অন্যান্য বিষয়গুলির উপর এই অ-স্বাভাবিকতার প্রভাব কী ? "এর কাছাকাছি। অনুমান পরীক্ষাটি নমুনার আকার পরিমাপ করছে, যখন আপনি যে প্রশ্নের উত্তর দিতে আগ্রহী তা নমুনা আকারের উপর খুব নির্ভরশীল নয় very
এমন কিছু সময় রয়েছে যখন স্বাভাবিকতার পরীক্ষাটি কিছুটা অর্থবোধ করে, তবে ছোট ছোট নমুনাগুলি নিয়ে এই পরিস্থিতি প্রায় কখনও ঘটে না।
কেন আপনি স্বাভাবিকতা পরীক্ষা করছেন?
স্বাভাবিকতা পরীক্ষায় একটি সম্পূর্ণ উইকিপিডিয়া বিভাগ রয়েছে:
আমি মনে করি এডি সম্ভবত তাদের মধ্যে সেরা।
সম্পূর্ণতার জন্য, অর্থনীতিবিদরাও ১৯৮৩ সালের অর্থনীতিতে তাদের গবেষণাপত্রের কাগজ থেকে কিফার এবং সালমন টেস্ট পছন্দ করেন - এটি স্কিউনেস এবং কুর্তোসিসের 'স্বাভাবিকীকরণ' যা তারপরে চি-বর্গ বিতরণকৃত অভিব্যক্তির সমষ্টি। আমার একটি পুরানো সি ++ সংস্করণ রয়েছে আমি গ্রেড স্কুলে পড়ার সময় আমি আর তে অনুবাদ করতে পারি could
সম্পাদনা করুন: এবং এখানে বিয়েরেন্সের পুনরায় সাম্প্রতিক কাগজ রয়েছে (পুনরায়) জার্কে-বেরা এবং কিফার-সলমন iving
সম্পাদনা 2: আমি পুরানো কোডটি দেখেছি এবং দেখে মনে হচ্ছে এটি জার্কে-বেরা এবং কিফের-সালমন এর মধ্যে সত্যই একই পরীক্ষা।
প্রকৃতপক্ষে কেফার সালমন পরীক্ষা এবং জার্কে বেরা পরীক্ষাটি বেশ কয়েকটি স্থানে প্রদর্শিত হিসাবে সমালোচিতভাবে আলাদা তবে খুব সম্প্রতি এখানে - স্ট্যান্ডার্ডাইজড ত্রুটি বিতরণের জন্য মোমেন্ট টেস্ট: ই-টিং চেনের একটি সহজ রোবস্ট অ্যাপ্রোচ । নির্মাণের দ্বারা খিফার সালমন পরীক্ষাটি স্ট্যান্ডার্ড জার্কে বেরার পরীক্ষার বিপরীতে এআরসিএইচ টাইপের ত্রুটি কাঠামোর মুখোমুখি। ই-টিং চেনের কাগজটি বিকাশ করেছে এবং আমার মনে হয় যা এই মুহূর্তে সেরা পরীক্ষা হতে পারে বলে আমি আলোচনা করি discus
নমুনা আকারের <30 বিষয়গুলির জন্য, শাপিরো-উইলককে একটি শক্তিশালী শক্তি হিসাবে বিবেচনা করা হয় - পরীক্ষার তাত্পর্য স্তরটি সামঞ্জস্য করার সময় সতর্ক থাকুন , যেহেতু এটি দ্বিতীয় ধরণের ত্রুটি প্ররোচিত করতে পারে! [1]