আমি শিখেছি যে ছোট নমুনা আকার অপর্যাপ্ত শক্তি এবং টাইপ 2 ত্রুটি হতে পারে। তবে আমার অনুভূতি আছে যে ছোট নমুনাগুলি কেবলমাত্র অবিশ্বাস্য হতে পারে এবং সুযোগের ফলে কোনও ধরণের ফলাফলের দিকে নিয়ে যেতে পারে। এটা কি সত্যি?
আমি শিখেছি যে ছোট নমুনা আকার অপর্যাপ্ত শক্তি এবং টাইপ 2 ত্রুটি হতে পারে। তবে আমার অনুভূতি আছে যে ছোট নমুনাগুলি কেবলমাত্র অবিশ্বাস্য হতে পারে এবং সুযোগের ফলে কোনও ধরণের ফলাফলের দিকে নিয়ে যেতে পারে। এটা কি সত্যি?
উত্তর:
একটি সাধারণ নীতি হিসাবে, ছোট নমুনা আকার টাইপ আই ত্রুটি হার বৃদ্ধি করবে না যে সাধারণ কারণে পরীক্ষাটি টাইপ 1 হার নিয়ন্ত্রণের ব্যবস্থা করা হয়েছে। (বিচ্ছিন্ন ফলাফলের সাথে যুক্ত ছোট প্রযুক্তিগত ব্যতিক্রম রয়েছে, যা নামমাত্র কারণ হতে পারে টাইপ আই রেট বিশেষত ছোট নমুনার আকারের সাথে অর্জন না করতে পারে))
একটি গুরুত্বপূর্ণ নীতি আছে রয়েছে: যদি আপনার পরীক্ষার গ্রহণযোগ্য আকার (= নামমাত্র টাইপ আই রেট) থাকে এবং আপনি যে প্রভাবটি খুঁজছেন তার জন্য গ্রহণযোগ্য শক্তি রয়েছে, তবে নমুনার আকারটি ছোট হলেও তা ঠিক আছে।
বিপদ হ'ল আমরা যদি অন্যথায় পরিস্থিতি সম্পর্কে সামান্যই জানি - সম্ভবত এগুলি আমাদের কাছে থাকা সমস্ত ডেটা হয় - তবে আমরা "টাইপ তৃতীয়" ত্রুটিগুলি সম্পর্কে উদ্বিগ্ন হতে পারি: এটি মডেলের ভুল স্পেসিফিকেশন। তারা ছোট নমুনা সেট সঙ্গে চেক করা কঠিন হতে পারে।
ধারণাগুলির ইন্টারপ্লেটির ব্যবহারিক উদাহরণ হিসাবে আমি একটি গল্প ভাগ করব। অনেক আগে আমাকে পরিবেশগত পরিষ্কারের বিষয়টি নিশ্চিত করার জন্য একটি নমুনার আকারের সুপারিশ করতে বলা হয়েছিল। আমাদের কোনও ডেটা থাকার আগে এটি প্রাক-পরিচ্ছন্নতার পর্যায়ে ছিল। আমার পরিকল্পনা 1000 বিশ্লেষণের জন্য তাই নমুনার যে বলা হবে (প্রতিষ্ঠা করতে যে যথেষ্ট মাটি প্রতিটি অবস্থানে সরিয়ে ফেলা হয়েছে) পরিষ্করণ সময় প্রাপ্ত সংক্রামকের ঘনত্ব পোস্ট পরিষ্করণ গড় এবং ভ্যারিয়েন্স মূল্যায়ন করার। তারপরে (ব্যাপকভাবে সরলকরণের জন্য), আমি বলেছিলাম যে আমরা নির্ধারিত শক্তি এবং পরীক্ষার আকারের উপর ভিত্তি করে - পাঠ্যপুস্তকের সূত্রটি ব্যবহার করব যা পরিষ্কার-পরিচ্ছন্নতা সফল প্রমাণিত করতে ব্যবহৃত হবে এমন স্বতন্ত্র নিশ্চিতকরণের নমুনার সংখ্যা নির্ধারণ করতে।
এইটি স্মরণীয় করে তুলেছে যে পরিষ্কারটি শেষ হওয়ার পরে সূত্রটি কেবলমাত্র 3 টি নমুনা ব্যবহার করতে বলেছে। হঠাৎ আমার সুপারিশটি খুব বিশ্বাসযোগ্য মনে হয়নি!
মাত্র 3 টি স্যাম্পল প্রয়োজনের কারণ হ'ল ক্লিনআপটি আগ্রাসী ছিল এবং ভালভাবে কাজ করেছিল। এটি 500 পিপিএমের লক্ষ্যমাত্রার নিচে ধারাবাহিকভাবে 100 পিপিএম দিতে বা নিতে 100 টির মতো গড় দূষিত ঘনত্বকে হ্রাস করে।
পরিশেষে এই পদ্ধতির কাজ হয়েছিল কারণ আমরা 1000 পূর্ববর্তী নমুনা পেয়েছি (নিম্ন বিশ্লেষণাত্মক মানের হলেও: তারা আরও পরিমাপের ত্রুটি করেছিল) তা প্রতিষ্ঠিত করার জন্য যে পরিসংখ্যানগত অনুমান করা হচ্ছে বাস্তবে এই সাইটের পক্ষে ভাল ছিল। যে কিভাবে প্রকার তৃতীয় ত্রুটির জন্য সম্ভাব্য ঘাঁটা হয়।
আপনার বিবেচনার জন্য আরও একটি মোচড়: নিয়ন্ত্রক সংস্থাটি জেনে কখনও মাত্র 3 টি নমুনা ব্যবহারের অনুমোদন দেওয়া হবে না, আমি 5 টি পরিমাপের প্রস্তাব দিয়েছিলাম। এগুলি পুরো সাইটের 25 টি এলোমেলো নমুনা দিয়ে তৈরি করতে হবে , 5 টি গ্রুপে মিশ্রিত ছিল Stat নমুনা। পরীক্ষায় কতগুলি সংখ্যা ব্যবহৃত হয় এবং কীভাবে প্রাপ্ত হয়েছিল তার মধ্যে এটি গুরুত্বপূর্ণ সম্পর্ককে হাইলাইট করে । সংখ্যার সাথে কেবল অ্যালগোরিদম ছাড়াও পরিসংখ্যানগত সিদ্ধান্ত গ্রহণের আরও অনেক কিছুই রয়েছে!
আমার চিরস্থায়ী স্বস্তির জন্য, পাঁচটি সম্মিলিত মানগুলি নিশ্চিত করেছে যে ক্লিনআপ লক্ষ্য পূরণ হয়েছে।
একটি ছোট নমুনার আর একটি পরিণতি হ'ল টাইপ 2 ত্রুটির বৃদ্ধি।
1960 সালে "মনোবিজ্ঞানের পরিসংখ্যানের স্থান" পত্রিকায় সুনির্দিষ্টভাবে প্রদর্শিত হয়েছিল যে ছোট নমুনাগুলি সাধারণত একটি বিন্দু নাল অনুমানকে প্রত্যাখ্যান করতে ব্যর্থ হন। এই অনুমানগুলি হ'ল হাইপোথিসিস যার কিছু পরামিতি সমান হয় এবং বিবেচিত অভিজ্ঞতায় এটি মিথ্যা বলে পরিচিত।
বিপরীতে, খুব বড় নমুনাগুলি টাইপ 1 ত্রুটি বৃদ্ধি করে কারণ পি-মানটি নমুনার আকারের উপর নির্ভর করে, তবে তাত্পর্যপূর্ণতার আলফা স্তরটি স্থির থাকে। এই জাতীয় নমুনার উপর পরীক্ষা সর্বদা নাল অনুমানকে প্রত্যাখ্যান করবে। জনসন এবং ডগলাস (১৯৯৯) দ্বারা ইস্যুটির একটি পর্যালোচনা রাখতে "স্ট্যাটিস্টিকাল তাত্পর্য পরীক্ষার তুচ্ছতা" পড়ুন।
এটি প্রশ্নের সরাসরি উত্তর নয় তবে এই বিবেচনাগুলি পরিপূরক।