আমি জন ক্রুশকের " ডুয়িং বায়েসিয়ান ডেটা অ্যানালাইসিস" স্লাইডগুলি পড়ছি , তবে আসলে টি-টেস্টগুলি এবং / অথবা সম্পূর্ণ নাল-হাইপোথিসিসের তাত্পর্য পরীক্ষার কাঠামোর ব্যাখ্যা সম্পর্কে একটি প্রশ্ন আছে। তিনি যুক্তি দিয়েছিলেন যে পি-মানগুলি সংজ্ঞায়িত কারণ তারা তদন্তকারীর উদ্দেশ্যগুলির উপর নির্ভর করে।
বিশেষত, তিনি দুটি ল্যাবগুলির একটি উদাহরণ (পৃষ্ঠা 3-6) দেন যা দুটি চিকিত্সার তুলনায় অভিন্ন ডেটা সেট সংগ্রহ করে। একটি ল্যাব 12 বিষয় (শর্ত অনুসারে 6) থেকে ডেটা সংগ্রহ করার প্রতিশ্রুতি দেয়, অন্যটি নির্দিষ্ট সময়কালের জন্য ডেটা সংগ্রহ করে, যা 12 টি বিষয়ও উপার্জন করে। স্লাইডগুলি অনুসারে, সমালোচনামূলক মানটি এই দুটি তথ্য সংগ্রহের স্কিমের মধ্যে পার্থক্য করে: প্রাক্তনটির জন্য, তবে জন্য !পি < 0.05 টি সমালোচক = 2.33 টি সমালোচক = 2.45
একটি ব্লগ পোস্ট - যা আমি এখন সন্ধান করতে পারি না - প্রস্তাবিত স্থিতিকালের দৃশ্যে স্বাধীনতার আরও ডিগ্রি রয়েছে যেহেতু তারা 11, 13 বা অন্য কোনও বিষয় থেকে ডেটা সংগ্রহ করতে পারত, যখন স্থির-এন দৃশ্যের দ্বারা সংজ্ঞা, ।
কেউ দয়া করে আমাকে ব্যাখ্যা করতে পারেন:
কেন এই শর্তগুলির মধ্যে সমালোচনামূলক মান পৃথক হবে?
(এটি একটি সমস্যা হিসাবে ধরে নেওয়া) কীভাবে কেউ বিভিন্ন স্টপিং মাপদণ্ডের প্রভাবগুলির জন্য সংশোধন / তুলনা করতে যায়?
আমি জানি যে তাত্পর্যের ভিত্তিতে স্টপিং মানদণ্ড নির্ধারণ করা (উদাহরণস্বরূপ, অবধি নমুনা ) প্রকার 1 ত্রুটির সম্ভাবনা বাড়িয়ে তুলতে পারে, তবে এটি এখানে চলছে বলে মনে হয় না, যেহেতু উভয়ই থামানো নিয়মের ফলাফলের উপর নির্ভর করে না বিশ্লেষণ.