একটি ছোট নমুনা আকার টাইপ 1 ত্রুটি হতে পারে?


21

আমি শিখেছি যে ছোট নমুনা আকার অপর্যাপ্ত শক্তি এবং টাইপ 2 ত্রুটি হতে পারে। তবে আমার অনুভূতি আছে যে ছোট নমুনাগুলি কেবলমাত্র অবিশ্বাস্য হতে পারে এবং সুযোগের ফলে কোনও ধরণের ফলাফলের দিকে নিয়ে যেতে পারে। এটা কি সত্যি?


অপ্রয়োজনীয় গাণিতিক স্বরলিপি সম্পর্কে আমার বিরক্তি আছে, তাই আমি শিরোনাম সম্পাদনা করেছি, আপনি কি দয়া করে পরীক্ষা করে দেখতে পারেন যে আমি এটি পরিবর্তন করে অর্থ পরিবর্তন করি নি?
এমপিটকাস

1
হাইপোথিসিস টেস্টিং (নেইমন-পিয়ারসন পরীক্ষা) এবং তাত্পর্য পরীক্ষা নয় (ফিশার পরীক্ষা) সম্পর্কেও কথা বলতে ভুলবেন না। দ্বিতীয়টিতে ত্রুটির ধারণা না থাকলেও এই পদ্ধতিগুলি সাধারণত মিশ্রিত হয় এবং যথাযথ ব্যবহারগুলি পৃথক হওয়া উচিত কারণ এগুলি বিভিন্ন ধরণের উপসংহারে নিয়ে যায়।
Seb

আপনি যদি তখন অ্যাসিমেটোটিক পরীক্ষা ব্যবহার করেন তবে হ্যাঁ, এটি সম্ভব। অন্যথায়, না - পরীক্ষাটি টাইপ 1 ত্রুটি হার (যেমন ) নিয়ন্ত্রণ করতে সংজ্ঞায়িত করা হয় । α
ম্যাক্রো

তবে এটি সত্য নয়, আপনি যদি দুবার মুদ্রা উল্টাচ্ছেন তবে আপনি 100 বার উল্টানোর সময় থেকে স্কিচ রেজাল্ট (2 একই দিক (100%)) হওয়ার সম্ভাবনা বেশি রয়েছে, সম্ভবত প্রায় 1 / 2, 1/2। এটি কি ছোট আকারটি নির্দেশ করে না যে আপনি টাইপ করতে ভুল করতে পারেন?

উত্তর:


27

একটি সাধারণ নীতি হিসাবে, ছোট নমুনা আকার টাইপ আই ত্রুটি হার বৃদ্ধি করবে না যে সাধারণ কারণে পরীক্ষাটি টাইপ 1 হার নিয়ন্ত্রণের ব্যবস্থা করা হয়েছে। (বিচ্ছিন্ন ফলাফলের সাথে যুক্ত ছোট প্রযুক্তিগত ব্যতিক্রম রয়েছে, যা নামমাত্র কারণ হতে পারে টাইপ আই রেট বিশেষত ছোট নমুনার আকারের সাথে অর্জন না করতে পারে))

একটি গুরুত্বপূর্ণ নীতি আছে রয়েছে: যদি আপনার পরীক্ষার গ্রহণযোগ্য আকার (= নামমাত্র টাইপ আই রেট) থাকে এবং আপনি যে প্রভাবটি খুঁজছেন তার জন্য গ্রহণযোগ্য শক্তি রয়েছে, তবে নমুনার আকারটি ছোট হলেও তা ঠিক আছে।

বিপদ হ'ল আমরা যদি অন্যথায় পরিস্থিতি সম্পর্কে সামান্যই জানি - সম্ভবত এগুলি আমাদের কাছে থাকা সমস্ত ডেটা হয় - তবে আমরা "টাইপ তৃতীয়" ত্রুটিগুলি সম্পর্কে উদ্বিগ্ন হতে পারি: এটি মডেলের ভুল স্পেসিফিকেশন। তারা ছোট নমুনা সেট সঙ্গে চেক করা কঠিন হতে পারে।

ধারণাগুলির ইন্টারপ্লেটির ব্যবহারিক উদাহরণ হিসাবে আমি একটি গল্প ভাগ করব। অনেক আগে আমাকে পরিবেশগত পরিষ্কারের বিষয়টি নিশ্চিত করার জন্য একটি নমুনার আকারের সুপারিশ করতে বলা হয়েছিল। আমাদের কোনও ডেটা থাকার আগে এটি প্রাক-পরিচ্ছন্নতার পর্যায়ে ছিল। আমার পরিকল্পনা 1000 বিশ্লেষণের জন্য তাই নমুনার যে বলা হবে (প্রতিষ্ঠা করতে যে যথেষ্ট মাটি প্রতিটি অবস্থানে সরিয়ে ফেলা হয়েছে) পরিষ্করণ সময় প্রাপ্ত সংক্রামকের ঘনত্ব পোস্ট পরিষ্করণ গড় এবং ভ্যারিয়েন্স মূল্যায়ন করার। তারপরে (ব্যাপকভাবে সরলকরণের জন্য), আমি বলেছিলাম যে আমরা নির্ধারিত শক্তি এবং পরীক্ষার আকারের উপর ভিত্তি করে - পাঠ্যপুস্তকের সূত্রটি ব্যবহার করব যা পরিষ্কার-পরিচ্ছন্নতা সফল প্রমাণিত করতে ব্যবহৃত হবে এমন স্বতন্ত্র নিশ্চিতকরণের নমুনার সংখ্যা নির্ধারণ করতে।

এইটি স্মরণীয় করে তুলেছে যে পরিষ্কারটি শেষ হওয়ার পরে সূত্রটি কেবলমাত্র 3 টি নমুনা ব্যবহার করতে বলেছে। হঠাৎ আমার সুপারিশটি খুব বিশ্বাসযোগ্য মনে হয়নি!

মাত্র 3 টি স্যাম্পল প্রয়োজনের কারণ হ'ল ক্লিনআপটি আগ্রাসী ছিল এবং ভালভাবে কাজ করেছিল। এটি 500 পিপিএমের লক্ষ্যমাত্রার নিচে ধারাবাহিকভাবে 100 পিপিএম দিতে বা নিতে 100 টির মতো গড় দূষিত ঘনত্বকে হ্রাস করে।

পরিশেষে এই পদ্ধতির কাজ হয়েছিল কারণ আমরা 1000 পূর্ববর্তী নমুনা পেয়েছি (নিম্ন বিশ্লেষণাত্মক মানের হলেও: তারা আরও পরিমাপের ত্রুটি করেছিল) তা প্রতিষ্ঠিত করার জন্য যে পরিসংখ্যানগত অনুমান করা হচ্ছে বাস্তবে এই সাইটের পক্ষে ভাল ছিল। যে কিভাবে প্রকার তৃতীয় ত্রুটির জন্য সম্ভাব্য ঘাঁটা হয়।

আপনার বিবেচনার জন্য আরও একটি মোচড়: নিয়ন্ত্রক সংস্থাটি জেনে কখনও মাত্র 3 টি নমুনা ব্যবহারের অনুমোদন দেওয়া হবে না, আমি 5 টি পরিমাপের প্রস্তাব দিয়েছিলাম। এগুলি পুরো সাইটের 25 টি এলোমেলো নমুনা দিয়ে তৈরি করতে হবে , 5 টি গ্রুপে মিশ্রিত ছিল Stat নমুনা। পরীক্ষায় কতগুলি সংখ্যা ব্যবহৃত হয় এবং কীভাবে প্রাপ্ত হয়েছিল তার মধ্যে এটি গুরুত্বপূর্ণ সম্পর্ককে হাইলাইট করে সংখ্যার সাথে কেবল অ্যালগোরিদম ছাড়াও পরিসংখ্যানগত সিদ্ধান্ত গ্রহণের আরও অনেক কিছুই রয়েছে!

আমার চিরস্থায়ী স্বস্তির জন্য, পাঁচটি সম্মিলিত মানগুলি নিশ্চিত করেছে যে ক্লিনআপ লক্ষ্য পূরণ হয়েছে।


1
(+1) আক্রমণাত্মক ক্লিনআপ এবং টাইপ তৃতীয় ত্রুটি সম্পর্কে দুর্দান্ত গল্প , এটি যদি অর্থনৈতিক সময় সিরিজের জন্যও প্রাসঙ্গিক হয় nice নির্বোধ মডেল বা কম শব্দ অনুপাতের সাথে ছোট মডেলের আকারের আইএমএইচও সবচেয়ে বড় সমস্যা হবে না (খুব শোরগোলের সম্ভাবনা স্বতন্ত্র বৃহত নমুনা ডেটার বিশাল সংখ্যার তুলনায় এমনকি মূল উপাদানগুলিও এগুলি শক্ত)।
দিমিত্রিজ সেলভ

1
+1, যারা প্রথম অনুচ্ছেদে উল্লিখিত "জটিল ফলাফলগুলির সাথে যুক্ত প্রযুক্তিগত ব্যতিক্রমগুলি" আরও বুঝতে আগ্রহী তাদের জন্য আমি এখানে তাদের নিয়ে আলোচনা করছি: পি-মান, তাত্পর্য স্তর এবং বিপরীতে টাইপ করার তুলনা এবং বিপরীতে
গুং - মনিকা পুনরায়

1
+1, কী তথ্য ব্যবহার ব্যতীত আপনি দরকারী নমুনার আকারে বন্য ছুরিকাঘাত করতে পারবেন না তার দুর্দান্ত উদাহরণ।
ফ্রেইয়া হ্যারিসন

0

একটি ছোট নমুনার আর একটি পরিণতি হ'ল টাইপ 2 ত্রুটির বৃদ্ধি।

1960 সালে "মনোবিজ্ঞানের পরিসংখ্যানের স্থান" পত্রিকায় সুনির্দিষ্টভাবে প্রদর্শিত হয়েছিল যে ছোট নমুনাগুলি সাধারণত একটি বিন্দু নাল অনুমানকে প্রত্যাখ্যান করতে ব্যর্থ হন। এই অনুমানগুলি হ'ল হাইপোথিসিস যার কিছু পরামিতি সমান হয় এবং বিবেচিত অভিজ্ঞতায় এটি মিথ্যা বলে পরিচিত।

বিপরীতে, খুব বড় নমুনাগুলি টাইপ 1 ত্রুটি বৃদ্ধি করে কারণ পি-মানটি নমুনার আকারের উপর নির্ভর করে, তবে তাত্পর্যপূর্ণতার আলফা স্তরটি স্থির থাকে। এই জাতীয় নমুনার উপর পরীক্ষা সর্বদা নাল অনুমানকে প্রত্যাখ্যান করবে। জনসন এবং ডগলাস (১৯৯৯) দ্বারা ইস্যুটির একটি পর্যালোচনা রাখতে "স্ট্যাটিস্টিকাল তাত্পর্য পরীক্ষার তুচ্ছতা" পড়ুন।

এটি প্রশ্নের সরাসরি উত্তর নয় তবে এই বিবেচনাগুলি পরিপূরক।


বড় নমুনা এবং টাইপ প্রথম ত্রুটি ইস্যু করার জন্য +1
জোশ হেমেন

6
-1, "খুব বড় নমুনাগুলি টাইপ 1 ত্রুটি বাড়ায়" মন্তব্যটি ভুল। আপনি পরিসংখ্যানগত তাত্পর্য এবং ব্যবহারিক তাত্পর্যকে বিভ্রান্ত করতে পারেন , এমন পরিস্থিতিতে এমন পরিস্থিতি উপস্থিত হতে পারে যেখানে সত্যিকারের প্রভাবটি ঠিক 0 নয়, তবে এত ছোট যে এটি অপ্রয়োজনীয়, এবং আমরা ব্যবহারিক উদ্দেশ্যে নালকে 'সত্য' বিবেচনা করব । এই ক্ষেত্রে, নালটি সময়ের (5)% এরও বেশি প্রত্যাখ্যান করা হবে, এবং আরও প্রায়ই ডাব্লু / ক্রমবর্ধমান এন। তবে, কঠোরভাবে বলতে গেলে, নাল অনুমানটি যে প্রকৃত প্রভাবটি ঠিক 0, শর্ত দ্বারা, মিথ্যা দ্বারা। সুতরাং, এই প্রত্যাখ্যানগুলি আসলে আমি ত্রুটিগুলি টাইপ করে না।
গুং - মনিকা পুনরায়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.