প্যারামেট্রিক হাইপোথিসিস পরীক্ষাগুলি কেন এলোমেলো নমুনা গ্রহণ করে?


12

জেড, টি, এবং আরও অনেকের মতো পরীক্ষাগুলি ধরে নেওয়া হয় যে ডেটা একটি এলোমেলো নমুনার উপর ভিত্তি করে। কেন?

মনে করুন যে আমি পরীক্ষামূলক গবেষণা করছি, যেখানে আমি বাহ্যিকের চেয়ে অভ্যন্তরীণ বৈধতার জন্য অনেক বেশি যত্নশীল। সুতরাং, যদি আমার নমুনাটি কিছুটা পক্ষপাতদুষ্ট হতে পারে তবে ঠিক আছে, আমি পুরো জনগোষ্ঠীর জন্য অনুমানটি অনুমান না করার জন্য গ্রহণ করেছি। এবং গ্রুপিংটি এখনও এলোমেলো থাকবে, অর্থাত্, আমি নমুনা অংশগ্রহণকারীদের সুবিধার্থে বেছে নেব, তবে আমি এলোমেলোভাবে তাদের বিভিন্ন গ্রুপে নিয়োগ করব।

কেন আমি শুধু এই অনুমানটিকে উপেক্ষা করতে পারি না?


যদি নমুনা কৌশলটি পক্ষপাতদ্বয়ের পরিচয় দেয়, তবে এটি 'এলোমেলো' নয়। যদি এটি কোনও পক্ষপাতিত্ব না প্রবর্তন করে তবে এটি 'এলোমেলো' (র্যান্ডম এর কিছু সংজ্ঞার জন্য ;-))। আমার স্যাম্পলিংয়ের স্কিম রয়েছে যেগুলি প্রতি কাউন্টার নমুনায় মিলে যাওয়া নমুনার আকার তৈরি করতে প্রতি 7 তম নমুনা গ্রহণ করে। তবে আমি জানতাম যে সেই নির্বাচনের কোনও বিশেষ দিক নেই, তাই নন-র্যান্ডম স্যাম্পলিং প্রক্রিয়া হিসাবে কার্যকরভাবে এলোমেলো মনে করা যেতে পারে। এটি লটারিতে 1,2,3,4,5,6 বল বাছাইয়ের সমান। এটি অন্য যে কোনও ক্রমের মতোই এলোমেলো।
ফিলিপ ওকলে

1
@ ফিলিপ ওকলে: লটারিতে 1,2,3,4,5,6 বল বাছাই করা আপনাকে অন্য যে কোনও নির্বাচনের মতো জয়ের সুযোগ দেয় তবে আপনার প্রত্যাশিত জয় হ্রাস হওয়ায় আপনি অন্যদের সাথে পুরস্কার ভাগাভাগির সম্ভাবনা বেশি থাকায় একই ধারণা ছিল
হেনরি

1
সিস্টেমেটিক নমুনা, যেমন @ ফিলিপ দ্বারা বর্ণিত, প্রায়শই বিশ্লেষণ করা হয় যেন এটি সাধারণ এলোমেলো নমুনা তৈরি করে, তবে এতে সমস্যা রয়েছে। উদাহরণস্বরূপ, আপনি যদি প্রতিদিন কোনও উত্পাদন প্রক্রিয়া পরিমাপ করতে থাকেন এবং প্রতি সপ্তম পরিমাপের নমুনা তৈরি করেন, তবে আপনি আপনার ফলাফলকে সপ্তাহের কার্যদিবসের সাথে বিভ্রান্ত করতে বাধ্য হবেন, যেহেতু (স্পষ্টতই) আপনি একই দিনে নমুনা নিচ্ছেন প্রতি সপ্তাহ. এলোমেলো নমুনাগুলি নিয়ে কাজ করার সময় আপনাকে এ জাতীয় সূক্ষ্মতার কথা চিন্তা করতে এবং তাদের সূত্রপাত করার জন্য আরও কঠোর হতে হবে।
হোবল

1
নিঃসন্দেহে এই বিষয়গুলি সম্পর্কে একটি অবশ্যই কঠোর (এবং ব্যাপকভাবে) চিন্তা করতে হবে! আমার ক্ষেত্রে আমার কয়েক ঘন্টা ভিডিও ছিল, কয়েকশ ইভেন্টের মধ্যে, এর মধ্যে দীর্ঘ ব্যবধান রয়েছে, তাই সাধারণ লজিস্টিক রিগ্রেশন (প্রতিটি ফ্রেম স্বাধীনভাবে বিবেচিত হয়, ফ্রেমের মধ্যে সামান্য পরিবর্তন হয়) এর জন্য অ ইভেন্ট ইভেন্টের ডেটা আকার হ্রাস করা প্রয়োজন, তাই প্রচুর ইভেন্টহীন ফ্রেম বাদ দেওয়া যুক্তিসঙ্গত ছিল। সময়ক্রমের দিকটি আলাদাভাবে বিবেচনা করা হত।
ফিলিপ ওকলে

1
@ ফিলিপ মজার বিষয়, প্রায় একই সময়ে আপনি এলোমেলোতা সম্পর্কে মন্তব্য লিখেছিলেন, এনআইএসটি একটি প্রেস বিজ্ঞপ্তি দাবি করে যে এটি করেছেপ্রকৃতির আজকের (4 এপ্রিল 2018) ইস্যুতে একটি অ্যাকাউন্ট উপস্থিত হবে ।
whuber

উত্তর:


18

আপনি যদি আপনার প্রকৃত নমুনার চেয়ে বৃহত্তর গোষ্ঠীর জন্য কোনও অনুমান করছেন না, তবে প্রথম স্থানে পরিসংখ্যান পরীক্ষার কোনও প্রয়োগ নেই এবং "পক্ষপাত" প্রশ্নটি উত্থাপিত হয় না। এই ক্ষেত্রে আপনি কেবলমাত্র আপনার নমুনার বর্ণনামূলক পরিসংখ্যান গণনা করবেন, যা জানা যায় are একইভাবে, এই ক্ষেত্রে মডেল "বৈধতা" নিয়ে কোনও প্রশ্ন নেই - আপনি কেবল পরিবর্তনশীল পর্যবেক্ষণ করছেন এবং তাদের মানগুলি রেকর্ড করছেন এবং সেই মানগুলির দিকগুলি বর্ণনা করছেন।

একবার আপনি আপনার নমুনার বাইরে যাওয়ার সিদ্ধান্ত নিয়েছেন, কিছু বৃহত্তর গোষ্ঠী সম্পর্কে ধারণা তৈরি করার পরে আপনার পরিসংখ্যানের প্রয়োজন হবে এবং আপনাকে নমুনা পক্ষপাত ইত্যাদির মতো বিষয়গুলি বিবেচনা করতে হবে এই অ্যাপ্লিকেশনটিতে, এলোমেলো নমুনা নির্ভরযোগ্য হয়ে উঠতে সহায়তা করার জন্য একটি দরকারী সম্পত্তি হয়ে ওঠে আগ্রহের বিস্তৃত গোষ্ঠী অনুসারে। আপনার যদি এলোমেলোভাবে নমুনা না থাকে (এবং জনসংখ্যার ভিত্তিতে আপনার নমুনাগুলির সম্ভাবনাগুলি আপনি জানেন না) তবে জনসংখ্যা সম্পর্কে নির্ভরযোগ্য তথ্য নির্ধারণ করা শক্ত / অসম্ভব হয়ে ওঠে।


5

সত্যিকারের বৈজ্ঞানিক গবেষণায়, সত্যিকারের এলোমেলো নমুনা থেকে আসা ডেটা পাওয়া খুব বিরল। ডেটা প্রায় সর্বদা সুবিধার নমুনা। এটি সাধারণত কোন জনসংখ্যাকে আপনি সাধারণ করতে পারেন তা প্রভাবিত করে। এটি বলেছিল, এমনকি যদি তারা কোনও সুবিধাযুক্ত নমুনাও ছিল তবে সেগুলি কোথাও থেকে এসেছে, আপনি কোথায় এবং সীমাবদ্ধতাগুলি বোঝায় সে সম্পর্কে আপনাকে পরিষ্কার হওয়া দরকার। তাহলে আপনি কি সত্যিই মনে করেন আপনার ডেটা, কিছু প্রতিনিধি না হন তবে আপনার অধ্যয়ন কোনো স্তরের উপর উপযুক্ত হতে যাচ্ছে না, কিন্তু যে সম্ভবত সত্য নয় 1 । সুতরাং, আপনার নমুনাগুলি কোথাও থেকে আঁকা হিসাবে বিবেচনা করা এবং কমপক্ষে হেজেড বা যোগ্য অর্থে এই স্ট্যান্ডার্ড পরীক্ষাগুলি ব্যবহার করা যুক্তিসঙ্গত।

পরীক্ষার একটি ভিন্ন দর্শন আছে, তবে আমাদের যুক্তিযুক্ত যে আমাদের সেই অনুমানগুলি এবং তাদের উপর নির্ভরশীল পরীক্ষাগুলি থেকে দূরে সরে যাওয়া উচিত। টুকি এটির একজন উকিল ছিলেন। পরিবর্তে, বেশিরভাগ পরীক্ষামূলক গবেষণা বৈধ হিসাবে বিবেচিত হয় (অভ্যন্তরীণভাবে) কারণ অধ্যয়ন ইউনিট (যেমন, রোগীরা) এলোমেলোভাবে বাহুতে অর্পণ করা হয়েছিল। এটি প্রদত্ত, আপনি অনুমতিপত্র পরীক্ষা ব্যবহার করতে পারেন , যা বেশিরভাগই ধরে নেয় যে র্যান্ডমাইজেশন সঠিকভাবে হয়েছিল। এ সম্পর্কে খুব বেশি উদ্বেগ প্রকাশ করার পাল্টা হ'ল ক্রমশক্তি পরীক্ষাগুলি সাধারণত সম্পর্কিত শাস্ত্রীয় পরীক্ষার মতো একই জিনিসটি প্রদর্শন করবে এবং সম্পাদন করার জন্য আরও কাজ করবে। সুতরাং আবার, স্ট্যান্ডার্ড পরীক্ষা গ্রহণযোগ্য হতে পারে।

১. এই রেখাগুলি আরও জানার জন্য, আমার উত্তরটি এখানে পড়তে সাহায্য করতে পারে: একটি গবেষণায় জনসংখ্যা এবং নমুনা চিহ্নিত করা


3

জেড, টি, এবং আরও বেশ কয়েকটির মতো পরীক্ষাগুলি সম্পর্কিত পরিসংখ্যানগুলির স্যাম্পলিং বিতরণের উপর ভিত্তি করে। সাধারণভাবে ব্যবহৃত সেই নমুনা বিতরণগুলি এলোমেলো নমুনা থেকে গণনা করা পরিসংখ্যানগুলির জন্য সংজ্ঞায়িত করা হয়।

অ-র্যান্ডম স্যাম্পলিংয়ের জন্য কখনও কখনও প্রাসঙ্গিক নমুনা বিতরণ করা সম্ভব হতে পারে তবে সাধারণভাবে এটি সম্ভবত সম্ভব নয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.