জনসংখ্যার নমুনা যখন "হয়" তখন পরিসংখ্যানগত অনুমিতি


47

কল্পনা করুন যে আপনাকে বার্ষিক প্রদত্ত পরীক্ষা দেয় এমন প্রার্থীর সংখ্যা সম্পর্কে রিপোর্টিং করতে হবে। লক্ষ্য হিসাবে জনসংখ্যার সুনির্দিষ্টতার কারণে বিস্তৃত জনসংখ্যার পক্ষে সাফল্যের পরিলক্ষিত%% অনুমান করা বরং কঠিন মনে হয়। সুতরাং আপনি বিবেচনা করতে পারেন যে এই ডেটাগুলি পুরো জনসংখ্যার প্রতিনিধিত্ব করে।

পরীক্ষাগুলির ফলাফলগুলি কি ইঙ্গিত দেয় যে পুরুষ এবং স্ত্রীলোকের অনুপাত সত্যই সঠিক? আপনি একটি সম্পূর্ণ জনসংখ্যার (এবং একটি নমুনা নয়) বিবেচনা করার কারণে একটি পরীক্ষা পর্যবেক্ষণ করা এবং তাত্ত্বিক অনুপাতগুলি কি সঠিক হিসাবে দেখা যাচ্ছে?

উত্তর:


31

এ সম্পর্কে বিভিন্ন মতামত থাকতে পারে, তবে আমি জনসংখ্যার উপাত্তকে একটি নমুনা হিসাবে বিবেচনা করব এবং একটি অনুমান জনসংখ্যা অনুমান করব, তারপরে সাধারণ উপায়ে সূচনা করব। এ সম্পর্কে চিন্তাভাবনার এক উপায় হ'ল সংগৃহীত ডেটা, "জনসংখ্যা" বিতরণের জন্য একটি অন্তর্নিহিত ডেটা উত্পাদন প্রক্রিয়া দায়বদ্ধ।

আপনার বিশেষ ক্ষেত্রে, এটি আরও বেশি অর্থবোধ করতে পারে যেহেতু ভবিষ্যতে আপনার সংস্থান থাকবে। তারপরে আপনার জনসংখ্যা সত্যই ভবিষ্যতেও পরীক্ষা দেয় এমন সমাহার। এইভাবে, আপনার যদি এক বছরেরও বেশি সময় ধরে ডেটা থাকে তবে আপনি সময় ভিত্তিক বিভিন্নতার জন্য অ্যাকাউন্ট করতে পারেন বা আপনার ত্রুটি মডেলের মাধ্যমে সুপ্ত কারণগুলির জন্য অ্যাকাউন্ট করার চেষ্টা করতে পারেন। সংক্ষেপে, আপনি আরও বেশি ব্যাখ্যামূলক শক্তি দিয়ে আরও সমৃদ্ধ মডেল বিকাশ করতে পারেন।


4
এ গেলম্যানের কাছ থেকে এই পোস্টটি সবেমাত্র এসেছে, একটি নমুনার পরিবর্তে পুরো জনসংখ্যা বিশ্লেষণ করার সময় পরিসংখ্যান বিশ্লেষণ কীভাবে পৃথক হবে? , j.mp/cZ1WSI । "অতি-জনসংখ্যার" ধারণার বিষয়ে মতামতকে ডাইভার করার বিষয়ে একটি ভাল সূচনা পয়েন্ট।
chl

2
@ সিএইচএল: আকর্ষণীয় - আমাকে মনে করিয়ে দেয় যে জেলম্যানের স্নাতক / সুপার জনসংখ্যার অনুমানের সাথে আনোভা সম্পর্কিত গবেষণাপত্রে স্থির-বা এলোমেলো-প্রভাবগুলির সাথে তুলনাযোগ্য আলোচনা হয়েছিল [ স্টাটকোলম্বিয়া.ইডু / এজেলম্যান / রিসার্চ / প্রকাশিত /econanova3.pdf ]।
Ars

+1 আমি আবার এটিতে ফিরে এসেছি (গুগলের মাধ্যমে)। আমি মনে করি যে আপনার উত্তর স্পট আছে।
শেন

25

প্রকৃতপক্ষে, আপনি যদি সত্যিই ইতিবাচক হন তবে আপনার পুরো জনসংখ্যা রয়েছে, এমনকি পরিসংখ্যানগুলিতে যাওয়ার দরকার নেই। তারপরে আপনি ঠিক জানেন যে পার্থক্যটি কতটা বড় এবং এটির আর পরীক্ষা করার কোনও কারণ নেই। একটি শাস্ত্রীয় ভুল পরিসংখ্যানিক তাত্পর্যকে "প্রাসঙ্গিক" তাত্পর্য হিসাবে ব্যবহার করছে। আপনি জনসংখ্যার নমুনা নিলে পার্থক্যটি এটি it

অন্যদিকে, আপনি যদি আপনার অনুমানকে সংশোধন করেন তবে প্রার্থীদের সম্ভাব্য প্রার্থীদের একটি নমুনা হিসাবে দেখা যেতে পারে, যা পরিসংখ্যানগত পরীক্ষার অনুমতি দেয়। এই ক্ষেত্রে, আপনি টেস্টে পুরুষ এবং মহিলা পৃথক পৃথক কিনা তা আপনি সাধারণভাবে পরীক্ষা করতেন।

যেমনটি বলেছে, আপনি একাধিক বছরের পরীক্ষা ব্যবহার করতে পারেন এবং এলোমেলো ফ্যাক্টর হিসাবে সময় যুক্ত করতে পারেন। তবে যদি আপনার আগ্রহটি এই নির্দিষ্ট পরীক্ষায় এই প্রার্থীদের মধ্যে পার্থক্যগুলির মধ্যে থাকে তবে আপনি সাধারণীকরণটি ব্যবহার করতে পারবেন না এবং পরীক্ষাটি নির্বুদ্ধিতা।


15

Ditionতিহ্যগতভাবে, সম্ভাব্যতার নমুনাগুলি এবং নমুনা ত্রুটির প্রকৃতির প্রসঙ্গে পরিসংখ্যানগত অনুমান শেখানো হয়। এই মডেলটি তাৎপর্যের পরীক্ষার ভিত্তি। যাইহোক, সুযোগ থেকে পদ্ধতিগত প্রস্থান মডেল করার অন্যান্য উপায় আছে এবং এটি প্রমাণিত হয় যে আমাদের প্যারামেট্রিক (স্যাম্পলিং ভিত্তিক) পরীক্ষাগুলি এই বিকল্পগুলির ভাল আনুমানিক রূপ ধারণ করে।

অনুমানের প্যারামেট্রিক পরীক্ষাগুলি সম্ভাব্য ত্রুটির অনুমান উত্পাদন করতে স্যাম্পলিং তত্ত্বের উপর নির্ভর করে। যদি কোনও জনসংখ্যার থেকে প্রদত্ত আকারের নমুনা নেওয়া হয় তবে নমুনা দেওয়ার পদ্ধতিগত প্রকৃতির জ্ঞান পরীক্ষার এবং আত্মবিশ্বাসের অন্তরগুলিকে অর্থবহ করে তোলে। একটি জনসংখ্যার সাথে, নমুনা তত্ত্বটি কেবল প্রাসঙ্গিক নয় এবং পরীক্ষাগুলি প্রচলিত অর্থে অর্থবোধক নয়। অনুমানটি অকেজো, অনুমান করার মতো কিছুই নেই, কেবল জিনিস আছে ... প্যারামিটারটি নিজেই।

কেউ কেউ বর্তমান জনগণনা প্রতিনিধিত্ব করে এমন সুপার-জনসংখ্যার প্রতি আহ্বান জানিয়ে এটিকে ঘিরে। আমি এই আপিলগুলি অবিস্মরণীয় বলে মনে করি - প্যারামেট্রিক পরীক্ষাগুলি সম্ভাব্যতা নমুনা এবং এর বৈশিষ্ট্যগুলির ভিত্তিতে তৈরি করা হয়। একটি নির্দিষ্ট সময়ে একটি জনসংখ্যা সময় এবং স্থানের সাথে বৃহত্তর জনসংখ্যার নমুনা হতে পারে। তবে, আমি কোনওভাবেই দেখতে পাচ্ছি না যে কেউ বৈধভাবে এই তর্ক করতে পারে যে এটি এলোমেলো (বা আরও সাধারণভাবে কোনও সম্ভাবনার কোনও ফর্ম রূপ) নমুনা। সম্ভাবনার নমুনা ছাড়াই, নমুনা তত্ত্ব এবং পরীক্ষার theতিহ্যগত যুক্তি কেবল প্রযোজ্য নয়। আপনি সুবিধার নমুনার ভিত্তিতে ঠিক পাশাপাশি পরীক্ষাও করতে পারেন।

স্পষ্টতই, একটি জনসংখ্যা ব্যবহার করার সময় পরীক্ষা গ্রহণ করতে, আমাদের নমুনা পদ্ধতিতে সেই পরীক্ষাগুলির ভিত্তিতে সরবরাহ করতে হবে। এটি করার একটি উপায় হ'ল আমাদের নমুনা-তাত্ত্বিক পরীক্ষার - যেমন টি, জেড, এবং এফ - এবং র্যান্ডমাইজেশন প্রক্রিয়াগুলির মধ্যে ঘনিষ্ঠ সংযোগটি সনাক্ত করা। র্যান্ডমাইজেশন পরীক্ষাগুলি হাতে থাকা নমুনার উপর ভিত্তি করে। আমি যদি পুরুষ এবং স্ত্রীদের আয়ের তথ্য সংগ্রহ করি তবে সম্ভাবনা মডেল এবং আমাদের ত্রুটির অনুমানের ভিত্তিতে প্রকৃত ডেটা মানগুলির বারবার এলোমেলো বরাদ্দ হয়। আমি এই র‌্যান্ডমাইজেশনের উপর ভিত্তি করে গোষ্ঠীগুলির মধ্যে পরিলক্ষিত পার্থক্যগুলিকে একটি বিতরণের সাথে তুলনা করতে পারি। (আমরা পরীক্ষার সময় সর্বদা এটি করি, যাইহোক, যেখানে জনসংখ্যার মডেল থেকে এলোমেলো নমুনা খুব কমই উপযুক্ত)।

এখন, দেখা গেছে যে নমুনা-তাত্ত্বিক পরীক্ষাগুলি প্রায়শই এলোমেলোকরণ পরীক্ষার ভাল অনুমান। সুতরাং, শেষ পর্যন্ত, আমি মনে করি জনসংখ্যা থেকে প্রাপ্ত পরীক্ষাগুলি এই কাঠামোর মধ্যে দরকারী এবং অর্থবহ এবং নমুনা-ভিত্তিক পরীক্ষার মতোই সুযোগের প্রকরণের থেকে পদ্ধতিগতভাবে পৃথক করতে সহায়তা করতে পারে। সেখানে যাওয়ার জন্য ব্যবহৃত যুক্তিটি কিছুটা আলাদা তবে এটি ব্যবহারিক অর্থ এবং পরীক্ষার ব্যবহারের উপর খুব বেশি প্রভাব ফেলেনি। অবশ্যই, এটি আমাদের সমস্ত আধুনিক কম্পিউটিং পাওয়ারের সাথে সহজেই উপলব্ধ হওয়ার সাথে সাথে কেবল এলোমেলোকরণ এবং ক্রমবর্ধমান পরীক্ষাগুলি ব্যবহার করা আরও ভাল।


3
বুদ্ধিমান আলোচনার জন্য +1; যদিও কয়েক পয়েন্ট। জনসংখ্যা বিশ্লেষণের জন্য অনুমানমূলক যন্ত্রপাতি অনুপলব্ধ, তবে অনেক মডেলিংয়ের ক্ষেত্রে আমি প্রশ্ন করি যে কারও কাছে জনসংখ্যার ডেটা শুরু হওয়া উচিত কিনা - প্রায়শই, গর্তগুলিকে পোঁকানো খুব কঠিন নয়। সুতরাং এটি সর্বদা একটি সুপার জনসংখ্যার কাছে অনুমান স্থাপনের উপায় হিসাবে আবেদন নয় । "সুপার জনসংখ্যা" এর চেয়ে আরও ভাল উপায় হ'ল ডেটা উত্পন্ন প্রক্রিয়াটি উত্পাদনশীল হিসাবে ধরে নেওয়া যায়, উদাহরণস্বরূপ, বছরের পর বছর পরীক্ষায় প্রশ্নাবলীর সাহায্য নেওয়া। সেখানেই স্টোকাস্টিক উপাদানটি উত্থিত হয়।
Ars

2
জনসংখ্যা বিশ্লেষণের জন্য অনুমানমূলক যন্ত্রপাতিটির অভাব বাদে আমি এখানে কোনও মতবিরোধ হিসাবে মনে করি না। র্যান্ডমাইজেশন পরীক্ষা জনসংখ্যার জন্য প্রযোজ্য এবং যথাযথভাবে পরীক্ষা করতে পারে যে ডেটা উত্পন্নকরণ প্রক্রিয়াটি সম্ভবত একটি নিয়মিত উত্পাদন প্রক্রিয়া বনাম একটি এলোমেলো উত্পন্ন প্রক্রিয়ার কারণে হয় কিনা। এগুলি এলোমেলো নমুনা গ্রহণ করে না এবং পদ্ধতিগত পরিবর্তনের বিপরীতে সুযোগের পরিবর্তে সরাসরি পরীক্ষা হয়। আমাদের প্রচলিত পরীক্ষাগুলি তাদের পক্ষে বেশ ভালভাবে দাঁড়ায়।
ব্রেট

এটাই সত্য: "অনুমানমূলক যন্ত্রের অভাব"। আমার দিক থেকে নির্লিপ্ত কথা বলা, বিশেষত যেহেতু আপনি আপনার উত্তরে এলোমেলোকরণ পরীক্ষাগুলি সম্পর্কে যে বিষয়টি করেছেন তা আমি পছন্দ করেছি।
Ars

দুঃখিত। আমি কীভাবে ক্রমশক্তি গণনা করব এবং আমি তাদের জন্য কী সিদ্ধান্তে সক্ষম হব তা বুঝতে আমার অসুবিধা আছে।
pbneau

বুটস্ট্র্যাপিং কি বৈধ বিকল্প নয়? বুটস্ট্র্যাপিং কীভাবে এই অনুমানগুলির যে কোনও একটির প্রয়োজনীয়তার সমাধান করতে ব্যর্থ হয়?
চেরনফ

3

ধরে নিন ফলাফলগুলি ইঙ্গিত দেয় যে প্রার্থীরা জেন্ডার লাইনের সাথে পৃথক রয়েছে। উদাহরণস্বরূপ, পরীক্ষাগুলি সম্পন্নকারীদের অনুপাত নিম্নরূপ: 40% মহিলা এবং 60% পুরুষ। সুস্পষ্ট পরামর্শ দেওয়ার জন্য, 40% 60% এর চেয়ে আলাদা। এখন কী গুরুত্বপূর্ণ তা সিদ্ধান্ত নেওয়া: 1) আপনার আগ্রহের জনসংখ্যা; 2) আপনার পর্যবেক্ষণগুলি আগ্রহের জনসংখ্যার সাথে কীভাবে সম্পর্কিত। এই দুটি বিষয় সম্পর্কে কিছু বিশদ এখানে রইল:

  1. যদি আপনার আগ্রহের জনসংখ্যা কেবলমাত্র পর্যবেক্ষিত প্রার্থী হয় (উদাহরণস্বরূপ, ২০১০ সালে যে ১০০ জন পরীক্ষার্থী একটি বিশ্ববিদ্যালয়ে আবেদন করেছিলেন), আপনার পরিসংখ্যানগত তাত্পর্য পরীক্ষার রিপোর্ট করার দরকার নেই। এটি কারণ আপনার আগ্রহের জনসংখ্যা সম্পূর্ণ নমুনাযুক্ত ছিল ... আপনার যত্ন নেওয়া সমস্ত হ'ল 100 প্রার্থী যার উপরে আপনার সম্পূর্ণ ডেটা রয়েছে। অর্থাৎ, 60% হ'ল ফুল স্টপ, 40% এর থেকে আলাদা। এই ধরণের প্রশ্নের উত্তরটি হ'ল, প্রোগ্রামটিতে প্রয়োগ হওয়া 100 জনসংখ্যার মধ্যে কি লিঙ্গগত পার্থক্য রয়েছে? এটি একটি বর্ণনামূলক প্রশ্ন এবং উত্তর হ্যাঁ।

  2. তবে বিভিন্ন সেটিংসে কী ঘটবে তা নিয়ে অনেক গুরুত্বপূর্ণ প্রশ্ন are এটি হ'ল অনেক গবেষক অতীত সম্পর্কে প্রবণতা নিয়ে আসতে চান যা আমাদের ভবিষ্যতের ভবিষ্যদ্বাণী করতে (এবং তারপরে পরিকল্পনা করতে) সহায়তা করে। এক্ষেত্রে উদাহরণস্বরূপ প্রশ্নটি হবে, ভবিষ্যতে প্রার্থীদের পরীক্ষাগুলি লিঙ্গের ধারায় কীভাবে আলাদা হতে পারে? উপরের # 1 দৃশ্যের তুলনায় আগ্রহের জনসংখ্যা আরও বিস্তৃত। এই মুহুর্তে, একটি গুরুত্বপূর্ণ প্রশ্ন জিজ্ঞাসা করা হল: আপনার পর্যবেক্ষণের ডেটা ভবিষ্যতের প্রবণতার প্রতিনিধি হওয়ার সম্ভাবনা কি? এটি একটি অনুমানমূলক প্রশ্ন এবং মূল পোস্টার সরবরাহকারীর তথ্যের ভিত্তিতে উত্তরটি: আমরা জানি না।

সংক্ষেপে, আপনি যে পরিসংখ্যানের প্রতিবেদন করছেন তা নির্ভর করে আপনি যে ধরণের প্রশ্নের উত্তর দিতে চান তার উপর নির্ভর করে।

প্রাথমিক গবেষণা নকশা সম্পর্কে চিন্তাভাবনা সবচেয়ে সহায়ক হতে পারে (এখানে চেষ্টা করুন: http://www.socialresearchmethods.net/kb/design.php )। আপনি আরও উন্নত তথ্য চাইলে সুপারপপুলেশনগুলির বিষয়ে চিন্তাভাবনা করা উপকারে আসতে পারে (এখানে একটি নিবন্ধ যা সহায়তা করতে পারে: http://projecteuclid.org/euclid.ss/1023798999#ui-tabs-1 )।


2

আপনি যদি এলোমেলো প্রক্রিয়া হিসাবে পরিমাপ করছেন তা যা বিবেচনা করে থাকেন, তবে হ্যাঁ পরিসংখ্যান পরীক্ষাগুলি প্রাসঙ্গিক। উদাহরণস্বরূপ, একটি মুদ্রা 10 বার উল্টিয়ে দেখুন এটি সুষ্ঠু কিনা if আপনি 6 টি মাথা এবং 4 টি লেজ পান - আপনি কী উপসংহারে পৌঁছান?


1
মুদ্রা টসানোর বিষয়টি সম্পর্কে আপনি যে সিদ্ধান্তে পৌঁছেছিলেন তা আমি সত্যিই বুঝতে পারি না যা জিজ্ঞাসিত প্রশ্নের সাথে সম্পর্কিত। আপনি যে বিন্দুতে একটু বিস্তৃত করতে পারে? পরিসংখ্যানগত পরীক্ষাগুলি প্রাসঙ্গিক বলে মনে হয় তারা বৃহত্তর জনগোষ্ঠীর কাছে পর্যবেক্ষণের ফলাফল নির্ধারণে যে পরিমাণ রেফারেন্স বা সাধারণ জনসংখ্যা নির্ধারণ করতে সহায়তা করে। এখানে প্রশ্নটি মনে হচ্ছে: নমুনা নির্ধারিত সময়ের জন্য পরীক্ষকগণের জনসংখ্যার কাছাকাছি থাকা (এখানে, এক বছর), শাস্ত্রীয় অনুমিতিটি কি পৃথক স্তরে সম্ভাব্য পার্থক্য সম্পর্কে সিদ্ধান্তে পৌঁছানোর সঠিক উপায়?
chl

1
@ সিএল হ্যাঁ, তবে মনে হয় ওপি সাফল্যের অন্তর্নিহিত সম্ভাবনা নির্ধারণের চেষ্টা করছে। পরীক্ষাগুলি পর্যবেক্ষিত অনুপাতকে তাত্ত্বিক বিতরণের সাথে তুলনা করে তা নির্ধারণ করার জন্য যে কোনও নির্দিষ্ট স্তরের আত্মবিশ্বাসের জন্য কোনও পার্থক্য রয়েছে কিনা তা নির্ধারণ করে। আপনি এলোমেলোভাবে যে কোনও ফর্মের জন্য পরীক্ষা করছেন, কেবল ত্রুটিকে এলোমেলো করে না।
জেমস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.