কেন কোনও ব্যবহারিক প্রয়োগে প্রতিস্থাপন ছাড়াই নমুনা বিবেচনা করবেন?


13

প্রতিস্থাপনের সাথে স্যাম্পলিংয়ের প্রতিস্থাপন ছাড়াই নমুনা দেওয়ার চেয়ে দুটি সুবিধা রয়েছে কারণ আমি এটি দেখছি:

1) আপনার সীমাবদ্ধ জনসংখ্যা সংশোধন সম্পর্কে চিন্তা করার দরকার নেই।

2) এমন একটি সুযোগ রয়েছে যে জনসংখ্যার উপাদানগুলি একাধিকবার আঁকতে পারে - তারপরে আপনি পরিমাপগুলি পুনর্ব্যবহার করতে পারেন এবং সময় বাঁচাতে পারেন।

অবশ্যই একাডেমিক পিওভের কাছ থেকে উভয় পদ্ধতিই তদন্ত করতে হয়। তবে একটি বাস্তব পিওভের থেকে আমি দেখতে পাচ্ছি না যে প্রতিস্থাপনের সুবিধাগুলি দিয়ে কেন কেউ প্রতিস্থাপন ছাড়াই নমুনা বিবেচনা করবে।

তবে আমি পরিসংখ্যানের এক শিক্ষানবিস তাই প্রতিস্থাপন ব্যতীত উচ্চতর পছন্দ হতে পারে এমন অনেকগুলি ভাল কারণ থাকতে পারে - কমপক্ষে নির্দিষ্ট ব্যবহারের ক্ষেত্রে। দয়া করে আমাকে নির্মূল করুন!


3
ইঙ্গিত: সীমাবদ্ধ জনসংখ্যা সংশোধন প্রয়োগের কী প্রভাব রয়েছে তা বিবেচনা করুন এবং কেন এটি সুবিধাজনক হতে পারে। (এছাড়াও মনে রাখবেন (1) অঙ্কের করছেন প্রায় সবসময় কম কষ্ট & ডেটা সংগ্রহ চেয়ে ব্যয় হয়; (2) যদি আপনি ব্যক্তি আপনি নয় "রিসাইকেল" পরিমাপ করা উচিত আলাদা করতে পারেন, কিন্তু শুধুমাত্র স্বতন্ত্র ব্যক্তির উপর বেস অনুমান।)
Scortchi - মনিকা পুনরায় ইনস্টল করুন

সত্যি বলতে কী, আমি আসলে আপনার কোন বক্তব্য বুঝতে পারি না। এফপিসি পরিমাপের স্বতন্ত্রতার অভাবের সাংখ্যিক পরিণতির ক্ষতিপূরণ দেয়। তবে কেন এটি সুবিধাজনক তা আমি জানি না। (1) এটি আমার প্রশ্নের সাথে কীভাবে সম্পর্কিত? (২) কেন আপনি একটি পরিমাপ পুনর্ব্যবহার করবেন না? প্রতিস্থাপনের সাথে নমুনা করার সময় কাকতালীয়ভাবে একই আইটেমের দ্বিগুণ আঁকার সরাসরি যৌক্তিক পরিণতিটি কি করছেন না?
রাফেল

উত্তর:


13

@ স্কার্টচি এর উত্তরে প্রসারিত হচ্ছে। । ।

মনে করুন জনসংখ্যার ৫ জন সদস্য রয়েছে এবং আপনার পক্ষে ৫ জন ব্যক্তির নমুনার বাজেট রয়েছে। আপনি এই পরিবর্তনশীল এক্স এর জনসংখ্যার গড় সম্পর্কে আগ্রহী, এই জনসংখ্যার ব্যক্তির একটি বৈশিষ্ট্য। আপনি এটি আপনার উপায়ে করতে পারেন, এবং এলোমেলোভাবে প্রতিস্থাপনের সাথে নমুনা। নমুনা গড়ের ভেরিয়েন্সটি হবে ভি (এক্স) / 5।

অন্যদিকে, ধরুন আপনি প্রতিস্থাপন ছাড়াই পাঁচটি ব্যক্তির নমুনা করেছেন। তারপরে, নমুনার গড়টির বৈচিত্র্য 0 হয় আপনি পুরো জনসংখ্যা, প্রতিটি পৃথককে একবারে নমুনা দিয়েছিলেন, সুতরাং "নমুনা গড়" এবং "জনসংখ্যার গড়ের" মধ্যে কোনও পার্থক্য নেই। তারা একই জিনিস।

বাস্তব বিশ্বে আপনার প্রত্যেকবার সীমাবদ্ধ জনসংখ্যা সংশোধন করতে হবে বলে আনন্দের জন্য ঝাঁপিয়ে পড়া উচিত কারণ (ড্রামরল।।) এটি আপনাকে আরও ডেটা সংগ্রহ না করেই আপনার অনুমানের বৈচিত্রকে হ্রাস করে দেয়। এটি প্রায় কিছুই করে না। এটি যাদু মত: ভাল যাদু।

গণিতে ঠিক একই জিনিসটি বলছেন (<<এবং মনোযোগ দিন নমুনার আকার 1 এর চেয়ে বেশি):

finite sample correction=NnN1<N1N1=1

সংশোধন <1 এর অর্থ হচ্ছে সংশোধন প্রয়োগ করার ফলে বৈকল্পিক নীচে চলে যায়, 'কারণ আপনি সংশোধনটিকে বৈকল্পিকের বিপরীতে বহুগুণ প্রয়োগ করে প্রয়োগ করেন। ভেরিয়েন্স ডাউন == ভাল।

সম্পূর্ণ গণিত থেকে দূরে বিপরীত দিকে অগ্রসর হয়ে আপনি কী জিজ্ঞাসা করছেন তা ভেবে দেখুন। আপনি যদি জনসংখ্যা সম্পর্কে জানতে চান এবং এ থেকে 5 জনকে নমুনা দিতে পারেন, তাহলে সম্ভবত একই লোকটির 5 বার নমুনা নেওয়ার সুযোগ নিয়ে আপনি আরও শিখবেন বলে মনে হয় বা নিশ্চিত হয়ে আপনি আরও শিখবেন বলে মনে হয় আপনি 5 বিভিন্ন ছেলেদের নমুনা?

আসল ওয়ার্ল্ড কেস আপনি যা বলছেন তার প্রায় বিপরীত। প্রতিস্থাপনের সাথে আপনি কখনই নমুনা করেন না --- আপনি কেবল তখনই বুটস্ট্র্যাপিংয়ের মতো বিশেষ কাজ করেন things সেক্ষেত্রে আপনি প্রকৃতপক্ষে প্রাক্কলনকারীকে স্ক্রু করার এবং এটিকে একটি "খুব বড়" বৈকল্পিক দেওয়ার চেষ্টা করছেন।


"বুটস্ট্র্যাপিং" এর অধীনে জনসংখ্যার একটি প্যারামিটার অনুমান করার জন্য আমি জনগণের প্যারামিটারের (যেখানে আপনাকে আসলে ব্যবহার করতে হবে) এর জায়গায় নমুনার একটি প্যারামিটার ব্যবহার করে বুঝতে পারি। আপনি কেন অনুমানকারীকে "স্ক্রু আপ" করতে এবং এটিকে "খুব বড়" রূপ দিতে আগ্রহী?
রাফেল

1
@ আফাফেল আমি নন-প্যারামেট্রিক বুটস্ট্র্যাপিংয়ের কথা বলছি। আপনি আপনার নমুনাটি নিন (আকারটি 100 বলুন), প্রতিস্থাপনের সাথে এটি থেকে পুনরায় নমুনা নিন (100 বারের আকারের বুটস্ট্র্যাপ নমুনা উত্পন্ন 100 গুণ) এবং তারপরে আপনার আগ্রহের অনুমানকারীটিকে পুনরায় গণনা করুন। আপনি নমুনাটিকে খেলনা জনসংখ্যা হিসাবে চিকিত্সা করছেন, এটি থেকে কোনও নমুনা অঙ্কন করে অনুমানকারী গণনা করছেন। যদি আপনি খেলনা জনসংখ্যা থেকে প্রতিস্থাপন না করে নমুনা তৈরি করেন, আপনি খেলনা জনসংখ্যাকে নমুনায় হুবহু অনুলিপি করে নতুন অনুমান হিসাবে মূল অনুমান পেয়ে যাবেন (যেমন বৈকল্পিক = 0)। এটি এড়াতে, যাতে আপনি প্রতিস্থাপনের সাথে নমুনা করেন।
বিল

5

প্রতিস্থাপনের সাথে নমুনা তুলনা করে প্রতিস্থাপন ছাড়াই নমুনাটির যথার্থতা সাধারণত বেশি হয়।

উদাহরণস্বরূপ, এটি শুধুমাত্র একটি উপাদান নির্বাচন করা সম্ভব বার যখন স্যাম্পলিং একটি চরম ক্ষেত্রে প্রতিস্থাপন সঙ্গে সম্পন্ন করা হয়। এটি সুদের জনসংখ্যার প্যারামিটারের খুব নির্ভুল অনুমানের দিকে নিয়ে যেতে পারে। স্যাম্পলিংয়ের অধীনে প্রতিস্থাপন ছাড়া এমন পরিস্থিতি সম্ভব নয় is সুতরাং প্রতিস্থাপন ছাড়াই নমুনা তৈরি থেকে তৈরি অনুমানের জন্য বৈকল্পিক সাধারণত কম হয়।n


2

আমি মনে করি না যে এখানে উত্তরগুলি পুরোপুরি পর্যাপ্ত, এবং আপনার ডেটার পরিমাণ খুব কম হওয়ায় সীমাবদ্ধ ক্ষেত্রে তারা যুক্তি দেখায়।

যথেষ্ট পরিমাণে বড় নমুনা সহ, এটি মোটেই উদ্বেগ নয়, বিশেষত অনেকগুলি বুটস্ট্র্যাপের রেসপ্যাম (~ 1000) দিয়ে। আমি যদি সত্য বিতরণ থেকে ১০,০০০ আকারের ডেটাসেটের নমুনা তৈরি করেছি এবং প্রতিস্থাপনের সাথে আমি ১,০০০ বার পুনরায় নমুনা দিয়েছি , তবে আমি যে বৈকল্পিকতা অর্জন করব ( কোনও প্রতিস্থাপন না করে আমি যে বৈকল্পিকতা অর্জন করব তার বিপরীতে ) সম্পূর্ণ নগণ্য।

আমি বলব যে আরও সঠিক উত্তরটি হ'ল: দ্বিতীয় আদেশের পরিসংখ্যানের আত্মবিশ্বাসের অনুমানের সময় প্রতিস্থাপন ছাড়াই পুনরায় মডেলিং জরুরি । উদাহরণস্বরূপ, আমি যদি ছড়িয়ে ছিটিয়ে পরিমাপে আমার যে অনিশ্চয়তা অনুমান করি তার অনুমান করতে যদি আমি একটি বুটস্ট্র্যাপ ব্যবহার করি। এই জাতীয় পরিমাণের প্রতিস্থাপনের সাথে অঙ্কন কৃত্রিমভাবে পুনরুদ্ধার করা ছত্রাককে পক্ষপাত করতে পারে।

আসল ডেটা সহ একটি দৃ concrete় উদাহরণের জন্য, আপনি যদি এটির বিষয়ে অবতীর্ণ হন তবে এই কাগজটি দেখুন https://arxiv.org/abs/1612.02827

এটি সংক্ষিপ্তভাবে আপনার পৃষ্ঠাটি 10 ​​এ আলোচনা করে


0

আমার এমন একটি ফলাফল রয়েছে যা প্রতিস্থাপন ছাড়া বাস্তবে প্রতিস্থাপন ছাড়াও আচরণ করে এবং সমস্ত সমস্যা সরিয়ে দেয়। নোট করুন যে প্রতিস্থাপনের গণনা সহ অনেক সহজ। সুতরাং, যদি কোনও সম্ভাব্যতা পি এবং কিউ, সাফল্য এবং ব্যর্থতার সম্ভাবনাগুলির সাথে প্রতিস্থাপনের ক্ষেত্রে জড়িত থাকে তবে প্রতিস্থাপনের ক্ষেত্রে ছাড়াই সম্পর্কিত সম্ভাবনাটি কেবলমাত্র ^ aq ^ b এর (নব) সি (রা) এর সাথে প্রতিস্থাপনের সাথে প্রাপ্ত হয় যে কোনও ক এবং খ, যেখানে এন, আর মোট বলের সংখ্যা এবং সাদা বলের সংখ্যা। মনে রাখবেন পি আর / এন হিসাবে বিবেচিত হয়।

K.Balasubramanian


একটি বাদ ছিল। (ন্যাব) সি (রা) / (এনসিআর) সঠিক অভিব্যক্তি। উদাহরণস্বরূপ গড় এনপি এন (এন-1-0) / (আর -1) / এনসিআর হয়ে যায়। আপনি যেমন কোনও ফলাফল চেক করতে পারেন।
কৃষ বালাসুব্রাহ্মণিয়াম
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.