একটি বৃহত যথেষ্ট নমুনা আকার হিসাবে 30 ব্যবহার করে সমর্থন করার জন্য কোন উল্লেখগুলি উদ্ধৃত করা উচিত?


41

আমি অনেকবার পড়ে / শুনেছি যে কমপক্ষে 30 ইউনিটের নমুনার আকারটিকে "বৃহত নমুনা" হিসাবে বিবেচনা করা হয় (সাধারণত স্বাভাবিকতার অনুমানগুলি সিএলটি-র কারণে সাধারণত প্রায় ধরে থাকে, ...)। সুতরাং, আমার পরীক্ষায় আমি সাধারণত 30 টি ইউনিটের নমুনা উত্পন্ন করি। আপনি কি দয়া করে আমাকে কিছু রেফারেন্স দিতে পারেন যা নমুনা আকার 30 ব্যবহার করার সময় উদ্ধৃত করা উচিত?


2
আপনি যে পরিমাণ প্যারামিটারগুলি অনুমান করার চেষ্টা করছেন, বা সমানভাবে আপনি যে ধরণের মডেল নিয়ে কাজ করছেন তা উল্লেখ ছাড়াই আপনাকে স্পষ্ট উত্তর দেওয়া বরং কঠিন বলে মনে হচ্ছে।
chl

2
ছোট এবং বড় নমুনাগুলির সীমানা হিসাবে n = 30 এর গ্রহণযোগ্যতা কোনও পরিসংখ্যান কৌশল দ্বারা ভাল সমর্থন করে না।
Jibol

উত্তর:


37

ছোট এবং বড় নমুনাগুলির মধ্যে সীমানার জন্য n = 30 এর পছন্দটি কেবলমাত্র থাম্বের নিয়ম। এখানে প্রচুর পরিমাণে বই রয়েছে যা এই মানটির (চারপাশে) উদ্ধৃতি দেয়, উদাহরণস্বরূপ, হগ এবং তানিসের সম্ভাবনা এবং পরিসংখ্যানগত অনুভূতি (7 ই) "25 বা 30 এর বেশি" বলে।

এই যে গল্পটি আমাকে বলেছিল তা হ'ল 30 টির পক্ষে একটি ভাল সীমানা হিসাবে বিবেচিত হওয়ার কারণ এটি একটি পৃষ্ঠায় সুন্দরভাবে শিক্ষার্থীদের টি টেবিলগুলি পাঠ্যপুস্তকের পিছনে তৈরি করা হয়েছিল। এটি, এবং সমালোচনামূলক মানগুলি (শিক্ষার্থীর টি এবং সাধারণের মধ্যে) কেবলমাত্র 0.25 অবধি বন্ধ হয়, যাইহোক, ডিএফ = 30 থেকে ডিএফ = অসীমতায়। হাত গণনার জন্য পার্থক্যটি আসলে কিছু যায় আসে না।

আজকাল 15 দশমিক জায়গায় সমস্ত ধরণের জিনিসের জন্য সমালোচনামূলক মানগুলি গণনা করা সহজ। এর উপরে আমাদের পুনর্নির্মাণ এবং ক্রমশারণের পদ্ধতি রয়েছে যার জন্য আমরা এমনকি প্যারামেট্রিক জনসংখ্যা বিতরণেও সীমাবদ্ধ নেই।

অনুশীলনে আমি কখনই n = 30 এ নির্ভর করি না । ডেটা প্লট করুন। আপনার পছন্দ মতো একটি সাধারণ বিতরণ সুপারমোজ করুন। সাধারণ আনুমানিক যথাযথ কিনা যথাযথভাবে মূল্যায়ন করুন (এবং আনুমানিকভাবে সত্যিকারের প্রয়োজন কিনা তা জিজ্ঞাসা করুন)। যদি গবেষণার জন্য নমুনা তৈরি করা এবং একটি আনুমানিক পরিমাণ বাধ্যতামূলক হয় তবে সান্নিধ্যটিকে পছন্দসই হিসাবে কাছাকাছি করার জন্য (বা সংখ্যার সাথে সম্ভাব্য যতটা সম্ভব) কাছে যথেষ্ট পরিমাণে নমুনা আকার তৈরি করুন।


13
টি বিতরণের স্বাভাবিক আনুমানিকতা ঠিক কতটা ভাল তার একটি পৃষ্ঠা এখানে রয়েছে n = 30 এর জন্য। johndcook.com/normal_approx_to_t.html
জন ডি কুক

41

আসলে, "ম্যাজিক নম্বর" 30 একটি ভ্রান্তি। জ্যাকবের কোহেনের আনন্দদায়ক কাগজটি দেখুন, জিনিসগুলি আমি শিখেছি (এতদূর) (আমি মনোবিজ্ঞান । ডিসেম্বর 1990 45 # 12, পৃষ্ঠা 1304-1312) । "আপনি যে কিছু জিনিস শিখেছেন তা তেমন নয়" কীভাবে এই গল্পটি তাঁর প্রথম উদাহরণ।

n=30.05.47


2
সুন্দর রেফারেন্স - এবং প্রাসঙ্গিক উপর স্পট। ধন্যবাদ.
শুক্রবার

1
@ হুবুহু মনে আছে কোন কাগজটি ছিল? লিঙ্কটি এখনই ভেঙে গেছে। সম্ভবত এই psych.colorado.edu/~willcutt/pdfs/Cohen_1990.pdf , "আমি যে জিনিসগুলি শিখেছি (এতদূর)"? বছরের ভাঙা লিঙ্কটির URL টির সাথে মিল রয়েছে।
অ্যামিবা বলেছেন মনিকা

1
@ আমোবা আমি যখন এই কাগজটি পড়ি তখন এটি সংরক্ষণ করেছিলাম, তাই আমি নিশ্চিত করতে পারি যে আপনি যা পেয়েছেন তা উদ্দেশ্যযুক্ত। আপনার লিঙ্কের সাথে একটি উদ্ধৃতি অন্তর্ভুক্ত করার জন্য আমি এই উত্তরটি আপডেট করেছি।
whuber

@ কার্লোস অ্যাকসিওলি আমি আগের লিঙ্কটি নষ্ট হয়ে যাওয়ায় এটি নতুন লিঙ্কটি দিয়ে আপডেট করেছি।
অক্ষয় বানসাল

9

আইএমও, এটি কীসের জন্য আপনার নমুনাটি ব্যবহার করতে চান তার উপর নির্ভর করে। আমার অর্থ বোঝানোর জন্য দুটি "নির্বোধ" উদাহরণ: আপনার যদি কোনও গড় অনুমান করার প্রয়োজন হয় তবে 30 টি পর্যবেক্ষণ পর্যাপ্তর চেয়ে বেশি। আপনার যদি 100 পূর্বাভাসকারীদের সাথে লিনিয়ার রিগ্রেশনটি অনুমান করার দরকার হয় তবে 30 টি পর্যবেক্ষণ পর্যাপ্ত হবে না।


9

μ¯(n)

আরও সাধারণভাবে, সিএলটি রাখতে দুটি মূল স্তম্ভের প্রয়োজন:

  1. যে র্যান্ডম ভেরিয়েবলগুলি স্বাধীন: আপনি কোনও তথ্য না হারিয়ে আপনার পর্যবেক্ষণগুলি পুনরায় অর্ডার করতে পারেন *।
  2. যে আরভি সীমাবদ্ধ দ্বিতীয় মুহুর্তের সাথে একটি বিতরণ থেকে আসে: এর অর্থ যে নমুনা আকার বাড়ার সাথে সাথে গড় এবং এসডির ধ্রুপদী অনুমানগুলি একত্রিত হয়।

(এই উভয় অবস্থা কিছুটা দুর্বল করা যেতে পারে, তবে পার্থক্যগুলি মূলত তাত্ত্বিক প্রকৃতির)


6
আপনার উদাহরণ দৃust় পরিসংখ্যানের মান চিত্রিত করে। নমুনা মধ্যমা ভাল একটি কোশি বিতরণের অবস্থান পরামিতি অনুমান। যে কেউ তর্ক করতে পারে যে ৩০ টি নমুনা নিয়ে টি-টেস্ট ব্যবহারের সবচেয়ে দুর্বল লিঙ্কটি 30 টি নমুনা নয়, টি-পরীক্ষা।
জন ডি কুক

1
জন:> "যে কেউ তর্ক করতে পারে যে 30 টি নমুনা নিয়ে টি-টেস্ট ব্যবহারের সবচেয়ে দুর্বল লিঙ্কটি 30 টি নমুনা নয়, টি-পরীক্ষা"। খুব সত্য, এবং এই ধারণাটিও যে ডেটা আইডি । এছাড়াও, মিডিয়ান হল কচির জন্য বিতরণ করা এলোমেলো ভেরিয়েবলগুলি (এবং তাই দক্ষ), তবে সাধারণভাবে আপনার 30 টিরও বেশি পর্যবেক্ষণের প্রয়োজন হতে পারে।
ব্যবহারকারী 60

1
সিএলটি-র সমস্ত সংস্করণ অভিন্নভাবে বিতরণ করা, এমনকি স্বাধীনতার উপরও নির্ভর করে না। আন্ডারগ্র্যাডদের শেখানো বেসিকগুলি প্রায়শই হয় তবে এমন সংস্করণ রয়েছে যা উভয় অনুমানই করে না যেমন লিয়াপুনভ সিএলটি স্বতন্ত্রতা স্বীকৃতি দেয় তবে অভিন্ন বন্টন নয়, এবং স্বাধীনতার শর্তটিও শিথিল করা যায়, উদাহরণস্বরূপ দেখুন এখানে । সেই 'পুনর্নির্মাণ' জিনিসটিও স্বাধীনতার মতো নয়। নির্ভরতা কিছু ফর্ম ক্রম উপর নির্ভর করে না।
Glen_b

2
লগ-সাধারণ বিতরণ করার জন্য একটি আধ্যাত্মিক ব্যবধান গণনা করতে সিএলটি যথেষ্ট পরিমাণে কাজ করার জন্য একটি নমুনা আকার 50,000 অপর্যাপ্ত।
ফ্রাঙ্ক হ্যারেল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.