20 নম্বর কি যাদু?


12

আমার কাছে উল্লেখ রয়েছে যা ডেটা ফিটিং বিতরণের জন্য সর্বনিম্ন 20 এর একটি নমুনা আকার বিবেচনা করার পরামর্শ দেয়।

এর মধ্যে কি কোনও ধারণা আছে?

ধন্যবাদ


3
সাধারণভাবে না, নির্দিষ্ট পরিস্থিতিতে সম্ভবত। আপনার কি রেফারেন্স রয়েছে এবং আপনার লক্ষ্যগুলি কী?
চিত্র_ডোক্টর

1
আমি @ আইমেজ_ডোক্টরের সাথে একমত হই - 20 টি পর্যবেক্ষণকে ন্যূনতম হিসাবে বিবেচনা করার কোনও সাধারণ কারণ নেই; এটি খুব বিশেষ পরিস্থিতিতে ক্ষেত্রে হতে পারে।
গ্লেন_বি -রিনস্টেট মনিকা

3
একটি একক মান কিছু ব্যবহারিক ক্ষেত্রে যেমন কাজ করে যখন বিতরণটি পয়েসন হিসাবে নিশ্চিত (নিশ্চিতভাবে) পরিচিত হয় এবং পর্যবেক্ষণটি একটি বৃহত গণনা। এটি কেবল বিতরণকে ফিট করার অনুমতি দেয় না, এটির প্যারামিটারের প্রাক্কলনটিতে সম্ভাব্য ত্রুটিও মূল্যায়নের অনুমতি দেয়।
whuber

1
e

1
হ্যাঁ, 20 হ'ল ম্যাজিক নম্বর: en.wikedia.org/wiki/Magic_number_%28physics%29
বিটওয়াইজ

উত্তর:


13

এর অনেকটাই নির্ভরশীল বিতরণ এবং আপনার গবেষণার প্রশ্নটি নির্ভর করে। থাম্বের নিয়ম হিসাবে আপনার থাম্বের নিয়ম থেকে সতর্ক হওয়া উচিত। যদি আপনি প্রত্যাশিত বিতরণটি জানেন তবে বিভিন্ন আকারের কিছু সিমুলেশন চালান এবং নির্ধারণ করুন যে নমুনা সিমুলেশনগুলি কতবার প্রকৃত বিতরণকে প্রতিবিম্বিত করে। এটি আপনাকে চূড়ান্ত প্রয়োজনীয় নমুনার আকার হিসাবে কিছু গাইডেন্স দেয় give


চূড়ান্ত এবং কৌতূহলোদ্দীপক বিবৃতি স্পিয়ারিং জন্য +1।
whuber

1
অংশ অংশে +1 "থাম্বের নিয়ম হিসাবে, আপনার থাম্বের নিয়ম থেকে সতর্ক হওয়া উচিত।"
ওল্ফগ্যাং

7

z0.9750.50.5/1000=1.960.158=0.031

|skewness|n2n1=4.58,|kurtosis|n23n+3n1=18.05.

n=20

h=1.06σ^n1/5=0.58σ^

ms(s/m)(3+(s/m)2)202
whuber

1
নমুনা আকার হিসাবে 1000 ব্যবহারের প্রসঙ্গে "পাওয়ার-অফ-টেন সিনড্রোম" এর বাধ্যতামূলক লিঙ্ক (প্রোগ্রামিং সম্পর্কিত পরিসংখ্যানগুলির প্রসঙ্গে, তবে এটি অন্য কোথাও প্রযোজ্য): zedshaw.com/essays/programmer_stats.html
গ্যারি এস। তাঁত

1
@ শুভ্র, আপনি খুব স্মার্ট, কোন অপরাধ নেই। সর্বাধিক লোকেরা স্কিউনেসকে ডেটা মুহুর্ত হিসাবে গণনা করবে, যেমনটি আপনি করেছেন তেমন কোনও প্যারাম্যাট্রিক অনুমানের মাধ্যমে নয়। এখন, যদি আমি বলেছিলাম "ধরুন আপনি মুহুর্তের পদ্ধতি অনুসারে একটি পিয়ারসন বিতরণ ফিট করছেন" - তাহলে এই যুক্তিটি কি প্রাসঙ্গিক হবে?
স্টাস্ক

হ্যাঁ, এটি অনেক ক্ষেত্রে প্রাসঙ্গিক হবে। মুহুর্তের পদ্ধতিটি ব্যবহার করে লগন্যালিমাল বিতরণে ফিট করার জন্য আমি আপনার পরামর্শটি অনুসরণ করেছি এবং একটি বিশাল স্কিউনেস পেয়েছি - সেখানে কোনও আশ্চর্যের কিছু নেই। এটি কেবলমাত্র প্রথম দুটি মুহুর্তের সাথে মিলেছি, তৃতীয়টিকে যা হতে পারে তা দেই। আমি যদি দুই বা ততোধিক প্যারামিটারের বিতরণ পরিবারের সাথে একই পদ্ধতি অনুসরণ করতে পারি যা নির্বিচারে বড় তৃতীয় মুহূর্তগুলিকে মঞ্জুরি দেয় তবে আমি মনে করি আমি একই ঘটনাটি দেখতে পাবো। পিয়ারসন পরিবারে, যার দুটি প্যারামিটারেরও বেশি রয়েছে, আমরা সম্ভবত বোধগম্য স্কিউনেসের সাথে মেলে চেষ্টা করব, যার ফলে এর মান সীমাবদ্ধ থাকবে।
whuber

2

নাঃ। দূর থেকে নয়।

এটির মতো চিন্তা করুন: যদি আপনার কাছে একটি বিলিয়ন-ডাইমেনশনাল স্পেস (মানবতা) থাকে এবং আপনি যে কোনও পদ্ধতি ব্যবহার করে 20 টি নমুনা টেনে বের করেন (20 জন) আপনি কি গ্রহের প্রত্যেক ব্যক্তিকে যুক্তিসঙ্গতভাবে বোঝার জন্য তথ্য ব্যবহার করতে পারবেন? দূর থেকে নয়। মিল্কিওয়ে ছায়াপথটিতে 100 বিলিয়ন তারা রয়েছে। তাদের 20 টি বাছাই করে (এলোমেলোভাবে) আপনি কি সমস্ত গ্যালাকটিক জ্যোতির্বিদ্যা বুঝতে পারবেন? কোনভাবেই না.

1-ডি স্পেসে কিছু হিউরিস্টিকস রয়েছে, বেশিরভাগই থাম্বের বৈধ নিয়ম যা সাহায্য করতে পারে, এটি বর্ণনা করে যে আপনি কত পরিমাপ নিতে চান। এর মধ্যে ইউটিলিটি এবং ন্যায্যতার বিভিন্ন ডিগ্রি অন্তর্ভুক্ত রয়েছে তবে কিছুটা অর্থে "20" এর চেয়ে বেশি প্রতিরক্ষা করা হয়েছে। এর মধ্যে রয়েছে "আপনার ফিট সমীকরণে প্রতি পরিবর্তনশীল 5 পরিমাপ", "গাউসিয়ান ডেনসিটি ফাংশনের কমপক্ষে 35 টি নমুনা" এবং "দ্বিপদী ফাংশনের কমপক্ষে 300 টি নমুনা" অন্তর্ভুক্ত রয়েছে। সত্যিকারের পরিসংখ্যানবিদরা এবং আমার মতো বোকা-বোম্বার নয়, প্রথম নীতিগুলি এবং কোনও ক্যালকুলেটর ছাড়াই নির্দিষ্ট আত্মবিশ্বাসের অন্তর এবং অনিশ্চয়তাগুলিকে যুক্ত করতে সক্ষম হবেন।

a3r3+a2r2+a1r+a0a1r+a0dr

অনুগ্রহ করে মনে রাখবেন যে "সেরাতার" পরিমাপ না করেই "সেরা" অর্থহীন ধারণা। সেরা পথটি কী? আপনি যদি নিজের ডুমটিতে যাচ্ছেন, তবে এটি সম্ভবত একটি দীর্ঘ এবং আনন্দদায়ক। আপনি যদি নিজের রাজ্যাভিষেকের দিকে যাচ্ছেন তবে সম্ভবত একটি সংক্ষিপ্ত এবং দুর্দান্ত। আপনি যদি মরুভূমির মধ্য দিয়ে হাঁটছেন তবে শীতল ছায়াছবি। নমুনার "সেরা" সংখ্যাটি কী? এটি আপনার সমস্যার উপরে এতটাই নির্ভরশীল যে এর আগে কর্তৃপক্ষের সাথে এর উত্তর দেওয়া শুরু করা যায় না। তাদের সবাই? আপনি যতটা পারেন? যারা শুধুমাত্র একটি সামান্য জ্ঞান করতে। হ্যাঁ এটি আংশিক মৃত বা গর্ভবতী হওয়ার মতো। আংশিক অযৌক্তিক হওয়া খুব আন্ডার-সংজ্ঞায়িত সমস্যার পরিণতি।

আপনি যদি বিমানের উপরে বায়ুপ্রবাহটি সঠিকভাবে পূর্বাভাস দেওয়ার চেষ্টা করছেন? বল-পার্কে যেতে আপনার কয়েক মিলিয়ন পরিমাপের প্রয়োজন হতে পারে। আপনি কতটা লম্বা তা জানতে চাইলে একজন বা দুজন কাজ করতে পারে।

এটি "স্পেসিং স্পেনিং" এবং "প্যারামিটারের অনুমানগুলিতে বৈকল্পিকতা হ্রাস করে এমন জায়গাগুলিতে নমুনা দেওয়ার" গুরুত্বপূর্ণ পয়েন্টগুলি নিয়ে আসে না তবে প্রশ্নটি আরও একটি নতুন স্তরের উত্তর প্রাসঙ্গিক বলে প্রস্তাব দেয়। এই জিনিসগুলি বাস্তবায়িত হওয়ার আগে সমস্যার প্রকৃতি সম্পর্কে আরও জানতে হবে।

দ্রষ্টব্য: প্রতিটি পরামর্শ উন্নত করতে সম্পাদিত।


1
আপনি "সর্বোচ্চ" বা "যথেষ্ট" হিসাবে প্রশ্নটিতে "সর্বনিম্ন" পড়েছেন বলে মনে হয়। আপনি যা লিখেছেন তা কিছুই ন্যূনতম -20 -20 এর থাম্বের বিপরীতে উপস্থিত বলে মনে হচ্ছে না।
whuber

2
@ হ্যাঁ, আমি ভাবেন লোকদের মধ্যে যারা অতিরিক্ত পরিমাপ ব্যয়বহুল বলে মনে করেন এবং আমি যদি তাদের "ন্যূনতম সংখ্যার নমুনা" সরবরাহ করি তবে তারা এটিকে অসমতা হিসাবে ভাবেন না যেখানে সম্ভাব্য সংখ্যার চেয়ে বেশি নমুনা রয়েছে। তারা এটিকে ব্যয় হ্রাস করার একটি অনুকূলিতকরণ সমস্যার সীমানা হিসাবে মনে করে এবং কেবলমাত্র সেই মানটিতে চালিত করার চেষ্টা করে। এটি আমার পরিবেশের একটি পণ্য।
EngrStudent

1

সম্ভবত আপনি যে প্রসঙ্গে টি-টেস্ট বা আনোভার চালিয়ে যাচ্ছেন - মৌলিক পরিসংখ্যান অ্যাপ্লিকেশনগুলির মধ্যে একটি সাধারণ প্রচলিত প্রসঙ্গ - এটি প্রতিটি গ্রুপের গড় সম্পর্কে প্রায় আস্থা রাখার জন্য প্রতিটি গ্রুপের জন্য প্রয়োজনীয় নমুনার আকারের কাছাকাছি around সাধারণত বিতরণ করা হয় (কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য অনুসারে) যখন বিতরণটি কমবেশি ইউনিਮੋডাল হিসাবে ধরে নেওয়া যায় এবং চূড়ান্ত নয়। একুশ এবং উনিশ বা একবিংশ নয় কারণ এটি একটি গোল সংখ্যা।


0

বিষয়টির কয়েকটি নিবন্ধের জন্য রাশি লেন্থের শক্তি এবং নমুনা আকারের পৃষ্ঠাটি দেখুন (পৃষ্ঠার মাঝখানে পরামর্শ বিভাগে)।

আপনার নমুনায় থাকা ব্যক্তিদের ন্যূনতম সংখ্যা জনসংখ্যার আকার, মাত্রার সংখ্যা (যদি আপনি বিভাগগুলিতে ডেটা ভাগ করে নিচ্ছেন) এবং পদক্ষেপগুলি (আপনি যদি নমুনা স্বতন্ত্র সম্পর্কে ক্রমাগত ব্যবস্থা নিচ্ছেন) অনুযায়ী গ্রহণ করছেন, তার আকার আপনার মহাবিশ্ব, বিশ্লেষণের যে কৌশলটি আপনি ব্যবহার করতে চেয়েছেন (এটি একটি অত্যন্ত গুরুত্বপূর্ণ বিষয় - কৌশলটি অধ্যয়নের পরিকল্পনার সময় বা পরীক্ষামূলক নকশাকালীন সময়ে কখনই সংজ্ঞায়িত করা হয় না), এবং পূর্ববর্তী গবেষণাগুলি দ্বারা জটিলতা দেখানো হয়েছিল।

এবং 20 "বিরল রোগ" এবং "পরীক্ষামূলক মনোবিজ্ঞান" (পপার তার কাজের মধ্যে সংজ্ঞায়িত হিসাবে মনো) বিষয়গুলির বাইরে কোনও গুরুতর গবেষণার জন্য যথেষ্ট নয়।

নীচের মন্তব্যের ভিত্তিতে উত্তরটি পরিমার্জন:

এবং 20 "বিরল রোগ" এবং "পরীক্ষামূলক মনোবিজ্ঞান" (পপ্পার তার কাজের মধ্যে সংজ্ঞায়িত হিসাবে) এর বিষয়গুলির বাইরে কোনও গুরুতর গবেষণার জন্য যথেষ্ট নয়, এতে সম্ভাব্যতা বন্টনের উপযুক্ততা রয়েছে

এবং না, আপনার একটি বড় নমুনা আকার পেতে লোকদের বিষক্রিয়া চালিয়ে রাখা উচিত নয়। কমন সেন্স এবং সিকোয়েন্সাল টেস্ট আপনাকে থামানোর আদেশ দেয়।


3
আমি মনে করি যে একটি কম্বল বিবৃতি দেওয়া অত্যন্ত চরম যে ২০ এর একটি নমুনা "কোনও গুরুতর গবেষণার জন্য যথেষ্ট নয়" " এটি আপনার পূর্ববর্তী বিবৃতিগুলির সাথে বৈষম্যমূলক যে উপযুক্ত নমুনা আকারটি উদ্দেশ্য, জনসংখ্যা এবং এর সাথে পরিবর্তিত হয়। কিছু ক্ষেত্রে একটি তাত্পর্যপূর্ণ ফল একটি সম্পূর্ণ তত্ত্বকে হত্যা করার জন্য যথেষ্ট।
whuber

1
কেস স্টাডি এবং গুণগত গবেষণা 1-5 অংশগ্রহণকারীদের সাথে সূক্ষ্ম করতে পারে।
বেহাকাদ

ঠিক আছে, তালিকায় "কেস স্টাডিজ" এবং "ফোকাস গ্রুপ" যুক্ত করুন :) এগুলি পপারকে "পরীক্ষামূলক মনোবিজ্ঞান" বলেছিলাম তার মধ্যে অন্তর্ভুক্ত করা হয়েছে।
লুকাস গ্যালিন্ডো

4
এরপরে আপনি জ্যোতির্বিজ্ঞান, ওষুধ, জীববিজ্ঞান, রসায়ন, এবং আরও ভালভাবে যোগ করতে পারেন ... অন্য কথায়, এটি যথেষ্ট ভাল যে জোর দিয়ে বলা যায় যে 20 "যথেষ্ট নয়" বলে মনে করা ঠিক ততটাই খারাপ। আসলে, এটি সম্ভবত আরও খারাপ। কোনও খাদ্য সুরক্ষার পরীক্ষার কল্পনা করুন যাতে পুষ্টি পরিপূরক দ্বারা পরিচালিত প্রথম আট বিষয় অপ্রত্যাশিত পার্শ্বপ্রতিক্রিয়ার কারণে মারা গিয়েছিলেন। আপনি কি আপনার "20 পর্যাপ্ত নয়" স্টেটমেন্টের ভিত্তিতে পরীক্ষা চালিয়ে যেতে চাইবেন?
whuber
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.