কেন একটি অনুপাতের স্ট্যান্ডার্ড ত্রুটি, প্রদত্ত এনের জন্য, 0.5 টির জন্য সবচেয়ে বড়?


10

অনুপাতের স্ট্যান্ডার্ড ত্রুটিটি কোনও প্রদত্ত এন এর পক্ষে সবচেয়ে বড় হতে পারে যখন প্রশ্নের অনুপাতটি 0.5 হয় এবং অনুপাতটি 0.5 থেকে আরও কম হয়ে যায়। আমি যখন অনুপাতের স্ট্যান্ডার্ড ত্রুটির জন্য সমীকরণটি দেখি তখন এটি কেন এমন হয় তা আমি দেখতে পাচ্ছি তবে আমি এটি আর ব্যাখ্যা করতে পারি না।

সূত্রের গাণিতিক বৈশিষ্ট্যের বাইরেও কি কোনও ব্যাখ্যা আছে? যদি তা হয় তবে কেন 0 বা 1 এর কাছাকাছি আসার কারণে আনুমানিক অনুপাতে (প্রদত্ত এন এর জন্য) কম অনিশ্চয়তা রয়েছে?

উত্তর:


8

পটভূমি এবং পরিভাষা

আমরা কী আলোচনা করছি তা পুরোপুরি পরিষ্কার করার জন্য আসুন কিছু ধারণা এবং পরিভাষা প্রতিষ্ঠা করি। অনুপাতের জন্য একটি দুর্দান্ত মডেল হ'ল বাইনারি urn: এটিতে রৌপ্য ("সাফল্য") বা ফুচিয়া ("ব্যর্থতা") রঙযুক্ত বল রয়েছে। রৌপ্য বলের অনুপাতটি কলুষের মধ্যেp (তবে এটি "অনুপাত" নয় যা আমরা বলব)।

এই কলসটি একটি বার্নোল্লি ট্রায়ালকে মডেল করার একটি উপায় সরবরাহ করে । একটি উপলব্ধি পেতে, বলগুলি ভালভাবে মিশ্রিত করুন এবং অন্ধভাবে এটির রঙটি পর্যবেক্ষণ করুন one অতিরিক্ত উপলব্ধি পেতে প্রথমে টানা বলটি ফিরিয়ে বক্সটি পুনর্গঠন করুন, তারপরে প্রক্রিয়াটি একটি নির্ধারিত সংখ্যার পুনরাবৃত্তি করুন। এর ক্রমn উপলব্ধিগুলি এর সাফল্যের গণনা দ্বারা সংক্ষিপ্ত করা যেতে পারে, X। এটি এমন একটি এলোমেলো পরিবর্তনীয় যা এর বৈশিষ্ট্যগুলি সম্পূর্ণরূপে নির্ধারিত হয়n এবং p। বিতরণX একে দ্বিপদী বলা হয়(n,p)বন্টন। (পরীক্ষামূলক বা "নমুনা") অনুপাতটি অনুপাতX/n

ব্যক্তিত্ব

এই পরিসংখ্যানগুলি বিভিন্ন দ্বিপদী অনুপাতের সম্ভাবনা বিতরণের বারপ্লট ots X/n। সর্বাধিক লক্ষণীয় হ'ল একটি সামঞ্জস্যপূর্ণ প্যাটার্ন, নির্বিশেষেn, যাতে বিতরণগুলি সংকীর্ণ হয়ে যায় (এবং বারগুলি তুলনামূলকভাবে উচ্চতর) p থেকে সরানো 1/2 নিচে.

এর স্ট্যান্ডার্ড বিচ্যুতি X/nহয় অনুপাত আদর্শ ত্রুটি প্রশ্নে আপনাকে উল্লেখ করেছে। যে কোনও দেওয়াn, এই পরিমাণ শুধুমাত্র উপর নির্ভর করতে পারে p। এটি কল করুনse(p)। বলগুলির ভূমিকা পাল্টে - রূপালীটিকে "ব্যর্থতা" এবং ফুচিয়াগুলি "সাফল্য" বলুন - এটি দেখতে সহজse(p)=se(1p)। এইভাবে পরিস্থিতি যেখানেp=1p--এটাই, p=1/2- বিশেষ হতে হবে। প্রশ্নটি কীভাবে তা নিয়ে উদ্বেগ প্রকাশ করেse(p) হিসাবে পরিবর্তিত হয় p থেকে দূরে সরানো 1/2 আরও চরম মান হিসাবে, যেমন 0

জ্ঞান বনাম বোঝাপড়া

যেহেতু প্রত্যেককে তাদের শিক্ষার প্রথম দিকে এই জাতীয় চিত্র দেখানো হয়েছে, প্রত্যেকে প্লটগুলির প্রস্থগুলি "জানে" - যা দ্বারা পরিমাপ করা হয় se(p)- মাত্রা হ্রাস হিসাবে p থেকে দূরে সরানো 1/2। তবে সেই জ্ঞানটি সত্যই কেবল অভিজ্ঞতা, যেখানে প্রশ্নটি আরও গভীর বোঝার চেষ্টা করে। প্রায় 300 বছর আগে আব্রাহাম ডি মাইভ্রে যেহেতু দ্বিপদী বিতরণগুলির যত্ন সহকারে বিশ্লেষণ থেকে এ জাতীয় উপলব্ধি উপলব্ধ। (আমি কেন্দ্রীয় সীমাবদ্ধ তত্ত্বের আলোচনায় তাদের উপস্থাপনার সাথে একাত্ম ছিলাম।) আমি মনে করি, কিছু অপেক্ষাকৃত সহজ বিবেচ্য বিষয়গুলি এই পয়েন্টটি তৈরি করতে যথেষ্ট হবে যে প্রস্থগুলি আরও প্রশস্ত হওয়া উচিতp=1/2

একটি সাধারণ স্বজ্ঞাত বিশ্লেষণ

এটা পরিষ্কার যে আমাদের পরীক্ষার সাফল্যের অনুপাত কাছাকাছি হওয়ার আশা করা উচিত p। স্ট্যান্ডার্ড ত্রুটিটি সেই প্রত্যাশা থেকে কতটা দূরে রয়েছে তা আমরা যুক্তিসঙ্গতভাবে আসল ফলাফলটি অনুমান করিX/nমিথ্যা বলবে। ধরা যাক, সাধারণতার কোনও ক্ষতি ছাড়াই thatp এর মধ্যে 0 এবং 1/2, এটি বাড়তে কি লাগবে X/n থেকে p? সাধারণত, প্রায়pn একটি পরীক্ষায় টানা বলগুলির মধ্যে রূপা ছিল এবং (তাই) প্রায় ছিল (1p)nফুচিয়া ছিল। আরও রৌপ্য বল পেতে, তাদের কয়েকটিpnফুচিয়া ফলাফলগুলি পৃথক ছিল। সম্ভাবনা কতটা সম্ভব এইভাবে কাজ করতে পারে? এর সুস্পষ্ট উত্তর হ'ল কখনpছোট, এটি খুব সম্ভবত কখনই হয় না যে আমরা রূপালী বল আঁকতে যাচ্ছি। সুতরাং, ফুচিয়া বাদে রৌপ্য বল আঁকার সম্ভাবনা সর্বদা কম থাকে are আমরা যুক্তিযুক্তভাবে আশা করতে পারি যে শুদ্ধ ভাগ্য দ্বারা, একটি অনুপাত দ্বারাpফুচিয়া ফলাফলগুলির মধ্যে পার্থক্য থাকতে পারে তবে এটির চেয়ে অনেক বেশি পরিবর্তিত হতে পারে বলে মনে হয় না। সুতরাং, এটি প্রশংসনীয়X এর চেয়ে অনেক বেশি আলাদা হবে না p×(1p)n। সমতুল্যভাবে,X/n এর চেয়ে অনেক বেশি আলাদা হবে না p(1p)n/n=p(1p)

denouement

এইভাবে যাদু সংমিশ্রণ p(1p)মনে হচ্ছে। এটি কার্যত প্রশ্নের সমাধান করে: স্পষ্টতই এই পরিমাণটি শিখর দেয়p=1/2 এবং হ্রাস শূন্য এ p=0 অথবা p=1। এটি "আমরা একটি চূড়ান্ত অন্যের চেয়ে সীমাবদ্ধ" বা আমাদের কী জানি তা বর্ণনা করার জন্য এই জাতীয় প্রচেষ্টাগুলির জন্য একটি স্বজ্ঞাত কিন্তু পরিমাণগত ন্যায়সঙ্গততা সরবরাহ করে।

যাহোক, p(1p) একেবারে সঠিক মান নয়: এটি কেবল পথ নির্দেশ করে, কী পরিমাণ প্রসারণের অনুমানের জন্য বিবেচনা করা উচিত তা আমাদের জানিয়ে দেয় X। ভাগ্য আমাদের বিপরীতে অভিনয় করার প্রবণতাটিকে আমরা এড়িয়ে গিয়েছি: যেমন ফুচিয়া কিছু বল রৌপ্য হতে পারে তেমনি কিছু রৌপ্য বলও ফুচিয়া হতে পারে । সমস্ত সম্ভাবনার জন্য অ্যাকাউন্টিং কঠোরভাবে জটিল হয়ে উঠতে পারে, তবে ফলাফল এটি ব্যবহার করার পরিবর্তে হয়p(1p)n কত একটি যুক্তিসঙ্গত সীমা হিসাবে X এর প্রত্যাশা থেকে বিচ্যুত হতে পারে pn, সম্ভাব্য সকল ফলাফলের সঠিকভাবে অ্যাকাউন্ট করতে আমাদের বর্গমূল নিতে হবে p(1p)n। (কেন আরও সতর্কতার জন্য, দয়া করে পরিদর্শন করুন ( https://stats.stackexchange.com/a/3904 ।) দ্বারা ভাগ করেn, আমরা অনুপাতের এলোমেলো পরিবর্তনগুলি শিখি X/n নিজেই এর আদেশ হওয়া উচিত p(1p)n/n=p(1p)n, যা এর স্ট্যান্ডার্ড ত্রুটি X/n


3

0 <= p <= 1 এর জন্য ফাংশন পি (1-পি) বিবেচনা করুন। ক্যালকুলাস ব্যবহার করে আপনি দেখতে পারেন যে পি = 1/2 এ এটি 1/4 যা সর্বোচ্চ মান। যদি আপনি দেখতে পান যে এটি স্কোরিট (পি (1-পি) / এন) অনুপাতের অনুমানের মান বিচ্যুতি সম্পর্কিত দ্বি-দ্বিস্থলের জন্য, তবে পি = 1/2 সর্বাধিক। যখন পি = 1 বা 0 মান ত্রুটি 0 হয় কারণ আপনি সর্বদা যথাক্রমে সমস্ত 1 বা সমস্ত 0 গুলি পাবেন। আপনি 0 বা 1 এর কাছাকাছি যাওয়ার সাথে একটি ধারাবাহিকতা যুক্তি বলে যে পি 0 বা 1 এর নিকটবর্তী হওয়ার সাথে সাথে স্ট্যান্ডার্ড ত্রুটি 0 এ পৌঁছেছে বাস্তবে এটি পি 0 বা 1 এর নিকটবর্তী হওয়ার সাথে সাথে এটি একঘেয়েমি হ্রাস পায় বৃহত n এর জন্য আনুমানিক অনুপাতটি বাস্তবের কাছাকাছি হওয়া উচিত অনুপাত.


3
ওপি ইতিমধ্যে মন্তব্য করেছে যে "আমি যখন অনুপাতের স্ট্যান্ডার্ড ত্রুটির জন্য সমীকরণটি দেখি তখন কেন এটি হয় তা আমি দেখতে পারি" " সুতরাং আমি বিশ্বাস করি তারা সূত্র বিশ্লেষণের জন্য বলছেন নাp(1p), বরং কেন সূত্রের গভীরভাবে জন্য - যাহা এটা হতে পারে - সত্যিই কর্তব্য এ বড় করাp=1/2
whuber

1
@ তবে আমি যেভাবে করেছি তার উত্তর দিয়েছি কারণ আমি দেখতে পাচ্ছি যে সূত্রটি কেন পি = 1/2 এ সবচেয়ে বড় এবং পি 0 বা 1 এর কাছাকাছি থাকার সময় খুব ছোট কেন তা বোঝার জন্য মৌলিক Maybe সূত্র থেকে সম্পূর্ণ বিচ্যুত কোন ব্যাখ্যা।
মাইকেল আর চেরনিক

1

দ্বিপদ বিন্যাস (বড় জন্য মোটামুটিভাবে প্রতিসম হতে থাকেnএটি প্রায় স্বাভাবিক )।

যেহেতু অনুপাতটি 0 এবং 1 এর মধ্যে হওয়া আবশ্যক তাই অনিশ্চয়তা এই সীমাবদ্ধতায় সীমাবদ্ধ থাকবে। গড় অনুপাতটি ঠিক মাঝখানে না হলে এই সীমাগুলির মধ্যে একটি অপরটির চেয়ে বেশি সীমাবদ্ধ থাকবে।

একটি কেন্দ্রিক ইউনিট বিহীন বেল বক্ররেখা জন্য p ইউনিটের ব্যবধানে ফিট করতে এর অর্ধ-প্রস্থ অবশ্যই কম হওয়া উচিত min[p,1p]


হ্যাঁ - তবে অন্য সীমাটি কম সীমাবদ্ধ হবে! দুটি প্রভাব কেন বাতিল হয় না?
whuber

@ যেহেতু আমি প্রতিসম থেকে তর্ক করছিলাম (অর্থাত্ সরল "বৃহত্তর " ক্ষেত্রে, প্রতিসম ঘণ্টা বক্ররেখা অবশ্যই বিরতিতে মাপসই করা উচিত, সুতরাং এর অর্ধ প্রস্থটি আরও শক্ততর দ্বারা আবদ্ধ হয়, )nmin[p,1p]
জিওম্যাটট22
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.