কেন একটি 95% আত্মবিশ্বাস অন্তর্বর্তী (সিআই) মানে না থাকার 95% সুযোগ বোঝায় না?


228

দেখে মনে হচ্ছে যে এখানে বিভিন্ন সম্পর্কিত প্রশ্নের মধ্য দিয়ে এখানে sensক্যমত্য রয়েছে যে আমরা "95%" আত্মবিশ্বাসের ব্যবধানকে যা বলে থাকি তার "95%" অংশটি এই সত্যটিকে বোঝায় যে আমরা যদি আমাদের নমুনা এবং সিআই-গণনার পদ্ধতিগুলি বহুবার প্রতিলিপি করি তবে , এইভাবে গণনা করা সিআই এর 95% জনসংখ্যার গড় ধারণ করে। এছাড়া যে এই সংজ্ঞা আছে ঐক্যমত্য হবে বলে মনে হয় নাএকজনকে একটি একক 95% সিআই থেকে উপসংহারে পৌঁছানোর অনুমতি দিন যে 95% সম্ভাবনা রয়েছে যেটি সিআই এর মধ্যে কোথাও পড়বে। যাইহোক, আমি বুঝতে পারি না যে প্রাক্তন কীভাবে পরবর্তী ইনসোফারটিকে বোঝায় না, অনেক সিআই কল্পনা করেছিলেন যে 95% জনসংখ্যা রয়েছে তার অর্থ আমাদের অনিশ্চয়তা হওয়া উচিত নয় (আমাদের প্রকৃত গণনা করা সিআই জনসংখ্যা রয়েছে কিনা সে সম্পর্কে মানে বা না) আমাদের বাস্তব ক্ষেত্রে সিআই রয়েছে এমন সম্ভাবনা সম্পর্কে আমাদের অনুমান হিসাবে আমাদের কল্পনা করা মামলার (95%) বেস-রেট ব্যবহার করতে বাধ্য করুন?

আমি পোস্টগুলিকে "প্রকৃতভাবে গণনা করা সিআই এর জনসংখ্যার অর্থ ধারণ করে বা এটি করে না, এর ধারায় যুক্তি দেখিয়েছি, সুতরাং এর সম্ভাব্যতা 1 বা 0 হয়" তবে এটি সম্ভবত নির্ভরতার একটি অদ্ভুত সংজ্ঞা বোঝায় যা নির্ভরশীল অজানা রাষ্ট্রগুলিতে (অর্থাত্ কোনও বন্ধু ফর্সা মুদ্রা উল্টায়, ফলাফলটি লুকিয়ে রাখে, এবং এটির 50% সম্ভাবনা রয়েছে বলে আমি বারণ করি না)।

অবশ্যই আমি ভুল, কিন্তু আমার যুক্তিটি কোথায় খারাপ হয়েছে তা আমি দেখতে পাই না ...


4
"সুযোগ" দ্বারা, আপনি কি প্রযুক্তিগত ঘনত্ববাদী অর্থে "সম্ভাব্যতা" বলতে চান, বা বায়েসিয়ান অর্থে ব্যক্তিত্বমূলক বোধগম্যতার অর্থ? ঘনত্ববাদী অর্থে, কেবল এলোমেলো পরীক্ষার ইভেন্টগুলির সম্ভাবনা থাকে। তাদের অর্ডার নির্ধারণের জন্য তিনটি প্রদত্ত (নির্দিষ্ট) সংখ্যা (প্রকৃত গড়, গণনা করা সিআই সীমানা) সন্ধান করা (এটিকে সত্যিকার অর্থে সিআই অন্তর্ভুক্ত?) কোনও র্যান্ডম পরীক্ষা নয়। এই কারণেই "প্রকৃত-গণিত সিআই এর সম্ভাব্যতা অংশটি জনসংখ্যার অর্থ ধারণ করে বা এটি হয় না, সুতরাং এর সম্ভাব্যতা 1 বা 0 হয়" তেমনি ভুলও রয়েছে। একটি ঘন ঘন সম্ভাবনাময় মডেল কেবলমাত্র সে ক্ষেত্রে প্রযোজ্য নয়।
কারাকাল

11
এটি তাত্ত্বিক গড়কে কীভাবে আচরণ করে তার উপর নির্ভর করে। যদি এটি এলোমেলো পরিবর্তনশীল হয় তবে আপনি সম্ভাব্যতা সম্পর্কে বলতে পারেন যে এটি কিছু ব্যবধানে পড়ে। যদি এটি স্থির থাকে তবে আপনি পারবেন না। এটি সবচেয়ে সহজ ব্যাখ্যা, যা ব্যক্তিগতভাবে আমার জন্য এই সমস্যাটি বন্ধ করে দিয়েছে।
এমপিটকাস

2
ঘটনাক্রমে, আমি এই আলোচনা জুড়ে এসেছি, থাডিউস তারপে থেকে: সমস্ত মডেল সঠিক ... বেশিরভাগই অকেজো । তিনি সম্ভাব্যতার প্রশ্নটি নিয়ে আলোচনা করেছেন যে 95% আত্মবিশ্বাসের ব্যবধানে (পি। 81 এফএফ) রয়েছে? μ
chl

3
@ নেপ: আমি মনে করি না যে সিআইআইতে (স্থির) পরামিতি রয়েছে এমন (উত্তরোত্তর) সম্ভাবনার প্রসঙ্গে "এটির সম্ভাবনা হয় শূন্য বা এক একটি" বিবৃতিতে কোনও সমস্যা আছে বলে আমি মনে করি না। (এই এমনকি নেই সত্যিই সম্ভাব্যতা কোন frequentist ব্যাখ্যা উপর নির্ভর!)। এটি "অজানা অবস্থা" এর উপরও নির্ভর করে না। এই জাতীয় বিবৃতি সেই পরিস্থিতিতে নির্দিষ্টভাবে বোঝায় যেটিতে নির্দিষ্ট নমুনার উপর ভিত্তি করে একজনকে সিআই দেওয়া হয়। এটা একটি সহজ গাণিতিক ব্যায়াম দেখাতে হবে যে এই ধরনের যে কোনও সম্ভাবনা তুচ্ছ হয়, অর্থাত্ মান লাগে । {0,1}
কার্ডিনাল

3
@ মাইক্রাওরেন্স তিন বছর পরে, আপনি এই হিসাবে 95% আত্মবিশ্বাসের ব্যবধানের সংজ্ঞা নিয়ে খুশি: "যদি আমরা বারবার জনসংখ্যা থেকে নমুনা নিই এবং প্রতিটি নমুনার পরে 95% আত্মবিশ্বাসের ব্যবধান গণনা করি তবে আমাদের 95% আস্থা অন্তর অন্তর্ভুক্ত থাকবে "। আপনার মতো ২০১২-তে, আমি কীভাবে এটি বোঝায় না যে 95% আত্মবিশ্বাসের ব্যবধানে 95% সম্ভাব্যতা রয়েছে তা বোঝার জন্য আমি লড়াই করে যাচ্ছি। আপনি এই প্রশ্নটি জিজ্ঞাসা করার পর থেকে একটি আত্মবিশ্বাসের অন্তর সম্পর্কে আপনার বোঝাপড়া কীভাবে বৃদ্ধি পেয়েছে তা দেখার আগ্রহী আমি।
লুসিয়ানো

উত্তর:


107

ইস্যুটির অংশটি হ'ল সম্ভাবনার ঘন ঘন সংজ্ঞাটি কোনও নির্দিষ্ট পরীক্ষার ফলাফলের জন্য কোনও অনাকাঙ্ক্ষিত সম্ভাবনা প্রয়োগ করতে দেয় না, তবে কেবলমাত্র পরীক্ষাগুলির এমন কিছু কল্পিত জনগোষ্ঠীর জন্য যা থেকে এই নির্দিষ্ট পরীক্ষাকে নমুনা হিসাবে বিবেচনা করা যেতে পারে। সিআই-এর সংজ্ঞাটি বিভ্রান্তিকর কারণ এটি পরীক্ষার কল্পিত জনসংখ্যার বিষয়ে একটি বিবৃতি, যেমনটি হাতের উদাহরণে সংগ্রহ করা নির্দিষ্ট ডেটা সম্পর্কে নয়। সুতরাং ইস্যুটির একটি অংশ সম্ভাবনার একটি সংজ্ঞা: সম্ভাব্যতা 95% সহ একটি নির্দিষ্ট ব্যবধানের মধ্যে থাকা সত্যিকারের মানটি একটি ঘন ঘন কাঠামোর সাথে বেমানান।

ইস্যুর আরেকটি বিষয় হ'ল ঘনত্ববাদী আত্মবিশ্বাসের গণনাটি পরিসংখ্যানের সত্যিকারের মানকে আবদ্ধ করার জন্য নির্দিষ্ট নমুনায় থাকা সমস্ত তথ্য ব্যবহার করে না। আমার প্রশ্ন "এখানে কি এমন কোনও উদাহরণ রয়েছে যেখানে বায়েশীয় বিশ্বাসযোগ্য অন্তরগুলি ঘন ঘন আস্থাভাজন বিরতির তুলনায় স্পষ্টতই নিকৃষ্ট হয়"এডউইন জেনিসের একটি গবেষণাপত্র নিয়ে আলোচনা করেছেন যার সত্যিকারের ভাল উদাহরণ রয়েছে যা আত্মবিশ্বাসের ব্যবধান এবং বিশ্বাসযোগ্য ব্যবধানগুলির মধ্যে পার্থক্যকে সত্যই তুলে ধরে। যে এই আলোচনার বিশেষ করে প্রাসঙ্গিক উদাহরণ 5, যা বিশ্বাসযোগ্য এবং (শিল্প মান নিয়ন্ত্রণ একটা সমস্যা জন্য) একটি ছেঁটে ফেলা সূচকীয় বণ্টনের প্যারামিটার আনুমানিক হিসাব জন্য একটি কনফিডেন্স ব্যবধান মধ্যে পার্থক্য আলোচনা হয়। তিনি যে উদাহরণটি দিয়েছেন তাতে নমুনায় পর্যাপ্ত তথ্য রয়েছে যা নিশ্চিত হওয়া যায় যে প্যারামিটারের আসল মান সঠিকভাবে নির্মিত 90% আস্থাভাজনের ব্যবধানে কোথাও নেই!

এটি কারও কাছে হতবাক বলে মনে হতে পারে তবে এই ফলাফলের কারণ হ'ল আত্মবিশ্বাসের ব্যবধান এবং বিশ্বাসযোগ্য ব্যবধানগুলি সম্ভাবনার দুটি পৃথক ব্যাখ্যা থেকে দুটি পৃথক প্রশ্নের উত্তর।

আত্মবিশ্বাসের ব্যবধানটি অনুরোধের উত্তর: "আমাকে এমন একটি বিরতি দিন যা প্রচুর সংখ্যক বার পুনরাবৃত্তি হয় এমন পরীক্ষার উদাহরণগুলির % প্যারামিটারের আসল মানটি ।" বিশ্বাসযোগ্য ব্যবধান অনুরোধ একটি উত্তর: "আমাকে একটি বিরতি যে সম্ভাবনা সঙ্গে সত্য মান বন্ধনী দাও । বিশেষ নমুনা আমি আসলে পালন করেছি দেওয়া " আধুনিক অনুরোধ উত্তর দিতে সক্ষম হওয়ার উদ্দেশ্যে আমরা প্রথম পারেন দত্তক গ্রহণ করা হবে (একটি ) ডেটা উত্পাদন প্রক্রিয়াটির একটি নতুন ধারণা বা (খ) সম্ভাবনার সংজ্ঞা নিজেই আলাদা ধারণা concept পি100pp

যে কোনও নির্দিষ্ট 95% আত্মবিশ্বাসের ব্যবধানটি অর্থটি ধারণ করার 95% সম্ভাবনা বোঝায় না কারণ আত্মবিশ্বাসের ব্যবধানটি একটি ভিন্ন প্রশ্নের উত্তর, সুতরাং যখন দুটি প্রশ্নের উত্তর ঘটে তখনই এটি সঠিক উত্তর হয় it একই সংখ্যা সমাধান আছে।

সংক্ষেপে, বিশ্বাসযোগ্য এবং আত্মবিশ্বাসের ব্যবধানগুলি বিভিন্ন দৃষ্টিকোণ থেকে বিভিন্ন প্রশ্নের উত্তর দেয়; উভয়ই কার্যকর, তবে আপনি যে প্রশ্নটি জিজ্ঞাসা করতে চান তার জন্য আপনার সঠিক ব্যবধানটি বেছে নেওয়া দরকার। যদি আপনি এমন একটি অন্তর চান যা 95% (উত্তরোত্তর) সম্ভাব্যতার প্রকৃত মান ধারণের একটি ব্যাখ্যা স্বীকার করে, তবে একটি বিশ্বাসযোগ্য ব্যবধান বেছে নিন (এবং এটির সাথে, সম্ভাবনার পরিচারক ধারণা), কোনও আত্মবিশ্বাসের ব্যবধান নয়। বিশ্লেষণে ব্যবহৃত ব্যবস্থার চেয়ে ব্যাখ্যার ক্ষেত্রে সম্ভাবনার একটি আলাদা সংজ্ঞা গ্রহণ করা আপনার যা করা উচিত নয়।

তার পরিশোধিতকরণের জন্য @ কার্ডিনালকে ধন্যবাদ!

ডেভিড ম্যাকের দুর্দান্ত বই "ইনফরমেশন থিওরি, ইনফারেন্স অ্যান্ড লার্নিং অ্যালগরিদম" (পৃষ্ঠা 464) থেকে এখানে একটি দৃ concrete় উদাহরণ দেওয়া হয়েছে :

সুদের প্যারামিটার হতে দিন এবং ডেটা , পয়েন্ট একজোড়া এবং নিম্নলিখিত বন্টন থেকে স্বাধীনভাবে টানা:ডি এক্স 1 এক্স 2θDx1x2

p(x|θ)={1/2x=θ,1/2x=θ+1,0otherwise

তাহলে হয় , তাহলে আমরা ডেটাসেট দেখার আশা করতে , , এবং সব সমান সম্ভাবনা থাকে । আত্মবিশ্বাসের ব্যবধান বিবেচনা করুন39 ( 39 , 39 ) ( 39 , 40 ) ( 40 , 39 ) ( 40 , 40 ) 1 / 4θ39(39,39)(39,40)(40,39)(40,40)1/4

[θmin(D),θmax(D)]=[min(x1,x2),max(x1,x2)]

স্পষ্টতই এটি একটি বৈধ 75% আত্মবিশ্বাসের ব্যবধান কারণ আপনি যদি ডেটা, পুনরায় নমুনা তৈরি করেন তবে অনেক সময় এইভাবে নির্মিত আত্মবিশ্বাসের ব্যবধানে 75% সময় আসল মান থাকবে।D=(x1,x2)

এখন ডেটা বিবেচনা করুন । এই ক্ষেত্রে ঘন ঘন 75% আত্মবিশ্বাসের ব্যবধান হবে । তবে, উত্পাদনের প্রক্রিয়াটির মডেলটি সঠিক বলে ধরে , এই ক্ষেত্রে 28 বা 29 হতে পারে, এবং আমাদের ধরে নেওয়ার কোনও কারণ নেই যে 29 টি 28 এর চেয়ে বেশি, সুতরাং উত্তরোত্তর সম্ভাবনা । তাই এই ক্ষেত্রে frequentist আস্থা ব্যবধান পরিষ্কারভাবে না 75% বিশ্বাসযোগ্য ব্যবধান যেমন সেখানে মাত্র 50% সম্ভাবনা এটি সত্য মান রয়েছে হয় , প্রদত্ত কি আমরা সম্পর্কে আবিষ্কার করতে পারেন এই বিশেষ নমুনা থেকে[ 29 , 29 ] θ পি ( θ = 28 | ডি ) = P ( θ = 29 | ডি ) = 1 / 2 θ θD=(29,29)[29,29]θp(θ=28|D)=p(θ=29|D)=1/2θθ

হ্যাঁ, এটি একটি স্বীকৃত উদাহরণ, তবে যদি আত্মবিশ্বাসের অন্তর এবং বিশ্বাসযোগ্য ব্যবধানগুলি আলাদা না হয় তবে তারা এখনও স্বীকৃত উদাহরণগুলিতে অভিন্ন হবে।

মূল পার্থক্যটি দ্রষ্টব্য হ'ল আত্মবিশ্বাসের ব্যবধান হ'ল কী হবে তা সম্পর্কে একটি বিবৃতি যা আপনি পরীক্ষায় বহুবার পুনরাবৃত্তি করেন, বিশ্বাসযোগ্য ব্যবধানটি একটি নির্দিষ্ট বিবরণ যা এই নির্দিষ্ট নমুনা থেকে অনুমান করা যায় about


8
আত্মবিশ্বাসের ব্যবধান হ'ল প্রশ্নের একটি উত্তর "আমাকে এমন একটি বিরতি দিন যা পরীক্ষার সংখ্যক বার পুনরাবৃত্তি করা হয়" যদি সম্ভাবনা পি দিয়ে পরিসংখ্যানের আসল মানটি বন্ধন করে। বিশ্বাসযোগ্য ব্যবধানটি "আমাকে এমন একটি বিরতি দিন যা সম্ভাব্যতা পি সহ সত্য মানকে বন্ধনী দেয়" এই প্রশ্নের উত্তর। প্রথমত, সম্ভাবনার ঘনঘনবাদী ব্যাখ্যা সম্পর্কিত বিবৃতিটি পছন্দসই কিছু রেখে দেয়। সম্ভবত, বিষয়টি সেই বাক্যে সম্ভাব্যতা শব্দটি ব্যবহারের মধ্যে রয়েছে । দ্বিতীয়ত, আমি বিশ্বাসযোগ্য ব্যবধানটি "সংজ্ঞা "টিকে কিছুটা সরল মনে করি ...
কার্ডিনাল

7
... এবং আপনি সিআইকে যে বৈশিষ্ট্যটি দিয়েছেন তা বিবেচনা করে কিছুটা বিভ্রান্তিকর। সম্পর্কিত শিরাতে, সমাপ্ত বাক্যটির একই সমস্যা রয়েছে: আপনি যদি এমন একটি বিরতি চান যা 95% সময় সময় করে সঠিক মান রাখে, তবে একটি বিশ্বাসযোগ্য ব্যবধান বেছে নিন, আত্মবিশ্বাসের ব্যবধান নয়। "সত্যিকারের 95% সময়ের মান রয়েছে" এর কথাবার্তাটি কিছুটা অসম্পূর্ণতা এবং ভুল ধারণা ছেড়ে দেয়। প্রকৃতপক্ষে, আমি একটি দৃinc়প্রত্যয়ী যুক্তি দিতে পারি (আমি বিশ্বাস করি) যে এই জাতীয় কথাটি সিআই এর সংজ্ঞা হওয়ার থেকে অনেক বেশি কাছাকাছি।
কার্ডিনাল

11
অনুরোধ : মন্তব্যগুলিতে তাদের মতামত / কারণগুলি জানাতে এই উত্তরটি নেওয়ার পক্ষে সহায়ক হবে। যদিও এই প্রশ্নটি বর্ধিত আলোচনার দিকে পরিচালিত করার তুলনায় কিছুটা বেশি সম্ভাবনা রয়েছে, তবুও উত্তরদাতাদের গঠনমূলক প্রতিক্রিয়া সরবরাহ করা দরকারী; এটি সাইটের সামগ্রিক সামগ্রীর উন্নতিতে সহায়তা করার অন্যতম সহজ উপায়। চিয়ার্স।
কার্ডিনাল

9
ডিকরান, হ্যাঁ, আমি একমত। আমি সম্পাদনাগুলিতে আরও কিছুটা আঁকতে চেষ্টা করেছিলাম তারই এটি ছিল। একটি র‌্যাডিকাল ঘনত্ববাদী (যা আমি অবশ্যই নই ) এটিকে উস্কানিমূলকভাবে বলতে পারে: "একটি সিআই রক্ষণশীল যে আমি এই ব্যবধানটি আগেই ডিজাইন করেছিলাম যে আমি যে নির্দিষ্ট ডেটা পর্যবেক্ষণ করি না কেন, প্যারামিটারটি 95% ব্যবধানে ধরা পড়বে সময়ের। একটি বিশ্বাসযোগ্য ব্যবধানটি 'ওফ, কেউ আমার কোলে কিছু তথ্য নিক্ষেপ করে বলে উত্থাপিত হয় that তথ্য থেকে আমি যে তথ্যসূত্রটি তৈরি করি তাতে প্রকৃত প্যারামিটারটি কী থাকে?' "এটি পরবর্তী ক্ষেত্রে কিছুটা অন্যায় .. ।
কার্ডিনাল

2
ডিকরান, আমরা সবাই বিভিন্ন ব্যাকগ্রাউন্ড থেকে এসেছি এবং এটি আমাদের বোঝার সমৃদ্ধ করতে সহায়তা করে। সম্ভাব্যতা এবং সম্পর্কিত ধারণাগুলি সম্পর্কে, সম্ভবত সবচেয়ে উজ্জ্বল চিন্তাবিদ আমার সাথে আলাপচারিতা করার আনন্দের সাথে একটি আনুষ্ঠানিক পরিসংখ্যান বা (গাণিতিক) সম্ভাবনার পটভূমি নেই; তিনি একজন ইঞ্জিনিয়ার ছিলেন।
কার্ডিনাল

28

ঘন ঘন পরিসংখ্যানের সম্ভাবনাগুলি দীর্ঘকালীন ঘটনাগুলি সম্পর্কে events তারা কেবল কোনও ইভেন্ট সম্পন্ন হওয়ার পরে প্রয়োগ করে না। এবং সিআই এর একটি পরীক্ষা-নিরীক্ষা চালানো কেবল এমন ঘটনা।

আপনি এটি কোনও লুকানো মুদ্রার প্রধান হওয়ার সম্ভাবনার সাথে তুলনা করতে চেয়েছিলেন কিন্তু আপনি পারবেন না। আপনি এটি খুব কাছের কিছু সম্পর্কিত করতে পারেন। যদি আপনার গেমটির কোনও নিয়ম থাকে যেখানে আপনাকে ফ্লিপ "হেডস" এর পরে উল্লেখ করতে হবে তবে আপনি দীর্ঘমেয়াদে সঠিক হবেন এমন সম্ভাবনা 50% এবং এটি সাদৃশ্যপূর্ণ।

আপনি যখন নিজের পরীক্ষা চালান এবং আপনার ডেটা সংগ্রহ করেন তখন আপনার মুদ্রার আসল ফ্লিপের মতো কিছু মিলবে। পরীক্ষার প্রক্রিয়াটি মুদ্রা উল্টানোর প্রক্রিয়াটির মতো is যা উত্পন্ন হয় μবা এটি মুদ্রার মাথা ঠিক যেমন হয় না বা হয় না। আপনি একবার মুদ্রাটি সরিয়ে ফেলেন, আপনি এটি দেখেন বা না করেন, এটির মাথা হওয়ার কোনও সম্ভাবনা নেই, তা হয় মাথা হয় না হয় তা নয়। এখন ধরুন আপনি মাথা কল করুন। এটিই সিআই গণনা করা হয়। কারণ আপনি কখনই মুদ্রা প্রকাশ করতে পারবেন না (কোনও পরীক্ষার সাথে আপনার উপমাটি নষ্ট হয়ে যাবে)। হয় আপনি ঠিক বলেছেন বা আপনি ভুল, এটিই। এর বর্তমান রাষ্ট্রটির পরবর্তী ফ্লিপটিতে মাথা উঁচু হওয়ার সম্ভাবনার সাথে কি কোনও সম্পর্ক আছে, বা আমি কী তা পূর্বাভাস দিতে পারতাম? না। যে প্রক্রিয়া দ্বারা মাথা উত্পাদিত হয় সেগুলির উত্পাদন করার একটি 0.5 সম্ভাবনা থাকে তবে এর অর্থ এই নয় যে ইতিমধ্যে একটি মাথা উপস্থিত থাকার সম্ভাবনা 0.5 থাকে। একবার আপনি আপনার সিআই গণনা করলে কোনও সম্ভাবনা থাকে না যে এটি ক্যাপচার করে μ, এটি হয় বা এটি করে না - আপনি ইতিমধ্যে মুদ্রাটি উল্টিয়েছেন।

ঠিক আছে, আমি মনে করি আমি যথেষ্ট নির্যাতন করেছি। গুরুত্বপূর্ণ বিষয়টি হ'ল আপনার উপমাটি বিপথগামী। আপনি কখনই মুদ্রা প্রকাশ করতে পারবেন না; আপনি কেবল মুদ্রা (পরীক্ষা-নিরীক্ষা) সম্পর্কে অনুমানের ভিত্তিতে মাথা বা লেজগুলি কল করতে পারেন। আপনার মাথার বা লেজগুলি সঠিক হওয়ার পরে আপনি বাজি তৈরি করতে চাইতে পারেন তবে আপনি এটি কখনই সংগ্রহ করতে পারবেন না। এছাড়াও, এটি সিআই পদ্ধতির একটি গুরুত্বপূর্ণ উপাদান যা আপনি উল্লেখ করছেন যে আমদানির মান ব্যবধানে রয়েছে। আপনি যদি না থাকেন তবে আপনার সিআই নেই (অথবা কমপক্ষে বর্ণিত% তে একটিও নেই)।

সম্ভবত যে জিনিসটি সিআইকে বিভ্রান্ত করে তোলে তা হ'ল নাম। এটা তোলে মান পারেন যে কি বা থাকে না একটি সীমার এর । আমরা মনে করি সেগুলি রয়েছে μ তবে এর সম্ভাবনাটি এটির বিকাশের প্রক্রিয়াটির মতো নয়। 95% সিআই নামের 95% অংশটি প্রক্রিয়া সম্পর্কে প্রায়। আপনি করতে পারেন একটি সীমার আপনি বিশ্বাস করেন যে পরে রয়েছে নিরূপণ μ কিছু সম্ভাব্যতা পর্যায়ে তবে সেটা ভিন্ন হিসাব এবং না একটি সি আই আছে।μμμ

এটা একটা একটি উপাধি হিসাবে নাম 95% সি আই মনে ভালো ধরনের মান আপনি -এর সম্ভাব্য মনে করি যে ধারণ একটি সীমার পরিমাপের এবং যে সম্ভরপরতা থেকে পৃথক 95%। আমরা এটিকে জেনিফার সিআই বলতে পারি, যখন 99% সিআই ওয়েেন্ডি সিআই। আসলে এটি আরও ভাল হতে পারে। এর পরে, পরে আমরা বলতে পারেন আমরা বিশ্বাস করি যে μ মূল্যবোধের সীমার মধ্যে হতে পারে এবং কেউ বলছে একটি ওয়েন্ডি সম্ভাব্যতা যে আমরা ক্যাপচার করা আছে যে আটকে যাওয়ার মতো μ । আপনি যদি অন্য কোনও উপাধি চান তবে আমি মনে করি আপনার সম্ভবত সিআইয়ের "আত্মবিশ্বাস" অংশ থেকে মুক্তি পেতে দ্বিধা বোধ করা উচিত (তবে এটি একটি অন্তর)।μμμ


যথেষ্ট ন্যায্য এই উত্তরটি ঠিক বলে মনে হচ্ছে তবে আমি এটির একটি আনুষ্ঠানিক (গাণিতিক) বিবরণ দেখতে পছন্দ করব। আনুষ্ঠানিক সাথে, আমি এটি ইভেন্টে রূপান্তরিত করতে চাই। আমি আমার বক্তব্যটি ব্যাখ্যা করব: আমি মনে করি শুরুতে মানগুলির সাথে খুব বিভ্রান্ত হয়ে পড়েছি । কোথাও আমি পড়েছি যে " পি মানগুলি যা গণনা করে তা হ'ল নাল অনুমান, এইচ 0 , সত্য বলে দেওয়া ডেটার সম্ভাব্যতা "। আমি যখন এটি বেয়েস উপপাদ্যের সাথে সম্পর্কিত করেছি, তখন সমস্ত এতটা অনুভূতি পেয়েছিল যে এখন আমি এটিকে সবার কাছে ব্যাখ্যা করতে পারি (অর্থাত্ যে কোনও একটি পি ( ডি | এইচ 0 ) গণনা করে )। তবে, আমি (হাস্যকরভাবে) সেই আত্মবিশ্বাসী নই ...ppH0p(D|H0)
নস্টর

... (অব্যাহত) আত্মবিশ্বাসের বিরতি সহ: জ্ঞানের দিক দিয়ে আপনি যা বলেছিলেন তা প্রকাশ করার কোনও উপায় আছে? ফ্রিকিতে পরিসংখ্যান। এক সাধারণত একটি বিন্দু আনুমানিক কিছু পদ্ধতি (যেমন, MLE) সঙ্গে। একটি উপায় আছে লিখতে হয় পি ( এল 1 ( μ ) < μ < এল 2 ( ^ আছি তোমার দর্শন লগ করা ) | ডি ) (যেমন একটি bayesian কেন্দ্রীয় অবর ব্যবধান, সঙ্গে সঙ্গে μ "সত্যিকারের গড়") এর কার্যকারিতা হিসেবে পি ( 1 < ˉ এক্স - μ <μ^P(L1(μ^)<μ<L2(mu^)|D)μ (অর্থাত্আত্মবিশ্বাসের অন্তরগুলির α % আসলে কী) আপনি যখন p ( H 0 | D ) কে পি ( ডি | এইচ 0 ) এর ফাংশন হিসাবেপ্রকাশ করতে পারেন? স্বজ্ঞাতভাবে আমি সবসময় ভাবতাম যে এটি করা যেতে পারে তবে এটি কখনই হয়নি। P(L1<X¯μ<L2)=ααp(H0|D)p(D|H0)
নস্টর

কখনও কখনও মন্তব্যগুলি মুছতে সক্ষম হওয়ায় এর ত্রুটিগুলি রয়েছে। এই পরিবর্তনগুলিতে আমি দ্রুত পরিবর্তনগুলি ধরে রাখতে পারি না!
কার্ডিনাল

1
" যদি আপনি আপনার আত্মবিশ্বাসের ব্যবধানটি গণনা না করেন তবে আপনার কাছে লুকানো মুদ্রার অনুরূপ কিছু রয়েছে এবং মুদ্রার যেমন মুখ্য হওয়ার 50% সম্ভাবনা রয়েছে ঠিক তেমন মু'র ধারণের 95% সম্ভাবনা রয়েছে " "- আমার মনে হয় আপনি পেয়েছেন উপমা এখানে ভুল। "সিআইয়ের গণনা করা" মুদ্রাটি প্রকাশের সাথে মিলে যায় না, এটি "শীর্ষস্থানীয়" বা "লেজ" কল করার সাথে মিলে যায়, এমন পর্যায়ে আপনার এখনও সঠিক হওয়ার 50-50 সম্ভাবনা থাকে। মুদ্রা প্রকাশক করুন * জনসংখ্যা মান এইজন্য অনুরূপ , যা এ নির্দেশ আপনি তা "বলা" ব্যবধান থাকা জিনিসের প্রশ্নের উত্তর দিতে পারেন। ওপির ধাঁধাটি রয়ে গেছে। μ
Glen_b

1
@ ভনজডি, আমি এটি দেখতে পাচ্ছি না যে এটির অর্থ কী? আপনার প্রতিপক্ষের ফ্লাশ হয়েছে বা নেই তা বেশ স্পষ্টতই এমন ঘটনা। যদি পূর্বের হয় তবে সম্ভাবনাটি (তুচ্ছভাবে) 1 হয় এবং যদি পরে 0 হয় তবে ফলস্বরূপ, আপনি সংবেদনশীলভাবে বলতে পারবেন না সম্ভাবনাটি .198। এটা নিখুঁত জ্ঞান করে তোলে। হাত মোকাবেলা করার আগে , ফ্লাশের মোকাবিলা করার সম্ভাবনা সম্পর্কে কথা বলা যুক্তিযুক্ত। তেমনি, কার্ড আঁকার আগে, আপনার প্রয়োজনীয় স্যুট পাওয়ার সম্ভাবনা সম্পর্কে কথা বলা যুক্তিযুক্ত। আপনার কার্ডটি থাকার পরে এটি যা কিছু উপযুক্ত তা কেবল।
গাং

22

আর্মিস্টিকস, অনুমান এবং যুক্তি সম্পর্কে আনুষ্ঠানিক, স্পষ্ট ধারণা, এরিস্টটলের সাথে পশ্চিমা traditionতিহ্যের মধ্যেই উদ্ভূত হয়েছিল। এরিস্টটল বিভিন্ন বিষয়গুলিতে এই বিষয়গুলি সম্পর্কে লিখেছিলেন (যার মধ্যে শীর্ষস্থানীয় বিষয়গুলি বলা হয় ;-))। যাইহোক, সর্বাধিক প্রাথমিক একক নীতিটি ল-অফ-অ-দ্বন্দ্ব যা মেটেফিজিক্স সহ বিভিন্ন স্থানে পাওয়া যায়চতুর্থ অধ্যায়, অধ্যায় 3 এবং 4 বইটি একটি সাধারণ সূত্রটি হ'ল: "... একই সময়ে কোনও কিছুর পক্ষে [একই অর্থে] থাকা এবং না হওয়া অসম্ভব" (1006 এ 1)। এর গুরুত্ব কিছুটা আগে বলা হয়েছে, "... এটি স্বাভাবিকভাবেই অন্য সমস্ত অক্ষের জন্যও প্রাথমিক বিন্দু" (1005 বি 30)। দার্শনিকভাবে মোমের জন্য আমাকে ক্ষমা করুন, তবে প্রকৃতির এই প্রশ্নটির মধ্যে দার্শনিক সামগ্রী রয়েছে যা সুবিধার জন্য কেবল আলাদা করা যায় না।

এই চিন্তার-পরীক্ষাটি বিবেচনা করুন: অ্যালেক্স একটি মুদ্রা ফ্লিপ করে, এটি ধরেন এবং তার হাতটি পাশের মুখটি .েকে দিয়ে তাঁর হাতের উপরে তুলে দেন। বব ঠিক সঠিক অবস্থানে দাঁড়িয়ে ছিল; তিনি অ্যালেক্সের হাতে মুদ্রাটি সংক্ষেপে দেখেছিলেন এবং এইভাবে এখন কোন দিকে মুখ করে তা অনুমান করতে পারেন। তবে কার্লোস মুদ্রাটি দেখেনি - তিনি সঠিক জায়গায় ছিলেন না। এই মুহুর্তে, অ্যালেক্স তাদের জিজ্ঞাসা করে যে মুদ্রাটি প্রধান দেখায় এমন সম্ভাবনাটি কী। কার্লোস পরামর্শ দেয় যে সম্ভাবনা .5, কারণ এটি দীর্ঘকালীন মাথার ফ্রিকোয়েন্সি। বব একমত নন, তিনি আত্মবিশ্বাসের সাথে দৃser়ভাবে দাবি করেছেন যে সম্ভাবনা হ'ল 0 ছাড়া আর কিছুই নয় ।

এখন, কে ঠিক আছে? এটি অবশ্যই সম্ভব যে বব ভুল দেখেছে এবং এটি ভুল (আমাদের ধরে নেওয়া যাক তিনি ভুল দেখেন নি)। তবুও, আপনি উভয়ই সঠিক এবং অ-বিরোধবিরোধী আইনকে ধরে রাখতে পারবেন না। (আমি মনে করি যে আপনি যদি দ্বি-দ্বন্দ্বের আইনকে বিশ্বাস না করেন তবে আপনি ভাবতে পারেন যে তারা উভয়ই ঠিক, বা এই জাতীয় কিছু গঠনমূলক।) এখন একইরকম একটি ঘটনাটি কল্পনা করুন, তবে বব উপস্থিত না থাকলে কার্লোসের পরামর্শ হতে পারে? আরও ঠিক (এহ?) বব ছাড়া চারপাশে, যেহেতু কেউ মুদ্রাটি দেখেনি? এই ক্ষেত্রে অ-দ্বন্দ্ব আইনের প্রয়োগটি খুব বেশি স্পষ্ট নয় তবে আমি মনে করি যে এটি স্পষ্টতই স্পষ্ট যে পরিস্থিতিগুলির যে অংশগুলি গুরুত্বপূর্ণ বলে মনে হচ্ছে তা পূর্ব থেকে পরবর্তী অবধি স্থির ছিল। সম্ভাব্যতা সংজ্ঞায়িত করার জন্য অনেক চেষ্টা করা হয়েছে এবং ভবিষ্যতে এখনও আরও অনেক কিছু থাকতে পারে, তবে কে চারপাশে দাঁড়িয়ে থাকতে পারে এবং যেখানে তারা অবস্থান নিয়ে থাকে তার কোনও ক্রিয়াকলাপ হিসাবে সম্ভাবনার সংজ্ঞা খুব কম আবেদন করে has যে কোনও হারে (আপনার বাক্যাংশটি ব্যবহার করে অনুমান করা)আত্মবিশ্বাসের ব্যবধান "), আমরা ফ্রিকোয়েন্সিস্ট পদ্ধতির মধ্যে কাজ করছি এবং এর মধ্যে কেউ মুদ্রার সত্যিকারের অবস্থা অপ্রাসঙ্গিক কিনা তা জানে কিনা It এটি কোনও এলোমেলো পরিবর্তনশীল নয় - এটি একটি উপলব্ধ মূল্য এবং এটি মাথা দেখায়, বা এটি লেজ দেখায় whether ।

@ জন নোট হিসাবে, একটি কয়েনের অবস্থা প্রথমে কোনও আত্মবিশ্বাসের ব্যবধানটি প্রকৃত অর্থকে অন্তর্ভুক্ত করে কিনা এই প্রশ্নের তুলনায় প্রথমে মনে হতে পারে না। যাইহোক, একটি মুদ্রার পরিবর্তে, আমরা প্যারামিটার সহ একটি বের্নোল্লি বিতরণ থেকে টানা একটি উপলব্ধি মূল্য হিসাবে এটি বিমূর্তভাবে বুঝতে পারি । মুদ্রার পরিস্থিতিতে, পি = .5 , যেখানে 95% সিআই, পি = .95 । সংযোগটি তৈরিতে যে বিষয়টি উপলব্ধি করা দরকার তা হ'ল রূপকের গুরুত্বপূর্ণ অংশটি পরিস্থিতি নিয়ন্ত্রণ করে এমন পি নয় , বরং উল্টানো মুদ্রা বা গণনা করা সিআই একটি এলোমেলো মান , এলোমেলো পরিবর্তনশীল নয়। pp=.5p=.95p

আমার পক্ষে এই মুহুর্তে লক্ষ্য করা জরুরী যে এই সমস্ত কিছুই সম্ভাবনার একটি ফ্রিকোয়েন্সিবাদী ধারণার মধ্যে রয়েছে। বায়েশীয় দৃষ্টিভঙ্গি অ-দ্বন্দ্বের আইনকে লঙ্ঘন করে না, এটি কেবল বাস্তবতার প্রকৃতি (সম্ভাব্যতা সম্পর্কে আরও বিশেষত) সম্পর্কে বিভিন্ন রূপক অনুমান থেকে শুরু হয়। সিভি নিয়ে অন্যদের অনেক ভালো Bayesian দৃষ্টিকোণ কোবিদ হয় আমার চেয়ে, এবং সম্ভবত কেন তারা আপনার প্রশ্নের পিছনে অনুমানের Bayesian পদ্ধতির মধ্যে প্রযোজ্য হবে না ব্যাখ্যা হতে পারে, এবং যে আসলে ভাল হতে পারে গড় একটি 95% সম্ভাবনা একটি 95% বিশ্বাসযোগ্য মধ্যে মিথ্যাব্যবধান, (অন্যান্যদের মধ্যে) সহ নির্দিষ্ট শর্তে যে পূর্বের ব্যবহারটি সঠিক ছিল (নীচে @ ডিক্রানমারসুপিয়ালের মন্তব্য দেখুন)। যাইহোক, আমি মনে করি সবাই একমত হবে, একবার আপনি যখন বলেন যে আপনি ফ্রিকোয়েন্সিবাদী পদ্ধতির মধ্যে কাজ করছেন, এমন ঘটনা ঘটতে পারে না যে কোনও নির্দিষ্ট 95% সিআইয়ের মধ্যে সত্যিকারের অর্থের সম্ভাবনাটি হয়।


5
বায়েশিয়ান পদ্ধতির অধীনে এটি সত্য নয় যে প্রকৃত মান 95% বিশ্বাসযোগ্য ব্যবধানের মধ্যে রয়েছে এমন 95% সম্ভাবনা রয়েছে। এটি বলা আরও সঠিক হবে যে পরিসংখ্যানের মান (আমাদের জ্ঞানের প্রাথমিক অবস্থার প্রতিনিধিত্ব করে) এর জন্য একটি নির্দিষ্ট পূর্ব বন্টন দেওয়া হয়েছে এবং তারপরে আমরা তথ্য পর্যবেক্ষণ করে জানাচ্ছি যে আমাদের উত্তরোত্তর বিতরণ রয়েছে যা জ্ঞানের আপডেট হওয়া রাষ্ট্রের প্রতিনিধিত্ব করে, যা আমাদের একটি বিরতি দেয় যেখানে আমরা 95% নিশ্চিত যে আসল মানটি মিথ্যা। এটি কেবলমাত্র তখনই সঠিক হবে যখন আমাদের পূর্বেরটি যথাযথ (এবং অন্যান্য অনুমান যেমন সম্ভাবনার ফর্ম)।
ডিকরান মার্সুপিয়াল

@ ডিক্রানমারসুপিয়াল, নোটটির জন্য ধন্যবাদ। এটা কিছুটা মুখের কথা। আমি আমার উত্তরটি এটিকে আপনার পরামর্শের সাথে আরও সামঞ্জস্য করার জন্য সম্পাদনা করেছি, তবে এটি পুরোতে অনুলিপি করিনি । যদি আরও সম্পাদনাগুলি উপযুক্ত হয় তবে আমাকে জানান।
গুং

মূলত বেইসিয়ান পদ্ধতির আগ্রহের প্যারামিটার সম্পর্কিত আপনার জ্ঞানের অবস্থার বিবৃতি হিসাবে সবচেয়ে ভাল ব্যাখ্যা করা হয়েছে (কার্ডিনাল দেখুন, আমি শিখছি; ও), তবে গ্যারান্টি দেয় না যে সমস্ত অনুমানগুলি সঠিক না হলে জ্ঞানের অবস্থা সঠিক কিনা । আমি ফিলোসফিকাল আলোচনা উপভোগ করেছি, আমাকে পরের বারের জন্য
অস্পষ্টতার

12

কেন একটি 95% সিআই এর অর্থ ধারণের 95% সুযোগ বোঝায় না?

এই প্রশ্নে এবং প্রদত্ত প্রতিক্রিয়াগুলির বেশিরভাগ ক্ষেত্রে অনেকগুলি বিষয় পরিষ্কার করা দরকার। আমি কেবল তাদের দু'জনের মধ্যেই আবদ্ধ থাকব।

ক। জনসংখ্যা বলতে কী বোঝায়? একটি সত্য জনসংখ্যার মানে কি?

জনসংখ্যার গড় ধারণাটি মডেল-নির্ভর। সমস্ত মডেলগুলি ভুল হলেও কিছু দরকারী, এই জনসংখ্যার অর্থ হ'ল একটি কল্পকাহিনী যা কেবলমাত্র দরকারী ব্যাখ্যা সরবরাহের জন্য সংজ্ঞায়িত করা হয়। কথাসাহিত্য একটি সম্ভাব্যতা মডেল দিয়ে শুরু।

(X,F,P),
XFXPF
μ=xXxP(X=x),
PXxXP(X=x)

PPPPM

(X,F,M).
ΘRpp<M{Pθ: θΘ}

PθM

μθ=xXxPθ(X=x).
{μθ: θΘ}MMM

MΘ

B ইংরেজী বর্ণমালার দ্বিতীয় অক্ষর. আত্মবিশ্বাসের ব্যবধানের সংজ্ঞা এবং উদ্দেশ্য কী?

1αCαθΘ

Pθ(Cα(X)μθ)1α   and   infθΘPθ(Cα(X)μθ)=1α,
Pθ(Cα(X)=)=0Pθ(Cα(X)μθ)Cα(X)μθPθ1α

মন্তব্য: পাঠকদের লক্ষ্য করা উচিত যে বাস্তবের অবস্থার উপর অনুমান করা প্রয়োজন হয় না, আত্মবিশ্বাসের অঞ্চলটি কোনও "সত্য" মানে উল্লেখ না করে একটি সংজ্ঞায়িত পরিসংখ্যানের মডেলের জন্য সংজ্ঞায়িত করা হয়। এমনকি যদি "সত্য" সম্ভাব্যতা পরিমাপের অস্তিত্ব না থাকে বা এটি in তে না থাকে তবে আত্মবিশ্বাসের অঞ্চল সংজ্ঞাটি কার্যকর হবে, কারণ অনুমানগুলি বাস্তবতার রাজ্যের চেয়ে স্ট্যাটিস্টিকাল মডেলিং সম্পর্কে।M

এক দিকে, সামনে ডেটা দেখে, একটি র্যান্ডম সেট (অথবা র্যান্ডম ব্যবধান) এবং সম্ভাব্যতা যে, "হয় মানে রয়েছে , অন্তত," all সকলের জন্য । এটি ঘন ঘন দৃষ্টান্তের জন্য খুব পছন্দসই বৈশিষ্ট্য।Cα(X)Cα(X)μθ(1α)θΘ

অন্যদিকে, পরে দেখে ডেটা , মাত্র একটি নির্দিষ্ট সেট এবং সম্ভাব্যতা যে, "হয় গড় রয়েছে মধ্যে {0,1} এর জন্য হবে" সমস্ত ।xCα(x)Cα(x)μθθΘ

এটি হ'ল ডেটা পর্যবেক্ষণ করার পরে আমরা আর সম্ভাব্য যুক্তিকে নিয়োগ করতে পারি না। আমি যতদূর জানি, একটি পর্যবেক্ষিত নমুনার জন্য আত্মবিশ্বাসের সেটগুলির চিকিত্সার কোনও তত্ত্ব নেই (আমি এটিতে কাজ করছি এবং আমি কিছু সুন্দর ফলাফল পাচ্ছি)। কিছুক্ষণের জন্য, ঘন ঘন বিশেষজ্ঞকে অবশ্যই বিশ্বাস করতে হবে যে পর্যবেক্ষণকৃত সেট (বা অন্তর) একটি সেটগুলির মধ্যে একটি যা সমস্ত জন্য রয়েছে ।সি α ( এক্স ) ( 1 - α ) 100 % μ θ θ Θ ΘxCα(x)(1α)100%μθθΘ

PS: আমি আমার পোস্টে কোনও মন্তব্য, পর্যালোচনা, সমালোচনা বা এমনকি আপত্তিগুলিকে আমন্ত্রণ জানাই। এর গভীরতা নিয়ে আলোচনা করা যাক। যেহেতু আমি স্থানীয় ইংরেজী স্পিকার নই, আমার পোস্টে অবশ্যই টাইপস এবং ব্যাকরণ সংক্রান্ত ভুল রয়েছে।

রেফারেন্স:

শেরভিশ, এম (1995), থিওরি অফ স্ট্যাটিস্টিক্স, সেকেন্ড এড, স্প্রিংগার।


কেউ কি এটি আলোচনা করতে চান?
আলেকজান্দ্রে প্যাট্রিয়োটা

4
আড্ডায় আলোচনা হতে পারে তবে আমাদের মূল সাইটে এটি অনুপযুক্ত। এটি কীভাবে কাজ করে সে সম্পর্কে আরও তথ্যের জন্য দয়া করে আমাদের সহায়তা কেন্দ্রটি দেখুন। এরই মধ্যে, আমি আপনার পোস্টটির ফর্ম্যাটিং দেখে হতবাক: প্রায় সবগুলিই উদ্ধৃতি হিসাবে ফর্ম্যাট করা হয়েছে। আপনি কি কোনও প্রকাশিত উত্স থেকে এই উপাদানটি বের করেছেন বা এটি আপনার নিজের, নতুন এই উত্তরের জন্য রচিত? যদি এটি পরে হয় তবে দয়া করে উদ্ধৃতিগুলি সরিয়ে দিন!
শুক্র

2
(+1 টি)। একটি চিত্তাকর্ষকভাবে পরিষ্কার সংক্ষেপের জন্য আপনাকে ধন্যবাদ। আমাদের সাইটে আপনাকে স্বাগতম!
শুক্র

11

আমি অবাক হয়েছি যে "সম্ভাবনা নীতিমালা" এর দ্বিতীয় অধ্যায়ে বর্ণিত মূলত অকেজো 75% আত্মবিশ্বাসের ব্যবধানের কোনও বার্গারের উদাহরণ সামনে আনেনি। বিশদটি মূল পাঠ্যটিতে পাওয়া যাবে (যা প্রকল্প ইউক্যালিডে বিনামূল্যে পাওয়া যায় ) উদাহরণটির বিষয়ে প্রয়োজনীয় যা হ'ল এটি নির্বিঘ্নভাবে বর্ণনা করে এমন একটি পরিস্থিতি যা আপনি সম্পূর্ণরূপে নিশ্চিতভাবে জানেন যে পরে কোনও অজানা প্যারামিটারের মূল্য রয়েছে ডেটা পর্যবেক্ষণ করছে, তবে আপনি দৃ as়ভাবে বলতে পারবেন যে আপনার অন্তর্বর্তীতে সত্যিকারের মান রয়েছে বলে আপনার কেবল 75% আস্থা রয়েছে। এই উদাহরণের বিশদটির মধ্য দিয়ে কাজ করা হ'ল আত্মবিশ্বাসের ব্যবস্থাগুলি গঠনের সম্পূর্ণ যুক্তিটি আমাকে বুঝতে সক্ষম হয়েছিল।


8
একটি ঘনত্ববাদী সেটিং-এ, প্রথমত, একজন সিআই-র প্রসঙ্গে "আপনার অন্তরালের সত্যিকারের মান রয়েছে যে আপনার কেবলমাত্র 75% আত্মবিশ্বাস আছে" তা দৃ not ়ভাবে দাবি করবে না । ইহাতে, ইস্যুটির জটিলতা রয়েছে। :)
কার্ডিনাল

1
আপনি কি উদাহরণের জন্য কোনও সরাসরি লিঙ্ক / পৃষ্ঠার রেফারেন্স সরবরাহ করতে পারেন? আমি অধ্যায়টি সন্ধান করেছি কিন্তু আমি সঠিক উদাহরণটি সনাক্ত করতে পারিনি।
রোনাল্ড

@ রোনাল্ড: এটি দ্বিতীয় পৃষ্ঠার প্রথম পৃষ্ঠায় প্রথম। একটি সরাসরি লিঙ্কটি স্বাগত সংযোজন হবে।
কার্ডিনাল

1
অনুরোধ হিসাবে লিঙ্ক। অই হ্যাঁ. এই উদাহরণে মধ্যেই এটা স্পষ্ট বলে মনে হয়: যদি আমরা একটি পরীক্ষা না, একটি 75% সম্ভাবনা যে এর ফলে আস্থা ব্যবধান হয় হবে গড় ধারণ করে। একবার আমরা পরীক্ষাটি শেষ করে ফেলেছি এবং আমরা জানি কীভাবে এটি শেষ হয়ে গেছে, ফলস্বরূপ নমুনার বিতরণের উপর নির্ভর করে সম্ভাবনাটি আলাদা হতে পারে।
রোনাল্ড

7

এটিকে নতুন প্রশ্ন হিসাবে জিজ্ঞাসা করা উচিত কিনা তা আমি জানি না তবে এটি একটি চিন্তার পরীক্ষার প্রস্তাব দিয়ে উপরে জিজ্ঞাসা করা একই প্রশ্নটির সমাধান করছে।

প্রথমত, আমি ধরে নেব যে আমি যদি কোনও স্ট্যান্ডার্ড ডেক থেকে এলোমেলোভাবে একটি প্লেয়ার কার্ড নির্বাচন করি তবে সম্ভাব্যতা যে আমি একটি ক্লাব নির্বাচন করেছি (এটি না দেখে) 13/52 = 25%।

এবং দ্বিতীয়ত, এটি বহুবার বলা হয়েছে যে 95% আত্মবিশ্বাসের ব্যবধানটি একাধিকবার পরীক্ষার পুনরাবৃত্তি করার ক্ষেত্রে ব্যাখ্যা করা উচিত এবং গণনা করা ব্যবধানটি সত্যিকারের 95% সময়কে ধারণ করবে - আমি মনে করি এটি জেমস ওয়াটার্স দ্বারা যুক্তিসঙ্গতভাবে প্রমাণিত হয়েছিল সিমুলেশন। বেশিরভাগ লোক 95% সিআই-এর এই ব্যাখ্যা গ্রহণ করে বলে মনে হচ্ছে।

এখন, চিন্তা পরীক্ষার জন্য। আসুন ধরে নেওয়া যাক আমাদের প্রচুর জনসংখ্যার মধ্যে সাধারণত বিতরণযোগ্য চলক রয়েছে - সম্ভবত প্রাপ্তবয়স্ক পুরুষ বা স্ত্রীদের উচ্চতা। আমার এক ইচ্ছুক এবং অক্লান্ত সহকারী রয়েছে যাকে আমি জনসংখ্যার থেকে প্রদত্ত নমুনা আকারের একাধিক নমুনা প্রক্রিয়া সম্পাদন এবং নমুনার গড় এবং প্রতিটি নমুনার জন্য 95% আত্মবিশ্বাসের ব্যবধান গণনা করে কাজ করি। আমার সহকারী খুব আগ্রহী এবং জনসংখ্যার সমস্ত সম্ভাব্য নমুনা পরিমাপ করতে পরিচালনা করেন। তারপরে, প্রতিটি নমুনার জন্য, আমার সহকারী হয় ফলস্বরূপ আত্মবিশ্বাসের ব্যবধানটিকে সবুজ হিসাবে রেকর্ড করে (যদি সিআই-র প্রকৃত গড় থাকে) বা লাল (যদি সিআই এর সত্যিকার অর্থ থাকে না)। দুর্ভাগ্যক্রমে, আমার সহকারী আমাকে তার পরীক্ষাগুলির ফলাফল প্রদর্শন করবে না। জনসংখ্যার বয়স্কদের উচ্চতা সম্পর্কে আমার কিছু তথ্য নেওয়া দরকার তবে আমার কাছে কেবল সময় আছে, সম্পদ এবং ধৈর্য একবার পরীক্ষা করতে। আমি একটি একক এলোমেলো নমুনা তৈরি করি (আমার সহকারী দ্বারা ব্যবহৃত একই নমুনা আকারের) এবং আত্মবিশ্বাসের ব্যবধান গণনা করি (একই সমীকরণটি ব্যবহার করে)।

আমার সহকারীটির ফলাফল দেখার কোনও উপায় নেই। সুতরাং, আমি যে এলোমেলো নমুনাটি বেছে নিয়েছি তাতে একটি সবুজ সিআই উৎপন্ন হওয়ার সম্ভাবনা কী আছে (অর্থাত্ অন্তরটির সত্যিকার অর্থ আছে)?

আমার মনে, এটি আগের হিসাবে বর্ণিত কার্ডগুলির ডেকের সমান এবং এটি ব্যাখ্যা করা যেতে পারে যে এটি একটি 95% সম্ভাবনা যা গণনা করা বিরতিতে প্রকৃত গড় থাকে (অর্থাৎ সবুজ)। এবং তবুও, অনুভূতিটি মনে হয় যে 95% আত্মবিশ্বাসের ব্যবধানটি ব্যাখ্যা করা যায় না কারণ 95% এর সম্ভাবনা রয়েছে যে অন্তরটির প্রকৃত অর্থ রয়েছে। উপরের চিন্তার পরীক্ষায় আমার যুক্তি কেন (এবং কোথায়) পৃথক হয়ে যায়?


+1 এটি একটি সাধারণ জনসংখ্যা থেকে বাইনারি নমুনা পরিস্থিতি থেকে ধারণাগত অগ্রগতির একটি উল্লেখযোগ্য স্পষ্ট বিবরণ। এটি আমাদের সাথে ভাগ করে নেওয়ার জন্য আপনাকে ধন্যবাদ, এবং আমাদের সাইটে আপনাকে স্বাগতম!
শুক্র

এটি একটি প্রশ্ন হিসাবে পোস্ট করুন।
জন

মন্তব্যের জন্য ধন্যবাদ, জন। এখন একটি পৃথক প্রশ্ন হিসাবে পোস্ট করেছেন ( stats.stackexchange.com / জিজ্ঞাসা / 301478/… )।
ব্যবহারকারী 1718097

4

যদিও অসংখ্য দুর্দান্ত উত্তরে বিস্তর আলোচনা হয়েছে, আমি আরও সাধারণ দৃষ্টিকোণ যুক্ত করতে চাই। (যদিও এটি অন্যান্য উত্তরে বর্ণিত হয়েছে - তবে তা স্পষ্টভাবে নয়) কিছু প্যারামিটারের জন্য এবং একটি নমুনা দেওয়া হয়েছে , একটি আত্মবিশ্বাসের ব্যবধানটি ফর্মটির সম্ভাব্য বিবৃতিθ(X1,X2,,Xn)100p%

P(g(X1,X2,,Xn)<θ<f(X1,X2,,Xn))=p

যদি আমরা একটি ধ্রুবক হিসাবে বিবেচনা করি , তবে উপরের বিবৃতিটি এলোমেলো ভেরিয়েবল এবং বা আরও সঠিকভাবে সম্পর্কে এলোমেলো ব্যবধান ।g ( এক্স 1 , এক্স 2 , , এক্স এন ) ( এক্স 1 , এক্স 2 , , এক্স এন ) ( জি ( এক্স 1 , এক্স 2 , , এক্স এন ) , ( এক্স 1 , এক্স 2 , , এক্স এন ) )θg(X1,X2,,Xn)f(X1,X2,,Xn)(g(X1,X2,,Xn),f(X1,X2,,Xn))

সুতরাং পরামিতিটির অন্তর অন্তর্ভুক্ত থাকার সম্ভাবনা সম্পর্কে কোনও তথ্য দেওয়ার পরিবর্তে, প্যারামিটারটি অন্তর্ভুক্ত হওয়ার সম্ভাবনা সম্পর্কে তথ্য দিচ্ছে - কারণ বিরতিটি এলোমেলো ভেরিয়েবল থেকে তৈরি করা হয়।


3

ব্যবহারিক উদ্দেশ্যে, আপনার 95% সিআই এর যথাযথ গড়টি 95: 5 মতামত হিসাবে অন্তর্ভুক্ত করা উচিত যে আপনি 50:50 মতবিরোধে আপনার বন্ধুর মুদ্রা ফ্লিপের উপর বাজি ধরার চেয়ে বাজে বাজেয়াতে কোন ভুল নেই।

যদি আপনার বন্ধু ইতিমধ্যে মুদ্রাটি উল্টে ফেলেছে এবং আপনি মনে করেন যে এটির প্রধান হওয়ার 50% সম্ভাবনা রয়েছে তবে আপনি কেবল সম্ভাব্য শব্দের একটি আলাদা সংজ্ঞা ব্যবহার করছেন। অন্যরা যেমন বলেছে, ঘন ঘনवादীদের জন্য আপনি কোনও ইভেন্ট সংঘটিত হওয়ার সম্ভাবনা নির্ধারণ করতে পারবেন না, তবে আপনি প্রদত্ত প্রক্রিয়াটি ব্যবহার করে ভবিষ্যতে কোনও ঘটনার সম্ভাবনা বর্ণনা করতে পারবেন।

অন্য ব্লগ থেকে: ঘনঘনবাদী বলবেন: "একটি নির্দিষ্ট ইভেন্টের সম্ভাবনা থাকতে পারে না The মুদ্রাটি মাথা বা লেজগুলি দেখায় এবং যদি আপনি এটি না দেখেন তবে আমি আসলে কি তা বলতে পারি না Only কেবলমাত্র যদি আপনি টসটির পুনরাবৃত্তি করেন তবে অনেকগুলি, অনেকবার, যদি আপনি টসসের প্রাথমিক অবস্থার দৃ strongly়তার সাথে যথেষ্ট পরিমাণে পরিবর্তন করেন তবে আমি প্রত্যাশা করি যে অনেকগুলি টাসসে সমস্ত থেসের মাথাগুলির আপেক্ষিক ফ্রিকোয়েন্সি 0.5 "এ পৌঁছে যাবে। http://www.researchgate.net/post/What_is_the_difference_between_frequentist_and_bayesian_probability


2
এই ব্লগটি স্ট্র ম্যান আর্গুমেন্টের মতো মনে হচ্ছে। এটি সম্ভাবনার মডেলগুলি তৈরির ক্ষমতাটিতে কিছুটা (অস্তিত্বহীন) সহজাত সীমাবদ্ধতার সাথে সম্ভাবনার দর্শনের বিভ্রান্ত বলে মনে হয়। আমি সেই বৈশিষ্ট্যটিতে কোনও ধ্রুপদী পরিসংখ্যান পদ্ধতি বা পদ্ধতিটি স্বীকৃতি দিই না। তবুও, আমি মনে করি যে আপনার চূড়ান্ত উপসংহারটি একটি ভাল - তবে যে ভাষাটি এটি ব্যবহার করে তা পরিষ্কার করে না যে বাজিটি সিআইয়ের সাথে উদ্বেগ প্রকাশ করে এবং এর অর্থ নয়, এমন একটি বিভ্রান্তি তৈরির ঝুঁকি তৈরি করে যা এই প্রশ্নটি সমাধানের উদ্দেশ্যে।
হোবার

1
একটি উপায় যা আমি প্রায়শই ব্যবহার করি তা হ'ল জোর দেওয়া যে সিআই কোনও পদ্ধতির ফলাফল। আপনার চূড়ান্ত বক্তব্যটি সম্পর্কে আমি যা পছন্দ করি তা হ'ল এটি সহজেই এমন আকারে পুনরায় সাজানো যায়, যেমন "95: 5 তে বাজি ধরতে আপনার কোনও ভুল হয় না যে আপনার 95% আত্মবিশ্বাসের ব্যবধানটি আপনার চেয়ে সত্যিকার অর্থে আবৃত হয়েছে 50:50 মতবিরোধে আপনার বন্ধুর মুদ্রা ফ্লিপ বাজি ধরতে। "
শুক্র

ঠিক আছে, এটি পরিবর্তন।
নাইজেলেনরি

2

বলুন যে আপনার কাছে থাকা নির্দিষ্ট সিআইটি থেকে আপনি যে সিআই গণনা করেছেন তা হ'ল সম্ভাব্য সিআইয়ের 5% এর মধ্যে একটি যা এর অর্থটি ধারণ করে না। আপনি এটি কল্পনা করতে চান যে 95% বিশ্বাসযোগ্য ব্যবধান এটি কতটা কাছাকাছি? (এটি, 95% সম্ভাব্যতার সাথে গড়টি কতটা নিকটবর্তী?) আপনার কোনও আশ্বাস নেই যে এটি একেবারেই কাছে রয়েছে। প্রকৃতপক্ষে, আপনার সিআই 95% সিআই এর 95% এর মধ্যে একটির সাথেও ওভারল্যাপ না করতে পারে যা প্রকৃতপক্ষে গড়টি বোঝায়। এটিতে গড়টি নেই বলে উল্লেখ করার দরকার নেই, যা এটিও প্রস্তাব করে যে এটি একটি 95% বিশ্বাসযোগ্য ব্যবধান নয়।

হতে পারে আপনি এটিকে উপেক্ষা করতে এবং আশাবাদীভাবে ধরে নিতে চান যে আপনার সিআই 95% এর মধ্যে একটি যা এর মধ্যে রয়েছে। ঠিক আছে, আমরা আপনার সিআই সম্পর্কে কী জানি যে এটি 95% এর মধ্যে রয়েছে? এটিতে এর অর্থটি রয়েছে তবে এটি কেবলমাত্র চূড়ান্তভাবে বাইরে বেরোনোর ​​উপায়টিকে অন্যদিকে বাদ দিয়ে। বিতরণ 95% থাকতে পারে না।

যেভাবেই হোক, কোনও গ্যারান্টি নেই, সম্ভবত আপনার যুক্তিসঙ্গত আশাও নয় যে আপনার 95% সিআই 95% বিশ্বাসযোগ্য ব্যবধান।


আমি প্রথম অনুচ্ছেদ সম্পর্কে কৌতূহলী। সম্ভবত আমি এটি ভুলভাবে লিখছি, তবে যুক্তিটি সামান্য মতবিরোধের সাথে মনে হচ্ছে যে একাধিক উদাহরণ রয়েছে যার মধ্যে সিআই এবং বিশ্বাসযোগ্য অন্তরগুলি সমস্ত সম্ভাব্য পর্যবেক্ষণের সেটগুলির সাথে মিলে যায়। আমি কি মিস করেছি?
কার্ডিনাল

@ কার্ডিনাল: আমি ভুল হতে পারি। আমি সাধারণ ক্ষেত্রে কথা বলছিলাম, তবে আমার ধারণাটি হ'ল সিআই এবং বিশ্বাসযোগ্য ব্যবধান একই ক্ষেত্রে, স্বাভাবিকতার মতো অন্যান্য বিধিনিষেধ রয়েছে যা সিআইকে খুব দূরের অবস্থান থেকে দূরে রাখে।
ওয়েইন

আমার ফোকাসটি অনুচ্ছেদে শেষ বাক্যটির দিকে সবচেয়ে দৃ ;়ভাবে আঁকছিল; কাকতালীয় অন্তরগুলির উদাহরণটি একটি বিষয়টিকে হাইলাইট করার জন্য বোঝানো হয়েছিল। আপনি সেই বাক্যটি সত্যই বিশ্বাস করেন কিনা তা আপনি বিবেচনা করতে পারেন। :)
কার্ডিনাল

আপনি কি এটি বলতে না করে একটি 95% সি আই পরোক্ষভাবে না যে 5% না না মানে অন্তর্ভুক্ত? আমার বলা উচিত "সংজ্ঞা অনুসারে, এমনকি কি নিজেও গড়টি থাকা উচিত না"? নাকি আমি আরও মিস করছি?
ওয়েইন

ওয়েইন, কীভাবে একটি নির্দিষ্ট ব্যবধানের গড়টি থাকে না তা কীভাবে এটি একটি বৈধ বিশ্বাসযোগ্য ব্যবধান হতে বাধা দেয়? আমি কি এই মন্তব্যটি ভুলভাবে লিখছি?
কার্ডিনাল

2

(অর্থাত্ কোনও বন্ধু ন্যায্য মুদ্রা উল্টে, ফলাফলটি লুকিয়ে রাখে, এবং এটির 50% সম্ভাবনা রয়েছে বলে আমি বারণ করি না)

যদি আপনি কেবল অনুমান করছেন যে আপনার বন্ধুদের মুদ্রা 50% মাথা / লেজ সহ ফ্লিপ হয় তবে আপনি এটি সঠিকভাবে করছেন না।

  • মুদ্রাটি নেমে যাওয়ার পরে / ফলাফলটি লুকানোর আগে এবং তার আগে দেখার চেষ্টা করা উচিত।
  • এছাড়াও আপনার মুদ্রার ন্যায্যতার জন্য কিছুটা প্রাথমিক ধারণা তৈরি করার চেষ্টা করা উচিত।

অবশ্যই মুদ্রা ফ্লিপ সম্পর্কে আপনার অনুমানের বিশ্বাসযোগ্যতা এই শর্তগুলির উপর নির্ভর করবে এবং সর্বদা একই 50% হবে না (কখনও কখনও আপনার প্রতারণার পদ্ধতি আরও ভাল কাজ করতে পারে)।

আপনার সামগ্রিক অনুমান হতে পারে, আপনি যদি প্রতারণা করেন তবে x> সময় সময় ঠিক 50%, তবে এর অর্থ এই নয় যে প্রতিটি নির্দিষ্ট নিক্ষেপের সম্ভাবনা ক্রমাগত x% মাথা ছিল। সুতরাং আপনার সামগ্রিক সম্ভাব্যতা নির্দিষ্ট থ্রো হওয়ার সম্ভাব্যতার উপরে প্রস্থান করা কিছুটা আশ্চর্যজনক হবে। এটি একটি পৃথক 'সম্ভাবনার ধরণ'।


আপনি 'সম্ভাব্যতা' সংজ্ঞা / সংজ্ঞাটি কোন স্তরের বা গভীরতার বিষয়ে খানিকটা ।

  • আস্থা 'বিশেষ পরীক্ষা / উল্টানো নির্দিষ্ট সম্ভাব্যতা' থেকে স্বাধীন এবং 'অবরোহী সম্ভাব্যতা' থেকে স্বাধীন

  • আত্মবিশ্বাস হ'ল পরীক্ষাগুলির নকল করা সম্পর্কে । এটি এমনভাবে তৈরি করা হয়েছে যাতে আপনার জনসংখ্যার পূর্ব-সম্ভাবনাগুলি বা বিতরণগুলি জানতে হবে না।

  • আত্মবিশ্বাসটি অনুমানের সামগ্রিক 'ব্যর্থতার হার' সম্পর্কে তবে নির্দিষ্ট ক্ষেত্রে কেউ সম্ভাবনার ক্ষেত্রে আরও সুনির্দিষ্ট প্রকরণ উল্লেখ করতে সক্ষম হন ।

    ( সম্ভাবনার এই প্রকরণগুলি তাত্ত্বিকভাবে কমপক্ষে স্পষ্টভাবে উপস্থিত রয়েছে এবং তাদের বিদ্যমান থাকার জন্য আমাদের তাদের জানার দরকার নেই But তবে বায়েসিয়ান পদ্ধতির সাহায্যে আমরা স্পষ্টভাবে এই সম্ভাবনাগুলি প্রকাশ করতে পারি)।


উদাহরণ 1:

p=0.99p=0.01

p0.05p10p0.95

আপনার যদি জনসংখ্যার ১% অসুস্থ থাকে, তবে গড়ে আপনি পরীক্ষার ইতিবাচক ১.৯৮% পাবেন (৯৯% স্বাস্থ্যকর ব্যক্তিদের মধ্যে ১% পজিটিভ পজিটিভ এবং ৯% অসুস্থ লোকের মধ্যে ৯%% পজিটিভ পজিটিভ পাবেন)। আপনি যখন ইতিবাচক পরীক্ষার মুখোমুখি হন তখন এটি আপনার 95% সিআই ব্যবধানকে (শর্তযুক্ত) করে তোলে , কেবলমাত্র 50% সময় সঠিক করে তোলে ।

p

উদাহরণ 2:

iN(μi,σi2)μi

μiN(100,15)

(100 এর কাছাকাছি ফলাফল প্রাপ্ত ব্যক্তিদের ক্ষেত্রে বিপরীত সত্য, তাদের আইকিউ সম্ভবত 95% -CI এর মধ্যে 95% এর বেশি হতে পারে, এবং এটি চূড়ান্তভাবে আপনি যে ভুলগুলি করেছেন তার ক্ষতিপূরণ করা উচিত যাতে আপনি শেষ পর্যন্ত সঠিক হন 95% ক্ষেত্রে)


2

প্রথমে আসুন আত্মবিশ্বাসের ব্যবধানের একটি সংজ্ঞা দেওয়া যাক, বা একের চেয়ে বেশি মাত্রার জায়গাগুলিতে আত্মবিশ্বাসের অঞ্চল। সংজ্ঞাটি জেরি নেইম্যান তার ১৯৩37 সালে রয়্যাল সোসাইটির কাছে প্রকাশিত একটি গবেষণাপত্রে সংক্ষিপ্ত সংস্করণ is

pspA(p,α)prob(sA(p,α)|p=p,I)=ααIps=sC(s,α)={p|sA(p,α)}

α

p

[pC(s,α)]prob(s=s|p=p,I)ds=[sA(p,α)]prob(s=s|p=p,I)ds=α

[pC(s,α)]pαppp

s=s

prob(pC(s,α)|s=s,I)=C(s,α)prob(s=s|p=p,I)prob(p=p|I)dpprob(s=s|p=p,I)prob(p=p|I)dp

αIA(p,α)spp

prob(pC(s,α)|s=s,I)=C(s,α)prob(s=p|p=s,I)dpprob(s=p|p=s,I)dp=prob(sC(s,α)|p=s,I)=prob(sA(s,α)|p=s,I)

sA(s,α)sA(s,α)

prob(pC(s,α)|s=s,I)=prob(sA(s,α)|p=s,I)=α

একটি জনসংখ্যার অনুমানের পাঠ্যপুস্তকের উদাহরণটি একটি সাধারণ পরিসংখ্যান সম্পর্কে নির্মিত মানক আত্মবিশ্বাসের ব্যবধানের সাথে বোঝানো পূর্ববর্তী অনুমানের একটি বিশেষ ঘটনা। অতএব মান 95% আস্থা ব্যবধান আছে সম্ভাব্যতা 0.95 সঙ্গে গড় ধারণ; তবে এই চিঠিপত্রটি সাধারণত ধারণ করে না।


-1

এখানে কিছু আকর্ষণীয় উত্তর রয়েছে, তবে আমি ভেবেছিলাম যে আমি আর ব্যবহার করে কিছুটা বিক্ষোভ যোগ করব We কোডটি কী করে তা এখানে:

1 - এটি একটি পরিচিত বিতরণ থেকে নমুনাগুলি (এন = 1000)

2 - এটি প্রতিটি নমুনার গড় জন্য 95% সিআই গণনা করে

3 - এটি প্রতিটি নমুনার সিআই-তে প্রকৃত গড় অন্তর্ভুক্ত কিনা তা জিজ্ঞাসা করে।

4 - এটি কনসোলটিতে সিআইএসের ভগ্নাংশের প্রতিবেদন করে যা প্রকৃত গড়টি অন্তর্ভুক্ত করে।

আমি স্ক্রিপ্টটি বেশ কয়েকবার চালিয়েছি এবং প্রকৃতপক্ষে 94% সিআই-র প্রকৃত অর্থ রয়েছে তা খুঁজে পাওয়াটা আসলে খুব সাধারণ বিষয় নয়। কমপক্ষে আমার কাছে, এটি এই ধারণাটি দূর করতে সহায়তা করে যে একটি আত্মবিশ্বাসের ব্যবধানে সত্য পরামিতিটি ধারণ করার 95% সম্ভাবনা থাকে।

#   In the following code, we simulate the process of
#   sampling from a distribution and calculating
#   a confidence interval for the mean of that 
#   distribution.  How often do the confidence
#   intervals actually include the mean? Let's see!
#
#   You can change the number of replicates in the
#   first line to change the number of times the 
#   loop is run (and the number of confidence intervals
#   that you simulate).
#
#   The results from each simulation are saved to a
#   data frame.  In the data frame, each row represents
#   the results from one simulation or replicate of the 
#   loop.  There are three columns in the data frame, 
#   one which lists the lower confidence limits, one with
#   the higher confidence limits, and a third column, which
#   I called "Valid" which is either TRUE or FALSE
#   depending on whether or not that simulated confidence
#   interval includes the true mean of the distribution.
#
#   To see the results of the simulation, run the whole
#   code at once, from "start" to "finish" and look in the
#   console to find the answer to the question.    

#   "start"

replicates <- 1000

conf.int.low <- rep(NA, replicates)
conf.int.high <- rep(NA, replicates)
conf.int.check <- rep(NA, replicates)

for (i in 1:replicates) {

        n <- 10
        mu <- 70
        variance <- 25
        sigma <- sqrt(variance)
        sample <- rnorm(n, mu, sigma)
        se.mean <- sigma/sqrt(n)
        sample.avg <- mean(sample)
        prob <- 0.95
        alpha <- 1-prob
        q.alpha <- qnorm(1-alpha/2)
        low.95 <- sample.avg - q.alpha*se.mean
        high.95 <- sample.avg + q.alpha*se.mean

        conf.int.low[i] <- low.95
        conf.int.high[i] <- high.95
        conf.int.check[i] <- low.95 < mu & mu < high.95
 }    

# Collect the intervals in a data frame
ci.dataframe <- data.frame(
        LowerCI=conf.int.low,
        UpperCI=conf.int.high, 
        Valid=conf.int.check
        )

# Take a peak at the top of the data frame
head(ci.dataframe)

# What fraction of the intervals included the true mean?
ci.fraction <- length(which(conf.int.check, useNames=TRUE))/replicates
ci.fraction

    #   "finish"

আশাকরি এটা সাহায্য করবে!


2
সমালোচনার জন্য ক্ষমা চাইছি, তবে আমাকে এই উত্তরটি (সাময়িকভাবে) হ্রাস করতে হয়েছিল। আমি বিশ্বাস করি এটি একটি আত্মবিশ্বাসের ব্যবধানের অর্থ ভুল বোঝাবুঝি করছে এবং আমি আন্তরিকভাবে আশা করি এটি আপনার শ্রেণিতে ব্যবহৃত যুক্তি ছিল না। সিমুলেশনগুলি (বেশ বিস্তৃত) দ্বিপদী নমুনা পরীক্ষায় কমে যায়।
কার্ডিনাল

5
1α=0.95

4
1000 সিআই-এর একটি নমুনায় "94% এর চেয়ে কম" অবশ্যই 95% সিআই-এর অন্তর্ভুক্ত থাকা এই ধারণার বিরুদ্ধে অবশ্যই উল্লেখযোগ্য প্রমাণ নয়। প্রকৃতপক্ষে, আমি আশা করব যে 95% সিআই প্রকৃতপক্ষে এই ক্ষেত্রে গড় থাকবে।
রোনাল্ড

3
@Ronald: হ্যাঁ, এই ঠিক মন্তব্যের সঙ্গে আমার পয়েন্ট ছিল, কিন্তু আপনি এটা বলেছি অনেক আরো সহজভাবে এবং concisely। ধন্যবাদ। হিসাবে মন্তব্য এক বিবৃত, এক 940 সফলতা বা তার কম সম্পর্কে দেখতে হবে 8.7% সময় এবং যে সত্য কোনো ঠিক 95% সি আই যে এক 1000 পরীক্ষায় কোর্সের উপর নির্মান। :)
কার্ডিনাল

2
@ জামেসওয়াটার্স: সাড়া দেওয়ার জন্য সময় দেওয়ার জন্য ধন্যবাদ। কোডটি ভাল, তবে আমি এটি দেখতে পাই না "এটি কীভাবে উদাহরণগুলি প্রদর্শন করে এটি ভুল" is আপনি কি এই অভিপ্রায়টি ব্যাখ্যা করতে পারেন? আমি এখনও সন্দেহ করি যে এখানে একটি মৌলিক ভুল বোঝাবুঝি হতে পারে। আমি সিআই কী এবং কীভাবে এটি সঠিকভাবে ব্যাখ্যা করতে হয় তা আপনি বুঝতে পেরেছেন, তবে সিমুলেশন পরীক্ষা আপনি যে প্রশ্নের প্রতিক্রিয়া দাবি করছেন বলে মনে হচ্ছে এমন প্রশ্নের উত্তর দেয় না। আমি মনে করি এই উত্তরটির সম্ভাবনা রয়েছে, তাই আপনি যে পয়েন্টটি পৌঁছানোর চেষ্টা করছেন তা স্পষ্ট করে বলতে চাই এটি একটি সুন্দর সম্পাদনা দিয়ে শেষ হয়েছে। চিয়ার্স। :)
কার্ডিনাল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.