সংকীর্ণ আত্মবিশ্বাসের ব্যবধান - উচ্চতর নির্ভুলতা?


18

আত্মবিশ্বাসের ব্যবধান সম্পর্কে আমার দুটি প্রশ্ন রয়েছে:

স্পষ্টতই একটি সংকীর্ণ আত্মবিশ্বাসের ব্যবধানটি বোঝায় যে সেই ব্যবধানের মধ্যে একটি পর্যবেক্ষণ পাওয়ার আরও কম সুযোগ রয়েছে, সুতরাং আমাদের নির্ভুলতা বেশি।

এছাড়াও একটি 95% আত্মবিশ্বাসের ব্যবধানটি 99% আত্মবিশ্বাসের ব্যবধানের চেয়ে সংকীর্ণ যা বিস্তৃত।

99% আত্মবিশ্বাসের ব্যবধান 95% এর চেয়ে বেশি সঠিক।

কেউ কি এমন একটি সহজ ব্যাখ্যা দিতে পারেন যা আমাকে সঠিকতা এবং সংকীর্ণতার মধ্যে এই পার্থক্যটি বুঝতে সাহায্য করতে পারে?


2
আমার মনে হয় আপনার অর্থ " এই ব্যবধানের বাইরে পর্যবেক্ষণ পাওয়ার আরও কম সুযোগ আছে "। দুর্ভাগ্যক্রমে, একটি আত্মবিশ্বাসের ব্যবধানটি প্রযুক্তিগত, পরিসংখ্যানগত সমস্যার কারণে এটির অর্থ যা বোঝায় তা বোঝাতে পারে না, তবে সাধারণভাবে বিরতিগুলি (নির্দিষ্ট আত্মবিশ্বাসের স্তরে) ফলাফলগুলি সম্পর্কে যত কম অনিশ্চয়তা থাকে তার সংক্ষিপ্তসার ঘটে। এই সাইটে একটি আত্মবিশ্বাস অন্তর্বর্তী (যা বিশ্বাসযোগ্য ব্যবস্থার বিপরীতে বলা হয়েছে) এর অর্থ কী তা নিয়ে আলোচনা হচ্ছে। আমরা এমনকি ভবিষ্যদ্বাণীমূলক অন্তরগুলিতে উঠছি না ...
ওয়েইন

@ ওয়াইনে এই বিবৃতিটি কেন হয় না যে "সেই ব্যবধানের মধ্যে একটি পর্যবেক্ষণ পাওয়ার আরও কম সুযোগ আছে "? সংকীর্ণ ব্যবধানে যেহেতু একটি বৃহত প্রকার 1 ত্রুটি রয়েছে তাই প্রকৃত নাল অনুমানটি প্রত্যাখ্যান করার সম্ভাবনা বেশি থাকে, অর্থাত্ আমার সত্য নাল মানটি সেই বিরতির মধ্যে নেই। সুতরাং, এটি আমার a narrow confidence interval implies that there is a smaller chance of obtaining an observation within that intervalকাছে সঠিক বলে মনে হচ্ছে । আপনি দয়া করে আমাকে ব্যাখ্যা করতে পারেন আমি কোথায় ভুল করছি?
ব্যবহারকারী 31466

উত্তর:


19

95% সংখ্যাগতভাবে সংযুক্ত নয় তবে আপনি কতটা আত্মবিশ্বাসী যে আপনি নিজের পরীক্ষায় সত্যিকারের প্রভাবটি আবৃত করেছেন to সম্ভবত "95% কভারেজ রেঞ্জ গণনা ব্যবহার করে বিরতি" স্বীকৃতি দেওয়া এটির জন্য আরও সঠিক নাম হতে পারে। ব্যবধানে সত্যিকারের মান রয়েছে তা সিদ্ধান্ত নিতে আপনি চয়ন করতে পারেন; এবং যদি আপনি ধারাবাহিকভাবে 95% সময় এটি করেন তবে আপনি সঠিক হবেন। তবে আপনি সত্যই জানেন না যে আরও নির্দিষ্ট তথ্য ছাড়াই আপনার নির্দিষ্ট পরীক্ষার জন্য এটি কতটা সম্ভব।

প্রশ্ন 1: আপনার প্রথম ক্যোয়ারী দুটি জিনিসকে সংযুক্ত করে এবং একটি পদকে অপব্যবহার করে। আপনি বিভ্রান্ত হওয়ার কারণ নেই। একটি সংকীর্ণ আত্মবিশ্বাসের ব্যবধানটি আরও সুনির্দিষ্ট হতে পারে তবে যখন একই পদ্ধতিতে গণনা করা হয়, যেমন 95% পদ্ধতি, তখন তাদের সকলের একই সঠিকতা থাকে। তারা সময়টির একই অনুপাতের সত্যিকারের মানটি ধারণ করে।

এছাড়াও, কেবল সংকীর্ণ হওয়ার অর্থ এই নয় যে আপনি সেই সংকীর্ণ আত্মবিশ্বাসের ব্যবধানের মধ্যে পড়ে এমন কোনও নমুনার মুখোমুখি হওয়ার সম্ভাবনা কম less একটি সংকীর্ণ আত্মবিশ্বাসের ব্যবধান তিনটি উপায়ে যেকোন একটি অর্জন করা যায়। পরীক্ষামূলক পদ্ধতি বা ডেটার প্রকৃতিতে খুব কম বৈকল্পিক থাকতে পারে। নমুনা আকার নির্বিশেষে সমুদ্র স্তরের নলের জলের ফুটন্ত পয়েন্টের কাছাকাছি আত্মবিশ্বাসের ব্যবধানটি বেশ ছোট। মানুষের গড় ওজনের চারপাশের আত্মবিশ্বাসের ব্যবধানটি বরং বড় হতে পারে কারণ লোকেরা খুব পরিবর্তনশীল তবে কেবলমাত্র আরও পর্যবেক্ষণ অর্জন করে যে কেউ এই আত্মবিশ্বাসের ব্যবধানটিকে ছোট করে তুলতে পারে। সেক্ষেত্রে, আপনি আরও সঠিক নমুনা কোথায় বিশ্বাস করেন সে সম্পর্কে আরও সুনির্দিষ্টতা অর্জন করার পরে, আরও বেশি নমুনা সংগ্রহ করে এবং একটি সংকীর্ণ আত্মবিশ্বাসের ব্যবধান তৈরি করে, তারপরে সেই আত্মবিশ্বাসের ব্যবধানে কোনও ব্যক্তির মুখোমুখি হওয়ার সম্ভাবনা হ্রাস পায়। (আপনি যখন নমুনার আকার বাড়ান তা কোনও ক্ষেত্রেই হ্রাস পায়, তবে আপনি ফুটন্ত জলের ক্ষেত্রে বড় নমুনা সংগ্রহ করতে বিরক্ত করবেন না)। অবশেষে, এটি সংকীর্ণ হতে পারে কারণ আপনার নমুনাটি প্রতিনিধিত্বমূলক নয়। সেক্ষেত্রে আপনার কাছে প্রকৃত মান ধারণ করে না এমন অন্তর অন্তর 5% এর মধ্যে একটি হওয়ার সম্ভাবনা বেশি। এটি সিআই প্রস্থ এবং আপনার সাহিত্য এবং এই ডেটা সাধারণত কতটা পরিবর্তনশীল তা জেনে আপনার পরীক্ষা করা উচিত সে সম্পর্কে কিছুটা প্যারাডক্স। সেক্ষেত্রে আপনার কাছে প্রকৃত মান ধারণ করে না এমন অন্তর অন্তর 5% এর মধ্যে একটি হওয়ার সম্ভাবনা বেশি। এটি সিআই প্রস্থ এবং আপনার সাহিত্য এবং এই ডেটা সাধারণত কতটা পরিবর্তনশীল তা জেনে আপনার পরীক্ষা করা উচিত সে সম্পর্কে কিছুটা প্যারাডক্স। সেক্ষেত্রে আপনার কাছে প্রকৃত মান ধারণ করে না এমন অন্তর অন্তর 5% এর মধ্যে একটি হওয়ার সম্ভাবনা বেশি। এটি সিআই প্রস্থ এবং আপনার সাহিত্য এবং এই ডেটা সাধারণত কতটা পরিবর্তনশীল তা জেনে আপনার পরীক্ষা করা উচিত সে সম্পর্কে কিছুটা প্যারাডক্স।

আরও বিবেচনা করুন যে আত্মবিশ্বাসের ব্যবধানটি জনসংখ্যার প্রকৃত গড় মূল্য অনুমান করার চেষ্টা করছে। যদি আপনি সেই স্পটটি জানতেন তবে আপনি আরও সুনির্দিষ্ট (এবং নির্ভুল) হতে পারতেন এবং অনুমানের একদমও না থাকতেন। তবে সেই একই সমান মানের সাথে কোনও পর্যবেক্ষণের মুখোমুখি হওয়ার সম্ভাবনা আপনার নির্দিষ্ট নমুনা ভিত্তিক সিআইয়ের মধ্যে একটি খুঁজে পাওয়ার চেয়ে অনেক কম হবে।

প্রশ্ন 2 : একটি 99% আত্মবিশ্বাসের ব্যবধান 95% এর চেয়ে বেশি বিস্তৃত। অতএব, এটির আসল মান থাকবে এমনটি সম্ভবত বেশি। সুনির্দিষ্ট এবং নির্ভুলের মধ্যে উপরের পার্থক্যটি দেখুন, আপনি দুটিকে বিভ্রান্ত করছেন। যদি আমি কম পরিবর্তনশীলতা এবং উচ্চতর নমুনার আকারের সাথে একটি আত্মবিশ্বাসের ব্যবধানকে সংকীর্ণ করে তুলি তবে এটি আরও সুনির্দিষ্ট হয়ে যায়, সম্ভাব্য মানগুলি একটি ছোট পরিসীমা জুড়ে। যদি আমি 99% গণনা ব্যবহার করে কভারেজটি বাড়িয়ে তুলি তবে এটি আরও নির্ভুল হয়ে ওঠে, আসল মান সীমার মধ্যে হওয়ার সম্ভাবনা বেশি থাকে।


2
জনসংখ্যার গড় (= আপনি কী অনুমান করার চেষ্টা করছেন) এর পরিবর্তনশীলতা শূন্য।
নিক সাব্বে

10

প্রদত্ত ডেটাসেটের জন্য, আত্মবিশ্বাসের ব্যবধানের আত্মবিশ্বাসের মাত্রা বাড়ানো কেবল বৃহত্তর বিরতিতে (বা কমপক্ষে আরও ছোট নয় ) ফলাফল করে। এটি নির্ভুলতা বা নির্ভুলতার বিষয়ে নয় বরং সত্যিকারের মূল্য মিস করার বিষয়ে আপনি কতটা ঝুঁকি নিতে চান তা সম্পর্কে।

আপনি যদি একাধিক ডেটা সেট থেকে একই ধরণের প্যারামিটারের জন্য আত্মবিশ্বাসের ব্যবধানগুলি তুলনা করে থাকেন এবং একটির তুলনায় অন্যটি ছোট হয় তবে আপনি বলতে পারেন যে ছোটটি আরও নির্ভুল । আমি কথা বলার পছন্দ স্পষ্টতা বদলে সঠিকতা (দেখুন এই অবস্থায় এই প্রাসঙ্গিক Wikipedia নিবন্ধটি )।


"একই ধরণের প্যারামিটার" এবং "একাধিক ডেটা সেট" বলতে কী বোঝায়? বলুন, নিরক্ষরতা নিয়ে একটি সমীক্ষা এবং জরিপটি বিভিন্ন সময়, 1995, 1998 ইত্যাদি সময়ে পরিচালিত হয়। তারপরে কি "নিরক্ষরতার হার" একই ধরণের প্যারামিটার এবং 1995, 1998, ইত্যাদির ডেটা সেটগুলি একাধিক ডেটা সেটগুলি নির্দেশ করে?
ব্যবহারকারী 31466

উদাহরণস্বরূপ, কিছু জনসংখ্যার গড় জন্য আস্থার অন্তরগুলির একটি সেট। আপনার উদাহরণটিও খাপ খায় I
কার্ল

3

প্রথমত, প্রদত্ত আত্মবিশ্বাসের শতাংশের জন্য সিআই (উদাহরণস্বরূপ 95%) অর্থ সমস্ত ব্যবহারিক উদ্দেশ্যে (যদিও প্রযুক্তিগতভাবে এটি সঠিক নয়) আপনি নিশ্চিত যে সত্যই মানটি অন্তরস্থলে রয়েছে।

যদি এটি অন্তর হয় "সংকীর্ণ" (দ্রষ্টব্য যে এটি কেবল একটি আপেক্ষিক ফ্যাশনে বিবেচনা করা যেতে পারে, সুতরাং যা অনুসরণ করে তার সাথে তুলনা করার জন্য বলুন যে এটি 1 ইউনিট প্রশস্ত), এর অর্থ হল যে খেলার খুব বেশি জায়গা নেই: যে কোনও মান আপনি যে ব্যবধানটি বেছে নিয়েছেন তা সত্য মানের কাছাকাছি চলে যাবে (কারণ অন্তর সংকীর্ণ), এবং আপনি এটির (95%) সম্পর্কে বেশ নিশ্চিত।

এটি তুলনামূলকভাবে প্রশস্ত 95% সিআইয়ের সাথে তুলনা করুন (উদাহরণটির সাথে মেলে ধরার জন্য, এটি 100 একক প্রস্থের বলুন): এখানে আপনি এখনও 95% নিশ্চিত যে সত্য মানটি এই ব্যবধানের মধ্যে থাকবে, তবে এটি আপনাকে খুব একটা বলে না অনেকগুলি, যেহেতু ব্যবধানে তুলনামূলকভাবে অনেকগুলি মান রয়েছে (1 এর বিপরীতে 100 টি একটি ফ্যাক্টর - এবং আমি আবারও শুদ্ধবাদীদের সরলকরণ উপেক্ষা করতে বলি)।

সাধারণত, যখন আপনি কেবলমাত্র ৯৯% নির্দিষ্ট হওয়া দরকার তার চেয়ে সত্যিকারের মান এটিতে 99৯% নিশ্চিত হতে চাইলে আপনার আরও একটি বড় ব্যবধানের প্রয়োজন হয় (দ্রষ্টব্য: অন্তরগুলি বাসা না থাকলে এটি সত্য হতে পারে না) ), সুতরাং প্রকৃতপক্ষে, আপনার যত বেশি আত্মবিশ্বাসের প্রয়োজন হবে, আপনার অন্তরকে আরও প্রশস্ত করতে হবে।

অন্যদিকে, আপনি হয় উচ্চতর আস্থা ব্যবধান সঙ্গে আরো নির্দিষ্ট। সুতরাং, আমি যদি আপনাকে একই প্রস্থের 2 অন্তর দিয়ে থাকি এবং আমি বলি যে একটি 95% সিআই এবং অন্যটি 99% সিআই, আমি আশা করি আপনি 99% এক পছন্দ করবেন। এই অর্থে, 99% সিআই আরও নিখুঁত: আপনার সন্দেহ কম রয়েছে যে আপনি সত্যটি মিস করেছেন।


ধন্যবাদ! সুতরাং যখন তারা বলে যে নিউট্রিনো সম্পর্কে আলোর তুলনায় এই নতুন গবেষণার খুব কম আত্মবিশ্বাসের অন্তর রয়েছে (আমার ধারণা এটির অর্থ সংকীর্ণ) তবে এর অর্থ তারা যথাযথ হওয়ার সম্ভাবনা বেশি থাকে তবে যদি এটি একটি বিস্তৃত আত্মবিশ্বাসের ব্যবধান হত? (অন্যান্য সমস্ত দিক উপেক্ষা করে)
02-

10
নিক, আপনার প্রথম বক্তব্য ভুল। এটি কোনও "প্রযুক্তিগত সমস্যা" নয়, এটি ঠিক সঠিক নয়। আত্মবিশ্বাসের বিরতিটি পুনরাবৃত্তি পরীক্ষায় কী ঘটবে সে সম্পর্কে একটি বিবৃতি যা তারা 95% সময়ের সত্যিকারের মানটি জুড়ে দেবে। আমার প্রদত্ত পরীক্ষায় পাওয়া সত্য দেওয়া মূল্য আমার দেওয়া পরিসরের মধ্যে রয়েছে এই আত্মবিশ্বাস সম্পর্কে একটি বিবৃতি মোটেও একই নয়। যদি আপনি "সেই" মধ্যে "সেই আত্মবিশ্বাসের" এবং প্যারেন্টিক্যাল সংখ্যাসূচক পরিমাণটি সরিয়ে ফেলে থাকেন তবে আপনি সত্যের আরও কাছাকাছি থাকবেন। আপনি কেবল এটি বলতে পারেন যে এর অর্থ আপনি বিরতিতে আসার সম্ভাব্য সত্য মান বিশ্বাস করেন।
জন

অন্যথায়, উত্তরটি বেশ ভাল ...
জন

4
@ জন: আমি স্পষ্টভাবে এই কথাটি এড়িয়ে গেছি যে অন্তর নিজেই এলোমেলো পরিবর্তনশীল, যদিও আমার বাক্যটি এটি না হওয়ার ইঙ্গিত দেয় না (স্বীকারোক্তিপূর্ণভাবে, এটি এ জাতীয় পরামর্শ দেয়)। আমি জড়িত বিষয়গুলি জানি, তবে এগুলি প্রশ্নের সাথে সম্পর্কিত নয়। আমি কখনও ব্যবহারিক পরিস্থিতি দেখতে পাইনি যেখানে পার্থক্যটি মেলে, তাই "সমস্ত ব্যবহারিক উদ্দেশ্যে"।
নিক সাবে

4
সমস্যাটির মুখোমুখি হয়নি? এটি প-মান = শূন্য হওয়ার সম্ভাব্যতা বলার মতো এবং তারপরে বলার মতো যে আপনি কখনই এর সাথে কোনও সমস্যার মুখোমুখি হন নি। আপনি সঠিক জার্নালে থাকলে আপনি পাবেন না। এটি বলা ঠিক ঠিক যে আপনি 95% নির্দিষ্ট প্রকৃত মানটি আপনার বর্তমান পরিসীমাতে রয়েছে। এটিকে কিছু গৌণ বিষয় হিসাবে বিবেচনা করার অর্থ এখন আমাদের আরও একজন (কমপক্ষে) এইভাবে ঘুরে বেড়াবেন, "আমি 95% আত্মবিশ্বাসী যে এই মানটি এই সীমার মধ্যে রয়েছে।" আপনার উত্তরটি সংশোধন করার জন্য এটি খুব কমই বদলে যাবে। আপনি যে বিবৃতিটি পরিবর্তন করেছেন যদি আপনি স্কার্ট করেন এমন অন্যান্য সমস্যাগুলি উপেক্ষা করা যেতে পারে।
জন

3

আমি এখানে কিছু ভাল উত্তর যুক্ত করছি যা আমি আপলোডগুলি দিয়েছি। আমি মনে করি আরও কিছু আছে যা সম্পূর্ণরূপে উপসংহারটি পরিষ্কার করার জন্য বলা উচিত। আমি ইফ্রন তাদের সংজ্ঞা হিসাবে শর্তাবলী সঠিক এবং সঠিক পছন্দ করি। আমি খুব সাম্প্রতিককালে একটি ভিন্ন প্রশ্নে এ নিয়ে দীর্ঘ আলোচনা করেছি। মধ্যম whuber সত্যিই উত্তরটি পছন্দ করেছে। আমি এখানে পুনরাবৃত্তি করতে একই লম্বা স্থানে যাব না। তবে ইফ্রন যথার্থতার সাথে আস্থার স্তরের প্রশস্ততা বা দৃ tight়তার সাথে আত্মবিশ্বাসের স্তর এবং যথার্থতা সম্পর্কিত। তবে আপনি প্রথমে নির্ভুলতার বিষয়টি বিবেচনা না করে শক্ততার বিষয়ে কথা বলতে পারবেন না। কিছু আত্মবিশ্বাসের ব্যবধানগুলি হুবহু সেগুলি সঠিক হয় কারণ তাদের বিজ্ঞাপনের আসল কভারেজ থাকে। একটি 95% আত্মবিশ্বাসের ব্যবধানও আনুমানিক হতে পারে কারণ এটি অ্যাসিম্পটোটিক বিতরণ ব্যবহার করে। অ্যাসিপটিকসের উপর ভিত্তি করে আনুমানিক অন্তরগুলি একটি সীমাবদ্ধ নমুনা আকারের জন্য যা বিজ্ঞাপন বিজ্ঞপ্তি যা কভারেজটি হ'ল যদি অ্যাসিপটোটিক বিতরণ সঠিক বিতরণ হয় তবে আপনি পাবেন coverage সুতরাং একটি আনুমানিক ব্যবধানটি গোপন করতে পারে (উদাহরণস্বরূপ, যখন এর আসল কভারেজটি কেবল 91% হয় তখন 95% বিজ্ঞাপন দেওয়া হয়) বা বিরল তবে কম মারাত্মক ক্ষেত্রে (যেমন বিজ্ঞাপনের কভারেজ 95% তবে 98% এর মধ্যে প্রকৃত)। আগের ক্ষেত্রে আমরা উদ্বেগ প্রকাশিত প্রকৃত কভারেজটি বিজ্ঞাপনের কভারেজের কতটা কাছাকাছি)। ঘনিষ্ঠতার একটি পরিমাপ হল নির্ভুলতার ক্রম যা 1 / orn বা 1 / n বলা যেতে পারে। প্রকৃত আত্মবিশ্বাসের স্তরটি যদি কাছাকাছি থাকে তবে আমরা এটিকে সঠিক বলি। বুটস্ট্র্যাপের আত্মবিশ্বাসের ব্যবধানগুলির সাথে অ্যাকুয়রি গুরুত্বপূর্ণ, যা কখনই নির্ভুল হয় না তবে কিছু রূপ অন্যদের তুলনায় আরও নির্ভুল।

নির্ভুলতার এই সংজ্ঞাটি ওপি উল্লেখ করছে তার থেকে আলাদা হতে পারে তবে ইফ্রনের সংজ্ঞা কী এবং সঠিক হওয়া কেন গুরুত্বপূর্ণ তা এখনই স্পষ্ট হওয়া উচিত। এখন যদি আপনার কাছে দুটি পদ্ধতি থাকে যা সঠিক হয় তবে আমরা যদি কোনও আত্মবিশ্বাসের স্তরের জন্য এটির চেয়ে কম প্রস্থের প্রস্থ থাকে তবে আমরা একে অপরের চেয়ে বেশি পছন্দ করতে পারি। একটি আত্মবিশ্বাসের ব্যবধান যা এই অর্থে সেরা (কখনও কখনও সংক্ষিপ্ত বলা হয়) বেছে নেওয়া উচিত। তবে এটি প্রয়োজনীয় নির্ভুলতা। আত্মবিশ্বাসের মাত্রাটি যদি আনুমানিক হয় তবে আমরা আপেল এবং কমলার তুলনা করতে পারি। একজনের তুলনায় আরও সংকীর্ণ হতে পারে কারণ এটি কম নির্ভুল এবং সুতরাং এটির বিজ্ঞাপনযুক্ত কভারেজের তুলনায় কম প্রকৃত কভারেজ রয়েছে।

যদি দুটি আত্মবিশ্বাসের অন্তর উভয়ই খুব নির্ভুল হয় বা একটি সঠিক হয় এবং অন্যটি খুব সঠিকভাবে প্রত্যাশিত প্রস্থের সাথে তুলনা করা ঠিক হয় কারণ কমপক্ষে এখন আমরা কেবল দুটি দুটি প্রকারের আপেলের দিকে তাকিয়ে আছি।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.