আত্মবিশ্বাসের ব্যবধান এবং একটি বিশ্বাসযোগ্য ব্যবধানের মধ্যে পার্থক্য কী?


229

আত্মবিশ্বাসের ব্যবধান এবং বিশ্বাসযোগ্য ব্যবধানগুলির মধ্যে পার্থক্যের জন্য আমার অভ্যন্তরীণ ব্যাখ্যা যদি সঠিক হয় তবে এখানে জরিস এবং শ্রীকান্তের এক্সচেঞ্জটি আমাকে (আবার) ভাবতে লাগল। আপনি কিভাবে পার্থক্য ব্যাখ্যা করবে?

উত্তর:


313

আমি শ্রীকান্তের ব্যাখ্যার সাথে পুরোপুরি একমত। এটির উপর আরও বেশি তাত্পর্যপূর্ণ স্পিন দেওয়ার জন্য:

ধ্রুপদী পদ্ধতিগুলি সাধারণত পোষ্ট করে যে পৃথিবীটি একটি উপায় (যেমন, কোনও প্যারামিটারের একটি নির্দিষ্ট সত্য মূল্য থাকে) এবং এমন পরীক্ষাগুলি চালানোর চেষ্টা করুন যার ফলস্বরূপ উপসংহার - প্যারামিটারের আসল মূল্য নির্বিশেষে - কিছুটা হলেও সর্বনিম্ন সঠিক হবে সম্ভাব্যতা.

ফলস্বরূপ, একটি পরীক্ষার পরে আমাদের জ্ঞানের বিষয়ে অনিশ্চয়তা প্রকাশ করতে, ঘনত্ববাদী পদ্ধতির "আত্মবিশ্বাসের ব্যবধান" ব্যবহার করা হয় - কিছুটা ন্যূনতম সম্ভাবনার সাথে প্যারামিটারের সত্যিকারের মান অন্তর্ভুক্ত করার জন্য ডিজাইন করা বিভিন্ন মান range একজন বার্ষিক বিশেষজ্ঞ পরীক্ষার নকশা এবং 95% আত্মবিশ্বাস ব্যবধানের নকশা তৈরি করবেন যাতে প্রতি 100 পরীক্ষা-নিরীক্ষার মধ্যে কমপক্ষে 95 জন ফলাফলের আত্মবিশ্বাসের অন্তরগুলির প্যারামিটারের সত্যিকারের মান অন্তর্ভুক্ত করার প্রত্যাশা করে। অন্য 5 টি কিছুটা ভুল হতে পারে, বা এগুলি সম্পূর্ণ বোকামি হতে পারে - আনুষ্ঠানিকভাবে বলতে গেলে যতদূর পর্যন্ত দৃষ্টিভঙ্গিটি ঠিক আছে, যতক্ষণ না 100 ইনফারেন্সের মধ্যে 95 টি সঠিক। (অবশ্যই আমরা তাদের মোটামুটি বাজে কথা নয়, কিছুটা ভুল হতে পছন্দ করব))

বায়েশিয়ান পদ্ধতির সমস্যাটি আলাদাভাবে তৈরি করে। প্যারামিটারটির কেবল একটি (অজানা) সত্য মান আছে তা বলার পরিবর্তে একটি বেইসিয়ান পদ্ধতিতে প্যারামিটারটির মান স্থির থাকলেও কিছু সম্ভাবনা বিতরণ থেকে বেছে নেওয়া হয়েছে - এটি পূর্ব সম্ভাবনার বন্টন হিসাবে পরিচিত। (এটি বলার আরেকটি উপায় হ'ল যে কোনও পরিমাপ করার আগে বায়েসিয়ান প্যারামিটারের আসল মানটি কী হয় তার উপর তারা একটি বিশ্বাসের অবস্থা বলে একটি সম্ভাবনা বিতরণ বরাদ্দ করে)) এই "পূর্ববর্তী" জানা থাকতে পারে (চেষ্টা করার চেষ্টা কল্পনা করুন) কোনও ট্রাকের আকার নির্ধারণ করতে, আমরা যদি ডিএমভি থেকে ট্রাকের আকারের সামগ্রিক বন্টন জানি) বা এটি একটি পাতলা বাতাস থেকে টানা অনুমান হতে পারে। বায়েশিয়ান অনুমান সহজতর - আমরা কিছু তথ্য সংগ্রহ করি এবং তারপরে প্যারামিটারের বিভিন্ন মানগুলির সম্ভাবনা গণনা করি ডেটা জাইভেন EN এই নতুন সম্ভাব্যতা বিতরণকে "একটি উত্তরোত্তর সম্ভাবনা" বা কেবল "উত্তরোত্তর" বলা হয়। বায়েশিয়ান পদ্ধতির উত্তরীয় সম্ভাব্যতা বিতরণে সম্ভাব্যতার ৯৫% অন্তর্ভুক্তের বিভিন্ন ধরণের মান দিয়ে তাদের অনিশ্চয়তার সংক্ষিপ্তসার জানাতে পারে - এটিকে "95% বিশ্বাসযোগ্যতা অন্তর" বলা হয়।

একজন বায়েশিয়ান পার্টিশন এই জাতীয় ঘন ঘন আত্মবিশ্বাসের ব্যবস্থার সমালোচনা করতে পারে: "তাহলে 100 পরীক্ষার মধ্যে 95 টি যদি সত্যের মূল্য অন্তর্ভুক্ত করে এমন একটি আত্মবিশ্বাসের ব্যবধান লাভ করে? তবে আমি যে 99 পরীক্ষাগুলি করি না তা করি না; আমি এই পরীক্ষার বিষয়ে যত্নশীল না আমি করলাম Your আপনার নিয়মটি 100 এর মধ্যে 5 টির জন্য সম্পূর্ণ অযৌক্তিক [নেতিবাচক মান, অসম্ভব মান] যতক্ষণ না অন্য 95 টি সঠিক থাকে তা হ'ল হাস্যকর। "

বারবারের মত ডাই-হার্ড বায়েশীয় বিশ্বাসযোগ্যতা ব্যবস্থার সমালোচনা করতে পারে: "তাহলে যদি উত্তরীয় সম্ভাবনার ৯৫% এই সীমার মধ্যে অন্তর্ভুক্ত থাকে তবে কী হবে যদি সত্য মানটি হয়, বলুন ০.০7? যদি এটি হয় তবে আপনার পদ্ধতিটি চালান run শেষ করতে শুরু করুন, সময়ের 75% ভুল হবে আপনার প্রতিক্রিয়া, 'ওহ ভাল, ঠিক আছে কারণ পূর্বের অনুসারে এটি খুব বিরল যে মান 0.37,' এবং এটি হতে পারে তবে আমি একটি পদ্ধতি চাই যা প্যারামিটারের যেকোন সম্ভাব্য মানের জন্য কাজ করে IT এটি প্যারামিটারের 99 টি মূল্যবোধের বিষয়ে আমি পাত্তা দিই না যা এটি করতে পারে না; আমি এটির সত্য মূল্যটি যত্নশীল Oh এছাড়াও, উপায় দ্বারা, আপনার উত্তরগুলি শুধুমাত্র সঠিক যদি পূর্বটি সঠিক থাকে তবে আপনি যদি এটি ঠিক মনে করেন কারণ এটি কেবল পাতলা বাতাসের বাইরে টানেন তবে আপনি পথ ছেড়ে যেতে পারেন। "

এক অর্থে এই উভয় পক্ষই একে অপরের পদ্ধতি সম্পর্কে তাদের সমালোচনায় সঠিক, তবে শ্রীকান্ত যেমন ব্যাখ্যা করেছেন - আমি আপনাকে পার্থক্য সম্পর্কে গাণিতিকভাবে চিন্তা করার জন্য অনুরোধ করব।


এখানে সেই আলাপের একটি বর্ধিত উদাহরণ যা একটি পৃথক উদাহরণে পার্থক্যটি নিখুঁতভাবে দেখায়।

আমি যখন ছোট ছিলাম আমার মা মাঝে মাঝে আমাকে চকোলেট-চিপ কুকিজের জারকে মেইলের মাধ্যমে সরবরাহ করার আদেশ দিয়ে অবাক করে দিতেন। সরবরাহকারী সংস্থা চারটি ধরণের কুকি জারগুলি স্টক করেছে - টাইপ এ, টাইপ বি, টাইপ সি, এবং টাইপ ডি, এবং তারা সবাই একই ট্রাকে ছিল এবং আপনি কী ধরনের পাবেন তা আপনি কখনই নিশ্চিত হন না। প্রতিটি জারে হ'ল 100 টি কুকি ছিল তবে বৈশিষ্ট্য যা বিভিন্ন কুকি জারের আলাদা করে তা হ'ল প্রতি কুকিতে চকোলেট চিপগুলির নিজ নিজ বিতরণ। যদি আপনি কোনও জারে পৌঁছে যান এবং এলোমেলোভাবে অভিন্নভাবে একক কুকি বের করেন তবে এগুলি সম্ভাবনা বিতরণ যা আপনি চিপের সংখ্যায় পাবেন:

বিকল্প পাঠ

একটি টাইপ-কুকি জারের উদাহরণস্বরূপ, দুটি চিপ সহ 70 টি কুকি রয়েছে এবং চারটি চিপ বা তার বেশি কুকিজ নেই! একটি টাইপ-ডি কুকি জারে প্রতিটি চিপ সহ 70 টি কুকি থাকে। প্রতিটি উল্লম্ব কলামটি কীভাবে সম্ভাব্য ভর ফাংশন তা লক্ষ্য করুন - জার = এ, বি, বা সি, বা ডি এবং প্রতিটি কলামের পরিমাণ 100 এর সমান হয়ে আপনি যে চিপগুলি পেয়েছেন তার শর্তসাপেক্ষ সম্ভাবনা।

ডেলিভারিম্যান আমার নতুন কুকি জারটি নামিয়ে দেওয়ার সাথে সাথে আমি একটি খেলা খেলতে পছন্দ করতাম। আমি জার থেকে এলোমেলোভাবে একটি কুকি টানতাম, কুকির চিপগুলি গণনা করতাম এবং আমার অনিশ্চয়তা প্রকাশ করার চেষ্টা করতাম - 70% স্তরে - এটি কোন জার হতে পারে। সুতরাং এটি জারের পরিচয় (এ, বি, সি বা ডি) যা অনুমান করা প্যারামিটারের মান । চিপের সংখ্যা (0, 1, 2, 3 বা 4) ফলাফল বা পর্যবেক্ষণ বা নমুনা।

মূলত আমি প্রায়শই 70% আত্মবিশ্বাসের ব্যবধান ব্যবহার করে এই গেমটি খেলি। এই ধরনের ব্যবধানটি নিশ্চিত করা দরকার যে প্যারামিটারের সত্যিকারের মূল্য বিবেচনা করা উচিত নয় , মানে আমি কোন কুকি জারের পাত্র পেয়েছি না, অন্তর অন্তত value০% সম্ভাবনার সাথে সেই সত্য মানটি আবরণ করবে।

একটি অন্তর্বর্তী অবশ্যই একটি ফাংশন যা প্যারামিটারের মানগুলির একটি কলাম (কলামের সেট) এর সাথে ফলাফল (একটি সারি) সম্পর্কিত করে। কিন্তু করার গঠন করা আস্থা ব্যবধান এবং 70% কভারেজ গ্যারান্টি, আমরা "উল্লম্বভাবে" কাজ করতে হবে - ঘুরে প্রতিটি কলামের দিকে তাকিয়ে, এবং নিশ্চিত উপার্জন যে সম্ভাব্যতা ভর ফাংশন 70% আচ্ছাদিত করা হয়, যাতে সময় 70%, যে কলামের পরিচয় ফলাফল অন্তর অন্তর হতে হবে। মনে রাখবেন যে এটি উল্লম্ব কলামগুলি যা একটি পিএমএফ গঠন করে

সুতরাং এই পদ্ধতিটি করার পরে, আমি এই অন্তরগুলি দিয়ে শেষ করেছি:

এখানে চিত্র বর্ণনা লিখুন

উদাহরণস্বরূপ, আমি যে কুকিটি আঁকছি তাতে চিপের সংখ্যা যদি 1 হয় তবে আমার আত্মবিশ্বাসের ব্যবধানটি {বি, সি, ডি} হবে} যদি সংখ্যাটি 4 হয় তবে আমার আত্মবিশ্বাসের ব্যবধানটি হবে {বি, সি}} লক্ষ্য করুন যেহেতু প্রতিটি কলামের পরিমাণ 70% বা তারও বেশি হয়, তবে আমরা কোন কলামে প্রকৃতই তা বিবেচনা করি না (প্রসবকর্তা যে জারটি ফেলে রাখেন তা নয়), এই প্রক্রিয়াটির ফলে অন্তর অন্তত 70% সম্ভাব্যতার সাথে সঠিক জারটি অন্তর্ভুক্ত করবে।

আরও লক্ষ করুন যে অন্তরগুলি তৈরির ক্ষেত্রে আমি যে পদ্ধতি অনুসরণ করেছি তাতে কিছুটা বিবেচনা ছিল। টাইপ-বি এর কলামে, আমি ঠিক সহজেই নিশ্চিত করতে পারছিলাম যে বি অন্তর্ভুক্ত অন্তরগুলি 1,2,3,4 এর পরিবর্তে 0,1,2,3 হবে। এর ফলে টাইপ-বি জারগুলির জন্য 75% কভারেজ তৈরি হত (12 + 19 + 24 + 20), এখনও নিচের সীমাটি 70% পূরণ করে।

যদিও আমার বোন বয়েসিয়া ভেবেছিল এই পদ্ধতিটি পাগল। "আপনাকে সরবরাহকারীর সিস্টেমের অংশ হিসাবে বিবেচনা করতে হবে," তিনি বলেছিলেন। "আসুন জারটির পরিচয়টি এলোমেলো পরিবর্তনশীল হিসাবে বিবেচনা করা যাক এবং ধরে নেওয়া যাক যে বিতরণকারী তাদের মধ্যে অভিন্নভাবে চয়ন করে - যার অর্থ তার ট্রাকে চারটি আছে, এবং যখন সে আমাদের বাড়িতে পৌঁছে যায় তখন সে এলোমেলোভাবে একটি করে বাছাই করে, প্রত্যেককে সাথে করে অভিন্ন সম্ভাবনা। "

"এই অনুমানের সাথে, এখন আসুন পুরো ইভেন্টের যৌথ সম্ভাবনাগুলি - আপনার প্রথম কুকি থেকে জার টাইপ এবং আপনি যে চিপগুলি আঁকেন সেদিকে নজর দিন ," তিনি নীচের সারণিকে অঙ্কন করে বলেছিলেন:

এখানে চিত্র বর্ণনা লিখুন

লক্ষ্য করুন যে পুরো টেবিলটি এখন একটি সম্ভাব্য ভর ফাংশন - যার অর্থ পুরো টেবিলের পরিমাণ 100%।

"ঠিক আছে," আমি বললাম, "আপনি কোথায় চলেছেন?"

বায়সিয়া বলেছিলেন, "আপনি জারটি দিয়ে চিপের সংখ্যার শর্তাধীন সম্ভাবনা দেখছেন," "এটি সবই ভুল! আপনি কুকিতে থাকা চিপের সংখ্যাটি দেখিয়ে শর্তসাপেক্ষ সম্ভাবনাটি যা জারের এটির শর্তযুক্ত সম্ভাবনা! আপনার 70% বিরতিতে কেবল তালিকা জারের অন্তর্ভুক্ত করা উচিত যা মোট হিসাবে মোট 70% সম্ভাবনা রয়েছে সত্য জার। এটি কি খুব সহজ এবং আরও স্বজ্ঞাত নয়? "

"অবশ্যই, তবে আমরা কীভাবে এটি গণনা করব?" আমি জিজ্ঞাসা করেছিলাম.

"ধরা যাক আমরা জানি যে আপনি 3 টি চিপস পেয়েছেন Then তারপরে আমরা টেবিলের সমস্ত অন্যান্য সারি উপেক্ষা করতে পারি এবং সেই সারিটিকে কেবল সম্ভাব্য ভর ফাংশন হিসাবে বিবেচনা করতে পারি We আমাদের সম্ভাবনাগুলি আনুপাতিকভাবে মাপতে হবে যাতে প্রতিটি সারির পরিমাণ 100 হয় , যদিও। " সে করেছে:

এখানে চিত্র বর্ণনা লিখুন

"লক্ষ্য করুন যে প্রতিটি সারি এখন কীভাবে একটি পিএমএফ, এবং তার যোগফল 100% হবে you আপনি যেটি শুরু করেছিলেন তার থেকে আমরা শর্তসাপেক্ষ সম্ভাবনাটি উল্টিয়ে দিয়েছি - এখন চিপ সংখ্যাটি দিয়ে লোকটি একটি নির্দিষ্ট জারটি নামিয়ে ফেলল the প্রথম কুকি। "

"আকর্ষণীয়," আমি বলেছিলাম। "সুতরাং এখন আমরা 70% পর্যন্ত সম্ভাব্যতা পেতে প্রতিটি সারিটিতে পর্যাপ্ত পরিমাণ জারগুলি বৃত্তে রেখেছি?" আমরা কেবল এটি করেছি, এই বিশ্বাসযোগ্যতা অন্তরগুলি তৈরি করে:

এখানে চিত্র বর্ণনা লিখুন

প্রতিটি বিরতিতে জারগুলির একটি সেট অন্তর্ভুক্ত থাকে যা, একটি পোস্টেরিয়েরি , সত্যিকারের জার হওয়ার সম্ভাবনা 70% থাকে।

"আচ্ছা, থাক," আমি বললাম। "আমি নিশ্চিত নই। আসুন, দুই ধরণের অন্তর পাশাপাশি থাকি এবং তাদের কভারেজের জন্য তুলনা করি এবং ধরে নিই যে ডেলিভারিম্যান প্রতিটি ধরণের জারকে সমান সম্ভাবনা, বিশ্বাসযোগ্যতার সাথে তুলবে।"

এখানে তারা:

আস্থা অন্তর:

এখানে চিত্র বর্ণনা লিখুন

বিশ্বাসযোগ্যতা অন্তর:

এখানে চিত্র বর্ণনা লিখুন

"দেখুন আপনার আত্মবিশ্বাসের অন্তর কতটা ক্রেজি?" বয়েসিয়া বলেছে। "আপনি যখন শূন্য চিপস দিয়ে একটি কুকি আঁকেন তখন আপনার কাছে বুদ্ধিমান উত্তরও নেই! আপনি কেবল বলেছিলেন এটি ফাঁকা ব্যবধান But তবে এটি স্পষ্টতই ভুল - এটি চার ধরণের জারের মধ্যে একটি হতে হবে you আপনি কীভাবে বাঁচতে পারবেন? নিজেকে, দিনের শেষে একটি বিরতি উল্লেখ করে যখন আপনি জানেন যে অন্তরটি ভুল? এবং আপনি যখন 3 টি চিপ সহ একটি কুকি টানেন তখন - আপনার অন্তরটি কেবল সময়ের 41% সঠিক। এটি একটি '70% 'আত্মবিশ্বাস বলে বিরতি হ'ল বুলশিট "

"আচ্ছা, আরে" আমি জবাব দিলাম। "এটি সময়ের %০% সঠিক, ডেলিভারিম্যানটি যে জারটি ফেলেছিল তা বিবেচ্য নয় your এটি আপনার বিশ্বাসযোগ্যতার অন্তরগুলি সম্পর্কে আপনি যা বলতে পারেন তার চেয়ে অনেক বেশি। জারটি বি টাইপ করলে কী হবে? তাহলে আপনার ব্যবধানটি ৮০% সময় ভুল হবে , এবং কেবলমাত্র 20% সময়ই সঠিক! "

"আমি মনে করি," এটি একটি বড় সমস্যার মতো বলে মনে হচ্ছে কারণ আপনার ভুলগুলি জারের ধরণের সাথে সংযুক্ত হবে you আপনার কী ধরণের জার আছে তা নির্ধারণ করতে যদি আপনি 100 'বায়সিয়ান' রোবট প্রেরণ করেন তবে প্রতিটি রোবট একটি কুকির নমুনা রাখে, আপনি আমাকে বলছেন যে টাইপ-বি দিনগুলিতে আপনি ৮০ টি রোবটকে ভুল উত্তর পেতে আশা করবেন, যার প্রত্যেকেরই তার ভুল উপসংহারে 73৩% বিশ্বাস রয়েছে! সমস্যাটি সমস্যাজনক, বিশেষত যদি আপনি বেশিরভাগ রোবটদের সাথে একমত হতে চান সঠিক উত্তর."

"প্লাস আমাদের এই ধারণাটি তৈরি করতে হয়েছিল যে ডেলিভারিম্যান সমানভাবে আচরণ করে এবং এলোমেলোভাবে প্রতিটি ধরণের জার নির্বাচন করে," আমি বলেছিলাম। "এটি কোথা থেকে এসেছে? ভুল হলে কী হয়? আপনি তাঁর সাথে কথা বলেননি; আপনি তাঁর সাক্ষাত্কার নেননি । তবুও আপনার উত্তরোত্তর সম্ভাবনার সমস্ত বিবৃতি তাঁর আচরণ সম্পর্কে এই বক্তব্যকে বিশ্রামে রেখেছিল । আমাকে আর করতে হয়নি। এ জাতীয় কোনও অনুমান এবং আমার বিরতি এমনকি সবচেয়ে খারাপ ক্ষেত্রেও তার মানদণ্ড পূরণ করে। "

"এটা সত্য যে আমার বিশ্বাসযোগ্যতা ব্যবধান টাইপ-বি জারগুলিতে খারাপ অভিনয় করে না," বয়েসিয়া বলেছিলেন। "তবে কি? টাইপ বি জারগুলি কেবল সময়ের 25% হয় A এ, সি, এবং ডি জার টাইপের আমার ভাল কভারেজ দ্বারা এটি ভারসাম্যপূর্ণ। এবং আমি কখনই বাজে কথা প্রকাশ করি না।"

"এটা সত্য যে আমি যখন জিরো চিপস সহ কোনও কুকি আঁকি তখন আমার আত্মবিশ্বাসের ব্যবধানটি খারাপভাবে সম্পাদন করে।" "তবে কি? চিপলেস কুকিজগুলি ঘটে যায়, সর্বাধিক 27% সময় সবচেয়ে খারাপ ক্ষেত্রে (একটি টাইপ-ডি জার) হয় this % সময়."

"কলামটি তারতম্যের বিষয়," আমি বলেছিলাম।

বায়সিয়া বলেছিলেন, "সারিটির বিষয়টি মোটামুটি ব্যাপার।"

"আমি দেখতে পাচ্ছি আমরা একটি অচলাবস্থার মধ্যে রয়েছি," আমি বলেছিলাম। "আমরা যে গাণিতিক বক্তব্য দিচ্ছি তার মধ্যে আমরা উভয়ই সঠিক, তবে আমরা অনিশ্চয়তা পরিমাপের উপযুক্ত উপায় সম্পর্কে একমত নই।"

"সত্য," আমার বোন বলল। "কুকি চাই?"


17
ভাল উত্তর - আপনি কেবল একটি ছোটখাটো বক্তব্য, "আপনি বলুন ...." পরামিতিটির একটি সত্য মূল্য আছে তা বলার পরিবর্তে একটি বায়েশিয়ান পদ্ধতি বলছে কিছু সম্ভাবনা বন্টন থেকে মানটি বেছে নেওয়া হয়েছে ..... "এটি সত্য নয়। সত্য, অজানা, স্থির মান সম্পর্কে অনিশ্চয়তা প্রকাশ করতে একজন বেইসিয়ান সম্ভাব্যতা বন্টনকে ফিট করে। ডেটা পর্যবেক্ষণের আগে যা জানা ছিল তা দিয়ে এটি কোন মানগুলি প্রশংসনীয় তা বলে। প্রকৃত সম্ভাবনা বিবৃতি হল , যেখানে সত্য মান, এবং এই ধারণার এক, তথ্যের উপর ভিত্তি করে । Pr[θ0(θ,θ+dθ)|I]θ0θI
সম্ভাব্যতাব্লোগিক

1
... তবুও ... তবে "পটভূমিতে" এর অর্থ কী তা বোঝার সাথে কেবল লিখতে আরও সুবিধাজনক । স্পষ্টতই এটি অনেক বিভ্রান্তির কারণ হতে পারে। p(θ)
সম্ভাব্যতাব্লোগিক

16
এই দুর্দান্ত পুরাতন পোস্টটি পুনরজ্জীবিত করার জন্য তবে একটি তাত্পর্যপূর্ণ প্রশ্ন, আপনার যে পোস্টে ঘন ঘনবাদী বায়েশিয়ান পদ্ধতির সমালোচনা করে আপনি বলেছেন: "সত্যিকারের মানটি যদি হয়, তবে বলুন 0.37? যদি এটি হয় তবে আপনার পদ্ধতিটি চালানো শুরু করুন" শেষ করতে হবে, সময় 75% ভুল হবে। " আপনি কীভাবে এই নম্বর পেয়েছেন? ০.7 কীভাবে 75৫% ভুলের সাথে মিলে যায়? এটি কি কোনও ধরণের সম্ভাব্যতা বক্ররেখা বন্ধ? ধন্যবাদ
BYS2

1
দারুণ দৃষ্টান্ত! আমরা জার থেকে কুকি নমুনা দেওয়ার অনুমতি দিলে কীভাবে চকোলেট চিপ মডেলের আত্মবিশ্বাস ও বিশ্বাসযোগ্যতা অন্তরগুলি সামঞ্জস্য করা যায়? আমরা আপেক্ষিক ফ্রেইকের উপর ডেটা সংগ্রহ করার সাথে সাথে আমরা দুটি পদ্ধতির যথার্থতাকে রেট করতে পারি। বিতরণ করা হয় যে জারের? আমি অনুমান করব যে একবার পূর্ব বিতরণ সম্পর্কে মোটামুটি নিশ্চিত হয়ে যাওয়ার পরে বায়েশিয়ান পদ্ধতির আরও ভাল ভবিষ্যদ্বাণী করা হবে (say 30 ডেলিভারির পরে বলবেন?) তবে যদি পূর্ববর্তী ডিবিএন হঠাৎ করে পরিবর্তন করা হয় (বলুন কোনও নতুন ডেলিভারিম্যান কাজ গ্রহণ করে) তবে ফ্রিকোয়ালিস্ট পদ্ধতির সুবিধা হবে।
রবার্টএফ

4
@ বিওয়াইএস 2, যখন লেখক বলেছেন যে "What if the true value is, say, 0.37? If it is, then your method, run start to finish, will be WRONG 75% of the time", তারা কেবল তাদের তৈরি উদাহরণ উদাহরণ দিচ্ছে। এই বিশেষ ক্ষেত্রে, তারা এমন কিছু পূর্ববর্তী বিতরণকে উল্লেখ করবে যা এর কোথাও কোথাও এর বেশিরভাগ ঘনত্বের সাথে 0.37 এ খুব কম মান ছিল। এবং আমরা ধরে নিই যে প্যারামিটারটির আসল মান 0.37 হওয়ার সাথে সাথে আমাদের উদাহরণ বিতরণটি খুব খারাপভাবে সম্পাদন করবে, একইভাবে জার টাইপ-বি হওয়ার পরে যখন বায়সিয়ার বিশ্বাসযোগ্যতার অন্তরগুলি খারাপভাবে ব্যর্থ হয়েছিল।
গ্যারেট

32

আমার বোঝার বিষয়টি নিম্নরূপ:

পটভূমি

মনে করুন যে আপনার কাছে কিছু ডেটা এবং আপনি অনুমান করার চেষ্টা করছেন । আপনার কাছে একটি ডেটা উত্পন্ন প্রক্রিয়া রয়েছে যা কীভাবে শর্তসাপেক্ষে generated উত্পন্ন হয় তা বর্ণনা করে । অন্য কথায় আপনি এর ডিস্ট্রিবিউশন জানেন (বলুন, ।xθxθxf(x|θ)

অনুমান সমস্যা

আপনার অনুমানের সমস্যাটি হল: পর্যবেক্ষণ করা ডেটা ভিত্তিতে এর কোন মানগুলি যুক্তিসঙ্গত ?θx

আস্থা অন্তর

আত্মবিশ্বাসের বিরতি হ'ল উপরের সমস্যার একটি শাস্ত্রীয় উত্তর। এই পদ্ধতির ক্ষেত্রে, আপনি ধরে নিবেন যে সত্য, স্থির মান রয়েছে । এই ধৃষ্টতা দেওয়া, আপনি ডেটা ব্যবহার একটি অনুমান পেতে (বলুন, )। একবার আপনার অনুমানটি হয়ে গেলে আপনি মূল্যায়নের সাথে সম্পর্কিত প্রকৃত মানটি কোথায় তা নির্ধারণ করতে চান।θxθθ^

লক্ষ্য করুন যে, এই পদ্ধতির অধীনে সত্য মান না একটি এলোপাতাড়ি ভেরিয়েবলের। এটি একটি স্থির তবে অজানা পরিমাণ। বিপরীতভাবে, আপনার অনুমান হয় যেমন এ আপনার ডেটা নির্ভর একটি এলোপাতাড়ি ভেরিয়েবলের যা আপনার ডেটা উৎপাদিত প্রক্রিয়া থেকে তৈরি করেছিল। সুতরাং, আপনি বুঝতে পারবেন যে প্রতিবার আপনার পড়াশুনার পুনরাবৃত্তি করার সময় আপনি বিভিন্ন অনুমান পান।x

উপরের বোঝাপড়াটি আপনার অনুমানের সাথে সত্যিকারের প্যারামিটারের সাথে সম্পর্কিত কিনা তা নির্ধারণ করার জন্য নিম্নলিখিত পদ্ধতিটির দিকে পরিচালিত করে। একটি বিরতি সংজ্ঞায়িত করুন, নীচের সম্পত্তি সহ :I[lb(x),ub(x)]

P(θI)=0.95

উপরের মতো নির্মিত একটি অন্তর্বর্তীত্বকে আত্মবিশ্বাসের ব্যবধান বলে। যেহেতু, আসল মানটি অজানা তবে স্থির তাই প্রকৃত মান হয় বিরতিতে বা বিরতির বাইরে। আত্মবিশ্বাসের বিরতিটি হ'ল সম্ভাবনা সম্পর্কে একটি বিবৃতি যা আমরা যে ব্যবধানটি পাই তা প্রকৃত প্যারামিটার মান হয়। সুতরাং, সম্ভাব্যতা বিবৃতিটি সত্যিকার প্যারামিটার মানের অবস্থানের পরিবর্তে অন্তর (যেমন, অন্তরটির প্রকৃত মান আছে কি না) সম্ভাবনা রয়েছে।

এই দৃষ্টান্তে, সত্য মানটি এলোমেলো পরিবর্তনশীল না বলে একটি সত্য মান কিছু মানের চেয়ে কম বা তার চেয়ে বেশি হওয়ার সম্ভাবনা সম্পর্কে কথা বলা অর্থহীন ।

বিশ্বাসযোগ্য ব্যবধান

শাস্ত্রীয় পদ্ধতির বিপরীতে, বায়সিয়ান পদ্ধতির মধ্যে আমরা ধরে নিই যে আসল মান একটি এলোমেলো পরিবর্তনশীল। সুতরাং, আমরা সত্য প্যারামিটার ভেক্টরের উপর পূর্ববর্তী বন্টন চাপিয়ে সত্য প্যারামিটার মান সম্পর্কে আমাদের অনিশ্চয়তা ক্যাপচার করি (বলুন )।f(θ)

বেইস উপপাদ্যটি ব্যবহার করে আমরা পূর্বের এবং আমাদের যে ডেটা আছে তা সংমিশ্রণ করে প্যারামিটার ভেক্টরের জন্য পূর্ববর্তী বিতরণটি তৈরি করি (সংক্ষেপে পরেরটি )।f(θ|)f(θ)f(x|θ)

তারপরে আমরা উত্তরোত্তর বিতরণ (উদাহরণস্বরূপ, উত্তরোত্তর বিতরণের গড়টি ব্যবহার করে) ব্যবহার করে একটি বিন্দুতে প্রাক্কলনে পৌঁছে যাই। তবে, যেহেতু এই দৃষ্টান্তের অধীনে, সত্য প্যারামিটার ভেক্টর একটি এলোমেলো পরিবর্তনশীল, আমরা আমাদের পয়েন্ট অনুমানের মধ্যে আমাদের কতটা অনিশ্চয়তা রয়েছে তাও জানতে চাই। সুতরাং, আমরা এমন একটি অন্তর তৈরি করি যা নিম্নলিখিতগুলি ধারণ করে:

P(l(θ)θub(θ))=0.95

উপরেরটি একটি বিশ্বাসযোগ্য ব্যবধান।

সারাংশ

বিশ্বাসযোগ্য ব্যবধানগুলি প্যারামিটার মানগুলির স্থানে আমাদের বর্তমান অনিশ্চয়তা ক্যাপচার করে এবং সুতরাং পরামিতি সম্পর্কে সম্ভাব্য বিবৃতি হিসাবে ব্যাখ্যা করা যায়।

বিপরীতে, আত্মবিশ্বাসের বিরতিগুলি আমাদের প্রাপ্ত বিরতি সম্পর্কে অনিশ্চয়তা ক্যাপচার করে (যেমন, এতে প্রকৃত মান রয়েছে কি না)। সুতরাং, তাদের সত্য পরামিতি মানগুলি সম্পর্কে সম্ভাব্য বিবৃতি হিসাবে ব্যাখ্যা করা যায় না।


2
সংজ্ঞা অনুসারে একটি 95% আত্মবিশ্বাসের ব্যবধান 95% ক্ষেত্রে সত্য প্যারামিটার মানটি কভার করে, যেমন আপনি সঠিকভাবে নির্দেশ করেছেন। সুতরাং, আপনার ব্যবধানটি সত্য পরামিতির মানটি কভার করার সুযোগটি 95%। অন্তর নির্মাণের সময় আপনার যে অনুমানগুলি করা হয় তার উপর ভিত্তি করে প্যারামিটারটি কোনও সীমার চেয়ে বড় বা ছোট হওয়ার সুযোগ সম্পর্কে আপনি কিছু সময় বলতে পারেন (প্রায়শই আপনার অনুমানের সাধারণ বিতরণ)। আপনি পি (থেটা> ub), বা পি (ub <থিতা) গণনা করতে পারেন। বিবৃতিটি সত্যই সীমানা সম্পর্কে, তবে আপনি এটি তৈরি করতে পারেন।
জোরিস মেজ

9
জরিস, আমি একমত হতে পারি না। হ্যাঁ, প্যারামিটারের যে কোনও মানের জন্য, 95% সম্ভাবনা থাকতে পারে যে ফলস্বরূপ ব্যবধানটি সত্য মানটি আবরণ করে। এর অর্থ এই নয় যে কোনও নির্দিষ্ট পর্যবেক্ষণ গ্রহণ এবং বিরতি গণনা করার পরে, এখনও অবধি 95% শর্তসাপেক্ষ সম্ভাবনা রয়েছে যা সেই ব্যবস্থায় প্রকৃত মানকে অন্তর্ভুক্ত করে। যেমন আমি নীচে বলেছি, আনুষ্ঠানিকভাবে এটি আত্মবিশ্বাসের ব্যবধানের জন্য [0, 1] 95% সময় এবং খালি সেটটি অন্য 5% নির্ধারণের জন্য পুরোপুরি গ্রহণযোগ্য হবে। বিরতি হিসাবে আপনি খালি সেটটি পেয়েছেন এমন ঘটনাগুলি, সেখানে সত্যিকারের মানটির 95% সম্ভাবনা থাকে না!
কিথ উইনস্টাইন

@ কীথ: আমি আপনার বক্তব্যটি দেখতে পাচ্ছি, যদিও খালি সেট সংজ্ঞা অনুসারে অন্তর নয়। বিপরীতে, একটি আত্মবিশ্বাসের ব্যবধানের সম্ভাবনাও ডেটা শর্তাধীন নয়। প্রতিটি আত্মবিশ্বাসের ব্যবধানটি একটি ভিন্ন এলোমেলো নমুনা থেকে আসে, সুতরাং আপনার নমুনাটি এমনভাবে আঁকার সুযোগ রয়েছে যে 95% সিআই এর উপর ভিত্তি করে সত্য পরামিতিটির মানটি আবরণ করে না, ডেটা নির্বিশেষে মাত্র 5% করে।
জোরিস মেজ

1
জোরিস, আমি "নমুনা" এর প্রতিশব্দ হিসাবে "ডেটা" ব্যবহার করছিলাম তাই আমার মনে হয় আমরা সম্মত হই। আমার বক্তব্যটি হ'ল পরিস্থিতিগুলিতে হওয়া সম্ভব, আপনি নমুনা নেওয়ার পরে, যেখানে আপনি নিখুঁতভাবে নিশ্চিত করতে পারেন যে আপনার বিরতি ভুল - এটি সত্যিকারের মানটি আবরণ করে না। এর অর্থ এই নয় যে এটি 95% আত্মবিশ্বাসের বৈধ নয়। সুতরাং আপনি বলতে পারবেন না যে আত্মবিশ্বাসের প্যারামিটার (95%) আপনাকে পরীক্ষাটি শেষ করে এবং বিরতি দেওয়ার পরে কোনও নির্দিষ্ট ব্যবধানের কভারেজ হওয়ার সম্ভাবনা সম্পর্কে আপনাকে কিছু বলে। পূর্বের দ্বারা জানানো কেবল একটি পোস্টেরিয়েরি সম্ভাবনাই এটির সাথে কথা বলতে পারে।
কীথ উইনস্টাইন

4
@svadalli - Bayesian পদ্ধতির মতে লাগবে না এলোমেলো হয়ে যায় । এটা তোলে নয় যে বিতরণ করা হয় ( সংশোধন কিন্তু অজানা হয়), এটা সম্পর্কে অনিশ্চয়তা যা বিতরণ করা হয়, প্রায় জ্ঞানের একটি রাষ্ট্র উপর শর্তাধীন । ক্যাপচার করছে এমন প্রকৃত সম্ভাব্যতা বিবৃতি হ'ল । প্রকৃতপক্ষে, একই একই যুক্তি জন্য প্রযোজ্য , এটিও স্থির, তবে অজানা হিসাবে বিবেচনা করা যেতে পারে। θ θθ θ θf(θ)Pr(θ is in the interval (θ,θ+dθ)|I)=f(θ)dθX
সম্ভাব্যতা

13

আমি একটি মৌলিক বিষয় নিয়ে শ্রীকান্তের জবাবের সাথে একমত নই। শ্রীকান্ত এই বলেছিলেন:

"অনুমানের সমস্যা: আপনার অনুমানের সমস্যাটি হল: data এর কোন মানগুলি পর্যবেক্ষণ করা ডেটা এক্স দিয়ে যুক্তিসঙ্গত?"

আসলে এটি বেইশিয়ান ইনফারেন্স সমস্যা। বায়সিয়ান পরিসংখ্যানগুলিতে আমরা পি (θ | x) গণনা করতে চাইছি পর্যবেক্ষণ করা ডেটা (নমুনা) দিয়ে প্যারামিটার মানের সম্ভাবনা। ক্রেডিবল ইন্টারভাল একটি ব্যবধান θ যেটির মূল সমস্যাটি অন্তর্ভুক্ত করে এমন অনেকগুলি অনুমানের ফলে 95% সুযোগ (বা অন্য) রয়েছে value এর সত্যিকারের মূল্য রয়েছে।

নিখুঁত তথ্য সমস্যা হ'ল:

পর্যবেক্ষণ করা ডেটা এক্স যুক্তিসঙ্গত θ এর অনুমানিত মানগুলি দেওয়া হয়?

ঘনত্ববাদী পরিসংখ্যানগুলিতে আমরা পি (x | θ) গণনা করতে চাইছি অর্থাৎ অনুমানিত প্যারামিটার মান (গুলি) প্রদত্ত ডেটা (নমুনা) পর্যবেক্ষণের সম্ভাবনা। কনফিডেন্স ইন্টারভাল (সম্ভবত কোনও মিসনোমার) হিসাবে ব্যাখ্যা করা হয়েছে: যদি এলোমেলো নমুনা এক্স উত্পন্ন পরীক্ষাটি বহুবার পুনরাবৃত্তি করা হয়, তবে এলোমেলো নমুনাগুলি থেকে তৈরি এমন অন্তরগুলির 95% (বা অন্যান্য) প্যারামিটারের সত্যিকারের মান থাকতে পারে।

আপনার মাথা দিয়ে জগাখিচুড়ি? ঘন ঘনবাদী পরিসংখ্যান এবং বায়সিয়ান পরিসংখ্যানগুলির মূল বিষয়টি এটিই সমস্যা।

সিকান্ত যেমন উল্লেখ করেছেন, পি (θ | x) এবং পি (x | θ) এর সাথে সম্পর্কিত রয়েছে:

পি (θ | x) = পি (θ) পি (x | θ)

যেখানে পি (θ) হ'ল আমাদের পূর্ব সম্ভাবনা; পি (x | θ) হ'ল সেই পূর্বের শর্তযুক্ত ডেটার সম্ভাবনা এবং পি (θ | x) উত্তরোত্তর সম্ভাবনা। পূর্ববর্তী পি (θ) স্বভাবগতভাবে বিষয়গত, তবে এটি মহাবিশ্ব সম্পর্কে জ্ঞানের মূল্য - খুব গভীর অর্থে।

সিক্রান্ত এবং কেথের উত্তর উভয়েরই অন্যান্য অংশগুলি দুর্দান্ত।


প্রযুক্তিগতভাবে, আপনি সঠিক তবে নোট করুন যে আত্মবিশ্বাসের ব্যবধানটি প্যারামিটার মানগুলির সেট দেয় যার জন্য নাল অনুমানটি সত্য। সুতরাং, "পর্যবেক্ষণ করা ডেটা এক্স যুক্তিযুক্ত কি থিটা সম্পর্কে আমাদের অনুমান দেওয়া আছে?" "পর্যবেক্ষণ করা ডেটা এক্সকে প্রদত্ত থাইটির সত্যিকারের মানগুলি কি সামঞ্জস্যপূর্ণ অনুমান হিসাবে বিবেচিত হবে?" নোট করুন যে পুনরায় শব্দযুক্ত প্রশ্নটি প্রয়োজনীয়ভাবে বোঝায় না যে থিটা একটি এলোমেলো পরিবর্তনশীল হিসাবে ধরে নেওয়া হচ্ছে। পুনরায় বাক্যযুক্ত প্রশ্নটি সত্যটি কাজে লাগায় যে অনুমান করা মানটি আত্মবিশ্বাসের বিরতিতে পড়ে কিনা তা পরীক্ষা করে আমরা নাল হাইপোথিসিস পরীক্ষা করি।

@ এসভাদালি - আত্মবিশ্বাসের ব্যবধানগুলি একটি নির্দিষ্ট অনুমানের জন্য ডেটা মূল্যায়ন করে । সুতরাং সমীকরণের "স্থির" অংশটি পরিবর্তন করার সময়, আপনি যদি আপনার ডেটা পর্যবেক্ষণ করার আগে অনুমানের সম্ভাবনাটি বিবেচনা করতে ব্যর্থ হন, তবে আপনি অসঙ্গতি এবং অসংলগ্ন ফলাফল নিয়ে আসতে বাধ্য। শর্ত পরিবর্তন করার সময় শর্তসাপেক্ষ সম্ভাবনা "সীমাবদ্ধ" নয় (উদাহরণস্বরূপ শর্তগুলি পরিবর্তন করে আপনি শর্তযুক্ত সম্ভাবনা 0 থেকে 1 এ পরিবর্তন করতে পারেন)। পূর্ব সম্ভাবনা এই স্বেচ্ছাচারিতার অ্যাকাউন্টে নেয়। এক্স-এ কন্ডিশনিং করা হয় কারণ আমরা নিশ্চিত যে এক্স ঘটে গেছে - আমরা এক্স পর্যবেক্ষণ করেছিলাম!
সম্ভাব্যতাব্লোগিক

13

পূর্বে প্রদত্ত উত্তরগুলি খুব সহায়ক এবং বিস্তারিত। এখানে আমার 0.25 ডলার।

আত্মবিশ্বাস অন্তর্বর্তী (সিআই) সম্ভাবনার শাস্ত্রীয় সংজ্ঞা (যাকে "ফ্রিকোয়ালিস্ট সংজ্ঞা "ও বলা হয়) এর উপর ভিত্তি করে একটি ধারণা যা সম্ভাবনা অনুপাতের মতো এবং কোলমোগ্রোভের (এবং অন্যদের) অ্যাক্সিয়োম্যাটিক সিস্টেমের উপর ভিত্তি করে।

ওয়াল্ড ও ডি ফিনেটির কাজগুলির ভিত্তিতে (এবং অন্যদের দ্বারা অনেকটা প্রসারিত) নির্ভরযোগ্য নির্ভরযোগ্য ব্যবধানগুলি (সর্বোচ্চ প্যাসিরিওর ডেনসিটি, এইচপিডি) সিদ্ধান্ত তত্ত্বের মূল হতে পারে বলে বিবেচনা করা যেতে পারে।

এই থ্রেডের লোকেরা যেমন বায়েশিয়ান এবং ঘনঘনবাদী মামলায় উদাহরণ এবং হাইপোথিসির পার্থক্য দেওয়ার ক্ষেত্রে দুর্দান্ত কাজ করেছে, আমি কেবল কয়েকটি গুরুত্বপূর্ণ বিষয়গুলির উপর জোর দেব।

  1. সিআইগুলি এই তথ্যের ভিত্তিতে তৈরি হয় যে কোনও পরীক্ষার সমস্ত সম্ভাব্য পুনরাবৃত্তির উপর অনুমান করা আবশ্যক যা কেবলমাত্র পর্যবেক্ষণ করা ডেটার উপরই নয় যেখানে এইচপিডি হ'ল পর্যবেক্ষণ করা তথ্যের উপরে সম্পূর্ণ ভিত্তি করে (এবং আমাদের পূর্বের অনুমানগুলি)।

  2. সাধারণ সিআইগুলি সুসংগত হয় না (পরে ব্যাখ্যা করা হবে) যেখানে এইচপিডিগুলি সুসংগত (সিদ্ধান্ত তত্ত্বের মূলের কারণে)। কোহরেন্স (যেমন আমি আমার গ্র্যান্ড মাকে বোঝাতে চাইছি) এর অর্থ: একটি প্যারামিটার মানের উপর বাজি সমস্যা দেওয়া হয়েছে, যদি সিআইতে কোনও ধ্রুপদী পরিসংখ্যানবিদ (ঘন ঘনবাদী) এবং এইচপিডিগুলিতে একটি বায়সিয়ান বেট থাকে তবে ঘন ঘন ঘন ঘন ব্যয়টি হারাতে পারে (তুচ্ছ ঘটনা বাদে) যখন এইচপিডি = সিআই)। সংক্ষেপে, আপনি যদি তথ্যের উপর ভিত্তি করে আপনার পরীক্ষার সন্ধানগুলি সংক্ষিপ্ত করতে চান তবে সম্ভাবনাটি উত্তরোত্তর সম্ভাবনা (পূর্বের ভিত্তিতে) হতে পারে H একটা উপপাদ্য (CF হিথ এবং Sudderth, পরিসংখ্যান কাহিনী, 1978) যা (প্রায়) বলে: সম্ভাবনা নিয়োগ ডেটার উপর ভিত্তি করে যদি এবং কেবল যদি এটি একটি bayesian ভাবে প্রাপ্ত হয় একটি নিশ্চিত অভাগা করা হবে না।θ

  3. যেহেতু সিআইআই পর্যবেক্ষণ করা তথ্যের উপর শর্ত না রাখে (এটিকে "কন্ডিশনালিটি প্রিন্সিপাল" সিপিও বলা হয়), সেখানে বিপরীতমুখী উদাহরণ থাকতে পারে। ফিশার সিপি-র একটি বড় সমর্থক ছিলেন এবং যখন এটি অনুসরণ করা হয়নি (সিআই-র ক্ষেত্রে যেমন ছিল) তখন প্রচুর প্যারাডক্সিক উদাহরণও পেয়েছিলেন। এই কারণেই তিনি সিআই-র বিপরীতে পি-ভ্যালু ব্যবহারের জন্য ব্যবহার করেছিলেন। তাঁর দৃষ্টিতে পি-মানগুলি পর্যবেক্ষণ করা তথ্যের উপর ভিত্তি করে তৈরি হয়েছিল (পি-মানগুলি সম্পর্কে অনেক কিছুই বলা যায়, তবে এখানে ফোকাস হয় না)। অত্যন্ত বিখ্যাত দুটি প্যারাডক্সিকাল উদাহরণ হ'ল: (4 এবং 5)

  4. কক্সের উদাহরণ (ম্যাথের অ্যানালস। স্ট্যাটিট।, 1958): (আইআইডি) এবং আমরা চাই অনুমান করার জন্য । স্থির নয় এবং একটি মুদ্রা টস করে বেছে নেওয়া হয়। যদি এইচ, টিনে টিনের ফলাফল বেছে নেওয়া হয়, অন্যথায় 1000 টি বেছে নেওয়া হয়। "সাধারণ জ্ঞান" অনুমান - নমুনা গড় একটি ভ্যারিয়েন্স সঙ্গে একটি পক্ষপাতিত্বহীন অনুমান । নমুনার বৈকল্পিক হিসাবে আমরা কী ব্যবহার করব যখন ? নমুনা গড়ের অনুমানকারীটির প্রকরণটি অনুমানের প্রকৃত পরিবর্তনের পরিবর্তে (শর্তসাপেক্ষ বৈকল্পিক) হিসাবে ব্যবহার করা ভাল নয় কি !! (XiN(μ,σ2)i{1,,n}μn0.5σ2+0.0005σ2n=10000.001σ20.5σ2+0.0005σ2)। এই সিপি সহজ চিত্রণ যখন আমরা যেমন ভ্যারিয়েন্স ব্যবহার যখন । একা দাঁড়ানো কোন গুরুত্ব বা কোন তথ্য রয়েছে এবং (অর্থাত তাদের জন্য আনুষঙ্গিক হয়) কিন্তু তার মান দেওয়া হয়েছে, আপনি "ডেটা গুণমান" সম্পর্কে অনেক জানি। এটি সরাসরি সিআইয়ের সাথে সম্পর্কিত কারণ এগুলি বৈকল্পিকের সাথে জড়িত যা শর্তযুক্ত করা উচিত নয় , অর্থাৎ আমরা বৃহত্তর বৈকল্পিকতাটি ব্যবহার করব, তাই রক্ষণশীলদের চেয়েও বেশি।0.001σ2n=1000nμσnn

  5. ওয়েলকের উদাহরণ: এই উদাহরণটি কোনও জন্য কাজ করে তবে আমরা সরলতার জন্য নেব । (IID), রিয়াল লাইন জন্যে। এটি (iid) বোঝায় । (নোট করুন যে এটি কোনও পরিসংখ্যান নয়) বিচ্ছিন্ন একটি বিতরণ রয়েছে । আমরা স্ট বোঝাতে টি 99% সিআইnn=2X1,X2U(θ1/2,θ+1/2)θX1θU(1/2,1/2)12(X1+X2)x¯θθc>0Probθ(c<=x¯θ<=c)=1α(99%)(x¯c,x¯+c)θ। এই সিআই-এর ব্যাখ্যাটি হ'ল: আমরা যদি বারবার নমুনা নিই, তবে আমরা একটি জিভেন ডেটার জন্য বিভিন্ন এবং 99% (কমপক্ষে) বার পেয়ে যাব সত্য , বাট (রুমে হাতি), আমরা সিআই-তে সত্য- থাকার সম্ভাবনাটি জানি না । এখন, নিম্নলিখিত ডেটা বিবেচনা করুন: এবং , হিসাবে , আমরা জানি যে বিরতিতে (একটি সম্ভাব্য সমালোচনা, রয়েছেx¯θθX1=0X2=1|X1X2|=1(X1,X2)θProb(|X1X2|=1)=0, তবে আমরা এটি গাণিতিকভাবে পরিচালনা করতে পারি এবং আমি এটি নিয়ে আলোচনা করব না)। এই উদাহরণটি সুসংগতির ধারণাটিকেও সুন্দরভাবে চিত্রিত করে। আপনি যদি একটি শাস্ত্রীয় পরিসংখ্যানবিদ হন তবে আপনি অবশ্যই মান না দেখে 99% সিআইয়ের উপর বাজি(ধরে নিই যে আপনি আপনার পেশার প্রতি সত্য)। তবে, কোনও বায়সিয়ান সিআই-তে বাজি ধরবে তবেই | X X মান 1 এর কাছাকাছি যদি আমরা শর্ত করি , ব্যবধানটি সুসংগত এবং প্লেয়ার আর কোনও নিশ্চিত পরাজিত হবে না (হিথ এবং সুদার্থের উপপাদ্যের মতো)।|X1X2||X1X2||X1X2|

  6. ফিশারের এই জাতীয় সমস্যার জন্য একটি সুপারিশ ছিল - সিপি ব্যবহার করুন। ওয়েলচের উদাহরণের জন্য, ফিশার শর্ত দেওয়ার পরামর্শ দিয়েছিল । আমরা দেখতে হিসাবে, জন্য আনুষঙ্গিক হয় , কিন্তু এটা থেটা সম্পর্কে তথ্য প্রদান করে। যদি ছোট হয় তবে ডেটাতে সম্পর্কে প্রচুর তথ্য নেই। যদি হয় তবে ডেটাতে সম্পর্কে প্রচুর তথ্য রয়েছে। ফিশার আনুষঙ্গিক পরিসংখ্যানগুলিতে কন্ডিশনিংয়ের কৌশলটিকে ফিডুসিয়াল ইনফারেন্স নামে একটি সাধারণ তত্ত্বে প্রসারিত করেছিলেনX2X1X2X1θX2X1θX2X1θ(এটিকে তার বৃহত্তম ব্যর্থতাও বলা হয়, সিএফ জাবেল, স্ট্যাটাস। বিজ্ঞান। 1992) তবে সাধারণতা এবং নমনীয়তার অভাবে এটি জনপ্রিয় হয়ে উঠেনি। ফিশার ধ্রুপদী পরিসংখ্যান (নেইমন স্কুল এর) এবং বাইশিয়ান স্কুল উভয়ের চেয়ে আলাদা একটি উপায় সন্ধান করার চেষ্টা করছিলেন (অতএব সাভেজের বিখ্যাত উক্তি: "ফিশার বায়েশিয়ান ডিম ভেঙে বায়েশিয়ান অমলেট (অর্থাত সিপি ব্যবহার করে) বানাতে চেয়েছিলেন") । ফোকলোর (কোনও প্রমাণ নেই) বলেছেন: ফিশার তার বিতর্কের সময় নেইমনকে (টাইপ প্রথম এবং টাইপ II ত্রুটি এবং সিআইয়ের জন্য) বিজ্ঞানীর চেয়ে কোয়ালিটি কন্ট্রোল লোক বলে আক্রমন করেছিলেন , কারণ নেইমনের পদ্ধতিগুলি পর্যবেক্ষণ করা তথ্যের উপর নির্ভর করে না, বরং তাকিয়েছিল সমস্ত সম্ভাব্য পুনরাবৃত্তি এ।

  7. পরিসংখ্যানবিদরা সিপি ছাড়াও পর্যাপ্তি নীতি (এসপি) ব্যবহার করতে চান। তবে এসপি এবং সিপি একসাথে সম্ভাবনা নীতি (এলপি) (সিএফ বর্নবাউম, জাসা, ১৯62২) বোঝায় সিপি এবং এসপি প্রদত্ত, কাউকে অবশ্যই নমুনা স্থানটিকে উপেক্ষা করতে হবে এবং কেবল সম্ভাবনার কার্যটি দেখতে হবে। সুতরাং, আমরা শুধুমাত্র দেওয়া তথ্য এবং তাকান প্রয়োজন না পুরো নমুনা স্থান দিকে (পুরো নমুনা স্থান দিকে তাকিয়ে বার বার স্যাম্পলিং অনুরূপ একটি উপায় হয়)। এটি পর্যবেক্ষিত ফিশার ইনফরমেশন (সিএফ। এফ্রন এবং হিঙ্কলি, এএস, 1978) এর মত ধারণার দিকে পরিচালিত করেছে যা ঘনত্ববাদী দৃষ্টিকোণ থেকে ডেটা সম্পর্কে তথ্য পরিমাপ করে। উপাত্তের তথ্যের পরিমাণ সিআইয়ের পরিবর্তে একটি বেয়েসিয়ান ধারণা (এবং এইচপিডি সম্পর্কিত)।

  8. কেফার ১৯ 1970০ এর দশকের শেষের দিকে সিআই-তে কিছু ফাউন্ডেশনাল কাজ করেছিলেন, তবে তার এক্সটেনশানগুলি জনপ্রিয় হয় নি। উল্লেখের একটি ভাল উত্স হ'ল বার্গার ("ক্যান ফিশার, নেইম্যান এবং জেফরি অনুমানের পরীক্ষার বিষয়ে একমত", স্ট্যাট সায়, 2003)।


সারাংশ:

(শ্রীকান্ত এবং অন্যদের দ্বারা নির্দেশিত হিসাবে)
সিআই-কে সম্ভাব্যতা হিসাবে ব্যাখ্যা করা যায় না এবং তারা অচিন্তিত প্যারামিটার সম্পর্কে পর্যবেক্ষণ করা ডেটা প্রদান করে না। সিআইগুলি হ'ল বারবার পরীক্ষা-নিরীক্ষা সম্পর্কে বিবৃতি।

এইচপিডিগুলি অজানা প্যারামিটারের উত্তরোত্তর বিতরণের উপর ভিত্তি করে সম্ভাব্য অন্তরগুলি হয় এবং প্রদত্ত ডেটার ভিত্তিতে সম্ভাব্যতা ভিত্তিক ব্যাখ্যা থাকে।

ফ্রিকোয়েন্সিস্ট সম্পত্তি (পুনরাবৃত্ত নমুনা) সম্পত্তি হ'ল কাঙ্ক্ষিত সম্পত্তি এবং এইচপিডি (উপযুক্ত প্রিরিয়ার সহ) এবং সিআই উভয়েরই থাকে। অজানা প্যারামিটার সম্পর্কে প্রশ্নের উত্তর দেওয়ার ক্ষেত্রে প্রদত্ত ডেটাতে এইচপিডি শর্ত

(অবজেক্টিভ নয় সাবজেক্টিভ) বেইসিয়ানরা শাস্ত্রীয় পরিসংখ্যানবিদদের সাথে একমত হন যে প্যারামিটারের একক সত্য মূল্য আছে। যাইহোক, এই সত্য পরামিতিটি সম্পর্কে তারা যেভাবে অনুমান করে তাতে উভয়ই পৃথক।

বায়েশিয়ান এইচপিডিগুলি আমাদের উপাত্তগুলিতে কন্ডিশনিংয়ের একটি ভাল উপায় দেয় তবে তারা সিআই এর ঘনত্ববাদী বৈশিষ্ট্যগুলির সাথে একমত হতে ব্যর্থ হলে সেগুলি খুব কার্যকর নয় (উপমা: একটি ব্যক্তি যে কোনও ভাল ফ্রিকোয়েন্সিস্ট সম্পত্তি ছাড়াই এইচপিডি ব্যবহার করেন (কিছু পূর্বের সাথে), আবদ্ধ হয় এমন এক ছুতার মতো নষ্ট করা যিনি কেবল হাতুড়ির যত্ন করে এবং স্ক্রু ড্রাইভারটি ভুলে যান)

শেষ অবধি, আমি এই থ্রেডে লোকদের দেখেছি (ডাঃ জরিসের মন্তব্য: "... জড়িত অনুমানগুলি আগে একটি বিচ্ছুরণ বোঝায়, অর্থাত সত্য পরামিতি সম্পর্কে জ্ঞানের অভাব।") সত্য পরামিতি সম্পর্কে জ্ঞানের অভাব সম্পর্কে কথা বলা পূর্বে একটি ছড়িয়ে পড়ার সমতুল্য হওয়া। আমি জানিনা আমি এই বক্তব্যটির সাথে একমত হতে পারি কিনা (ডঃ কিথ আমার সাথে একমত)। উদাহরণস্বরূপ, বেসিক লিনিয়ার মডেলগুলির ক্ষেত্রে, কিছু বিতরণ পূর্ববর্তী ইউনিফর্ম ব্যবহার করে প্রাপ্ত করা যেতে পারে (যা কিছু লোককে ছড়িয়ে পড়ে বলে পরিচিত) তবে এটির অর্থ এই নয় যে ইউনিফর্ম বিতরণকে নিম্ন তথ্য প্রিভিয়ার হিসাবে বিবেচনা করা যেতে পারে। সাধারণভাবে, অ-তথ্যপ্রযুক্তি (উদ্দেশ্য) এর আগে এর অর্থ প্যারামিটার সম্পর্কে কম তথ্য নেই।



বিঃদ্রঃ:এই পয়েন্টগুলি অনেক একটি বিশিষ্ট bayesians এর বক্তৃতা উপর ভিত্তি করে। আমি এখনও একজন ছাত্র এবং কোনওভাবে তাকে ভুল বুঝতে পারি। আমার ক্ষমা অগ্রিম গ্রহণ করুন।


"ঘনঘনবাদী হারাতে বাধ্য" সবচেয়ে বেশি ভোট প্রাপ্ত উত্তরের দিকে তাকিয়ে, আমি ধরে নিই যে এটি ইউটিলিটি ফাংশনের উপর নির্ভর করে (যেমন আফসোমাইজেশন চলছে কিনা তা নয়)। স্বজ্ঞাতভাবে, এটি পূর্ববর্তী কার্য নির্ধারণের দক্ষতার উপরও নির্ভর করতে পারে ...
আবেল মোলিনা

4
"ঘনঘনবাদী হারাতে বাধ্য" ... * যথাযথ পূর্ববর্তী * (যা সাধারণভাবে এত সহজ নয়) হওয়ার শর্তসাপেক্ষে। নিখুঁত উদাহরণ: জুয়া আসক্তরা 99% নিশ্চিত যে তাদের ভাগ্য এবার বদলে যাবে। যারা তাদের সিদ্ধান্ত বিশ্লেষণের আগে এইটিকে অন্তর্ভুক্ত করেন তাদের দীর্ঘমেয়াদে তেমন ভাল করার প্রবণতা নেই।
ক্লিফ এবি

1
আমি বিশ্বাস করি না যে আপনার বিশ্বাসযোগ্য ব্যবধান এবং আত্মবিশ্বাসের ব্যবধানগুলির মধ্যে পার্থক্য সম্পর্কে উত্তরে সিআই হিসাবে আত্মবিশ্বাসের ব্যবধানগুলি সংক্ষেপিত করা উচিত ।
হিউজ

10

কিছুটা দর্শনে ব্যস্ত থাকতে সর্বদা মজা। আমি কিথের প্রতিক্রিয়াটি বেশ পছন্দ করি, তবে আমি এটিই বলতে পারি যে তিনি "মিস্টার ভুলে যাওয়া বায়েসিয়া" এর অবস্থান নিচ্ছেন। টাইপ বি এবং টাইপ সি এর খারাপ কভারেজটি কেবল তখনই আসতে পারে (গুলি) সে প্রতিটি পরীক্ষায় একই সম্ভাবনা বন্টন প্রয়োগ করে এবং তার (তার) পূর্বে আপডেট করতে অস্বীকার করে।

আপনি এটিকে বেশ স্পষ্ট দেখতে পাচ্ছেন, টাইপ এ এবং টাইপ ডি জারগুলি "সুনির্দিষ্ট ভবিষ্যদ্বাণী" তৈরি করে তাই কথা বলতে (যথাক্রমে 0-1 এবং 2-3 চিপগুলির জন্য), তবে টাইপ বি এবং সি জারগুলি মূলত চিপের একটি সমান বিতরণ দেয়। সুতরাং, কিছু স্থির "সত্য জার" (বা যদি আমরা অন্য বিস্কুট নমুনা নিই) দিয়ে পরীক্ষার পুনরাবৃত্তির উপর, চিপের অভিন্ন বন্টন বি বা সি জার টাইপের প্রমাণ সরবরাহ করবে।

এবং "ব্যবহারিক" দৃষ্টিকোণ থেকে, বি এবং সি টাইপ করুন তাদের মধ্যে পার্থক্য করতে সক্ষম হওয়ার জন্য একটি প্রচুর নমুনা প্রয়োজন। দুটি বিতরণের মধ্যে কেএল ডাইভারজেন্সগুলি । এটি বৈকল্পিক এবং মধ্যে পার্থক্য সহ দুটি সাধারণ বিতরণের সমতুল্য একটি বিচ্যুতি । সুতরাং আমরা সম্ভবত একটি নমুনার ভিত্তিতে বৈষম্য সক্ষম হতে পারে বলে আশা করা যায় না (সাধারণ ক্ষেত্রে, 5% তাত্পর্য স্তরে এই পার্থক্যটি সনাক্ত করতে আমাদের প্রায় 320 নমুনা আকার প্রয়োজন হবে)। সুতরাং আমরা যুক্তিসঙ্গতভাবে টাইপ বি টাইপ করতে পারি এবং সি টাইপ করতে পারি, যতক্ষণ না আমাদের কাছে পর্যাপ্ত পরিমাণে নমুনা থাকে।KL(B||C)0.006KL(C||B)12×0.006=0.11

এখন cred বিশ্বাসযোগ্য ব্যবধানগুলির সাথে কী ঘটে? আমাদের কাছে এখন "বি বা সি" এর 100% কভারেজ রয়েছে! ঘন ঘন অন্তর সম্পর্কে কী? সমস্ত বিরতিতে বি এবং সি উভয়ই অন্তর্ভুক্ত থাকায় কভারেজটি অপরিবর্তিত রয়েছে, সুতরাং এটি কীথের প্রতিক্রিয়াতে এখনও সমালোচনার বিষয় - এটি 3 এবং 0 চিপের জন্য 59% এবং 0% পর্যবেক্ষণ করেছে।

কিন্তু আসুন এখানে ব্যবহারিক হতে। আপনি যদি কোনও ফাংশনের প্রতি শ্রদ্ধার সাথে কিছু অনুকূল করেন তবে এটি অন্য কোনও ফাংশনের জন্য ভালভাবে কাজ করার আশা করা যায় না। তবে, ঘন ঘন এবং বায়সিয়ান উভয় বিরতিই গড় হিসাবে পছন্দসই বিশ্বাসযোগ্যতা / আত্মবিশ্বাসের স্তর অর্জন করে। আমাদের - তাই ঘন ঘন বিশেষজ্ঞের যথাযথ গড় বিশ্বাসযোগ্যতা থাকে। আমাদের কাছেও - বায়সিয়ানের যথাযথ গড় কভারেজ রয়েছে।(0+99+99+59+99)/5=71.2(98+60+66+97)/4=80.3

আরেকটি বিষয় যা আমি চাপ দিতে চাই তা হ'ল বায়েসিয়ান সম্ভাব্যতা বন্টন বরাদ্দ করে "প্যারামিটারটি এলোমেলো" বলে দিচ্ছে না। বায়েশিয়ানদের জন্য (ভাল, কমপক্ষে আমার পক্ষে যাইহোক) সম্ভাবনা বন্টন সেই প্যারামিটার সম্পর্কে যা জানা আছে তার একটি বিবরণ। "র্যান্ডমনেস" ধারণাটি বেইসিয়ান তত্ত্বটিতে আসলেই বিদ্যমান নয়, কেবল "জেনে রাখা" এবং "না জেনে" ধারণাটি রয়েছে। "পরিচিত" শর্তগুলির মধ্যে চলে যায় এবং "অজানা" হ'ল আমরা আগ্রহের জন্য সম্ভাবনাগুলি গণনা করি এবং যদি কোনও উপদ্রব হয় তবে তাকে প্রান্তিক করে তুলি। সুতরাং একটি বিশ্বাসযোগ্য ব্যবধানটি নির্দিষ্ট প্যারামিটার সম্পর্কে যা জানা তা বর্ণনা করে যা এটি সম্পর্কে জানা নেই তার উপর গড়। সুতরাং আমরা যদি সেই ব্যক্তির অবস্থান গ্রহণ করি যিনি কুকির জারটি প্যাক করেছিলেন এবং জানতেন যে এটি টাইপ এ ছিল, তাদের বিশ্বাসযোগ্যতার ব্যবধানটি কেবলমাত্র [এ] হবে, নমুনা নির্বিশেষে এবং যতই নমুনা নেওয়া হয়েছিল তা বিবেচনা করে। এবং তারা 100% সঠিক হবে!

একটি আত্মবিশ্বাসের ব্যবধান "এলোমেলোতা" বা পরিবর্তনের উপর ভিত্তি করে যা বিভিন্ন সম্ভাব্য নমুনায় বিদ্যমান in যেহেতু তারা একমাত্র পরিবর্তনের বিষয়টি বিবেচনা করে তা হ'ল একটি নমুনায়। সুতরাং যে ব্যক্তি কুকির জারটি প্যাক করেছেন এবং এটি টাইপ এ জাতীয় তার পক্ষে আস্থার ব্যবধানটি অপরিবর্তিত রয়েছে So সুতরাং আপনি যদি বিস্কুটটি 1 চিপ টাইপ এ জারের ধরণের বাইরে আঁকেন তবে ঘন ঘন প্রবণতাটি 70% আত্মবিশ্বাসের সাথে দৃ would়ভাবে দাবি করে যে টাইপটি ছিল এ না, যদিও তারা জানে যে জারটি টাইপ এ! (যদি তারা তাদের আদর্শ বজায় রাখে এবং তাদের সাধারণ জ্ঞানটিকে উপেক্ষা করে)। এটি কেসটি দেখতে, লক্ষ্য করুন যে এই পরিস্থিতিতে কোনও কিছুই নমুনা বিতরণকে বদলেছে না - আমরা কেবলমাত্র একটি পরামিতি সম্পর্কে "অ-ডেটা" ভিত্তিক তথ্য সহ অন্য ব্যক্তির দৃষ্টিভঙ্গি নিয়েছি।

যখন ডেটা পরিবর্তন হয় বা মডেল / নমুনা বিতরণ পরিবর্তন হয় কেবল তখনই আত্মবিশ্বাসের ব্যবধানগুলি পরিবর্তন হবে change অন্যান্য প্রাসঙ্গিক তথ্য বিবেচনায় নেওয়া হলে বিশ্বাসযোগ্যতা ব্যবধানগুলি পরিবর্তন করতে পারে।

দ্রষ্টব্য যে এই ক্রেজি আচরণ অবশ্যই আত্মবিশ্বাসের ব্যবস্থার প্রবক্তা যা করবে তা নয়; তবে এটি কোনও নির্দিষ্ট ক্ষেত্রে পদ্ধতির অন্তর্নিহিত দর্শনে দুর্বলতা প্রদর্শন করে। যখন আপনি কোনও ডেটা সেটে থাকা তথ্যের বাইরে কোনও প্যারামিটার সম্পর্কে বেশি জানেন না তখন আত্মবিশ্বাসের ব্যবধানগুলি তাদের সেরা কাজ করে। এবং আরও, বিশ্বাসের ব্যবধান বিবেচনা করতে পারে না এমন পূর্ববর্তী তথ্য না থাকলে বা পর্যাপ্ত এবং আনুষাঙ্গিক পরিসংখ্যান খুঁজে পাওয়া শক্ত না হলে বিশ্বাসযোগ্যতা ব্যবধানগুলি আত্মবিশ্বাসের ব্যবস্থাগুলিতে খুব বেশি উন্নতি করতে সক্ষম হবে না।


আমি বলতে পারব না আমি বয়াম উদাহরণস্বরূপ কিথ এর ব্যাখ্যা, একটি দ্রুত প্রশ্ন বুঝতে: আমি পরীক্ষা পুনরাবৃত্তি বার সংগৃহীত বিভিন্ন নমুনার, তাই এখন আমি নির্ণিত থাকেন বিভিন্ন সিআইএস (95% আস্থা স্তর সঙ্গে প্রতিটি), এখন কি সিআই হয়? এর অর্থ কি 95% সিআই এর সঠিক মানটি আবরণ করা উচিত? mmmm
অ্যাভোকাডো

@ লগানেকলস - এটি সত্য, তবে কেবল ইনফটি হিসাবে সীমাবদ্ধ । এটি স্ট্যান্ডার্ড "সম্ভাব্যতা" = "দীর্ঘ রান ফ্রিকোয়েন্সি" ব্যাখ্যার অন্তর্নিহিত সিআই সহ সম্মতি দেয়। m
সম্ভাব্যতা

হ্যাঁ, সীমাতে। তারপরে এক বা মাত্র কয়েকটি নমুনার জন্য, সিআইএস মানে কিছু বোঝায় না, তাই না? তারপরে সিআই গণনা করার বিষয়টি কী, যদি আমার কাছে প্রচুর নমুনা না থাকে?
অ্যাভোকাডো

3
@ লোগানেকলস - সে কারণেই আমি একজন বায়সিয়ান।
সম্ভাব্যতা

2
@ নাজকা - সাজানো আমি বলব যে আপনার কাছে যতটা ডেটা থাকবে তা বিবেচনা না করে কোনও বয়েশিয়ান পদ্ধতির ব্যবহার করা সর্বদা সেরা। যদি এটি একটি ঘন ঘন পদ্ধতিতে ভালভাবে অনুমান করা যায় তবে এটি ব্যবহার করুন। বায়েশিয়ান ধীর প্রতিশব্দ নয়।
সম্ভাব্যতাব্লোগিক

6

যেহেতু আমি এটি বুঝতে পেরেছি: একটি বিশ্বাসযোগ্য ব্যবধান হ'ল আগ্রহের পরিসংখ্যানের জন্য মূল্যগুলির পরিসীমাটির বিবৃতি যা আমরা প্রকৃতপক্ষে পর্যবেক্ষণ করেছি এমন ডেটার নির্দিষ্ট নমুনার ভিত্তিতে প্রশংসনীয় থেকে যায়। একটি আত্মবিশ্বাসের ব্যবধান হ'ল ফ্রিকোয়েন্সিটির একটি বিবৃতি, যার সাথে পরীক্ষার পরিমাণটি একই সংখ্যার অন্তর্নিহিত জনসংখ্যার থেকে আলাদা আলাদা নমুনা সহ প্রচুর পরিমাণে পুনরাবৃত্তি করা হয় সেই সময় আত্মবিশ্বাসের ব্যবধানে প্রকৃত মান থাকে।

সাধারণত আমরা যে প্রশ্নের উত্তর দিতে চাই তা হ'ল "পরিসংখ্যানগুলির মানগুলি পর্যবেক্ষণ করা তথ্যের সাথে সামঞ্জস্যপূর্ণ" এবং বিশ্বাসযোগ্য ব্যবধানটি সেই প্রশ্নের সরাসরি উত্তর দেয় - পরিসংখ্যানের আসল মান সম্ভাবনার 95% সহনীয় ব্যবধানে মিথ্যা %। আত্মবিশ্বাসের ব্যবধান এই প্রশ্নের সরাসরি উত্তর দেয় না; এটি দৃ to়ভাবে বলা ঠিক নয় যে পরিসংখ্যানের আসল মান 95% আত্মবিশ্বাসের ব্যবধানের মধ্যে রয়েছে 95% (এটি বিশ্বাসযোগ্য ব্যবধানের সাথে মিলিত না হলে)। তবে এটি একটি ঘনত্ববাদী আত্মবিশ্বাসের ব্যবধানের একটি খুব সাধারণ ভুল ব্যাখ্যা কারণ এটি ব্যাখ্যা যে প্রশ্নের সরাসরি উত্তর হবে।

জেইনের অন্য যে প্রশ্নে আমি আলোচনা করেছি তার কাগজগুলি এটির একটি ভাল উদাহরণ দেয় (উদাহরণস্বরূপ # 5), পুরোপুরি সঠিক আত্মবিশ্বাসের ব্যবধানটি তৈরি করা হয়েছিল, যেখানে নির্দিষ্ট তথ্যের নমুনা যার উপর ভিত্তি করে এটি সত্য মানের কোনও সম্ভাবনার বাইরে চলে যায় rules পরিসংখ্যানের 95% আত্মবিশ্বাস ব্যবধানে! এটি কেবলমাত্র তখনই সমস্যা হয় যখন আমরা যে নির্দিষ্ট নমুনাটি দেখেছি তার ভিত্তিতে পরিসংখ্যানগুলির বিশ্বাসযোগ্য ব্যবস্থাগুলির হিসাবে স্ট্যান্ডিস্টের অন্তর্বর্তকে ভুলভাবে ব্যাখ্যা করা হয়।

দিনের শেষে, এটি "কোর্সের জন্য ঘোড়া" এবং এটির মধ্যবর্তীতমটি আপনার প্রশ্নের উত্তরটির উপর নির্ভর করে just কেবল সেই পদ্ধতিটি চয়ন করুন যা সেই প্রশ্নের সরাসরি উত্তর দেয়।

আমার সন্দেহ হয় যে [স্বীকৃত] পুনরাবৃত্তিযোগ্য পরীক্ষাগুলি বিশ্লেষণ করার সময় আত্মবিশ্বাসের ব্যবধানগুলি আরও কার্যকর ( আমার নিজের কাজ, তবে নিজেকে বিশেষজ্ঞ হিসাবে বর্ণনা করবেন না)।


6
পুনরাবৃত্তি পরীক্ষায় আত্মবিশ্বাসের ব্যবধানগুলির সাথে সমস্যাটি হ'ল তাদের কাজ করার জন্য, পুনরাবৃত্তিমূলক পরীক্ষার শর্তগুলি একই থাকতে হবে (এবং কে বিশ্বাস করবে?), তবে বায়েশিয়ান অন্তর (সঠিকভাবে ব্যবহৃত হলে) শর্তগুলি ডেটা পর্যবেক্ষণ করা হয় এবং এভাবে বাস্তব বিশ্বে ঘটে যাওয়া পরিবর্তনের জন্য ভাতা সরবরাহ করে (ডেটা মাধ্যমে)। আমি মনে করি এটি বায়েশিয়ার পরিসংখ্যানগুলির কন্ডিশনার নিয়ম যা এটিকে ছাপিয়ে চলা এত শক্ত করে তোলে (আমি মনে করি এটি অসম্ভব: কেবলমাত্র সমতা অর্জন করা যেতে পারে), এবং যে স্বয়ংক্রিয় যন্ত্রপাতি এটি অর্জন করে এটি এটিকে এত স্পষ্ট বলে মনে হয়।
সম্ভাব্যতা

3

আমি খুঁজে পেয়েছি আত্মবিশ্বাসের ব্যবধান এবং বিশ্বাসযোগ্য সেট সম্পর্কে প্রচুর ব্যাখ্যা ভুল। উদাহরণস্বরূপ, আত্মবিশ্বাসের ব্যবধানটি এই ফর্ম্যাট । আপনি যদি ঘন ঘন এবং বায়েশিয়ানদের দিকনির্দেশনায় 'বিতরণগুলি' ঘনিষ্ঠভাবে লক্ষ্য করেন তবে আপনি ফ্রেইসিডালিস্ট ডেটা স্যাম্পলিং বিতরণ নিয়ে কাজ করতে পারবেন এবং বায়েসিয়ান প্যারামিটারের (উত্তরোত্তর) বিতরণে কাজ করছেন। তারা সম্পূর্ণ ভিন্ন নমুনা স্পেস এবং সিগমা বীজগণিত উপর সংজ্ঞায়িত করা হয়।P(θCI)

সুতরাং হ্যাঁ আপনি বলতে পারেন যে 'আপনি যদি পরীক্ষার অনেক বার পুনরাবৃত্তি করেন তবে 95% সিআই এর প্রায় 95% সত্য প্যারামিটারটি কভার করবে'। যদিও বায়েশিয়ান ভাষায় আপনি বলতে পারেন যে 'পরিসংখ্যানের প্রকৃত মান 95% সম্ভাব্যতার সাথে 95% বিশ্বাসযোগ্য ব্যবধানের মধ্যে রয়েছে' তবে, এই 95% সম্ভাবনাটি (বায়েশিয়ানে) নিজেই কেবল একটি অনুমান মাত্র। (মনে রাখবেন এটি স্যাম্পলিং বিতরণ নয়, এই নির্দিষ্ট ডেটা দেওয়া শর্ত বিতরণের উপর ভিত্তি করে)। এই অনুমানকারীটি এলোমেলো নমুনার কারণে এলোমেলো ত্রুটিযুক্ত হওয়া উচিত।

বায়েশিয়ান টাইপ আই ত্রুটির বিষয়টি এড়াতে চেষ্টা করুন। বায়েশিয়ান সবসময় বলে যে বায়েশিয়ান টাইপ আই ত্রুটি সম্পর্কে কথা বলার অর্থ হয় না। এই সম্পূর্ণ সত্য নয়। পরিসংখ্যানবিদরা সর্বদা সেই সম্ভাবনা বা ত্রুটি মাপতে চান যে 'আপনার ডেটা আপনাকে সিদ্ধান্ত নেওয়ার পরামর্শ দেয় তবে জনসংখ্যা অন্যথায় পরামর্শ দেয়'। এটি এমন কিছু যা বায়েশিয়ান উত্তর দিতে পারে না (বিশদগুলি এখানে বাদ দেওয়া হয়েছে)। দুর্ভাগ্যক্রমে, পরিসংখ্যানবিদদের এই উত্তর দেওয়া উচিত সবচেয়ে গুরুত্বপূর্ণ বিষয়। পরিসংখ্যানবিদরা কেবল কোনও সিদ্ধান্তের পরামর্শ দেন না। পরিসংখ্যানবিদদেরও সিদ্ধান্তটি কতটা ভুল হতে পারে তা মোকাবেলায় সক্ষম হওয়া উচিত।

ধারণাটি ব্যাখ্যা করার জন্য আমাকে নীচের সারণী এবং শর্তাদি উদ্ভাবন করতে হবে। আশা করি এটি আত্মবিশ্বাস ইন্টারভাল এবং বিশ্বাসযোগ্য সেটের পার্থক্য ব্যাখ্যা করতে সহায়তা করতে পারে।

দয়া করে মনে রাখবেন যে ডিস্ট্রিবিউশন হ'ল , যেখানে পূর্ববর্তী থেকে সংজ্ঞায়িত হয়েছে । প্রায়শই নমুনা বিতরণ হ'ল । এর নমুনা বিতরণ হ'ল । সাবস্ক্রিপ্ট নমুনা আকার। অনুগ্রহ করে নমুনা বিতরণ উপস্থাপনের জন্য অনুগ্রহ করে ব্যবহার করবেন না । আপনি এবং এলোমেলো ডেটা সম্পর্কে কথা বলতে পারেন তবে আপনি এলোমেলো ডেটা সম্পর্কে কথা বলতে পারবেন না ।P(θ0|Datan)θ0P(θ0)P(Datan;θ)θ^P(θ^n;θ)nP(Datan|θ)P(Datan;θ)পি(θ0|Datan)P(θ^n;θ)P(θ0|Datan)

আত্মবিশ্বাস বিরতি বনাম বিশ্বাসযোগ্য সেট

দ্য '???????' বায়েশিয়ানে আমরা টাইপ আই ত্রুটি (বা অনুরূপ কিছু) কেন মূল্যায়ন করতে পারছি না তা ব্যাখ্যা করে।

দয়া করে নোট করুন যে বিশ্বাসযোগ্য সেটগুলি কিছু পরিস্থিতিতে আনুমানিক আত্মবিশ্বাসের ব্যবধানগুলিতে ব্যবহার করা যেতে পারে। তবে এটি কেবল গাণিতিক আনুমানিকতা। ব্যাখ্যাটি ঘনঘনবাদীর সাথে হওয়া উচিত। এই ক্ষেত্রে বায়েশিয়ান ব্যাখ্যাটি আর কাজ করে না।


থেইটা ) তে থাইলাকোলিওর স্বরলিপি ঘন ঘনবাদী নয়। এটি এখনও বায়েশিয়ান। ঘনত্ববাদী সম্পর্কে কথা বলার সময় এই স্বরলিপিটি পরিমাপ তত্ত্বের একটি মৌলিক সমস্যার কারণ ঘটায়।P(x|θ)

আমি ডিকরান মার্সুপিয়ালের উপসংহারের সাথে একমত । আপনি যদি এফডিএ পর্যালোচক হন তবে আপনি সর্বদা এই সম্ভাবনাটি জানতে চান যে আপনি কোনও ড্রাগ প্রয়োগ অনুমোদন করেছেন তবে ড্রাগটি কার্যকরী নয়। এটি বেইসিয়ান কমপক্ষে ক্লাসিক / টিপিক্যাল বায়েশিয়ানগুলিতে দিতে পারে না এমন উত্তর।


3

জেনেরিক এবং ধারাবাহিক আস্থা এবং বিশ্বাসযোগ্য অঞ্চল। http://dx.doi.org/10.6084/m9.figshare.1528163 কোড সহ http://dx.doi.org/10.6084/m9.figshare.1528187

সম্ভাব্যতা ফাংশন এবং কিছু পর্যবেক্ষিত ডেটা উভয়ই গণ্য করার জন্য জেনেরিক আর কোডের সাথে সেট নির্বাচনের জন্য বিশ্বাসযোগ্য ব্যবধান এবং আত্মবিশ্বাসের অন্তরগুলির বিবরণ সরবরাহ করে। আরও এটি পরীক্ষার পরিসংখ্যান প্রস্তাব করে যা একে অপরের সাথে সামঞ্জস্যপূর্ণ অনুকূল আকারের বিশ্বাসযোগ্য এবং আত্মবিশ্বাসের অন্তর দেয়।

সংক্ষেপে এবং এড়ানো সূত্র। বায়সিয়ান বিশ্বাসযোগ্য ব্যবধান ডেটা প্রদত্ত প্যারামিটারগুলির সম্ভাবনার উপর ভিত্তি করে । এটি এমন প্যারামিটারগুলি সংগ্রহ করে যা বিশ্বাসযোগ্য সেট / বিরতিতে উচ্চ সম্ভাবনা রয়েছে। 95% বিশ্বাসযোগ্য ব্যবধানে প্যারামিটার রয়েছে যা একসাথে ডেটা প্রদত্ত 0.95 এর সম্ভাবনা থাকে।

ঘনত্ববাদী আত্মবিশ্বাসের ব্যবধানটি কিছু পরামিতি প্রদত্ত ডেটার সম্ভাবনার উপর ভিত্তি করে । প্রতিটি (সম্ভবত অসীম অনেকগুলি) প্যারামিটারের জন্য, এটি প্রথমে প্যারামিটারের সাথে পর্যবেক্ষণ করা ডেটার সেট তৈরি করে। এটি প্রতিটি প্যারামিটারের জন্য যাচাই করে, নির্বাচিত উচ্চ সম্ভাবনার ডেটাতে পর্যবেক্ষণ করা ডেটা রয়েছে কিনা তা পরীক্ষা করে। যদি উচ্চ সম্ভাবনার ডেটাতে পর্যবেক্ষণ করা ডেটা থাকে, তবে সংশ্লিষ্ট প্যারামিটারটি আত্মবিশ্বাসের ব্যবধানে যুক্ত করা হয়। সুতরাং, আত্মবিশ্বাসের ব্যবধান হ'ল প্যারামিটারগুলির সংগ্রহ যা আমরা প্যারামিটারটি ডেটা তৈরি করেছে এমন সম্ভাবনাটি অস্বীকার করতে পারি না। এটি এমন একটি নিয়ম দেয় যে একই রকম সমস্যাগুলিতে বারবার প্রয়োগ করা হলে 95% আত্মবিশ্বাসের ব্যবধান 95% ক্ষেত্রে সত্য প্যারামিটার মান ধারণ করে।

95ণাত্মক দ্বিপদী বিতরণ থেকে উদাহরণের জন্য 95% বিশ্বাসযোগ্য সেট এবং 95% আত্মবিশ্বাস সেট 95% বিশ্বাসযোগ্য সেট এবং 95% আস্থা নেতিবাচক দ্বিপদী বিতরণের জন্য সেট


আত্মবিশ্বাসের ব্যবধানগুলির বর্ণনা সঠিক নয়। "95%" সম্ভাবনা থেকেই আসে যে জনসংখ্যার একটি নমুনা এমন একটি বিরতি তৈরি করবে যা প্যারামিটারের সত্যিকারের মান রাখে।
jlimahaverford

@ জ্লিমাহ্যাভারফোর্ড - বর্ণনাটি আপনার মতো সঠিক আপনার বর্ণনার সাথে লিঙ্কটি তৈরি করতে, আমি যোগ করেছি "এটি এমন একটি বিধি দেয় যে একইভাবে বারবার প্রয়োগ করা হলে 95% বিশ্বাসযোগ্য ব্যবধান 95% ক্ষেত্রে সত্য পরামিতি মান ধারণ করে।"
user36160

1
আমি আপনার বিশ্বাসযোগ্য ব্যবধানগুলির বিবরণ সম্পর্কে বলছিলাম না আমি আত্মবিশ্বাসের বিরতি সম্পর্কে কথা বলছিলাম। আমি এখন লক্ষ্য করছি যে আত্মবিশ্বাসের বিরতিতে আপনার অনুচ্ছেদের মাঝখানে আপনি আবার বিশ্বাসযোগ্য সম্পর্কে কথা বলতে শুরু করলেন এবং আমি মনে করি এটি একটি ভুল। গুরুত্বপূর্ণ ধারণাটি হ'ল "যদি এটি প্যারামিটারের সত্যিকারের মান হত তবে আমি কীভাবে এই চরম বা তার চেয়ে বেশি নমুনা আঁকতে পারি তার সম্ভাবনা কী। যদি উত্তরটি 5% এর বেশি হয় তবে এটি আত্মবিশ্বাসের ব্যবধানে থাকে in"
jlimahaverford

@ জ্লিমাহ্যাভারফোর্ড - সম্মতি এবং সংশোধন - ধন্যবাদ
ব্যবহারকারী36160

হুম, আমি এটি সংশোধন করে দেখছি না।
jlimahaverford

1

এটি একটি মন্তব্য বেশি কিন্তু খুব দীর্ঘ। নিম্নলিখিত নিবন্ধে : http://www.stat.uchicago.edu/~lekheng/courses/191f09/mumford-AMS.pdf ম্যামফোর্ডের নিম্নলিখিত আকর্ষণীয় মন্তব্য রয়েছে:

এই সমস্ত সত্যই উত্তেজনাপূর্ণ ব্যবহারের পরিসংখ্যান তৈরি হচ্ছিল, স্যার আরএ ফিশারের নেতৃত্বে বেশিরভাগ পরিসংখ্যানবিদরা তাদের পিঠের পিছনে হাত বেঁধে রেখেছিলেন, জোর দিয়েছিলেন যে পরিসংখ্যানগুলি কোনও সম্পূর্ণ পুনরুত্পাদনযোগ্য পরিস্থিতিতে ব্যবহার করা যাবে না এবং কেবল তখনই অভিজ্ঞতা ডেটা। এটি তথাকথিত 'ঘনঘনবাদী' স্কুল যা বেইশিয়ান স্কুলটির সাথে লড়াই করেছিল যা বিশ্বাস করেছিল যে প্রিয়ারদের ব্যবহার করা যেতে পারে এবং পরিসংখ্যানগত অনুক্রমের ব্যবহার ব্যাপকভাবে প্রসারিত হয়েছিল। এই পদ্ধতির বিষয়টি অস্বীকার করে যে পরিসংখ্যানগত অনুক্রমের বাস্তব চিন্তার সাথে কোনও সম্পর্ক থাকতে পারে কারণ বাস্তব জীবনের পরিস্থিতি সর্বদা প্রাসঙ্গিক পরিবর্তনশীলগুলিতে সমাধিস্থ হয় এবং পুনরাবৃত্তি করা যায় না। ভাগ্যক্রমে, বায়েশিয়ান স্কুল পুরোপুরি মারা যায় নি, ডিফিনেটি, ইটি জয়েনেস, অন্যদের শুকিয়ে রেখেছিল continued

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.