ঘন ঘনবাদী-বায়েশিয়ান বিতর্ক কোথায় গেল?


59

পরিসংখ্যানের পৃথিবীটি ঘন ঘন এবং বায়েশীয়দের মধ্যে বিভক্ত ছিল। এই দিনগুলি দেখে মনে হচ্ছে সবাই দুজনেই কিছুটা করে। এটা কিভাবে হতে পারে? যদি বিভিন্ন পদ্ধতির জন্য বিভিন্ন সমস্যার উপযোগী হয় তবে পরিসংখ্যানের প্রতিষ্ঠাতা পিতারা কেন এটি দেখেন নি? বিকল্পভাবে, বিতর্কটি কী ফ্রিকোয়েন্সিস্টদের দ্বারা জয়লাভ করে এবং সত্য বিষয়ী বায়েশিয়ানরা সিদ্ধান্ত তত্ত্বের দিকে চলে গিয়েছিল?


13
আমি এই সিডব্লিউটিকে এমন এক ভিত্তিতে তৈরি করেছি যে এর কোনও অনুমোদিত বা সর্বোত্তম উত্তর হওয়ার সম্ভাবনা নেই। (অন্যথায় যদি আপনি একমত না হন তবে কোনওরকম মোডগুলিকে রাজি করার জন্য নির্দ্বিধায় বোধ করুন!) প্রশ্নটি সম্ভবত এটি বিতর্কিত হওয়ার কারণেই প্রশ্নটি বন্ধ করার পক্ষে যুক্তি দিতে পারে, তবে (আইএমএইচও) এটি বিষয় এবং আকর্ষণীয় বিষয়। তবে বিতর্কিত, মেরুক বা অসমর্থিত জবাব, যদি সেগুলি উপস্থিত হয় তবে তাদের আর কোনও ব্যাখ্যা ছাড়াই মুছে ফেলা হবে।
whuber

উত্তর:


58

আমি প্রকৃতপক্ষে হালকাভাবে অসমত। প্রত্যেকেই বায়েশিয়ান, যদি তাদের যদি সত্যিই কোনও সম্ভাবনা বন্টন থাকে তবে তাদের পূর্বের হিসাবে দেওয়া হয়। তারা যখন না আসে তখনই সমস্যাটি আসে এবং আমি মনে করি still বিষয়টিতে এখনও বেশ ভাল আকারের একটি বিভাজন রয়েছে।

যদিও এই কথাটি বলে আমি সম্মত হই যে, বেশি বেশি লোক পবিত্র যুদ্ধের প্রতি কম ঝুঁকছে এবং যে কোনও পরিস্থিতিতে উপযুক্ত মনে হয় এমনটি করার চেষ্টা চালিয়ে যাচ্ছে।

আমি বলব, পেশাটি এগিয়ে যাওয়ার সাথে সাথে উভয় পক্ষই বুঝতে পেরেছিল যে অন্য পক্ষের পদ্ধতির মধ্যে কিছুটা যোগ্যতা রয়েছে। বায়েশিয়ানরা বুঝতে পেরেছিল যে বারবার ব্যবহার করা হলে বায়েশিয়ান পদ্ধতিগুলি কতটা ভাল করবে তা মূল্যায়ন করার জন্য (যেমন, এই 95% বিশ্বাসযোগ্য ব্যবধানটি (সিআই) আসলে প্রায় 95% সময়কালের সত্য পরামিতি ধারণ করে?) বারবারবাদী দৃষ্টিভঙ্গির প্রয়োজন হয়। এটি ছাড়া, কোনও বাস্তব-বিশ্বের সংখ্যায় "95%" এর কোনও ক্রমাঙ্কন নেই। বলিষ্ঠতার? পুনরাবৃত্তি ফিটিং ইত্যাদির মাধ্যমে মডেল বিল্ডিং? ঘন ঘনবাদী বিশ্বে যে আইডিয়াগুলি উঠে আসে এবং ১৯ and০ এর দশকের শেষের দিকে বায়েশিয়ানরা এটি গ্রহণ করেছিলেন। নিয়মিতকরণ ভাল ছিল বলে ঘন ঘন বিশেষজ্ঞরা বুঝতে পেরেছিলেন এবং আজকাল এটি বেশিরভাগ ক্ষেত্রেই ব্যবহার করেন - এবং বায়সিয়ান প্রিরিয়াররা সহজেই নিয়মিতকরণ হিসাবে ব্যাখ্যা করা যায়। পেনাল্টি ফাংশন সহ কিউবিক স্প্লাইজের মাধ্যমে ননপ্যারমেট্রিক মডেলিং? তোমার শাস্তি আমার পূর্ব! এখন আমরা সবাই একসাথে যেতে পারি।

আমার বিশ্বাস, অন্য প্রধান প্রভাবটি হ'ল উচ্চ-মানের সফ্টওয়্যারটির প্রাপ্যতা মধ্যে স্তম্ভিত উন্নতি যা আপনাকে বিশ্লেষণ দ্রুত করতে দেয়। এটি দুটি অংশে আসে - অ্যালগরিদমগুলি, যেমন, গিবস স্যাম্পলিং এবং মেট্রোপলিস-হেস্টিংস এবং নিজেই, আর, এসএএস, সফ্টওয়্যার ... আমি যদি আমার সমস্ত কোড সিতে লিখতে হত তবে আমি খাঁটি বায়েশিয়ান হতে পারি (আমি কেবল অন্য কিছুর চেষ্টা করার সময় নেই), তবে যেমনটি হয়, আমি আর-তে এমজিগ্রাভি প্যাকেজে গ্যামটি ব্যবহার করব যে কোনও সময় আমার মডেল দেখে মনে হচ্ছে যে আমি এটি খুব বেশি সংকুচিত না করে that কাঠামোর সাথে ফিট করতে পারি, এবং আমি এটির জন্য আরও ভাল পরিসংখ্যানবিদ। আপনার প্রতিপক্ষের পদ্ধতিগুলির সাথে পরিচিতি এবং এটি উপলব্ধি করে যে এটি কতটা প্রচেষ্টা সংরক্ষণ করতে পারে / আরও ভাল মানের এটি কিছু পরিস্থিতিতে তাদের ব্যবহারের জন্য সরবরাহ করতে পারে, যদিও তারা কোনও সমস্যা সম্পর্কে চিন্তাভাবনার জন্য আপনার ডিফল্ট কাঠামোর মধ্যে 100% ফিট নাও করতে পারে,


5
@ ডিকরান: আমি একমত যে এই সতর্কতার সাথে আমি ব্যক্তিগতভাবে প্রতিপক্ষের শব্দের সাথে শব্দটি পছন্দ করব । :)
কার্ডিনাল

2
@ কার্ডিনাল আমি জানি না, সহকর্মীদের ঘুরিয়ে দেওয়া মজাদার হতে পারে (যতক্ষণ না আপনি উভয়ই এটির অর্থ বোঝার চেয়ে ভাল জানেন !; ও)
ডিকরান মার্শুপিয়াল

3
@ ডিকরান - বোঝার জন্য ধন্যবাদ! আমি মনে করি না যে "প্রতিপক্ষ" হুবহু সঠিক শব্দ ছিল, তবে আমি এটিকে আংশিকভাবে কেবল মজা করার জন্যই আটকে রেখেছি এবং আংশিক কারণ আমি এর থেকে আরও ভাল বিরোধিতা ভাবতে পারি নি যা এখনও বিরোধিতার কিছু ধারণা রক্ষা করেছিল।
jboman

5
@ জাবোম্যান: নোট করুন যে বায়েসিয়ান পরিসংখ্যান এ-লা গুড, লিন্ডলি বা ডিফিনেটি, এর অর্থ পূর্বেরটি বিষয়গত / মানসিক এবং উদ্দেশ্যমূলক / শারীরিক নয়। যে কারণে, আমি এর সাথে একমত নই: "... প্রত্যেকে বায়েশিয়ান"। এই কারণেই রব্বিন্সকে ঘনত্ববাদী এর আগে "উপন্যাস" ধারণাটি প্রবর্তনের সময় "এম্পিরিকাল বেইস" শব্দটি ব্যবহার করতে হয়েছিল। তবে আমি একমত হই যে, আজ একাধিক স্তরের স্যাম্পলিং স্কিম ব্যবহার করে, এর আগে ঘন ঘন ঘনবাদী থাকা, "বায়েশিয়ান পরিসংখ্যান" হিসাবে যোগ্য হওয়ার পক্ষে যথেষ্ট।
জনরোস

2
@ জনরোস - আমি যা ভাবছিলাম তা আরও ক্লাসিক ছিল "আপনি যক্ষ্মা হওয়ার সম্ভাবনা কীভাবে পেয়েছেন যে আপনি টিবি পরীক্ষায় ইতিবাচক এসেছেন?" পরিস্থিতি. (আমি অনুমান করি) কিছু ঘন ঘনসংখ্যক পরিসংখ্যানবিদরা যথাযথ বেসলাইন টিবি হারকে পূর্বের সম্ভাবনা হিসাবে যা ব্যবহার করতে এবং পরীক্ষার সম্ভাবনা দিয়ে এটি আপডেট করার বিষয়ে আপত্তি জানায়। অবশ্যই তারা তাদের পূর্ববর্তী ব্যক্তিত্বমূলক হওয়ার ধারণার বিরুদ্ধে আপত্তি জানায় এবং আমি অন্যদিকে যুক্তিযুক্ত একটি পংক্তি দেখতে পেলাম যে দাবি করবে যে এটি পিছনের তথ্য থাকা সত্ত্বেও বিষয়বোধী, সুতরাং পয়েন্টটি নেওয়া হয়েছে (+1)।
jboman

35

এটি উত্তর দেওয়া একটি কঠিন প্রশ্ন। সত্যিকার অর্থে উভয় কাজ করে এমন লোকের সংখ্যা এখনও খুব সীমাবদ্ধ। হার্ড কোর বায়েশিয়ানরা ভ্যালু ব্যবহারের জন্য মূলধারার পরিসংখ্যানগুলির ব্যবহারকারীদের তুচ্ছ করে বলেছে, বায়েশীয়দের জন্য একটি অযৌক্তিক, অভ্যন্তরীণভাবে বেমানান পরিসংখ্যান; এবং মূলধারার পরিসংখ্যানবিদরা কেবলমাত্র তাদের সম্পর্কে মন্তব্য করার মতো বায়েশিয়ান পদ্ধতিগুলি জানেন না। এর আলোকে, আপনি বেইসিয়ান সাহিত্যে নাল অনুমানের তাত্পর্য পরীক্ষা-নিরীক্ষার প্রচুর সমালোচনা দেখতে পাবেন (মূলত প্রায় বিশুদ্ধ জীববিজ্ঞান বা খাঁটি মনোবিজ্ঞান জার্নালগুলি নিয়ে), মূল অভিনেতাদের কাছ থেকে কোনও সাড়া না পেয়ে।p

পরিসংখ্যান পেশায় "বিতর্কটি কে জিতল" তা নিয়ে বিরোধমূলক প্রকাশ রয়েছে manifest একদিকে, গড় পরিসংখ্যান বিভাগের রচনাটি হ'ল বেশিরভাগ জায়গায় আপনি ১০-১৫ মেইনস্ট্রিমার বনাম 1-2 বেইশিয়ানদের খুঁজে পাবেন, যদিও কিছু বিভাগ খাঁটি বায়েশিয়ান, কোনও মেনস্ট্রেমার নেই, সম্ভবত পরামর্শের অবস্থান ব্যতীত। (হার্ভার্ড, ডিউক, কার্নেগি মেলন, ব্রিটিশ কলম্বিয়া, উত্তর আমেরিকার মন্ট্রিল; আমি ইউরোপীয় দৃশ্যের সাথে কম পরিচিত)। অন্যদিকে, আপনি দেখতে পাবেন যে জাসা বা জেআরএসএসের মতো জার্নালে, সম্ভবত 25-30% পেপারগুলি বয়েসিয়ান হয়। এক উপায়ে, বয়েশীয় পুনর্জাগরণ 1950-এর দশকে আনোভা কাগজ ফেটানোর মতো কিছু হতে পারে: তখন লোকেরা ভেবেছিল যে কোনও পরিসংখ্যান সমস্যা আনোভা সমস্যা হিসাবে চিহ্নিত করা যেতে পারে; এখনই,

আমার অনুভূতি হ'ল প্রয়োগিত অঞ্চলগুলি দার্শনিক বিবরণগুলি নির্ণয় করতে বিরক্ত করে না এবং কেবল যেটি দিয়ে কাজ করা সহজ তার সাথে চলে। বায়েশিয়ান পদ্ধতিটি খুব জঘন্য জটিল: পরিসংখ্যানগুলির শীর্ষে, আপনাকে গণনার শিল্পও শিখতে হবে (নমুনা স্থাপন, ব্লকিং, কনভার্সন ডায়াগনস্টিকস, ব্লা-ব্লাহ-ব্লাহ) এবং আপনার কারাবন্দীদের রক্ষা করার জন্য প্রস্তুত থাকতে হবে (আপনি যদি ব্যবহার করেন তবে অবজেক্টিভ প্রিয়ারস, বা ক্ষেত্রটি 3e8 মি / সেকেন্ড আলোর গতিতে স্থির হয়ে থাকলে বা পূর্বের পছন্দটি আপনার উত্তরোত্তর যথাযথ হবে কি না তা প্রভাবিত করে) বা আপনার তথ্যমূলক প্রিয়ারগুলি ব্যবহার করা উচিত। সুতরাং বেশিরভাগ চিকিত্সা বা মনোবিজ্ঞান বা অর্থনীতির অ্যাপ্লিকেশনগুলিতে আপনি মূল গবেষকগুলি যথেষ্ট গবেষক দ্বারা লিখিত কাগজগুলিতে দেখতে পাবেন,

একটি ক্ষেত্র, যেখানে আমার মনে হয়, বেয়েসিয়ান কাঠামোটি এখনও ছোট আসছে মডেল ডায়াগনস্টিকগুলি - এবং এটি অনুশীলনকারীদের জন্য একটি গুরুত্বপূর্ণ ক্ষেত্র। বায়েশিয়ান বিশ্বে, কোনও মডেল নির্ণয়ের জন্য আপনাকে আরও জটিল একটি তৈরি করতে হবে এবং যেটি বায়েসিয়ান ফ্যাক্টর বা বিআইসি দ্বারা উপযুক্ত ফিট আছে তা বেছে নিতে হবে। সুতরাং আপনি যদি আপনার রৈখিক প্রতিরোধের জন্য স্বাভাবিকতা অনুমানটি পছন্দ না করেন তবে আপনি শিক্ষার্থীর ত্রুটিগুলি নিয়ে একটি রিগ্রেশন তৈরি করতে পারেন এবং ডেটাটিকে স্বাধীনতার ডিগ্রিগুলির একটি অনুমান তৈরি করতে দিতে পারেন, বা আপনি সমস্ত অভিনব হয়ে উঠতে পারেন এবং আপনার জন্য একটি ডিরিচলেট প্রক্রিয়া করতে পারেন ত্রুটি শর্তাবলী এবং কিছু এমএইচ বিভিন্ন মডেলের মধ্যে লাফ দেয়। মূলধারার পন্থাটি হ'ল স্টুডেন্টাইজড অবশিষ্টাংশগুলির একটি কিউকিউ প্লট তৈরি করা এবং বিদেশীদের অপসারণ করা এবং এটি আবার এত সহজ again

আমি এটির উপর একটি বইয়ের একটি অধ্যায় সম্পাদনা করেছি - দেখুন http://onlinelibrary.wiley.com/doi/10.1002/9780470583333.ch5/summary । এটি একটি অত্যন্ত প্রত্নতাত্ত্বিক নিবন্ধ, যাতে এই বিতর্ক সম্পর্কে প্রায় 80 টি উল্লেখ দেওয়া হয়েছিল, সমস্তই বায়েশিয়ার দৃষ্টিভঙ্গিকে সমর্থন করে। (আমি লেখককে এটি একটি সংশোধিত সংস্করণে প্রসারিত করতে বলেছিলাম, যা এটি সম্পর্কে অনেক কিছু বলে :))। শীর্ষস্থানীয় বায়েশিয়ান তাত্ত্বিকদের মধ্যে ডিউকের জিম বার্গার প্রচুর বক্তৃতা দিয়েছিলেন এবং এই বিষয়টিতে বেশ কয়েকটি চিন্তাশীল নিবন্ধ লিখেছিলেন।


14

দু'জনের থাকার এখনও একটি যুক্তিসঙ্গত কারণ রয়েছে, এটি হ'ল একজন ভাল কারিগর হাতের কাজটির জন্য সেরা সরঞ্জামটি নির্বাচন করতে চান এবং বায়েশিয়ান এবং ঘন ঘন পদ্ধতিগুলির উভয়ই অ্যাপ্লিকেশন রয়েছে যেখানে তারা কাজের সেরা হাতিয়ার।

তবে, প্রায়শই কাজের জন্য ভুল সরঞ্জামটি ব্যবহৃত হয় কারণ ঘন ঘনসংখ্যক পরিসংখ্যানগুলি "পরিসংখ্যান কুকবুক" পদ্ধতির জন্য আরও কার্যকর হয় যা তাদের বায়েশীয় অংশগুলির তুলনায় বিজ্ঞান এবং প্রকৌশলটিতে প্রয়োগ করা আরও সহজ করে তোলে, যদিও বায়েশিয়ান পদ্ধতিগুলি আরও সরাসরি উত্তর প্রদান করে প্রশ্ন উত্থাপিত (যা সাধারণত আমরা আমাদের কাছে থাকা ডেটার নির্দিষ্ট নমুনা থেকে অনুমান করতে পারি)। আমি খুব বেশি পক্ষে এর পক্ষে নই কারণ "কুকবুক" পদ্ধতির ফলে আপনি আসলে কী করছেন তার একটি দৃ understanding় বোধ না করে পরিসংখ্যানগুলি ব্যবহার করে, যার কারণেই পি-ভ্যালু ফ্যালাসি ফলের মতো জিনিসগুলি বারবার উত্থিত হয়।

তবে সময় বাড়ার সাথে সাথে বায়েশিয়ান পদ্ধতির জন্য সফ্টওয়্যার সরঞ্জামগুলির উন্নতি হবে এবং জোবোম্যান যথাযথভাবে বলেছে সেগুলি আরও ঘন ঘন ব্যবহার করা হবে।

আমি ঝুঁকিতে বায়েশিয়ান (এটি আমার কাছে ঘন ঘনবাদী পদ্ধতির চেয়ে অনেক বেশি অর্থবোধ করে বলে মনে হয়) তবে আমি আমার কাগজপত্রগুলিতে ঘনত্ববাদী পরিসংখ্যানগুলি ব্যবহার করে শেষ করছি কারণ আংশিক কারণ আমি যদি বায়সিয়ান পরিসংখ্যানগুলি তাদের হিসাবে ব্যবহার করি তবে পর্যালোচকদের সাথে আমার সমস্যা হবে "অ-মানক" হবে।

পরিশেষে (কিছুটা গালে জিহ্বা; ও), ম্যাক্স প্ল্যাঙ্কের উদ্ধৃতি দিতে "একটি নতুন বৈজ্ঞানিক সত্য তার বিরোধীদের দৃinc় বিশ্বাস করে এবং তাদের আলোকে দেখিয়ে দেয় না, বরং এর বিরোধী অবশেষে মারা যায়, এবং একটি নতুন প্রজন্ম বড় হয় যা পরিচিত এর সাথে."


10

আমি মনে করি না ফ্রিকোয়েন্সিস্ট এবং বায়েশিয়ানরা একই প্রশ্নের বিভিন্ন উত্তর দেয়। আমি মনে করি তারা বিভিন্ন প্রশ্নের উত্তর দিতে প্রস্তুত । সুতরাং, আমি মনে করি না যে এক পক্ষের জয়ের বিষয়ে অনেক কথা বলা, এমনকি সমঝোতার বিষয়ে কথা বলাও বোধগম্য।

আমরা জিজ্ঞাসা করতে চাইতে পারে সমস্ত প্রশ্ন বিবেচনা করুন। অনেকগুলিই কেবল অসম্ভব প্রশ্ন (" আসল মানটি কী ?")। এই প্রশ্নগুলির সাবসেট বিবেচনা করা আরও কার্যকর যা বিভিন্ন অনুমানের দ্বারা উত্তর দেওয়া যেতে পারে। বৃহত্তর সাবসেটটি এমন প্রশ্নগুলির উত্তর দেওয়া যেতে পারে যেখানে আপনি নিজেকে প্রিয়ার ব্যবহার করার অনুমতি দেন। এই সেটটি বিএফ কল করুন। বিএফ-এর একটি উপসেট রয়েছে, যা এমন প্রশ্নের সেট যা কোনও পূর্বের উপর নির্ভর করে না। এই দ্বিতীয় উপসেটটি এফ কল করুন এফ। বি = বিএফ \ বি সংজ্ঞায়িত করুনθ

তবে কোন প্রশ্নের উত্তর দিতে হবে তা আমরা বেছে নিতে পারি না। বিশ্ব সম্পর্কে দরকারী তথ্য তৈরি করতে, আমাদের মাঝে মাঝে বি এর মধ্যে থাকা প্রশ্নের উত্তর দিতে হয় এবং এর অর্থ একটি পূর্ব ব্যবহার করে।

আদর্শভাবে, একটি অনুমানকারী দেওয়া আপনি একটি বিশদ বিশ্লেষণ করবেন। আপনি কোনও পূর্ব ব্যবহার করতে পারেন তবে আপনি যদি আপনার প্রাক্কলনকারী সম্পর্কে কোনও ভাল প্রমাণ করতে পারেন যা কোনও পূর্বের উপর নির্ভর করে না it এর অর্থ এই নয় যে আপনি প্রাকটি খনন করতে পারেন, সত্যিই আকর্ষণীয় প্রশ্নগুলির জন্য পূর্বের প্রয়োজন।

সবাই এফ-এ প্রশ্নের উত্তর কীভাবে দেবেন তাতে একমত হন। উদ্বেগ হ'ল সত্যই 'আকর্ষণীয়' প্রশ্নগুলি এফ বা বিতে রয়েছে?

একটি উদাহরণ: একজন রোগী চিকিত্সকের কাছে যান এবং তিনি স্বাস্থ্যকর (এইচ) বা অসুস্থ (এস) হন। আমাদের একটি পরীক্ষা রয়েছে যা ইতিবাচক (+) বা নেতিবাচক (-) ফিরে আসবে। পরীক্ষাটি কখনও মিথ্যা নেতিবাচকতা দেয় না - যেমন । তবে এটি কখনও কখনও মিথ্যা -P(|S)=0P(+|H)=0.05

আমাদের কাছে কার্ডের একটি টুকরা রয়েছে এবং পরীক্ষার মেশিন কার্ডের একপাশে + বা - লিখবে। কল্পনা করুন, আপনি যদি করেন তবে আমাদের কাছে এমন একটি ওরাকল আছে যিনি একরকম সত্য জানেন and

পরিসংখ্যানগতভাবে প্রশিক্ষিত চিকিত্সক হিসাবে, কার্ডটি খোলার আগে এনভোলপে কার্ড সম্পর্কে আমরা কী বলতে পারি? নিম্নলিখিত বিবৃতি দেওয়া যেতে পারে (এগুলি উপরে চ এ রয়েছে):

  • কার্ডের একদিকে যদি এস হয় তবে অন্য পাশটি হবে +। P(+|S)=1
  • যদি এইচ, তবে অন্য দিকটি 5% সম্ভাব্যতার সাথে + 95% সম্ভাব্যতার সাথে থাকবে। P(|H)=0.95
  • (শেষ দুই পয়েন্ট সংক্ষেপিত) সম্ভাব্যতা যে দুই পক্ষের ম্যাচ হয় অন্তত 95%। P((,S)(+,H))0.95

আমরা জানি না বা কী। আমরা really জন্য কোনও প্রকার পূর্ববর্তী ছাড়া সত্যই উত্তর দিতে পারি না । তবে আমরা এই দুটি সম্ভাবনার যোগফল সম্পর্কে বিবৃতি দিতে পারি।P((,S))P((+,H))P(S)

এটি আমরা যতদূর যেতে পারি is খামটি খোলার আগে , আমরা পরীক্ষার যথার্থতা সম্পর্কে খুব ইতিবাচক বক্তব্য দিতে পারি। (কমপক্ষে) 95% সম্ভাবনা রয়েছে যা পরীক্ষার ফলাফলটি সত্যের সাথে মেলে।

কিন্তু যখন আমরা আসলে কার্ডটি খুলি তখন কী হয়? পরীক্ষার ফলাফলটি ইতিবাচক (বা নেতিবাচক) দেওয়া সত্ত্বেও তারা সুস্থ বা অসুস্থ কিনা সে সম্পর্কে আমরা কী বলতে পারি?

পরীক্ষাটি ইতিবাচক (+) হলে, আমরা বলতে পারি এমন কিছুই নেই। সম্ভবত তারা স্বাস্থ্যবান, এবং নাও হতে পারে। রোগের বর্তমান বিস্তারের উপর নির্ভর করে ( ) এমন অবস্থা হতে পারে যে ইতিবাচক পরীক্ষা করা বেশিরভাগ রোগীরা সুস্থ আছেন, বা এটি বেশিরভাগ অসুস্থ ক্ষেত্রেও হতে পারে। প্রথমে নিজেরাই কিছু সীমানা অনুমতি না দিয়ে আমরা এটিতে কোনও সীমানা রাখতে পারি না ।P(S)P(S)

এই সাধারণ উদাহরণে এটি স্পষ্ট যে নেতিবাচক পরীক্ষার ফলাফল সহ সকলেই স্বাস্থ্যবান। কোনও মিথ্যা নেতিবাচক নেই, এবং তাই প্রতিটি পরিসংখ্যানবিদ সুখে সেই রোগীকে বাড়িতে পাঠিয়ে দেবে। অতএব, পরীক্ষার ফলাফল ইতিবাচক না হলে কোনও পরিসংখ্যানবিদদের পরামর্শের জন্য অর্থ প্রদান করার কোনও অর্থ হয় না

উপরের তিনটি বুলেট পয়েন্ট সঠিক এবং বেশ সহজ। তবে তারাও অকেজো! সত্যই আকর্ষণীয় প্রশ্নটি, স্বীকৃত এই অনুমোদিত মডেলটিতে হ'ল

P(S|+)

এবং ছাড়া উত্তর দেওয়া যাবে না (অর্থাত্ পূর্ববর্তী, বা কমপক্ষে কিছুটা পূর্বের সীমানা)P(S)

আমি অস্বীকার করি না এটি সম্ভবত একটি অতিমাত্রায় মডেল, তবে এটি প্রমাণ করে যে আমরা যদি এই রোগীদের স্বাস্থ্যের বিষয়ে দরকারী বক্তব্য দিতে চাই, তবে তাদের স্বাস্থ্যের বিষয়ে আমাদের কিছুটা পূর্ব বিশ্বাস শুরু করতে হবে।


2
আপনি কিভাবে বিবৃতি মিলনসাধন করা হয় "যদি , তারপর অন্য দিকে হবে সঙ্গে , সম্ভাব্যতা সঙ্গে সম্ভাবনা। " আপনার আগের কথন সঙ্গে যে অনুচ্ছেদে শুরুতে "একটি উদাহরণ:"? H+5%95%P(|S)=0.95P(|S)=0
দিলীপ সরোতে

1
টাইপো। এই টুইটটি দেখার জন্য ধন্যবাদ। আমি বলতে ,P(|H)=0.95P(|S)=0.95
অ্যারন ম্যাকডেইড

2
মনে রাখবেন যে আপনি না জেনে আপনি দাবি করার চেয়ে আমরা আরও নির্ভুল হতে পারি এবং বলি যে একটি পরীক্ষা গুণক দ্বারা সুস্থ হওয়ার তুলনায় অসুস্থ হওয়ার প্রতিক্রিয়া বাড়িয়ে তোলে । তবে, সিদ্ধান্ত নেওয়ার ক্ষেত্রে (যেমন ট্রিট করুন বা চিকিত্সা করবেন না), আমাদের (এবং একটি ক্ষতির ফাংশন) প্রয়োজন require P(S)+20P(S)
সম্ভাব্যতাসংক্রান্ত

1
জনগণের পূর্বের সমীক্ষা (বনাম একটি শিক্ষিত অনুমান) থেকে যদি অনুমান করা হয় তবে এটি কি ন্যায়সঙ্গত হবে , তবে পরিসংখ্যানগুলির ঘনতান্ত্রিক দিকটি গুরুত্বপূর্ণ হয়ে ওঠে, বিশেষত যদি গবেষকরা এর যথার্থতা অনুমান করতে চান ? P(S)P(S)
রবার্টএফ

6

আপনি যেমন দেখতে পাবেন, সেখানে প্রচুর ঘন ঘনবাদী-বায়েশিয়ান বিতর্ক চলছে। আসলে, আমি মনে করি এটি আগের চেয়ে বেশি গরম এবং কৌতূহলযুক্ত। আপনি আমার ব্লগে আগ্রহী হতে পারেন: http://errorstatics.com


2
শালিজি এবং গেলম্যানের লেখার মাধ্যমে আমি আপনার কাজের সাথে পরিচিত। আমি অবশ্যই ব্লগটি অনুসরণ করব। আর আমি ভাবছি, Gelman এর "বায়েসের" DeFinetti এর "বায়েসের" হিসাবে একই .... হয়
JohnRos

1

অনেক লোক (বিশেষজ্ঞ বিশেষজ্ঞের বাইরের) যারা মনে করেন যে তারা ঘন ঘন ঘন ঘনবাদী হন তারা আসলে বায়েশিয়ান। এটি বিতর্ককে কিছুটা অর্থহীন করে তোলে। আমি মনে করি যে বায়েশিয়ানিজম জিতেছে, কিন্তু এখনও অনেক বায়েশিয়ান রয়েছে যারা মনে করে যে তারা ঘন ঘনবাদী। কিছু লোক আছেন যারা ভাবেন যে তারা প্রিয়ার ব্যবহার করেন না এবং তাই তারা মনে করেন যে তারা ঘন ঘন। এটি বিপজ্জনক যুক্তি। প্রিয়ার (ইউনিফর্ম প্রিয়ার বা অ-ইউনিফর্ম) সম্পর্কে এটি এতটা নয়, আসল পার্থক্যটি আরও সূক্ষ্ম।

(আমি পরিসংখ্যান বিভাগে আনুষ্ঠানিকভাবে থাকি না; আমার পটভূমি গণিত এবং কম্পিউটার বিজ্ঞান difficulties আমি অন্যান্য অ-পরিসংখ্যানবিদদের সাথে এই বিতর্কটি নিয়ে আলোচনা করার চেষ্টা করেছি এমনকী, এমনকি কিছুটা প্রাথমিক ক্যারিয়ার নিয়েও লিখছি) স্ট্যাটিসটিসিয়ান।)

এমএলই আসলে একটি বায়েশিয়ান পদ্ধতি। কিছু লোক বলবেন "আমি ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন। আমি এটি পিয়ার-পর্যালোচিত সাহিত্যে দেখেছি। এটি অযৌক্তিক এবং এর ভিত্তিতে তৈরি হয়েছে (অপরিবর্তিত, তবে বোঝানো) এই মিথটির উপর ভিত্তি করে যে একটি ঘনত্ববাদী এমন কেউ যিনি নন-ইউনিফর্ম পূর্বের পরিবর্তে ইউনিফর্ম ব্যবহার করেন)।

জ্ঞাত গড়, এবং অজানা বৈকল্পিক সহ একটি সাধারণ বিতরণ থেকে একটি একক অঙ্কন বিবেচনা করুন । এই রূপটিকে কল করুন ।μ=0θ

XN(μ=0,σ2=θ)

এখন সম্ভাবনা ফাংশন বিবেচনা করুন। এই ফাংশনটিতে দুটি এবং প্যারামিটার রয়েছে এবং এবং এটি সম্ভাব্যতা প্রদান করে, প্রদত্ত , ।xθθx

f(x,θ)=Pσ2=θ(X=x)=12πθex22θ

আপনি একটি হিটম্যাপ এই ষড়যন্ত্র, সঙ্গে কল্পনা করতে পারেন x- অক্ষ এবং এর Y- অক্ষ, এবং রঙ (অথবা z অক্ষ) ব্যবহার করে। কনট্যুর লাইন এবং রঙ সহ প্লটটি এখানে।xθ

উত্তাপের মানচিত্র

প্রথমে কয়েকটি পর্যবেক্ষণ। যদি আপনি এর একক মান স্থির করে থাকেন , তবে আপনি হিটম্যাপের মাধ্যমে সংশ্লিষ্ট আনুভূমিক টুকরোটি নিতে পারেন । এই স্লাইস আপনাকে মানটির জন্য পিডিএফ দেবে । স্পষ্টতই, এই স্লাইশের বক্ররেখার ক্ষেত্রফল 1 হবে the অন্যদিকে, আপনি যদি একক মানটি স্থির করেন এবং তার পরে উল্লম্ব স্লাইসটি দেখুন, তবে বক্ররেখার অধীনে অঞ্চল সম্পর্কে কোনও গ্যারান্টি নেই is ।θ এক্সθθx

অনুভূমিক এবং উল্লম্ব টুকরাগুলির মধ্যে এই পার্থক্যটি গুরুত্বপূর্ণ, এবং আমি এই সাদৃশ্যটি আমাকে পক্ষপাতের ঘন ঘনবাদী দৃষ্টিভঙ্গি বুঝতে সাহায্য করেছিল ।

একজন বায়েশিয়ান এমন কেউ আছেন যিনি বলেছেন

θf(x,θ)

g(θ)

θf(x,θ)g(θ)

সুতরাং একজন বায়েশিয়ান এক্স সংশোধন করে এবং সেই কনট্যুর প্লটে সম্পর্কিত উল্লম্ব স্লাইসটি দেখে (বা পূর্বেটি অন্তর্ভুক্ত করে বৈকল্পিক প্লটে)। এই স্লাইসে, বক্ররেখার ক্ষেত্রফল 1 হওয়ার দরকার নেই (যেমনটি আমি আগে বলেছি)। একটি বায়সিয়ান 95% বিশ্বাসযোগ্য ব্যবধান (সিআই) অন্তর্গত যা 95% উপলব্ধ ক্ষেত্র রয়েছে contains উদাহরণস্বরূপ, ক্ষেত্রফলটি যদি 2 হয় তবে বেইশিয়ান সিআইয়ের আওতাধীন অঞ্চলটি 1.9 হতে হবে।

θ

θ

N(μ=0,σ2=θ)θx3θ+3θ

θ

ঘন ঘন সিআইটি নির্মাণ করার একমাত্র উপায় এটি নয়, এটি খুব ভাল (সংকীর্ণ )ও নয়, তবে এক মুহুর্তের জন্য আমাকে সহ্য করুন।

'ইন্টারভাল' শব্দের ব্যাখ্যার সর্বোত্তম উপায়টি 1-ডি লাইনে অন্তর হিসাবে নয়, এটি উপরের 2-ডি বিমানের অঞ্চল হিসাবে ভাবা হয়। একটি 'ইন্টারভাল' 2-ডি বিমানের উপসেট হয়, কোনও 1-ডি লাইনের নয়। যদি কেউ এরকম 'ব্যবধান' প্রস্তাব করে তবে আমাদের পরীক্ষা করতে হবে 'ইন্টারভাল' 95% আত্মবিশ্বাস / বিশ্বাসযোগ্য স্তরে বৈধ।

ঘন ঘন প্রতিটি আড়াআড়ি টুকরোটি বিবেচনা করে এবং বক্ররেখার ক্ষেত্রফলটি দেখে এই 'অন্তর' এর বৈধতা পরীক্ষা করবে। আমি আগেই বলেছি, এই বক্ররেখার অধীনে অঞ্চলটি সর্বদা এক থাকবে। গুরুতর প্রয়োজনীয়তা হ'ল 'বিরতি'র মধ্যে অঞ্চলটি কমপক্ষে ০.৯৯ হতে হবে।

একজন বায়েশিয়ান উল্লম্ব টুকরোগুলি না দেখে বৈধতা পরীক্ষা করবে। আবার, বক্ররেখার নীচের অঞ্চলটি ব্যবধানের নীচে থাকা সুবারের সাথে তুলনা করা হবে। যদি পরবর্তীটি পূর্বের কমপক্ষে 95% হয় তবে 'বিরতি' একটি বৈধ 95% বায়সিয়ান বিশ্বাসযোগ্য ব্যবধান।

এখন যেহেতু আমরা জানি যে কোনও নির্দিষ্ট ব্যবধানটি 'বৈধ' হয় কিনা তা পরীক্ষা করতে হয়, তবে প্রশ্নটি কীভাবে আমরা বৈধ বিকল্পগুলির মধ্যে সেরা বিকল্পটি বেছে নেব। এটি একটি কালো শিল্প হতে পারে, তবে সাধারণত আপনি সংকীর্ণ অন্তর চান। উভয় পদ্ধতিরই এখানে একমত হওয়ার ঝোঁক রয়েছে - উল্লম্ব টুকরোগুলি বিবেচনা করা হয় এবং লক্ষ্যটি প্রতিটি উল্লম্ব ফালিগুলির মধ্যে অন্তরকে যতটা সম্ভব সংকীর্ণ করা হয়।

উপরোক্ত উদাহরণে আমি সংকীর্ণ সম্ভাব্য ঘন ঘন আস্থাভাজন অন্তর্ভুক্তিকে সংজ্ঞায়িত করার চেষ্টা করি নি। সংক্ষিপ্ত বিরতিগুলির উদাহরণগুলির জন্য নীচে @ কার্ডিনাল দ্বারা মন্তব্যগুলি দেখুন। আমার লক্ষ্যটি সেরা অন্তরগুলি সন্ধান করা নয়, তবে বৈধতা নির্ধারণে অনুভূমিক এবং উল্লম্ব টুকরোগুলির মধ্যে পার্থক্যের উপর জোর দেওয়া। একটি ব্যবধান যা 95% ঘন ঘন আস্থাভাজন অন্তর্ভুক্তির শর্তাদি পূরণ করে সাধারণত 95% বায়সিয়ান বিশ্বাসযোগ্য ব্যবধানের শর্ত পূরণ করে না এবং এর বিপরীতে।

উভয় পদ্ধতিরই সংকীর্ণ বিরতি কামনা করে, অর্থাত্ একটি উল্লম্ব টুকরো বিবেচনা করার সময় আমরা সেই স্লাইসে (1-ডি) অন্তরকে যতটা সম্ভব সংকীর্ণ করতে চাই। পার্থক্যটি কীভাবে 95% প্রয়োগ করা হয় তার মধ্যে - একটি ঘনত্ববাদী কেবল প্রস্তাবিত অন্তরগুলিতে নজর রাখেন যেখানে প্রতিটি অনুভূমিক স্লাইসের ক্ষেত্রের 95% অঞ্চল অন্তরের নীচে থাকে, তবে একজন বায়েশিয়ান জোর দিয়ে বলেন যে প্রতিটি উল্লম্ব টুকরো এর ক্ষেত্রের 95% হয় বিরতি অধীনে।

অনেক অ-পরিসংখ্যানবিদ এটি বুঝতে পারে না এবং তারা কেবল উল্লম্ব টুকরাগুলিতে মনোনিবেশ করে; এটি তাদের বায়েশিয়ানরা তোলে যদিও তারা অন্যথায় চিন্তা করে।


3
(-1) আমি বিশ্বাস করি যে এই পোস্টটি কয়েকটি পয়েন্টে কিছু মৌলিক ভুল বোঝাবুঝি দেখায়। কোথা থেকে শুরু করবেন তা জানা শক্ত।
কার্ডিনাল

1
X2/θχ12θ(θ^,θ^u)P(θ(θ^,θ^u))=1α θXX2/θ
কার্ডিনাল

1
( ) একটি পছন্দ হ'ল যেখানে বিতরণের ম কোয়ান্টাইলকে বোঝায় । প্রায় যে কোনও তার পরিবর্তে, সমানভাবে বৈধ ব্যবধানটি যেহেতু অসীম সংকীর্ণ এবং এটি নির্মাণ করা সহজ। তবে , এই পরবর্তী অন্তরটি এমনকি সংক্ষিপ্ততমও নয়, যা একটি সাধারণ সংখ্যা পদ্ধতিতে পাওয়া যেতে পারে। সংক্ষেপে , উত্তরে যুক্তিটির মূল ভিত্তিটি বিন্দুটি পুরোপুরি মিস করেছে বলে মনে হয়। কুই χ 2 1 [ এক্স 2 / কুই 1 - α / 2 , এক্স 2 / কুই α / 2 ][X2/q1α,)qbbχ12[X2/q1α/2,X2/qα/2]
কার্ডিনাল

হাই @ কার্ডিনাল, আমি আপনার শেষ দুটি মন্তব্যে আপনার পয়েন্টগুলি বুঝতে পারি। আসলে, আমি মনে করি আপনার পয়েন্টগুলি আমি যা বলেছি তার সাথে সামঞ্জস্যপূর্ণ :-) ঠিক আছে, ঘন ঘন আত্মবিশ্বাসের অন্তরগুলি তৈরির বিভিন্ন উপায় রয়েছে। আমি বর্ণিত পদ্ধতিটি আপনি বৈধ বলে গ্রহণ করেন। এবং আপনি (যুক্তিসঙ্গতভাবে) দেখান যে আমার পদ্ধতিটি সবচেয়ে সংকীর্ণ নয়। আমি মনে করি আপনার প্রথম মন্তব্যটি খুব একটা সহায়ক ছিল না।
অ্যারন ম্যাকডেইড

2
@ কার্ডিনাল, দ্বিতীয় চিন্তাগুলির ভিত্তিতে আমি স্বীকার করি যে আমার উত্তরটির শেষটি সহায়ক নয় এবং মূলত ভুল, আমি এটিকে পরিষ্কার করব। এটি আমার মূল বক্তব্য থেকে দূরে সরে যায়, এটি হ'ল স্ট্যাটাস বিভাগের বাইরের অনেক লোক যারা এই সম্পর্কে দৃ strong় মতামত রাখে তারা দুটি পদ্ধতির মধ্যে মৌলিক পার্থক্যের প্রশংসা করে না: উভয় পদ্ধতির বক্ররেখার নীচে একটি ভাল অঞ্চল রয়েছে বলে মনে হয় (কমপক্ষে 95%) ), তবে পার্থক্য হ'ল তাপের মানচিত্রের মাধ্যমে অনুভূমিক (ফ্রিকোয়েন্সিস্ট) বা উল্লম্ব (বায়েশিয়ান) টুকরো গ্রহণ করা হবে কিনা । আমি কি ঠিক এখানে আছি, এবং এখানে কি এই বিষয়টি তৈরি করা উপযুক্ত?
অ্যারন ম্যাকডেইড
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.