বায়েশিয়ান পদ্ধতিগুলিতে কেন একাধিক পরীক্ষার সংশোধন প্রয়োজন হয় না?


22

অ্যান্ড্রু গেলম্যান বায়েশিয়ান এ বি পরীক্ষায় কেন একাধিক অনুমান সংশোধনের প্রয়োজন হয় না সে সম্পর্কে একটি বিস্তৃত নিবন্ধ লিখেছিলেন: কেন আমাদের (সাধারণত) একাধিক তুলনা সম্পর্কে চিন্তা করা উচিত নয় , ২০১২।

আমি বেশ বুঝতে পারি না: কেন বায়েশিয়ান পদ্ধতিতে একাধিক পরীক্ষার সংশোধন প্রয়োজন হয় না?

A ~ Distribution1 + Common Distribution
B ~ Distribution2 + Common Distribution
C ~ Distribution3 + Common Distribution
Common Distribution ~ Normal

আমার বোধগম্যতা হল যে বাইসিয়ান পদ্ধতির উপরোক্ত চিত্রগুলি সমস্ত অনুমানের দ্বারা ভাগ করা অন্তর্নিহিত বিতরণের জন্য রয়েছে (বারবারবাদী বনফেরোনি সংশোধন ব্যতীত)। আমার যুক্তি কি সঠিক?



5
যদিও প্যাট্রিকের লিঙ্কগুলি খুব সহায়ক, তবে 'পরিমিত পরিসংখ্যানগতভাবে সাক্ষরিত বৈজ্ঞানিক পর্যালোচক' এর চেয়ে আরও বেশি স্ব-নির্ভর উত্তর দেখতে পারাটা দুর্দান্ত হবে।
অনুমান করা হয়েছে

উত্তর:


14

প্রশ্নের উত্তর দেওয়ার একটি অদ্ভুত উপায়টি লক্ষ করা যায় যে বায়েশিয়ান পদ্ধতিটি এটি করার কোনও উপায় প্রদান করে না কারণ বায়েশিয়ান পদ্ধতিগুলি প্রমাণের স্বীকৃত নিয়মের সাথে সামঞ্জস্যপূর্ণ এবং ঘন ঘন পদ্ধতিগুলি তাদের সাথে প্রায়ই মতবিরোধে থাকে। উদাহরণ:

  • ঘন ঘন বিশেষজ্ঞের পরিসংখ্যানগুলির সাথে, চিকিত্সার সাথে তুলনা করতে A থেকে B চিকিত্সা সি এবং ডি এর সাথে তুলনা করার জন্য দণ্ডিত করতে হবে কারণ পরিবারগত ধরণের I ত্রুটি বিবেচনার কারণে; বায়েশিয়ানের সাথে এবি তুলনাটি নিজেরাই দাঁড়িয়েছে।
  • ক্রমিক ক্রমবর্ধমান পরীক্ষার জন্য সাধারণত ডেটাতে একাধিক বর্ণনার জন্য পেনাল্টির প্রয়োজন হয়। একটি গ্রুপ অনুক্রমিক সেটিংয়ে, এ বনাম বিয়ের জন্য প্রাথমিক তুলনা অবশ্যই পরবর্তী তুলনার জন্য দণ্ডিত করতে হবে যা এখনও করা হয়নি, এবং পরবর্তী তুলনাটি পূর্বের তুলনাটির জন্য অবশ্যই দন্ডিত করতে হবে যদিও পূর্বের তুলনাটি এর গতি পরিবর্তন করে না even অধ্যয়ন.

সমস্যাটি বারবারবাদীর সময় এবং তথ্য প্রবাহের বিপরীত থেকে উদ্ভূত হয়, যা ঘন ঘনবাদীদের বিবেচনা করতে হয় যা ঘটেছিল তার পরিবর্তে কী ঘটতে পারে । বিপরীতে, বায়েসিয়ান মূল্যায়ন পূর্বের বিতরণে সমস্ত মূল্যায়ন নোঙ্গর করে, যা প্রমাণকে ক্যালিব্রেট করে। উদাহরণস্বরূপ, এবি পার্থক্যের পূর্বের বিতরণটি এবি সম্পর্কিত সমস্ত ভবিষ্যত মূল্যায়ন ক্যালিব্রেট করে এবং সিডি বিবেচনা করতে হয় না।

অনুক্রমিক পরীক্ষার মাধ্যমে, ঘনঘনবাদী অনুমান ব্যবহার করে কোনও পরীক্ষা শুরুর দিকে কীভাবে বিন্দু অনুমানের সমন্বয় করা যায় সে সম্পর্কে দুর্দান্ত বিভ্রান্তি রয়েছে। বায়েশিয়ান বিশ্বে, পূর্ববর্তী যে কোনও বিন্দু অনুমানের উপর "পিছনে টান" এবং আপডেট পোস্টেরিয়র বিতরণ যে কোনও সময় অনুমানের ক্ষেত্রে প্রযোজ্য এবং কোনও জটিল নমুনা স্থান বিবেচনার প্রয়োজন নেই।


4
আমি সত্যিই এই যুক্তি বুঝতে পারি না। যদি আমরা একটি সাধারণ ঘন ঘন পদ্ধতির সাথে 1000 টি আলাদা তুলনা করি তবে অবশ্যই আমাদের কাছে পি <0.05 প্রভাবগুলি প্রায় শূন্যের নীচে প্রায় 50 টি উল্লেখযোগ্য আশা করতে হবে। সুতরাং সংশোধন। এর পরিবর্তে যদি আমরা সমস্ত তুলনার জন্য কিছু পূর্ব (প্রায় 0?) পেয়ে বায়েসিয়ান অনুমান / পরীক্ষার ব্যবহার করি তবে হ্যাঁ পূর্বেরটি পোস্টাররিয়ারগুলি শূন্যের দিকে সঙ্কুচিত করবে, তবে আমাদের এখনও এলোমেলোভাবে পোস্টাররিয়ার এবং / বা বেয়েস ফ্যাক্টরগুলি থাকতে পারে এবং সম্ভবত কিছুটা থাকবে 1000 এর মধ্যে কেসগুলি "যথেষ্ট পরিমাণে" প্রভাবগুলির মতো দেখাবে, যদিও সত্য প্রভাবগুলি সমস্ত শূন্য থাকে।
অ্যামিবা

1
21000210001

1
দুঃখিত, @ প্রোব্যাবিলিটিস্লোগিক, আমি নিশ্চিত নই যে আমি আপনার বক্তব্যটি বুঝতে পেরেছি। "সমস্ত বিকল্প" সম্পর্কে যথেষ্ট ন্যায্য, তবে বাস্তবে কী ঘটে? আমি যেমন বলেছি, আমরা 1000 গ্রুপ পার্থক্য (উদাহরণস্বরূপ) অনুমান করছি; গ্রুপ পার্থক্যের বিষয়ে আমাদের একটা অগ্রাধিকার রয়েছে; আমরা 1000 পোস্টারিয়র, 95% বিশ্বাসযোগ্য অন্তর বা যা কিছু পাই। তারপরে আমরা প্রতিটি বিশ্বাসযোগ্য ব্যবস্থার দিকে নজর রাখি এটি শূন্য থেকে "অর্থবহ / যথেষ্ট" প্রভাব হিসাবে যথেষ্ট কিনা তা পরীক্ষা করে দেখুন। আমরা যদি এটি 1000 বার করি তবে আমাদের সম্ভবত "মিথ্যা ধনাত্মকতা" রয়েছে এমন এক অর্থে যে কিছু 1000 প্রভাব বাস্তবে শূন্যের সমান হলেও কিছু প্রভাব বড় দেখাবে। কোন?
অ্যামিবা বলেছেন মোনিকা

1
1000

1
@ প্রোব্যাবিলিটিস্লোগিক: আচ্ছা, আমি একেবারে মাল্টিলেভেল মডেলগুলির পক্ষে, যদিও আমি এগুলি প্রয়োজনীয়ভাবে বায়েশিয়ান সরঞ্জাম হিসাবে দেখি না - মিশ্র মডেলগুলি এবং এ্যান্ডোভগুলি এলোমেলো প্রভাবের সাথে টি-টেস্টের পাশাপাশি ব্যবহার করা হয় ...
অ্যামিবা বলেছেন, পুনর্নির্মাণ মনিকা

6

এই জাতীয় শ্রেণিবিন্যাসের মডেল অনুমানগুলি সঙ্কুচিত করে এবং ছোট থেকে মাঝারি সংখ্যার অনুমানের পক্ষে যুক্তিসঙ্গত পরিমাণে মিথ্যা দাবির সংখ্যা হ্রাস করে। এটি কি কোনও নির্দিষ্ট ধরণের আই ত্রুটির হারের নিশ্চয়তা দেয়? না।

গেলম্যানের এই বিশেষ পরামর্শ (যিনি অনেকগুলি বিভিন্ন বিষয় দেখার সাথে বিষয়টি স্বীকার করেছেন এবং তারপরে খুব সহজেই ভুলভাবে এই সিদ্ধান্তে পৌঁছেছেন যে আপনি তাদের কিছুটির জন্য কিছু দেখতে পান - আসলে তার ব্লগে তার পোষ্যের একটি বিষয়) একটি চূড়ান্ত বিকল্প থেকে পৃথক যে দৃষ্টিভঙ্গিটি ধরে রেখেছে যে বায়েশিয়ান পদ্ধতিগুলি সংখ্যাবৃত্তির জন্য অ্যাকাউন্টিং করার দরকার নেই, কারণ সমস্ত বিষয় আপনার সম্ভাবনা (এবং আপনার পূর্ব)।


1
(+1) কয়েকটি ক্ষেত্রে প্রত্যাশার সাথে আমার জ্ঞানের কাছে (উদাহরণস্বরূপ মিলের সাথে পূর্বনির্ধারিত) বায়েশিয়ান অনুমান টাইপ 1 ত্রুটি হারের উপর কোনও নিয়ন্ত্রণ সরবরাহ করে না। সুতরাং বায়েসিয়ান সেটিংয়ে একাধিক পরীক্ষার সংশোধন IHMO টাইপ -1 ত্রুটির সংশোধন হিসাবে ভাবা যায় না।
peuhp


6

খুব আকর্ষণীয় প্রশ্ন, এটি আমার গ্রহণ করা এখানে।

এটি সমস্ত তথ্য এনকোডিং সম্পর্কে, তারপরে বায়েশিয়ান ক্র্যাঙ্কটি চালু করুন। এটি সত্য বলে মনে হয় খুব ভাল - তবে এগুলি উভয়ই মনে হয় তার চেয়ে শক্ত।

আমি প্রশ্ন জিজ্ঞাসা দিয়ে শুরু

আমরা একাধিক তুলনা সম্পর্কে চিন্তিত হলে কোন তথ্য ব্যবহার করা হচ্ছে?

আমি কিছু সম্পর্কে ভাবতে পারি - প্রথমটি হ'ল "ডেটা ড্রেজিং" - পরীক্ষার "সবকিছু" যতক্ষণ না আপনি পর্যাপ্ত পাস / ব্যর্থ হন (আমি মনে করি প্রশিক্ষণ প্রাপ্ত প্রায় প্রতিটি স্ট্যাটাসই এই সমস্যার মুখোমুখি হবে)। আপনারও কম অশুভ, তবে মূলত একই "আমার চালানোর জন্য অনেক পরীক্ষা আছে - অবশ্যই সব সঠিক হতে পারে না"।

এই সম্পর্কে চিন্তা করার পরে, একটি জিনিস আমি লক্ষ্য করি তা হল আপনি নির্দিষ্ট অনুমান বা নির্দিষ্ট তুলনা সম্পর্কে খুব বেশি কিছু শুনতে চান না। এগুলি সবই "সংগ্রহ" সম্পর্কে - এটি আমার চিন্তাভাবনাটি বিনিময়যোগ্যতার দিকে চালিত করে - তুলনা করা অনুমানটি কোনওভাবে একে অপরের সাথে "অনুরূপ" are এবং আপনি কীভাবে বাইসিয়ান বিশ্লেষণে বিনিময়যোগ্যতা এনকোড করবেন? - হাইপার-প্রিয়ার, মিশ্র মডেল, এলোমেলো প্রভাব ইত্যাদি etc

তবে বিনিময়যোগ্যতা কেবল আপনাকে সেখানকার অংশের অংশ করে। সব কি বিনিময়যোগ্য? বা আপনার কাছে কি "স্পারসিটি" রয়েছে - যেমন কেবলমাত্র কয়েকটি বড় শূন্য প্রার্থীর বৃহত পুল সহ শূন্যের রিগ্রেশন সহগ। মিশ্র মডেল এবং সাধারণত বিতরণ করা এলোমেলো প্রভাব এখানে কাজ করে না। স্কোয়াশিং শব্দের মধ্যে এবং "সিচুয়ালগুলি অপরিচ্ছন্ন রেখে দেওয়ার" মধ্যে তারা "আটকে" যায় (উদাহরণস্বরূপ, উদাহরণস্বরূপ লোকেশনবি এবং লোকেশনসি "সত্য" পরামিতি সমান রাখুন এবং অবস্থানের "সত্য" পরামিতিটি নির্বিচারে বড় বা ছোট সেট করুন এবং স্ট্যান্ডার্ড লিনিয়ার মিশ্রিত মডেলটি ব্যর্থ দেখুন)) । তবে এটি স্থির করা যায় - যেমন "স্পাইক এবং স্ল্যাব" প্রিয়ার বা "ঘোড়ার জুতো" প্রিয়ার সহ।

সুতরাং আপনি কী ধরণের অনুমানের কথা বলছেন এবং পূর্বের এবং সম্ভাবনার প্রতিফলিত হিসাবে অনেকগুলি বৈশিষ্ট্য প্রতিফলিত হয়েছে তা বর্ণনা করার ক্ষেত্রে এটি আরও সত্য। অ্যান্ড্রু গেলম্যানের দৃষ্টিভঙ্গি একাধিক তুলনার বিস্তৃত শ্রেণিকে স্পষ্টভাবে পরিচালনা করার উপায়। ঠিক যেমন ন্যূনতম স্কোয়ার এবং সাধারণ বিতরণ বেশিরভাগ ক্ষেত্রে ভাল কাজ করার প্রবণতা রয়েছে (তবে সবগুলি নয়)।

এটি কীভাবে এটি করে তার পদক্ষেপে আপনি কোনও ব্যক্তিকে নিম্নরূপ যুক্তি দিয়ে ভাবতে পারেন - গ্রুপ এ এবং গ্রুপ বি এর একই অর্থ হতে পারে - আমি ডেটা দেখলাম এবং উপায়গুলি "কাছাকাছি" - অতএব, আরও ভাল অনুমান করার জন্য উভয়ের জন্যই আমার ডেটা পুল করা উচিত, কারণ আমার প্রাথমিক ধারণাটি ছিল তাদের একই রকম ছিল। - যদি সেগুলি না হয় তবে ডেটা প্রমাণ দেয় যে তারা "নিকটবর্তী", সুতরাং আমার "হাইপোথিসিসটি ভুল থাকলে" কিছুটা "পুলিং আমাকে খুব খারাপভাবে ক্ষতি করতে পারে না (একটি মডেলের সমস্ত মডেল ভুল, কিছু কার্যকর)

নোট করুন যে উপরের সমস্তগুলি প্রাথমিক দিকের উপর নির্ভর করে "তারা একই হতে পারে"। এটি সরিয়ে নিন, এবং পুলিংয়ের কোনও যৌক্তিকতা নেই। আপনি সম্ভবত পরীক্ষাগুলি সম্পর্কে চিন্তাভাবনার একটি "আদর্শ বিতরণ" দেখতে পারেন। "শূন্য সম্ভবত", "যদি শূন্য না হয় তবে তারপরে শূন্যের খুব কাছাকাছি হয় সম্ভবত", "চূড়ান্ত মানগুলি অসম্ভব"। এই বিকল্পটি বিবেচনা করুন:

  • গ্রুপ এ এবং গ্রুপ বি এর অর্থ সমান হতে পারে তবে সেগুলিও বেশ আলাদা হতে পারে

তারপরে "কিছুটা" পুলিং সম্পর্কে যুক্তিটি খুব খারাপ ধারণা। মোট পুলিং বা জিরো পুলিং বেছে নেওয়া আপনি ভাল। আরও অনেক কিছু কচির মতো, স্পাইক ও স্ল্যাব, পরিস্থিতির ধরণের (শূন্যের কাছাকাছি প্রচুর ভর, এবং চূড়ান্ত মানগুলির জন্য প্রচুর ভর)

পুরো একাধিক তুলনা মোকাবিলা করার দরকার নেই, কারণ বেইসিয়ান পদ্ধতির তথ্যটি সংযুক্ত করা হচ্ছে যা আমাদের পূর্ব এবং / অথবা সম্ভাবনার দিকে উদ্বেগের দিকে নিয়ে যায় । এক অর্থে আপনার কাছে কোন তথ্য উপলব্ধ তা সঠিকভাবে চিন্তা করা এবং আপনি এটি আপনার বিশ্লেষণে অন্তর্ভুক্ত করেছেন কিনা তা নিশ্চিত করে নেওয়া আরও একটি অনুস্মারক।


2
l1exp(|x|)

@ স্ট্যাস্ক - এল 1 আরও ভাল কাজ করবে, তবে এটি লগ-অবতল হিসাবে স্পার্স নন-জিরোগুলির সাথে লড়াই করবে। আমি যেগুলি উল্লেখ করেছি তারা হ'ল সমস্ত লগ-উত্তল। এল 1 এর একটি ঘনিষ্ঠ রূপটি ডাবল পেরেটোকে সাধারণীকরণ করা হয় - ল্যাপ্লেস স্কেল প্যারামিটারের মিশ্রণ গ্রহণ করে পান (এমএল স্পিকের ক্ষেত্রে অভিযোজিত লাসোর অনুরূপ)
সম্ভাব্যতা ব্লগ

5

প্রথমে, আপনি যে মডেলটি উপস্থাপন করেছেন তা বুঝতে পেরে আমি মনে করি এটি গেলম্যান প্রস্তাবের চেয়ে কিছুটা আলাদা, এটি আরও দেখতে:

A ~ Distribution(locationA)
B ~ Distribution(locationB)
C ~ Distribution(locationC)

locationA ~ Normal(commonLocation)
locationB ~ Normal(commonLocation)
locationC ~ Normal(commonLocation)

commonLocation ~ hyperPrior

অনুশীলনে, এই commonLocationপ্যারামিটারটি যুক্ত করে, 3 টি বিতরণ (এখানে অবস্থান 1, 2 এবং 3) পরামিতিগুলির উপরের সূত্রগুলি আর একে অপরের থেকে স্বতন্ত্র নয়। তদুপরি, commonLocationএকটি কেন্দ্রীয় (সাধারণত অনুমান) একের দিকে পরামিতিগুলির প্রত্যাশিত মানগুলি সঙ্কুচিত করে। একটি নির্দিষ্ট অর্থে, এটি একাধিক সংশোধনের প্রয়োজন নেই সংশোধনের প্রয়োজনীয়তা তৈরি করে সমস্ত অনুক্রমের উপর নিয়মিতকরণ হিসাবে কাজ করে (বাস্তবে আমরা মডেলের ব্যবহারের মাধ্যমে তাদের প্রত্যেকের মধ্যে মিথস্ক্রিয়া থেকে একটি একক বহু ফলক অনুমানের অ্যাকাউন্টিং করি)।

অন্য উত্তরের দ্বারা নির্দেশিত হিসাবে, এই সংশোধনটি টাইপ আই ত্রুটির উপর কোনও নিয়ন্ত্রণ সরবরাহ করে না তবে বেশিরভাগ ক্ষেত্রে, বেইসিয়ান পদ্ধতিটি একক অনুমান স্কেল এমনকি এমন একাধিক নিয়ন্ত্রণের প্রস্তাব দেয় না এবং একাধিক তুলনার জন্য সংশোধনকে অবশ্যই বেইশিয়ান ভাষায় আলাদাভাবে চিন্তা করা উচিত বিন্যাস.

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.