খুব আকর্ষণীয় প্রশ্ন, এটি আমার গ্রহণ করা এখানে।
এটি সমস্ত তথ্য এনকোডিং সম্পর্কে, তারপরে বায়েশিয়ান ক্র্যাঙ্কটি চালু করুন। এটি সত্য বলে মনে হয় খুব ভাল - তবে এগুলি উভয়ই মনে হয় তার চেয়ে শক্ত।
আমি প্রশ্ন জিজ্ঞাসা দিয়ে শুরু
আমরা একাধিক তুলনা সম্পর্কে চিন্তিত হলে কোন তথ্য ব্যবহার করা হচ্ছে?
আমি কিছু সম্পর্কে ভাবতে পারি - প্রথমটি হ'ল "ডেটা ড্রেজিং" - পরীক্ষার "সবকিছু" যতক্ষণ না আপনি পর্যাপ্ত পাস / ব্যর্থ হন (আমি মনে করি প্রশিক্ষণ প্রাপ্ত প্রায় প্রতিটি স্ট্যাটাসই এই সমস্যার মুখোমুখি হবে)। আপনারও কম অশুভ, তবে মূলত একই "আমার চালানোর জন্য অনেক পরীক্ষা আছে - অবশ্যই সব সঠিক হতে পারে না"।
এই সম্পর্কে চিন্তা করার পরে, একটি জিনিস আমি লক্ষ্য করি তা হল আপনি নির্দিষ্ট অনুমান বা নির্দিষ্ট তুলনা সম্পর্কে খুব বেশি কিছু শুনতে চান না। এগুলি সবই "সংগ্রহ" সম্পর্কে - এটি আমার চিন্তাভাবনাটি বিনিময়যোগ্যতার দিকে চালিত করে - তুলনা করা অনুমানটি কোনওভাবে একে অপরের সাথে "অনুরূপ" are এবং আপনি কীভাবে বাইসিয়ান বিশ্লেষণে বিনিময়যোগ্যতা এনকোড করবেন? - হাইপার-প্রিয়ার, মিশ্র মডেল, এলোমেলো প্রভাব ইত্যাদি etc
তবে বিনিময়যোগ্যতা কেবল আপনাকে সেখানকার অংশের অংশ করে। সব কি বিনিময়যোগ্য? বা আপনার কাছে কি "স্পারসিটি" রয়েছে - যেমন কেবলমাত্র কয়েকটি বড় শূন্য প্রার্থীর বৃহত পুল সহ শূন্যের রিগ্রেশন সহগ। মিশ্র মডেল এবং সাধারণত বিতরণ করা এলোমেলো প্রভাব এখানে কাজ করে না। স্কোয়াশিং শব্দের মধ্যে এবং "সিচুয়ালগুলি অপরিচ্ছন্ন রেখে দেওয়ার" মধ্যে তারা "আটকে" যায় (উদাহরণস্বরূপ, উদাহরণস্বরূপ লোকেশনবি এবং লোকেশনসি "সত্য" পরামিতি সমান রাখুন এবং অবস্থানের "সত্য" পরামিতিটি নির্বিচারে বড় বা ছোট সেট করুন এবং স্ট্যান্ডার্ড লিনিয়ার মিশ্রিত মডেলটি ব্যর্থ দেখুন)) । তবে এটি স্থির করা যায় - যেমন "স্পাইক এবং স্ল্যাব" প্রিয়ার বা "ঘোড়ার জুতো" প্রিয়ার সহ।
সুতরাং আপনি কী ধরণের অনুমানের কথা বলছেন এবং পূর্বের এবং সম্ভাবনার প্রতিফলিত হিসাবে অনেকগুলি বৈশিষ্ট্য প্রতিফলিত হয়েছে তা বর্ণনা করার ক্ষেত্রে এটি আরও সত্য। অ্যান্ড্রু গেলম্যানের দৃষ্টিভঙ্গি একাধিক তুলনার বিস্তৃত শ্রেণিকে স্পষ্টভাবে পরিচালনা করার উপায়। ঠিক যেমন ন্যূনতম স্কোয়ার এবং সাধারণ বিতরণ বেশিরভাগ ক্ষেত্রে ভাল কাজ করার প্রবণতা রয়েছে (তবে সবগুলি নয়)।
এটি কীভাবে এটি করে তার পদক্ষেপে আপনি কোনও ব্যক্তিকে নিম্নরূপ যুক্তি দিয়ে ভাবতে পারেন - গ্রুপ এ এবং গ্রুপ বি এর একই অর্থ হতে পারে - আমি ডেটা দেখলাম এবং উপায়গুলি "কাছাকাছি" - অতএব, আরও ভাল অনুমান করার জন্য উভয়ের জন্যই আমার ডেটা পুল করা উচিত, কারণ আমার প্রাথমিক ধারণাটি ছিল তাদের একই রকম ছিল। - যদি সেগুলি না হয় তবে ডেটা প্রমাণ দেয় যে তারা "নিকটবর্তী", সুতরাং আমার "হাইপোথিসিসটি ভুল থাকলে" কিছুটা "পুলিং আমাকে খুব খারাপভাবে ক্ষতি করতে পারে না (একটি মডেলের সমস্ত মডেল ভুল, কিছু কার্যকর)
নোট করুন যে উপরের সমস্তগুলি প্রাথমিক দিকের উপর নির্ভর করে "তারা একই হতে পারে"। এটি সরিয়ে নিন, এবং পুলিংয়ের কোনও যৌক্তিকতা নেই। আপনি সম্ভবত পরীক্ষাগুলি সম্পর্কে চিন্তাভাবনার একটি "আদর্শ বিতরণ" দেখতে পারেন। "শূন্য সম্ভবত", "যদি শূন্য না হয় তবে তারপরে শূন্যের খুব কাছাকাছি হয় সম্ভবত", "চূড়ান্ত মানগুলি অসম্ভব"। এই বিকল্পটি বিবেচনা করুন:
- গ্রুপ এ এবং গ্রুপ বি এর অর্থ সমান হতে পারে তবে সেগুলিও বেশ আলাদা হতে পারে
তারপরে "কিছুটা" পুলিং সম্পর্কে যুক্তিটি খুব খারাপ ধারণা। মোট পুলিং বা জিরো পুলিং বেছে নেওয়া আপনি ভাল। আরও অনেক কিছু কচির মতো, স্পাইক ও স্ল্যাব, পরিস্থিতির ধরণের (শূন্যের কাছাকাছি প্রচুর ভর, এবং চূড়ান্ত মানগুলির জন্য প্রচুর ভর)
পুরো একাধিক তুলনা মোকাবিলা করার দরকার নেই, কারণ বেইসিয়ান পদ্ধতির তথ্যটি সংযুক্ত করা হচ্ছে যা আমাদের পূর্ব এবং / অথবা সম্ভাবনার দিকে উদ্বেগের দিকে নিয়ে যায় । এক অর্থে আপনার কাছে কোন তথ্য উপলব্ধ তা সঠিকভাবে চিন্তা করা এবং আপনি এটি আপনার বিশ্লেষণে অন্তর্ভুক্ত করেছেন কিনা তা নিশ্চিত করে নেওয়া আরও একটি অনুস্মারক।