আমার গবেষণায় আমি নিম্নলিখিত সাধারণ সমস্যাটি নিয়ে চলেছি: একই ডোমেনের উপরে আমার কাছে দুটি এবং কিউ এবং এই বিতরণগুলি থেকে একটি বৃহত (তবে সসীম) সংখ্যার নমুনা রয়েছে। নমুনাগুলি এই দুটি বিতরণের যে কোনও একটি থেকে স্বতন্ত্র এবং অভিন্নভাবে বিতরণ করা হয় (যদিও বিতরণ সম্পর্কিত হতে পারে: উদাহরণস্বরূপ, প্রশ্ন পি এবং কিছু অন্যান্য বিতরণের মিশ্রণ হতে পারে ।) নাল অনুমানটি হ'ল নমুনাগুলি পি থেকে আসে , বিকল্প অনুমানটি হ'ল নমুনা প্রশ্ন থেকে আসা ।
আমি নমুনা পরীক্ষার ক্ষেত্রে টাইপ 1 এবং টাইপ II ত্রুটিগুলি চিহ্নিত করার চেষ্টা করছি, ডি এবং ডিস্ট্রিবিউশনগুলি এবং কিউ জেনে । বিশেষত, আমি পি এবং কিউ এর জ্ঞান ছাড়াও অন্যকে প্রদত্ত একটি ত্রুটি বেঁধে রাখতে আগ্রহী ।
আমি গণিত.এসইতে একটি প্রশ্ন জিজ্ঞাসা করেছি পি এবং কিউর মধ্যে পার্থক্যের পরীক্ষার সাথে মোট পরিবর্তনের দূরত্বের সম্পর্ক সম্পর্কে এবং আমি একটি উত্তর পেয়েছি যা আমি স্বীকার করেছি। এই উত্তরটি বোধগম্য হয়, তবে আমার সমস্যার সাথে সম্পর্কিত হিসাবে টোটাল ভেরিয়েশন দূরত্ব এবং হাইপোথিসিস পরীক্ষার সম্পর্কের পিছনে গভীর অর্থের সাথে আমি এখনও আমার মনটি গুটিয়ে রাখতে সক্ষম হইনি। এইভাবে, আমি এই ফোরামে ফিরে যাওয়ার সিদ্ধান্ত নিয়েছি।
আমার প্রথম প্রশ্নটি হ'ল: কোনও ব্যক্তি নিযুক্ত অনুমানের পরীক্ষার পদ্ধতি থেকে পৃথক টাইপ 1 এবং টাইপ II ত্রুটির সম্ভাবনার যোগফলের মোট পার্থক্য কি আবদ্ধ ? সংক্ষেপে, যতক্ষণ না কোনও শূন্যের সম্ভাবনা থাকে যে নমুনাটি যে কোনও একটি বিতরণের মাধ্যমে তৈরি করা যেতে পারে, ত্রুটিগুলির মধ্যে কমপক্ষে একটির সম্ভাবনা অবশ্যই শূন্য নয় be মূলত, আপনি যতটা সিগন্যাল প্রসেসিংই করেন না কেন, আপনার হাইপোথিসিস পরীক্ষক কোনও ভুল করবেন এই সম্ভাবনা থেকে আপনি বাঁচতে পারবেন না। এবং মোট বৈকল্পিক সঠিক সম্ভাবনার সীমাবদ্ধ। আমার বোধগম্যতা কি সঠিক?
টাইপ I এবং II ত্রুটিগুলির মধ্যে আরও একটি সম্পর্ক রয়েছে এবং এবং Q এর অন্তর্নিহিত সম্ভাব্যতা বিতরণ : কেএল ডাইভারজেন্স । সুতরাং, আমার দ্বিতীয় প্রশ্নটি হল: কেএল-ডাইভারজেন্সটি কেবলমাত্র একটি নির্দিষ্ট অনুমানের পরীক্ষা পদ্ধতিতে প্রযোজ্য (এটি লগ-সম্ভাবনা অনুপাতের পদ্ধতির চারপাশে প্রচুর পরিমাণে আসে বলে মনে হয়) বা কোনও এটি সমস্ত অনুমানের পরীক্ষা পদ্ধতিতে সাধারণত প্রয়োগ করতে পারে? এটি যদি সমস্ত অনুমানের পরীক্ষার পদ্ধতিগুলির মধ্যে প্রযোজ্য হয় তবে কেন এটি সম্পূর্ণ ভেরিয়েশন বাউন্ডের থেকে খুব আলাদা বলে মনে হয়? এটি কি অন্যরকম আচরণ করে?
এবং আমার অন্তর্নিহিত প্রশ্নটি: আমার যখন আবদ্ধ ব্যবহার করা উচিত তখন কি পরিস্থিতিগুলির একটি নির্ধারিত সেট থাকে, বা এটি খাঁটি সুবিধার বিষয়? অন্যটি ব্যবহার করে একটি বাউন্ড হোল্ড ব্যবহার করে ফলাফল কখন নেওয়া উচিত?
এই প্রশ্নগুলি তুচ্ছ হলে আমি ক্ষমা চাইছি। আমি একজন কম্পিউটার বিজ্ঞানী (সুতরাং এটি আমার কাছে অভিনব প্যাটার্নের সাথে মিলে যাওয়ার সমস্যার মতো মনে হচ্ছে :)।) আমি তথ্য তত্ত্বটি যুক্তিসঙ্গতভাবে জানি, এবং সম্ভাব্যতা তত্ত্বে স্নাতক পটভূমিও রয়েছে। যাইহোক, আমি কেবল এই অনুমানের পরীক্ষার স্টাফগুলি শিখতে শুরু করছি। প্রয়োজনে আমি আমার প্রশ্নগুলি পরিষ্কার করার জন্য যথাসাধ্য চেষ্টা করব।