একাধিক তুলনায় পি-মানগুলি কখন সংশোধন করবেন?


11

আমি ভয় করি যে সম্পর্কিত প্রশ্নগুলি আমার উত্তর দেয় না didn't আমরা> 2 শ্রেণিবদ্ধের (মেশিন লার্নিং) পারফরম্যান্সগুলি মূল্যায়ন করি। আমাদের নাল অনুমান যে পারফরম্যান্স পৃথক হয় না। এই অনুমানটি মূল্যায়নের জন্য আমরা প্যারামিট্রিক (আনোভা) এবং নন-প্যারামেট্রিক (ফ্রেডম্যান) পরীক্ষা করি। যদি তারা তাৎপর্যপূর্ণ হয় তবে আমরা খুঁজে পেতে চাই যে উত্তর-পরবর্তী অনুসন্ধানে কোন শ্রেণিবদ্ধকারী আলাদা।

আমার প্রশ্ন দ্বিগুণ:

1) একাধিক তুলনা পরীক্ষার পরে কি পি-ভ্যালুগুলির সংশোধন করা প্রয়োজনীয়? "আলফাফেলার কুমিলিয়েরং" -র জার্মান উইকিপিডিয়া সাইট বলেছে যে একই ডাটাতে একাধিক অনুমান পরীক্ষা করা হলেই সমস্যাটি ঘটে occurs শ্রেণিবদ্ধ (1,2), (1,3), (2,3) তুলনা করার সময় ডেটা কেবল আংশিকভাবে ওভারল্যাপ হয়। এখনও কি পি-মানগুলি সংশোধন করা দরকার?

2) পি-মান সংশোধন প্রায়শই টি-টেস্টের সাথে জোড়াযুক্ত পরীক্ষার পরে ব্যবহৃত হয়। বিশেষায়িত পোস্ট-হক পরীক্ষাগুলি যেমন নেমেনির (নন-প্যারামেট্রিক) বা টুকির এইচএসডি পরীক্ষা করার সময়ও কি এটি প্রয়োজনীয়? এই উত্তরটি টুকির এইচএসডি "না" বলছে: একাধিক তুলনার জন্য টুকি এইচএসডি পরীক্ষাটি সঠিক হয়? । কোনও নিয়ম আছে বা প্রতিটি সম্ভাব্য উত্তর-পরবর্তী পরীক্ষার জন্য আমাকে এটি সন্ধান করতে হবে?

ধন্যবাদ!


আপনি কেন এএনওভা এবং ফ্রেডম্যান উভয় পরীক্ষা করছেন?
অ্যালেক্সিস

এটি একটি স্বয়ংক্রিয় পরীক্ষার কাঠামো সম্পর্কে যা প্যারামমিত্রিক অনুমানগুলি পূরণ না হলে পর্যালোচনাকারীকে প্যারামেট্রিক এবং নন-প্যারাম্যাট্রিক বিকল্প উভয়ই সরবরাহ করতে হবে।
ক্রিস

1
আপনার উল্লিখিত সর্বজনীন পরীক্ষাগুলি সম্পর্কে: (ক) যদি আপনার ডেটা গ্রুপগুলি স্বতন্ত্র থাকে, তবে আপনাকে এএনওওএ (প্যারামেট্রিক) বা ক্রুসকল-ওয়ালিস (নন-প্যারামেট্রিক) পরীক্ষা করা উচিত; (খ) যদি আপনার গোষ্ঠীগুলি নির্ভরশীল (যেমন, পুনরাবৃত্তি ব্যবস্থা) থাকে তবে আপনার উচিত হয় পুনরাবৃত্তি ব্যবস্থা আনোভা (প্যারামেট্রিক) বা ফ্রেডম্যান (নন-প্যারামেট্রিক) পরীক্ষা। (ধ্রুপদী) এর বিকল্প হিসাবে এএনওওএ এবং ফ্রেডম্যান পরীক্ষা সঠিক বলে মনে হচ্ছে না।
গেগজনাভি

উত্তর:


10

প্রশ্নের উত্তর 1
আপনার একাধিক তুলনার জন্য সামঞ্জস্য করতে হবে যদি আপনি যে টাইপ 1 ত্রুটি করতে চান তার সম্ভাবনা সম্পর্কে যত্নশীল হন। রূপক / চিন্তার পরীক্ষার একটি সহজ সংমিশ্রণ সাহায্য করতে পারে:

কল্পনা করুন যে আপনি লটারি জিততে চান। এই লটারিটি আশ্চর্যজনকভাবে যথেষ্ট, আপনাকে জয়ের 0.05 সুযোগ দেয় (অর্থাত 20 এ 1)। এই লটারিতে এম হ'ল টিকিটের মূল্য, যার অর্থ একটি একক লটারি কলের জন্য আপনার প্রত্যাশিত রিটার্ন এম / 20। এখন এমনকি অপরিচিত, কল্পনা করুন যে অজানা কারণে এই এম , এম আপনাকে আপনাকে যতগুলি লটারির টিকিট দিতে চান তা দিতে দেয় (বা কমপক্ষে দু'জনের বেশি)। নিজেকে ভাবছেন "আপনি যত বেশি খেলবেন, তত বেশি আপনি জিতবেন" আপনি একগুছ টিকিট দখল করবেন। লটারির কলটিতে আপনার প্রত্যাশিত প্রত্যাবর্তন আর এম / 20 নয়, তবে মোটামুটি কিছুটা বড়। এখন "লটারি জিতেছে" এর সাথে "টাইপ আই ত্রুটি তৈরি করে" প্রতিস্থাপন করুন।

যদি আপনি ত্রুটিগুলির বিষয়ে চিন্তা করেন না এবং আপনি বারবার এবং উপহাসের সাথে জেলিবিন সম্পর্কে একটি নির্দিষ্ট কার্টুনের দিকে আপনার দৃষ্টি আকর্ষণ করছেন না , তবে এগিয়ে যান এবং একাধিক তুলনার জন্য সামঞ্জস্য করবেন না।

"একই তথ্য" ইস্যুটি পরিবার-ভিত্তিক ত্রুটি সংশোধন পদ্ধতিতে উত্থাপিত হয় (উদাঃ বোনফেরোনি, হলম-সিডেক, ইত্যাদি), যেহেতু "পরিবার" ধারণাটি কিছুটা অস্পষ্ট। যাইহোক, মিথ্যা আবিষ্কারের রেট পদ্ধতিগুলি (যেমন: বেঞ্জামিনি এবং হচবার্গ, বেঞ্জামিনি এবং ইয়েউকেটেলি ইত্যাদি) এর এমন একটি সম্পত্তি রয়েছে যা তাদের ফলাফলগুলি বিভিন্ন গোপনীয়তার বিভিন্ন দল জুড়ে মজবুত।



α


2
একটি বিস্তৃত এবং হাস্যকর উত্তরের জন্য +1 (এবং xkcd উল্লেখ করার জন্য)। বিশেষত, আপনি আমার এখনও নিরপেক্ষ প্রশ্নটিও মোকাবিলা করেছেন যে "বনফেরনি-পরীক্ষা" এবং "বনফেরনি-সংশোধন" এর মধ্যে কোনও পার্থক্য রয়েছে কিনা। তবুও, আপনি আমার সমস্যার বর্ণনার ক্ষেত্রে একাধিক তুলনা সমস্যাটি ব্যাখ্যা করতে আপত্তি করবেন? আমি বুঝতে পারি যে একটি শ্রেণিবদ্ধ হ'ল কমিকের কোনও নীল / নীল / সবুজ / ... জেলি শিমের সাথে চিকিত্সা গোষ্ঠীর মতো।
ক্রিস

পিপি

আমি মনে করি এটি ঠিক আছে, আপনাকে অনেক ধন্যবাদ! আমার ব্যবহারের ক্ষেত্রে লটারির উদাহরণ প্রয়োগ করতে আমাকে আরও কিছুটা সময় নিতে পারে, তবে আমি ধারণাটি পেয়েছিলাম got
ক্রিস

@ ক্রিস বুঝতে পারে যে লটারিটি কেবল একটি রূপক ছিল। আপনার যদি FWER বা FDR পদ্ধতি প্রয়োগে সহায়তা প্রয়োজন হয়, উইকিপিডিয়া এন্ট্রিগুলি দেখুন, এখানে সম্পর্কিত প্রশ্নগুলি অনুসন্ধান করুন বা সম্ভবত, সে সম্পর্কে একটি নতুন প্রশ্ন জিজ্ঞাসা করুন। :)
অ্যালেক্সিস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.