ফ্রেডম্যান পরীক্ষার পরে কীভাবে সঠিকভাবে নিমেনিয় পোস্ট-হক পরীক্ষা করতে হবে


11

আমি একাধিক ডেটা সেটগুলিতে একাধিক অ্যালগরিদমের পারফরম্যান্স তুলনা করছি। যেহেতু এই পারফরম্যান্স পরিমাপগুলি সাধারণত বিতরণ করার গ্যারান্টিযুক্ত না, তাই আমি ডিমের (২০০ based ) ভিত্তিক নিমেনেই পোস্ট-হক পরীক্ষার সাথে ফ্রেডম্যান টেস্টটি বেছে নিয়েছি ।

আমি তখন অন্য একটি কাগজ পেয়েছি যা কোয়েড পরীক্ষার মতো অন্যান্য পদ্ধতিগুলি পরবর্তী শাফার পোস্ট-হক পরীক্ষার পরামর্শ ছাড়াও তারা নেমেনিয়ি পরীক্ষাটি আলাদাভাবে প্রয়োগ করে।

আমি কীভাবে নিমেনিয় পোস্ট-হক পরীক্ষা সঠিকভাবে প্রয়োগ করব?

১. স্টেনটিজড রেঞ্জ স্ট্যাটিস্টিক ব্যবহার করছেন?

ডেমারের কাগজে এটি নাল অনুমানকে বাতিল করতে বলেছে (দুটি অ্যালগরিদমের কোনও পারফরম্যান্সের পার্থক্য নেই) যদি গড় র‌্যাঙ্ক পার্থক্য critical with এর সাথে সমালোচনামূলক দূরত্বের সিডির চেয়ে বেশি হয়

CD=qαk(k+1)6N

"যেখানে সমালোচনামূলক মানগুলি Q enti by দ্বারা বিভক্ত স্টাডেন্টাইজড রেঞ্জের পরিসংখ্যানের ভিত্তিতে " "2.

কিছু খননের পরে আমি জানতে পেরেছি যে আপনি সেই "সমালোচনামূলক মানগুলি" নির্দিষ্ট বর্ণমালা হিসাবে সন্ধান করতে পারেন, উদাহরণস্বরূপ a জন্যα=0.05 একটি সারণীতে , স্বাধীনতার অসীম ডিগ্রির জন্য (প্রতিটি সারণির নীচে)।

2. বা সাধারণ বিতরণ ব্যবহার করে?

আমি যখন ভাবলাম আমি কী করব জানি, তখন আমি অন্য একটি কাগজ পেয়েছি যা আমাকে আবারও বিভ্রান্ত করেছে, কারণ তারা কেবলমাত্র সাধারণ বিতরণ ব্যবহার করছিল। ডেমার একটি অনুরূপ জিনিস পৃষ্ঠা 12 তে উল্লেখ করছেন:

এই পদ্ধতিগুলি ব্যবহার করে i-th এবং j-th শ্রেণিবদ্ধের সাথে তুলনা করার পরীক্ষার পরিসংখ্যানগুলি Z মানটি স্বাভাবিক বিতরণের টেবিল থেকে সংশ্লিষ্ট সম্ভাব্যতা fi nd করতে ব্যবহৃত হয়, যা পরে উপযুক্ত সাথে তুলনা করা হয় । একাধিক তুলনার জন্য ক্ষতিপূরণ দিতে The মানটি যেভাবে সামঞ্জস্য করে তা পরীক্ষাগুলিতে পৃথক ।

z=(RiRj)k(k+1)6N
αα

এই অনুচ্ছেদে তিনি সমস্ত অ্যালগরিদমকে একটি নিয়ন্ত্রণ অ্যালগরিদমের সাথে তুলনা করার বিষয়ে কথা বলছিলেন, তবে "একাধিক তুলনার জন্য ক্ষতিপূরণ দেওয়ার জন্য তারা যেভাবে সামঞ্জস্য করে ... তার চেয়ে আলাদা" মন্তব্যটিও নির্দেশ করে যে এটিও নিমেনিয় পরীক্ষা করতে হবে।

সুতরাং আমার কাছে যা যুক্তিযুক্ত বলে মনে হচ্ছে তা হল পরীক্ষার পরিসংখ্যান উপর ভিত্তি করে পি- ভ্যালু গণনা করা , যা সাধারণত বিতরণ করা হয় এবং মাধ্যমে বিভাজন করে সেইটিকে সংশোধন করে ।zk(k1)/2

যাইহোক, এটি নাল অনুমানকে প্রত্যাখ্যান করার জন্য সম্পূর্ণ আলাদা র‌্যাঙ্কের পার্থক্য অর্জন করে। এবং এখন আমি আটকে আছি এবং কোন পদ্ধতি প্রয়োগ করতে হবে তা জানি না। আমি সাধারণ বিতরণটি ব্যবহার করে তার দিকে দৃ strongly়ভাবে ঝুঁকছি , কারণ এটি আমার কাছে সহজ এবং আরও যৌক্তিক। আমারও সারণিতে মূল্যবোধ সন্ধান করার দরকার নেই এবং আমি নির্দিষ্ট তাত্পর্যপূর্ণ মানগুলিতে আবদ্ধ নই।

তারপরে আবার, আমি কখনও স্টুডেন্টাইজড রেঞ্জের পরিসংখ্যান নিয়ে কাজ করি নি এবং আমি এটি বুঝতে পারি না।

উত্তর:


5

আমিও এই প্রশ্নটি সন্ধান করতে শুরু করেছি।

পূর্বে উল্লিখিত হিসাবে, যখন আমরা প্রতিটি পরীক্ষার জন্য পি-মানগুলি গণনা করার জন্য সাধারণ বিতরণ ব্যবহার করি, তখন এই পি-মানগুলি একাধিক পরীক্ষাকে বিবেচনা করে না। এটি সংশোধন করতে এবং পরিবার-ভিত্তিক ত্রুটি হার নিয়ন্ত্রণ করতে, আমাদের কিছু সামঞ্জস্য প্রয়োজন need বনফেরনি, অর্থাত তাত্পর্য স্তরটি ভাগ করা বা পরীক্ষাগুলির সংখ্যার দ্বারা কাঁচা পি-মানগুলি গুণ করা, কেবলমাত্র একটি সম্ভাব্য সংশোধন। অন্যান্য বহু সংখ্যক পরীক্ষামূলক পি-মান সংশোধন রয়েছে যা অনেক ক্ষেত্রে রক্ষণশীল।

এই পি-মান সংশোধনগুলি অনুমানের পরীক্ষাগুলির নির্দিষ্ট কাঠামোটিকে বিবেচনা করে না।

আমি ক্রসকল-ওয়ালিস বা ফ্রেডম্যান পরীক্ষার মতো র‌্যাঙ্ক ট্রান্সফর্মড ডেটার পরিবর্তে মূল ডেটার পেয়ারওয়াইজের তুলনায় আরও বেশি পরিচিত। সেক্ষেত্রে, যা টুকি এইচএসডি পরীক্ষা, একাধিক তুলনার জন্য পরীক্ষার পরিসংখ্যান স্টুডেন্টাইজড রেঞ্জ বিতরণ অনুযায়ী বিতরণ করা হয়, যা স্বাধীন নমুনার অনুমানের অধীনে সমস্ত যুগল তুলনার জন্য বিতরণ। এটি মাল্টিভারিয়েট স্বাভাবিক বিতরণের সম্ভাবনার উপর ভিত্তি করে যা সংখ্যার একীকরণের মাধ্যমে গণনা করা যেতে পারে তবে সাধারণত টেবিল থেকে ব্যবহৃত হয়।

আমার ধারণা, যেহেতু আমি তত্ত্বটি জানি না, তা হ'ল স্টুডেনটাইজড পরিসীমা বিতরণকে টুকি এইচএসডি জুটিওয়ালা তুলনা করার মতোই র‌্যাঙ্ক পরীক্ষার ক্ষেত্রে প্রয়োগ করা যেতে পারে।

সুতরাং, (2) সাধারণ বিতরণ এবং একাধিক পরীক্ষার পি-মান সংশোধন এবং (1) স্ট্যাটিটিজড রেঞ্জ বিতরণগুলি পরীক্ষার পরিসংখ্যানগুলির আনুমানিক বিতরণ পাওয়ার দুটি ভিন্ন উপায়। তবে, যদি স্ট্যান্ডিনেটেড রেঞ্জ বিতরণ ব্যবহারের জন্য অনুমানগুলি সন্তুষ্ট হয়, তবে এটি আরও ভাল আনুমানিকতা সরবরাহ করা উচিত কারণ এটি সমস্ত জোড়াযুক্ত তুলনার নির্দিষ্ট সমস্যার জন্য ডিজাইন করা হয়েছে।


1

যতদূর আমি জানি, মাত্র ২ টি অ্যালগরিদমের সাথে তুলনা করার সময় ডেমার ফ্রিডম্যান + পোস্টহকের চেয়ে উইলকক্সন স্বাক্ষরিত র‌্যাঙ্ক পরীক্ষার পরামর্শ দেয় sugges আমি দুঃখের সাথে বলতে চাই যে আপনি যখন ডিমেয়ারকে কে -1 দিয়ে ভাগ করবেন তার অর্থ কী তা বোঝাবার সময় আপনার মতো বিস্মিত হয়ে পড়েছেন।


1
(কে -১) দ্বারা বিভাজন হ'ল আপনি যখন কোনও নিয়ন্ত্রণ পদ্ধতির বিরুদ্ধে একাধিক অ্যালগরিদম তুলনা করেন। তবে এটি প্রতিটি বনাম, তাই এনএক্সএন। বিভাজক অংশটি আমি বুঝতে পারি, তবে স্টাটিঞ্জযুক্ত রেঞ্জ বিতরণের সম্পর্ক আমার বোধগম্য।
সেন্ট্রি 14

@ সেন্ট্রি: আপনাকে অবশ্যই এখানে সমন্বয় ফ্যাক্টরের সাথে গুণ করতে হবে, গুণ নয়। উপরে আমার উত্তর দেখুন দয়া করে।
ক্রিস

0

আমি সাধারণ বা স্টুডেন্টেড টি-ডিস্ট্রিবিউশন থেকে পি-মানটি গণনা করব কিনা তাও জিজ্ঞাসাটি পেরিয়ে গিয়েছি। দুর্ভাগ্যক্রমে, আমি এখনও এর উত্তর দিতে পারি না, কারণ বিভিন্ন কাগজপত্র বিভিন্ন পদ্ধতিতে যোগাযোগ করে।

তবুও, সামঞ্জস্য করা পি-মানগুলি গণনা করার জন্য, আপনাকে সমন্বিত ফ্যাক্টরের সাথে অপরিশোধিত পি-মানটি গুণ করতে হবে, যেমন একটি নিয়ন্ত্রণ পদ্ধতি বা পি * ((কে * (কে -1) এর সাথে তুলনা করার ক্ষেত্রে পি * (কে -1) )) / 2) এনএক্সএন তুলনার জন্য।

অ্যাডজাস্টমেন্ট ফ্যাক্টর দ্বারা আপনার যা ভাগ করা উচিত তা হ'ল আলফা মান, যদি অযৌক্তিক পি এর সাথে তুলনা করা হয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.