অসম বৈকল্পিকতা অধীনে মান-হুইটনি নাল অনুমান


9

আমি মান-হুইটনি ইউ পরীক্ষার নাল অনুমানের সম্পর্কে কেবল কৌতূহলী। আমি প্রায়শই দেখতে পাই যে নাল অনুমানটি হল যে দুটি জনসংখ্যার সমান বন্টন রয়েছে। তবে আমি ভাবছি - যদি আমার একই গড় কিন্তু অত্যন্ত অসম বৈকল্পিকতা সহ দুটি সাধারণ জনসংখ্যা থাকে তবে মান-হুইটনি পরীক্ষা সম্ভবত এই পার্থক্যটি সনাক্ত করতে পারে না।

আমি এও দেখেছি যে মান-হুইটনি পরীক্ষার নাল অনুমানটি হ'ল বা এক জনসংখ্যার ( এক্স ) থেকে পর্যবেক্ষণের সম্ভাবনা দ্বিতীয় জনসংখ্যার ( ওয়াই ) থেকে পর্যবেক্ষণকে ছাড়িয়ে যায় (পরে) বন্ধন বর্জন) 0.5 এর সমান। এটি কিছুটা আরও বোধগম্য মনে হয় তবে আমি যে প্রথম নাল অনুমানটি বলেছিলাম তার সমান মনে হয় না।Pr(X>Y)=0.5XY

আমি এটি অবিচ্ছিন্নভাবে কিছুটা সাহায্য পাওয়ার আশা করছি। ধন্যবাদ!

উত্তর:


5

মান-হুইটনি পরীক্ষাটি ক্রমুয়েশন পরীক্ষার একটি বিশেষ ক্ষেত্রে (শূন্যের অধীনে বন্টন তথ্যের সমস্ত সম্ভাব্য ক্রমগুলি দেখে নেওয়া হয়) এবং অনুক্রমের পরীক্ষাগুলিতে অভিন্ন ডিস্ট্রিবিউশন হিসাবে নাল থাকে, সুতরাং এটি প্রযুক্তিগতভাবে সঠিক।

মান-হুইটনি পরীক্ষার পরিসংখ্যানগুলির চিন্তার এক উপায় হ'ল এক গোষ্ঠীর থেকে এলোমেলোভাবে নির্বাচিত মান অন্য গ্রুপের থেকে এলোমেলোভাবে নির্বাচিত মানের চেয়ে বহুগুণ বেশি। সুতরাং পি (এক্স> ওয়াই) = 0.5 এটিও বোধগম্য এবং এটি প্রযুক্তিগতভাবে সমান বন্টন নালীর সম্পত্তি (অবিচ্ছিন্ন বিতরণগুলি ধরে নেওয়া যেখানে টাইয়ের সম্ভাবনা 0 থাকে)। যদি 2 টি বিতরণ একই হয় তবে এক্স এর Y এর চেয়ে বৃহত্তর হওয়ার সম্ভাবনা 0.5 কারণ তারা উভয়ই একই বিতরণ থেকে আঁকা।

2 টি বিতরণের একই গড় থাকলেও বিস্তৃত ভিন্ন রূপগুলি 2 য় নাল হাইপোথিসিসের সাথে মেলে তবে অভিন্ন ডিস্ট্রিবিউশনের প্রথম নয়। এক্ষেত্রে পি-মানগুলির সাথে কী ঘটে যায় তা দেখার জন্য আমরা কিছু সিমুলেশন করতে পারি (তত্ত্বের ভিত্তিতে সেগুলি সমানভাবে বিতরণ করা উচিত):

> out <- replicate( 100000, wilcox.test( rnorm(25, 0, 2), rnorm(25,0,10) )$p.value )
> hist(out)
> mean(out < 0.05)
[1] 0.07991
> prop.test( sum(out<0.05), length(out), p=0.05 )

        1-sample proportions test with continuity correction

data:  sum(out < 0.05) out of length(out), null probability 0.05
X-squared = 1882.756, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.05
95 percent confidence interval:
 0.07824054 0.08161183
sample estimates:
      p 
0.07991 

সুতরাং স্পষ্টতই এটি তার চেয়ে বেশি বার প্রত্যাখ্যান করছে এবং নাল অনুমানটি মিথ্যা (এটি বিতরণের সাম্য্যের সাথে মেলে তবে প্রোব = 0.5 নয়)।

এক্স> ওয়াইয়ের সম্ভাবনার দিক বিবেচনা করে কিছু আকর্ষণীয় সমস্যা দেখা দেয় যদি আপনি কখনও জনগণের তুলনা করেন যা এফ্রন ডাইসের উপর ভিত্তি করে ।


হাই গ্রেগ, উত্তরের জন্য আপনাকে ধন্যবাদ। মনে হচ্ছে আপনি যা বলছেন তা হ'ল আমি এমন একটি বিশেষ ক্ষেত্রে পেয়েছি যেখানে পরীক্ষা সমান বন্টন শূন্যের অধীনে সঠিকভাবে কাজ করে না। এবং তদতিরিক্ত, আমি যে নাল অনুমানগুলি বলেছি সেগুলি সমান নয়। এটা কি ঠিক?
জিম্জ

4

মান-হুইটনি সমান গড়ের সাথে বৈকল্পিক পরিবর্তনের ক্ষেত্রে সংবেদনশীল নয়, তবে এটি হতে পারে - আপনি যেমনটি ফর্মের সাথে দেখেন , পার্থক্যগুলি সনাক্ত করে যা কে থেকে বিচ্যুত করতে পরিচালিত করে (যেমন: যেখানে উভয় গড় এবং বৈকল্পিক একসাথে বৃদ্ধি পায়)। বেশ স্পষ্টত যদি আপনার দুটি সমান গড়ের গড় থাকে তবে তাদের পার্থক্যগুলি শূন্যের প্রতিসাম্যপূর্ণ। অতএব , যা নাল পরিস্থিতি।P(X>Y)=0.5P(X>Y)0.5P(X>Y)=P(XY>0)=12

উদাহরণস্বরূপ, যদি আপনার এর বন্টন গড় দিয়ে ঘনিষ্ঠ হয় তবে এর সাথে কেওর (একটি স্কেল পরিবর্তন) দিয়ে তাত্পর্যপূর্ণ বিতরণ থাকে , মান-হুইটনি তার প্রতি সংবেদনশীল (সত্যই, উভয় পক্ষের লগ গ্রহণ করে, এটি কেবল একটি অবস্থান-শিফট এবং মান-হুইটনি একঘেয়ে রূপান্তর দ্বারা প্রভাবিত নয়)।Y1Xk

-

আপনি যদি সেই পরীক্ষাগুলিতে আগ্রহী হন যা মান-হুইটনির সাথে ধারণাগতভাবে খুব মিল থাকে যা মিডিয়ানদের সাম্যের অধীনে ছড়িয়ে দেওয়ার পার্থক্যের প্রতি সংবেদনশীল হয় তবে এরকম বেশ কয়েকটি পরীক্ষা রয়েছে।

সেখানে সিগেল-টুকি পরীক্ষা এবং আনসারী-ব্র্যাডলি পরীক্ষা রয়েছে, উদাহরণস্বরূপ, উভয়ই মান-হুইটনি-উইলকক্সন দুটি নমুনা পরীক্ষার সাথে ঘনিষ্ঠভাবে জড়িত।

তারা উভয়ই প্রান্ত থেকে র‌্যাঙ্কিংয়ের প্রাথমিক ধারণার ভিত্তিতে।

আপনি যদি আর ব্যবহার করেন তবে আনসারী-ব্র্যাডলি পরীক্ষাটি অন্তর্নির্মিত ... ?ansari.test

সিয়াগেল-টুকি কার্যকরভাবে নমুনা থেকে আলাদাভাবে গণনা করা র‌্যাঙ্কগুলিতে একটি মান-হুইটনি-উইলকক্সন পরীক্ষা করে; আপনি যদি ডেটা নিজেই র‌্যাঙ্ক করেন তবে পি-ভ্যালুগুলির জন্য আপনার আলাদা আলাদা ফাংশন দরকার নেই। তবুও, আপনি এখানে কিছু খুঁজে পেতে পারেন:

http://www.r-statistics.com/2010/02/siegel-tukey-a-non-parametric-test-for-equality-in-variability-r-code/

-

(আমার মূল উত্তরের অধীনে ttnphns এর মন্তব্যে)

আপনার বিশেষ প্রতিক্রিয়াতে @ গ্রেগসনোর সাথে মতবিরোধ হিসাবে এটি পড়ার জন্য আপনি আমার প্রতিক্রিয়াটিকে অতিরিক্ত ব্যাখ্যা করবেন। আমরা যে বিষয়ে কথা বলছি তাতে অবশ্যই কিছুটা জোর দেওয়া এবং কিছুটা হলেও পার্থক্য রয়েছে তবে এর পিছনে যদি সত্যিকারের মতপার্থক্য থাকে তবে আমি খুব অবাক হব।

মান এবং হুইটনি উদ্ধৃত করা যাক: " এবং এর আপেক্ষিক র‌্যাঙ্কের উপর নির্ভর করে একটি পরিসংখ্যান কে হাইপোথিসিস পরীক্ষার জন্য প্রস্তাব করা হয়েছে " এটি দ্ব্যর্থহীন; এটি সম্পূর্ণরূপে @ গ্রেগসনোর অবস্থান সমর্থন করে।Uxyf=g

এখন, যাক কিভাবে পরিসংখ্যাত নির্মাণ হয়: " যাক যতবার গণনা একটি আগে বসেছে একটি ।Uyx " এখন যদি তাদের নাল সত্য, যে ঘটনা সম্ভাব্যতা ... কিন্তু ০.০ এর সম্ভাব্যতা পাওয়ার অন্যান্য উপায় রয়েছে এবং সেই দিক থেকে এমন একটি সিদ্ধান্ত নেওয়া যেতে পারে যে পরীক্ষাটি অন্যান্য পরিস্থিতিতে কাজ করতে পারে। তারা যে পরিমাণে (পুনঃ-মাপা) সম্ভাবনাটি অনুমান করছেন যে > এটি আমার বক্তব্যকে সমর্থন করে।12YX

তবে, তাত্পর্যপূর্ণ স্তরগুলি ঠিক সঠিক হওয়ার গ্যারান্টিযুক্ত হওয়ার জন্য, শূন্য বিতরণের সাথে মেলে আপনার বিতরণ প্রয়োজন। এটি এবং গ্রুপ-লেবেলের লেবেলের শূন্যের নীচে সম্মিলিত পর্যবেক্ষণগুলিতে সমস্ত ক্রম সমান সম্ভাবনা বলে অনুমান করে তৈরি হয়েছিল। এটি অবশ্যই অধীনে কেস । ঠিক যেমনটি গ্রেগসনো বলেছেন।UXYf=g

প্রশ্নটি কতটা সীমাবদ্ধ তা হল (উদাহরণস্বরূপ যে পরীক্ষার পরিসংখ্যানগুলির বিতরণ আরও সাধারণভাবে প্রকাশিত শূন্যতার জন্য, বা আনুমানিক তাই অনুমানের অধীনে উত্পন্ন একের সাথে মেলে )।f=g

আমি বিশ্বাস করি যে এটি অনেক পরিস্থিতিতেই ঘটে; বিশেষত এমন পরিস্থিতিতে যেমন আপনি বর্ণনা করেছেন তার চেয়ে বেশি সাধারণ (একই গড়ের সাথে দুটি সাধারণ জনসংখ্যা তবে অত্যন্ত অসম বৈকল্পিক পদগুলির উপর ভিত্তি করে ফলাফল বিতরণকে পরিবর্তন না করে কিছুটা সাধারণ করা যেতে পারে), আমি বিশ্বাস করি পরীক্ষার পরিসংখ্যানের বিতরণ এটি বিতরণ করা হয়েছে যার অধীনে একই বিতরণ রয়েছে এবং এটির জন্য বৈধ হওয়া উচিত turns আমি কিছু সিমুলেশন করেছি যা মনে হয় এটি সমর্থন করে। তবে এটি সর্বদা খুব কার্যকর পরীক্ষা হবে না (এটির শক্তি কম থাকতে পারে)।

আমি কোনও প্রমাণ দিচ্ছি না যে এই ঘটনাটি। আমি কিছু স্বজ্ঞাততা / হাত-avyেউয়ের যুক্তি প্রয়োগ করেছি এবং কিছু বুনিয়াদি সিমুলেশনও করেছি যা এটিকে সত্য বলে প্রস্তাব করে - যে মান-হুইটনি কাজ করে (যেটিতে এটি নালীর নীচে 'ডান' বিতরণ করে) যখন ।f=g

আপনি যা চাইবেন তা তৈরি করুন, তবে আমি এটি @ গ্রেগসনোর সাথে মতানৈক্য হিসাবে বিবেচনা করি না

উল্লেখ - মান এবং হুইটনি এর মূল কাগজ


আমি তোমাকে পাবো কি সেটা ঠিক বলেছি আপনি উইকিপিডিয়ার মান-হুইটনি আলাপ পাতা থেকে এই শব্দের সঙ্গে একমত: the null hypothesis of Mann-Whitney U-test is not about the equality of distributions. Is is about the symmetry between two populations with respect to the probability of obtaining a larger observation। এবং তাই আপনি @ গ্রেগের উত্তরটির সাথে একমত নন, ঠিক?
ttnphns

আমি সম্পাদনায় কিছু আলোচনা যোগ করেছি।
গ্লেন_বি -মিনিকা

খুব সুন্দর সংযোজন। আমি এটি অধ্যয়ন করব (আমার সর্বদা মনে হয়েছিল যেন এমডব্লু টেস্টে কোনও ঘাটতি রয়েছে যা আমাকে বিস্মৃত করে চলেছে)। এদিকে, আপনি কি এই বিষয়ে সম্মতি দিবেন যদি আমি বলে থাকি: "যেহেতু মেগাওয়াট পরীক্ষার পরিসংখ্যানগুলি গড় পরিমাপের সামঞ্জস্যের (মধ্যে) প্রতিফলন করে , তখন situations = g [আমি f, g কে মূল বন্টন হিসাবে বুঝতে পারি, পূর্বের র‌্যাঙ্কিং] থাকতে পারে তবে তবে পরীক্ষাটি নিবিড়হীন পুরোপুরি প্রাসঙ্গিক কারণ এফ = জি এর অধীনে একই H0 নিয়ে কাজ করে চলেছে such এই জাতীয় পরিস্থিতির উদাহরণস্বরূপ স্প্রেড প্যারামিটার (বৈকল্পিকতা) ব্যতীত সম্পূর্ণ প্রতিসাম্যিক বিতরণ বিতরণ ।
ttnphns

স্বরলিপিটিতে (মান এবং হুইটনিজ দ্য ওয়ে), এবং হ'ল এবং ঘনত্ব । আমি তাতে একমত হই যে আমি যতটা পরিস্থিতি যাচাই / বুঝেছি, আপনার বক্তব্যটি কেস হিসাবে উপস্থিত হবে। আমার সন্দেহ হয় যে মান-হুইটনি সম্পর্কে আমার কাছে আরও কিছু আছে still fgXY
গ্লেন_বি -রিনস্টেট মনিকা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.