আনপায়ার্ড টি-টেস্টের পরিবর্তে উইলকক্সন র‌্যাঙ্ক-সাম টেস্ট কখন ব্যবহার করবেন?


26

এটি ফ্রাঙ্ক হ্যারেল এখানে যা লিখেছিল তার ফলোআপ প্রশ্ন :

আমার অভিজ্ঞতায় টি বিতরণের সঠিক হওয়ার জন্য প্রয়োজনীয় নমুনার আকারটি প্রায়শই হাতের নমুনার আকারের চেয়ে বড়। উইলকক্সন স্বাক্ষরিত-র‌্যাঙ্ক পরীক্ষাটি আপনার দক্ষতা অনুসারে অত্যন্ত দক্ষ এবং এটি দৃust়, তাই আমি প্রায় সবসময়ই এটি টি পরীক্ষার চেয়ে বেশি পছন্দ করি prefer

যদি আমি এটি সঠিকভাবে বুঝতে পারি - দুটি তুলনামূলক নমুনার অবস্থানের তুলনা করার সময়, আমাদের নমুনার আকারগুলি যদি ছোট হয় তবে আমরা অবিযুক্ত টি-টেস্টের উপর উইলকক্সন র‌্যাঙ্ক-সামনের পরীক্ষাটি ব্যবহার করতে পছন্দ করব।

এমন কোন তাত্ত্বিক পরিস্থিতি আছে যেখানে আমরা অবিযুক্ত টি-টেস্টের চেয়ে উইলকক্সন র‌্যাঙ্ক-সামনের পরীক্ষাকে পছন্দ করব, এমনকি আমাদের দুই গ্রুপের নমুনা আকার তুলনামূলকভাবে বড়?

এই প্রশ্নের জন্য আমার অনুপ্রেরণা পর্যবেক্ষণ থেকে উদ্ভূত যে একক নমুনা টি-পরীক্ষার জন্য, এটি স্কিভ বিতরণের খুব অল্প-ছোট নমুনার জন্য এটি ব্যবহার করা ভুল ধরণের আই ত্রুটি অর্জন করবে:

n1 <- 100
mean1 <- 50
R <- 100000
P_y1 <- numeric(R)
for(i in seq_len(R))
{
    y1 <- rexp(n1, 1/mean1)
    P_y1[i] <- t.test(y1 , mu = mean1)$p.value
}
sum(P_y1<.05) / R # for n1=n2=100 -> 0.0572  # "wrong" type I error

1
আমার কাছে, 0.0572 0.05 এর কাছাকাছি মনে হচ্ছে।
999

হাই মার্ক - নাল অনুমানের 100000 পুনরাবৃত্তির অধীনে পরিচালিত হলে, আমরা 0.05 থেকে এই স্তরটির পার্থক্য পাওয়ার আশা করি না। সাধারণত আমরা 0.05 থেকে দুই বার স্কয়ার্ট (0.05 * 0.95 / 100000) এর মতো প্লাস
বিয়োগের কিছুটির

1
আমি একমত যে এটি ভুল ছিল। আমি কেবল বোঝাই যে এটি ব্যবহারিক উদ্দেশ্যে যথেষ্ট কাছাকাছি মনে হচ্ছে।
999

1
একটি সম্পর্কিত প্রশ্ন: টি-টেস্ট বা নন-প্যারামেট্রিক পরীক্ষার মধ্যে কীভাবে চয়ন করবেন যেমন ছোট নমুনায় উইলকক্সন , যা জোড়যুক্ত এবং অযৌক্তিক উভয় পরীক্ষাকে বিবেচনা করে পাশাপাশি ব্রুনার-মুনজেলের মতো উইলকক্সনের বিকল্পগুলিও বিবেচনা করে। ফ্র্যাঙ্ক হ্যারেলের একটি দুর্দান্ত উত্তর রয়েছে যা ব্যাখ্যা করে যে কেন তিনি তার পদ্ধতির উপরের এক্সট্র্যাক্টের চেয়ে আরও বিশদভাবে ন্যায়সঙ্গত বোধ করেন (উদাহরণস্বরূপ, একঘেয়ে রূপান্তরের অধীনে র‌্যাঙ্কের অদম্যতার গুরুত্ব)।
সিলভার ফিশ

@ টালগালিলি: আপনি টি-পরীক্ষা করছেন এবং স্বাভাবিকতা অনুমান লঙ্ঘিত হয়েছে তা বিবেচনা করে আপনি কেন এই স্তরটির পার্থক্য পাওয়ার আশা করবেন না (আমি দেখতে পাচ্ছি যে আপনার নমুনাটি তাত্পর্যপূর্ণভাবে বিতরণ করা হয়েছে)? আমি এখানে একটি নবজাতক দৃষ্টিকোণ থেকে জিজ্ঞাসা করছি। যখন আমরা স্বাভাবিকতা অনুমান লঙ্ঘন করা হয় তখন আমরা কেবলমাত্র কী প্রত্যাশা করছি তা বোঝার চেষ্টা করছি a গড় টাইপ আই ত্রুটিটি 5% এর চেয়ে ছোট বা 5% এর চেয়ে বড় বা কোনও কিছুর হতে হবে? আমি এটি যেভাবে দেখছি, আমরা যা করছি তা হ'ল এবং বিতরণটি স্বাভাবিক। এইচ0:μ=50
এরোজেনিন

উত্তর:


23

হ্যা এখানে. উদাহরণস্বরূপ, অসীম বৈচিত্র সহ বিতরণ থেকে যে কোনও নমুনা টি-টেস্ট নষ্ট করবে, তবে উইলকক্সন নয়। ননপ্যারমেট্রিক স্ট্যাটিস্টিকাল মেথডস (হল্যান্ডার এবং ওল্ফ) উল্লেখ করে দেখলাম যে টি পরীক্ষার সাথে সম্পর্কিত উইলকক্সনের অ্যাসিপটোটিক আপেক্ষিক দক্ষতা (এআরই) ইউনিফর্ম বিতরণের জন্য 1.0, লজিস্টিকের জন্য 1.097 (অর্থাৎ উইলকক্সন আরও ভাল) ডাবল এক্সফোনেনশিয়াল (ল্যাপ্লেস) এবং এক্সপেনশিয়ালের জন্য 3.0।

হজস এবং লেহম্যান দেখিয়েছেন যে অন্য কোনও পরীক্ষার তুলনায় উইলকক্সনের ন্যূনতম এআরই 0.864, তাই আপনি অন্য যে কোনও কিছুর তুলনায় প্রায় 14% এর বেশি দক্ষতা হারাতে পারবেন না। (অবশ্যই, এটি একটি অ্যাসিম্পটোটিক ফলাফল)) ফলস্বরূপ, ফ্রাঙ্ক হ্যারেলের উইলকক্সনকে ডিফল্ট হিসাবে ব্যবহার করা সম্ভবত আমার সহ প্রায় সবাই গ্রহণ করা উচিত।

সম্পাদনা: মন্তব্যে ফলোআপ প্রশ্নের জবাব দেওয়া, যারা আত্মবিশ্বাসের ব্যবধানগুলিকে পছন্দ করেন তাদের জন্য, হজস-লেহম্যান অনুমানকারী এমন এক অনুমানকারী যা উইলকক্সন পরীক্ষার সাথে "সামঞ্জস্যপূর্ণ" এবং আশেপাশের আত্মবিশ্বাসের অন্তরগুলি তৈরি করা যেতে পারে।


1
উইলকক্সন পরীক্ষাটি ব্যবহার করা হলে আত্মবিশ্বাসের ব্যবধান পাওয়ার কী সহজ উপায় আছে? এটি পি-ভ্যালুতে প্যারামেট্রিক পদ্ধতিতে আরও বেশি জোর দেওয়ার জন্য জনগণকে উত্সাহিত করে বলে মনে হচ্ছে।
999

হ্যাঁ, হজস-লেহম্যান অনুমানক প্রাসঙ্গিক অনুমানক এবং আমি প্রতিক্রিয়ার মূল অংশটি সম্পাদনা করেছি যাতে ভবিষ্যতের পাঠকদের যাতে মন্তব্যগুলির মধ্যে না যেতে হয়।
jboman

ধন্যবাদ জোবোম্যান আমি হজস-লেহম্যান আনুমানিকের সাথে পরিচিত নই, তবে আমি এটি সম্পর্কে কী জানতে পারি তা দেখতে পাবে।
999

3
biostat.mc.vanderbilt.edu/WilcoxonSoftware হজস-লেহম্যান অনুমান এবং এর আত্মবিশ্বাসের ব্যবধান পেতে কীভাবে আর ব্যবহার করতে হয় তা দেখায়।
ফ্রাঙ্ক হ্যারেল

1
(+1) অবিচলিত এন্টি-র‌্যাঙ্কের সনাতনবাদী from তবে র‌্যাঙ্ক পরীক্ষার জন্য একটি চ্যালেঞ্জ হ'ল অনুমানটি অস্পষ্ট। এটি সাধারণত টি-টেস্টের মতো একই অনুমান নয়। টি-টেস্ট সর্বদা গড় পার্থক্য পরীক্ষা করে, উইলকক্সন একটি ওজনযুক্ত গড় র‌্যাঙ্ক পার্থক্য পরীক্ষা করে। অবশ্যই যদি র‌্যাঙ্ক-গড় পার্থক্যটি পরিসংখ্যানগতভাবে তাত্পর্যপূর্ণ হয় তবে আমরা জানি যে বিতরণগুলি পৃথক হতে হবে, এমনকি যদি তাদের উপায়গুলি একই হয়। আমরাও পরীক্ষা distributional পার্থক্য সনাক্ত করতে চালিত হয় সব ক্ষেত্রেই। আমি কেবল ততটাই বলি কারণ আমি ব্যাখ্যার পক্ষে। (1/2)
অ্যাডামো

24

আপনার এই প্রশ্নের মন্তব্যে আমাকে আমাদের আলোচনায় ফিরিয়ে আনতে দিন । উইলকসন সম-র‌্যাঙ্ক পরীক্ষা মান-হুইটনি ইউ পরীক্ষার সমতুল্য (এবং এর চেয়ে দু'র বেশি নমুনার জন্য সরাসরি সম্প্রসারণকে ক্রুসকল-ওয়ালিস পরীক্ষা বলা হয়)। আপনি উইকিপিডিয়ায় পাশাপাশি এই লেখায় দেখতে পারেন যে মান-হুইটনি (বা কৃস্কাল-ওয়ালিস) সাধারণত অর্থ বা মধ্যমাধ্যায়ের তুলনা করে না। এটি মানগুলির সামগ্রিক বিস্তারের তুলনা করে: নমুনাগুলির মধ্যে কোনটি "স্টোচাস্টিকালি আরও বড়"। পরীক্ষাটি বিতরণ-মুক্ত। টি-টেস্টের অর্থ তুলনা। এটি সাধারণ বিতরণ অনুমান করে। সুতরাং, পরীক্ষাগুলি বিভিন্ন অনুমানের সাথে জড়িত। বেশিরভাগ ক্ষেত্রে, আমরা নির্দিষ্ট উপায়ে তুলনা করার পরিকল্পনা করি না, বরং মানগুলি দ্বারা কোন নমুনা বেশি তা আমরা জানতে চাই এবং এটি মান-হুইটনি আমাদের জন্য ডিফল্ট পরীক্ষা করে তোলে। অন্যদিকে, যখন উভয় বিতরণগুলি প্রতিসম হয় তখন একটি নমুনা অন্য দুটি পদ্ধতির সাথে তুলনামূলকভাবে অন্য ডিগ্রেশনর চেয়ে "বৃহত্তর" কিনা তা পরীক্ষা করার কাজ করে এবং তারপরে, বিতরণগুলি সমান বৈকল্পের সাথে স্বাভাবিক হলে টি-টেস্ট কিছুটা হয়ে যায় আরো শক্তিশালী.


অনুমানের পরীক্ষা করা হচ্ছে তার অর্থের সাথে আপনার উত্তরটি বেঁধে রাখার জন্য +1।
জোশ হেম্যান

"নমুনাগুলির মধ্যে কোনটি" স্টোচাস্টিক্যালি বৃহত্তর "" দ্বারা বোঝানো হয়, আপনি কি "নমুনাগুলির মধ্যে একটি সাধারণত অন্যের তুলনায় বেশি মান গ্রহণ করেন"? যদি না হয়, আপনার মানে কি? আপনি কি আরও একটু এখানে বিস্তারিত বলতে পারেন?
এরদোগান সিইভিভার

1
@ এরদোগান, হ্যাঁ, আমরা যেমন বলেছিলাম তেমন বলতে পারি। কঠোর শব্দটি হ'ল: এলোমেলোভাবে বেছে নেওয়া বস্তুর জোড়া, প্রতিটি নমুনা থেকে একটিতে, "স্টোকাসটিক্যালি আরও প্রভাবশালী" নমুনা থেকে প্রাপ্ত বস্তুটি সম্ভাব্যতা> ০.০ সহ অন্যান্য নমুনার চেয়ে বস্তুর চেয়ে বেশি (মান দ্বারা) হবে।
ttnphns
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.