উইলকক্সনের স্বাক্ষরিত র‌্যাঙ্ক পরীক্ষার যথাযথতা


11

আমি ক্রস যাচাইকৃত সংরক্ষণাগারগুলিতে কিছুটা তাকিয়েছি এবং আমার প্রশ্নের উত্তর খুঁজে পেয়েছে বলে মনে হচ্ছে না। আমার প্রশ্নটি নীচে: উইকিপিডিয়া তিনটি অনুমান দিয়েছে যা উইলকক্সনের স্বাক্ষরিত র‌্যাঙ্ক পরীক্ষার জন্য রাখা দরকার (আমার প্রশ্নের জন্য কিছুটা সংশোধন করা):

আই = 1, ..., এন এর জন্য জিৎ = শি-ই'য় আসুন।

  1. জি পার্থক্যগুলি স্বাধীন বলে ধরে নেওয়া হয়।

  2. (ক।) প্রতিটি জি একই অবিচ্ছিন্ন জনসংখ্যার থেকে আসে এবং (খ) প্রতিটি জি একটি সাধারণ মধ্যম সম্পর্কে প্রতিসম হয়;

  3. একাদশ এবং ইয়ি যে মানগুলি উপস্থাপন করে সেগুলি অর্ডার করা হয় ... সুতরাং 'এর চেয়ে বড়', 'এর চেয়ে কম', এবং 'সমান' এর তুলনা দরকারী।

আর এর মধ্যে উইলকক্স.স্টেস্টের ডকুমেন্টেশনগুলি অবশ্য ইঙ্গিত দেয় যে (২. বি) আসলে এমন কিছু যা প্রক্রিয়া দ্বারা পরীক্ষা করা হয়:

"... যদি x এবং y উভয়ই দেওয়া হয় এবং যুক্ত করা হয়, সত্য, উইলকক্সন শূন্যতার শূন্য রেকর্ড পরীক্ষা করে যে এক্স - ওয়াইয়ের (জোড়যুক্ত দুটি নমুনা ক্ষেত্রে) বিতরণটি মিউ সম্পর্কে সমান্তরিত হয়" "

আমাকে এই শব্দ যেন পরীক্ষা নাল হাইপোথিসিস যে, "টু Z symetrically প্রায় মধ্যমা মিউ = SomeMu বিতরণ করা হয়" জন্য সঞ্চালিত হয় - যেমন নাল ফো প্রত্যাখ্যান হতে পারে যে পারেন প্রতিসাম্য প্রত্যাখ্যানের বা প্রত্যাখ্যানের যে মিউ যা প্রায় জেড হ'ল প্রতিসম হয় সাম্মু।

এটি কি উইলকক্স.টেস্টের জন্য আর ডকুমেন্টেশনের সঠিক বোঝাপড়া? অবশ্যই এটি গুরুত্বপূর্ণ হওয়ার কারণটি হ'ল আমি পূর্বের ও পরে কিছু তথ্যের (উপরের "এক্স" এবং "ওয়াই") উপর বেশ কয়েকটি জোড়-পার্থক্য পরীক্ষা করে চলেছি। পৃথকভাবে "আগে" এবং "পরে" ডেটা অত্যন্ত স্কিউড হয় তবে পার্থক্যগুলি প্রায় ততটা স্কিউড হয় না (যদিও এখনও কিছুটা স্কিউড করা হয়)। এর অর্থ আমার অর্থ যে "আগে" বা "পরে" ডেটা একাকী বিবেচিত ske 7 থেকে 21 (আমি যে নমুনাটি দেখছি তার উপর নির্ভর করে), যখন "পার্থক্যগুলি" ডেটাতে স্নিগ্ধতা রয়েছে 0.5 = 0.5 থেকে 5. তবুও স্কিউ, কিন্তু প্রায় হিসাবে না।

যদি আমার "পার্থক্য" ডেটাতে স্নিগ্ধতা থাকার কারণে উইলকক্সন পরীক্ষা আমাকে মিথ্যা / পক্ষপাতমূলক ফলাফল দেয় (যেমন উইকিপিডিয়া নিবন্ধটি ইঙ্গিত করে বলে মনে হয়), তবে স্কিউনেস বড় উদ্বেগের কারণ হতে পারে। তবে, উইলকক্সন পরীক্ষাগুলি যদি প্রকৃতপক্ষে এই পার্থক্যগুলি বিতরণকে "মিউ = সাম্মু-এর আশেপাশের প্রতিসাম্য" কিনা (যেমন? উইলকক্স.স্টেস্ট বলে মনে হয়) কিনা তা পরীক্ষা করে দেখছে তবে এটি উদ্বেগের কম নয়।

এইভাবে আমার প্রশ্নগুলি হ'ল:

  1. উপরের কোন ব্যাখ্যাটি সঠিক? আমার "পার্থক্য" বিতরণে স্কিউনেস কি আমার উইলকক্সন পরীক্ষার পক্ষপাতিত্ব করে?

  2. যদি বক্রতা হয় একটি উদ্বেগের বিষয়: "কত বক্রতা একটি উদ্বেগের বিষয় হল"

  3. যদি উইলকসন স্বাক্ষরিত র‌্যাঙ্ক পরীক্ষাগুলি এখানে গুরুতরভাবে অনুপযুক্ত বলে মনে হচ্ছে, আমার কী ব্যবহার করা উচিত তার জন্য কোনও পরামর্শ?

অনেক ধন্যবাদ. আমি কীভাবে এই বিশ্লেষণটি করতে পারি সে সম্পর্কে আপনার যদি আরও কোনও পরামর্শ থাকে তবে সেগুলি শুনে আমি আরও বেশি খুশি (যদিও আমি সে উদ্দেশ্যে আরও একটি থ্রেডও খুলতে পারি)। এছাড়াও, ক্রস ভ্যালিডেটে এটি আমার প্রথম প্রশ্ন; আমি কীভাবে এই প্রশ্নটি জিজ্ঞাসা করেছি সে সম্পর্কে আপনার যদি পরামর্শ / মন্তব্য থাকে তবে আমিও এটির জন্য উন্মুক্ত!


সামান্য ব্যাকগ্রাউন্ড: আমি একটি ডেটাসেট বিশ্লেষণ করছি যাতে আমি যা বলব তার উপর পর্যবেক্ষণ রয়েছে "দৃ production় উত্পাদনের ত্রুটি"। আমার বিস্মিত পরিদর্শনের আগে এবং পরে উত্পাদন প্রক্রিয়াতে ত্রুটিগুলি সম্পর্কে একটি পর্যবেক্ষণ রয়েছে এবং বিশ্লেষণের একটি লক্ষ্য এই প্রশ্নের উত্তর দেওয়া, "তদন্তের ত্রুটিগুলির প্রমাণিত সংখ্যার মধ্যে কোনও পার্থক্য রয়েছে কি?"

ডেটা সেটটি দেখতে এমন কিছু দেখাচ্ছে:

ID, errorsBefore, errorsAfter, size_large, size_medium, typeA, typeB, typeC, typeD
0123,1,1,1,0,1,1,1,0 
2345,1,0,0,0,0,1,1,0
6789,2,1,0,1,0,1,0,0
1234,8,8,0,0,1,0,0,0

মোটামুটি 4000 পর্যবেক্ষণ আছে। অন্যান্য পরিবর্তনশীল হ'ল সংঘের বৈশিষ্ট্যগুলি বর্ণনাকারী ক্যাটাগরিয়াল পর্যবেক্ষণ। আকার ছোট, মাঝারি বা বড় হতে পারে এবং প্রতিটি ফার্ম এইগুলির মধ্যে একটি এবং কেবল একটি। ফার্মগুলি যে কোনও বা সমস্ত "প্রকারের" হতে পারে।

সমস্ত সংস্থাগুলি এবং বিভিন্ন সাব-গ্রুপিংয়ের (পরিমাপ ও প্রকারের ভিত্তিতে) পরিদর্শন করার আগে এবং পরে পরিদর্শনকৃত ত্রুটি হারের পরিসংখ্যানগতভাবে উল্লেখযোগ্য পার্থক্য রয়েছে কিনা তা জানতে আমাকে কিছু সাধারণ পরীক্ষা চালিয়ে যেতে বলা হয়েছিল। টি-টেস্টগুলি আউট ছিল কারণ ডেটা আগে এবং পরে উভয়ই গুরুতরভাবে স্কিউ করা হয়েছিল, উদাহরণস্বরূপ, আর-এর আগে ডেটা এমনভাবে দেখাচ্ছিল:

summary(errorsBefore)
# Min.  1st Qu.  Median   Mean  3rd Qu.    Max
# 0.000  0.000    4.000  12.00    13.00  470.0

(এগুলি তৈরি করা হয়েছে - আমি ভয় করি যে মালিকানা / গোপনীয়তার সমস্যাগুলির কারণে আমি প্রকৃত ডেটা বা এটির কোনও আসল হস্তক্ষেপ পোস্ট করতে পারি না - আমার ক্ষমা চাই!)

জোড়যুক্ত পার্থক্যগুলি আরও কেন্দ্রীভূত ছিল তবে সাধারণ বিতরণে এখনও এটি খুব ভালভাবে ফিট ছিল না - অনেক বেশি শিখর। পার্থক্যগুলির ডেটা এরকম কিছু দেখায়:

summary(errorsBefore-errorsAfter)
# Min.   1st Qu.  Median   Mean  3rd Qu.    Max
# -110.0  -2.000   0.000  0.005   2.000   140.0

এটি প্রস্তাবিত হয়েছিল যে আমি উইলকক্সন স্বাক্ষরিত র‌্যাঙ্ক পরীক্ষাটি ব্যবহার করব, এবং? উইলকক্স.স্টেস্ট এবং উইকিপিডিয়া সংক্ষিপ্ত প্ররোচনার পরে এবং এখানে, এটি ব্যবহারের মতো পরীক্ষার মতো বলে মনে হচ্ছে। উপরের অনুমানগুলি বিবেচনা করে, আমি বিশ্বাস করি (1) ডেটা উত্পন্ন করার প্রক্রিয়াটি দেওয়া ঠিক আছে। অনুমান (২. এ) আমার ডেটা-র জন্য কঠোরভাবে সত্য নয়, তবে এখানে আলোচনা: বিতরণ অবিচ্ছিন্ন না হলে উইলকক্সন পরীক্ষার বিকল্প? মনে হচ্ছে যে এটি খুব একটা উদ্বেগের বিষয় নয়। অনুমান (3) ঠিক আছে। আমার একমাত্র উদ্বেগ (আমি বিশ্বাস করি) হ'ল অনুমান (২.২)।

একটি অতিরিক্ত নোট , কয়েক বছর পরে: আমি অবশেষে একটি দুর্দান্ত নন-প্যারাম্যাট্রিক স্ট্যাটাস কোর্স নিয়েছি এবং র‌্যাঙ্ক-সামনের পরীক্ষাগুলিতে প্রচুর সময় ব্যয় করেছি। অনুমানের মধ্যে এম্বেড করা (২. এ), "প্রতিটি জিৎ একই ধারাবাহিক জনগোষ্ঠী থেকে আসে", এই ধারণাটিই যে উভয় নমুনা মাশ সমান বৈচিত্র্যের সাথে জনসংখ্যা থেকে আসে - এটি ব্যবহারিকভাবে বলতে গেলে অত্যন্ত গুরুত্বপূর্ণ বলে প্রমাণিত হয় । আপনার জনসংখ্যার (যেমন আপনি নমুনাগুলি আঁকেন) আলাদা করার বিষয়ে আপনার যদি উদ্বেগ থাকে তবে আপনার ডাব্লুএমডাব্লু ব্যবহার সম্পর্কে উদ্বিগ্ন হওয়া উচিত।


দুটি উত্তরের জন্য ধন্যবাদ! তারা উভয়ই মোটামুটি সমানভাবে আমাকে সাহায্য করেছিল। পারলে আমি "দু'জনকেই বেছে নিই"। মাইক আমাকে তাত্ত্বিক কিছু বোঝার দিকে ইঙ্গিত করেছিল যা ধারণাগতভাবে খুব সহায়ক ছিল, যদিও অনিকো আমার মূল প্রশ্নের উত্তরটি আরও কিছুটা সরাসরি উত্তর দিয়েছিল। আপনাদের দুজনকেই ধন্যবাদ!
CompEcon

উত্তর:


8

উইকিপিডিয়া আপনাকে উল্লেখ করে "বিভ্রান্ত করেছে" ... যদি x এবং y উভয়ই দেওয়া হয় এবং জোড় বানানো সত্য হয় তবে উইলকক্সন শূন্য র‌্যাঙ্ক পরীক্ষা করে যে এক্স-ওয়াইয়ের (জোড়াযুক্ত দুটি নমুনা ক্ষেত্রে) প্রতিসাম্যিক সম্পর্কে মু সম্পাদিত হয়। "

পরীক্ষাটি নির্ধারণ করে যে এর র্যাঙ্ক-ট্রান্সফর্মড মানগুলি আপনার নাল হাইপোথিসিসে আপনি যে মিডিয়ানটি নির্দিষ্ট করেছেন তার চারপাশের প্রতিসাম্য কিনা (আমি ধরে নিচ্ছি আপনি শূন্য ব্যবহার করবেন)। অসুস্থতা কোনও সমস্যা নয়, যেহেতু সর্বাধিক ননপ্যারমেট্রিক টেস্টের মতো স্বাক্ষরিত-র‌্যাঙ্ক পরীক্ষাটি "বিতরণ মুক্ত"। এই পরীক্ষাগুলির জন্য আপনি যে মূল্য দিয়ে থাকেন তা প্রায়শই শক্তি হ্রাস পায় তবে মনে হয় এটি অতিক্রম করার জন্য আপনার কাছে যথেষ্ট পরিমাণে নমুনা রয়েছে।z- রআমি=এক্সআমি-Yআমি

র‌্যাঙ্ক-সমীক্ষার পরীক্ষার "হ্যাঁ হোয়াট" বিকল্পটি chance এবং মতো সরল রূপান্তরের চেষ্টা করা যেতে পারে যাতে এই পরিমাপগুলি প্রায় একটি লগন্যাল বিতরণ অনুসরণ করতে পারে - সুতরাং লগড মানগুলি "বেল বাঁকানো" দেখতে হবে। তারপরে আপনি পরীক্ষায় ব্যবহার করতে পারেন এবং নিজেকে (এবং আপনার ব্যবসায়িক যারা কেবল ব্যবসায়িক পরিসংখ্যান নিয়েছিলেন) বোঝাতে পারতেন যে র‌্যাঙ্ক-সমষ্টি পরীক্ষা চলছে। যদি এটি কাজ করে তবে একটি বোনাস রয়েছে: লগনরমাল ডেটাগুলির জন্য টি টেস্টটি মূল, অপরিবর্তিত, পরিমাপের জন্য মিডিয়ানের তুলনা।ln ( y i )Ln(এক্সআমি)Ln(Yআমি)

আমাকে? আমি উভয়ই করতাম, এবং আমি রান্না করতে পারি এমন অন্য কিছু (দৃ Po় আকারের দ্বারা পোয়েসন গণনায় সম্ভাবনা অনুপাতের পরীক্ষা?)। হাইপোথিসিস টেস্টিং প্রমাণ নির্ধারণযোগ্য কিনা তা নির্ধারণের জন্য, এবং কিছু লোকেরা কনভিন্সিনের গাদা হয়।


আহ, এটা অনেক বোঝায়। বিশেষত এখন আমি ঘরে ফিরে এসে আমার পুরানো ডিগ্রট এবং শেরভিশ পাঠ্যপুস্তিকাটি বের করেছি, যা এই সাইন টেস্টগুলি আসলে কী করছে তার একটি দুর্দান্ত বর্ণনা রয়েছে। ফ্যান্টাস্টিক। হাইপোথিসিস টেস্টিং এবং সাধারণ চিন্তাভাবনার জন্য ধন্যবাদ :) আমি দৃষ্টিকোণটি পছন্দ করি। একটি গৌণ নোট: আপনি যে অংশটি বিভ্রান্তিকর হিসাবে নোট করেছেন সেটি আসলে আর থেকে, উইলকক্স.স্টেস্টের ডকুমেন্টেশন থেকে। এটি আমার কাছে কিছুটা বিরক্তিকর ...

9

উইকিপিডিয়া এবং আর সহায়ক পৃষ্ঠা উভয়ই সদয়ভাবে সঠিক এবং একই জিনিসটি লেখার চেষ্টা করছে, তারা কেবল এটিকে আলাদাভাবে ব্যাখ্যা করে।

উইকিপিডিয়া নিবন্ধটি অনুমানকে (মধ্যক = 0) বনাম (মধ্যমা! = 0) হিসাবে উল্লেখ করেছে এবং বলেছে যে পার্থক্যগুলির প্রতিসাম্য বিতরণ (+ অন্যান্য অনুমান) থাকলে আপনি পরীক্ষা থেকে এই সিদ্ধান্তে পৌঁছাতে পারেন।

আর সহায়তা পৃষ্ঠাটি আরও সুনির্দিষ্ট, হাইপোথেসিসগুলি (মধ্যস্থতা = 0 এবং পার্থক্যের প্রতিসাম্য বন্টন রয়েছে) হিসাবে বনাম (এর মধ্যে কমপক্ষে একটি মিথ্যা) states সুতরাং এটি নাল অনুমানের মধ্যে একটি অনুমান স্থানান্তরিত। আমি মনে করি তারা এই প্রতিসারণের প্রয়োজনীয়তার উপর জোর দেওয়ার জন্য এটি করেছে: স্কিডযুক্ত পার্থক্যের সাথে স্বাক্ষরিত-র‌্যাঙ্ক পরীক্ষা নাল অনুমানকে বাতিল করে দেবে এমনকি মিডিয়ান মারা গেলেও। আপনি যদি কোনও পাঠ্যপুস্তক পড়ে থাকেন তবে এটি আপনাকেও বলতে পারে যে নাল অনুমানটি পরীক্ষা করা হচ্ছে এটি হ'ল পি (এক্স> ওয়াই) = 0.5 - বাকী আসলে এইগুলি অনুসরণ করুন follow

প্রয়োগের ক্ষেত্রে, প্রশ্ন অবশ্যই আপনি মিডিয়ান সম্পর্কে বিশেষভাবে যত্নশীল কিনা (এবং তারপরে স্কিউনেস একটি সমস্যা এবং মিডিয়ান পরীক্ষাটি সম্ভাব্য বিকল্প), বা আপনি পুরো বিতরণ সম্পর্কে যত্নবান কিনা এবং পি (এক্স>) y)! = 0.5 হল পরিবর্তনের প্রমাণ।


1
ঠিক আছে, এটি বোঝা যায়। ইনপুট জন্য ধন্যবাদ! আমি লক্ষ্য করেছি যে মিডিয়ান টেস্টের উইকিপিডিয়া পৃষ্ঠাটি বলেছে যে জোড়যুক্ত ম্যান-হুইটনি-ইউ পরীক্ষাকে অগ্রাধিকার দেওয়া হয়েছে। এটি তত্ক্ষণাত আমাকে ভাবতে বাধ্য করে যে আমি যেখানেই শুরু করেছি সেখানে ফিরে এসেছি, ভেবেছিলাম জোড়াযুক্ত উইলকক্সন পরীক্ষাটি কোনওভাবে তথ্যের আরও বেশি ব্যবহার করে uses আপনি যখন "মিডিয়ান সম্পর্কে বিশেষভাবে যত্ন নিন ... বা পুরো বিতরণ সম্পর্কে" বলছেন তখন সম্ভবত আমি যা বোঝার চেষ্টা করছি সেটাই আপনি বোঝাতে চাইছেন। আমি সম্পূর্ণ বিতরণ সম্পর্কে যত্নশীল, কিন্তু এটি মধ্যমা মাধ্যমে বৈশিষ্ট্যযুক্ত করছি ..
কমপ্যাকন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.