আমি ক্রস যাচাইকৃত সংরক্ষণাগারগুলিতে কিছুটা তাকিয়েছি এবং আমার প্রশ্নের উত্তর খুঁজে পেয়েছে বলে মনে হচ্ছে না। আমার প্রশ্নটি নীচে: উইকিপিডিয়া তিনটি অনুমান দিয়েছে যা উইলকক্সনের স্বাক্ষরিত র্যাঙ্ক পরীক্ষার জন্য রাখা দরকার (আমার প্রশ্নের জন্য কিছুটা সংশোধন করা):
আই = 1, ..., এন এর জন্য জিৎ = শি-ই'য় আসুন।
জি পার্থক্যগুলি স্বাধীন বলে ধরে নেওয়া হয়।
(ক।) প্রতিটি জি একই অবিচ্ছিন্ন জনসংখ্যার থেকে আসে এবং (খ) প্রতিটি জি একটি সাধারণ মধ্যম সম্পর্কে প্রতিসম হয়;
একাদশ এবং ইয়ি যে মানগুলি উপস্থাপন করে সেগুলি অর্ডার করা হয় ... সুতরাং 'এর চেয়ে বড়', 'এর চেয়ে কম', এবং 'সমান' এর তুলনা দরকারী।
আর এর মধ্যে উইলকক্স.স্টেস্টের ডকুমেন্টেশনগুলি অবশ্য ইঙ্গিত দেয় যে (২. বি) আসলে এমন কিছু যা প্রক্রিয়া দ্বারা পরীক্ষা করা হয়:
"... যদি x এবং y উভয়ই দেওয়া হয় এবং যুক্ত করা হয়, সত্য, উইলকক্সন শূন্যতার শূন্য রেকর্ড পরীক্ষা করে যে এক্স - ওয়াইয়ের (জোড়যুক্ত দুটি নমুনা ক্ষেত্রে) বিতরণটি মিউ সম্পর্কে সমান্তরিত হয়" "
আমাকে এই শব্দ যেন পরীক্ষা নাল হাইপোথিসিস যে, "টু Z symetrically প্রায় মধ্যমা মিউ = SomeMu বিতরণ করা হয়" জন্য সঞ্চালিত হয় - যেমন নাল ফো প্রত্যাখ্যান হতে পারে যে পারেন প্রতিসাম্য প্রত্যাখ্যানের বা প্রত্যাখ্যানের যে মিউ যা প্রায় জেড হ'ল প্রতিসম হয় সাম্মু।
এটি কি উইলকক্স.টেস্টের জন্য আর ডকুমেন্টেশনের সঠিক বোঝাপড়া? অবশ্যই এটি গুরুত্বপূর্ণ হওয়ার কারণটি হ'ল আমি পূর্বের ও পরে কিছু তথ্যের (উপরের "এক্স" এবং "ওয়াই") উপর বেশ কয়েকটি জোড়-পার্থক্য পরীক্ষা করে চলেছি। পৃথকভাবে "আগে" এবং "পরে" ডেটা অত্যন্ত স্কিউড হয় তবে পার্থক্যগুলি প্রায় ততটা স্কিউড হয় না (যদিও এখনও কিছুটা স্কিউড করা হয়)। এর অর্থ আমার অর্থ যে "আগে" বা "পরে" ডেটা একাকী বিবেচিত ske 7 থেকে 21 (আমি যে নমুনাটি দেখছি তার উপর নির্ভর করে), যখন "পার্থক্যগুলি" ডেটাতে স্নিগ্ধতা রয়েছে 0.5 = 0.5 থেকে 5. তবুও স্কিউ, কিন্তু প্রায় হিসাবে না।
যদি আমার "পার্থক্য" ডেটাতে স্নিগ্ধতা থাকার কারণে উইলকক্সন পরীক্ষা আমাকে মিথ্যা / পক্ষপাতমূলক ফলাফল দেয় (যেমন উইকিপিডিয়া নিবন্ধটি ইঙ্গিত করে বলে মনে হয়), তবে স্কিউনেস বড় উদ্বেগের কারণ হতে পারে। তবে, উইলকক্সন পরীক্ষাগুলি যদি প্রকৃতপক্ষে এই পার্থক্যগুলি বিতরণকে "মিউ = সাম্মু-এর আশেপাশের প্রতিসাম্য" কিনা (যেমন? উইলকক্স.স্টেস্ট বলে মনে হয়) কিনা তা পরীক্ষা করে দেখছে তবে এটি উদ্বেগের কম নয়।
এইভাবে আমার প্রশ্নগুলি হ'ল:
উপরের কোন ব্যাখ্যাটি সঠিক? আমার "পার্থক্য" বিতরণে স্কিউনেস কি আমার উইলকক্সন পরীক্ষার পক্ষপাতিত্ব করে?
যদি বক্রতা হয় একটি উদ্বেগের বিষয়: "কত বক্রতা একটি উদ্বেগের বিষয় হল"
যদি উইলকসন স্বাক্ষরিত র্যাঙ্ক পরীক্ষাগুলি এখানে গুরুতরভাবে অনুপযুক্ত বলে মনে হচ্ছে, আমার কী ব্যবহার করা উচিত তার জন্য কোনও পরামর্শ?
অনেক ধন্যবাদ. আমি কীভাবে এই বিশ্লেষণটি করতে পারি সে সম্পর্কে আপনার যদি আরও কোনও পরামর্শ থাকে তবে সেগুলি শুনে আমি আরও বেশি খুশি (যদিও আমি সে উদ্দেশ্যে আরও একটি থ্রেডও খুলতে পারি)। এছাড়াও, ক্রস ভ্যালিডেটে এটি আমার প্রথম প্রশ্ন; আমি কীভাবে এই প্রশ্নটি জিজ্ঞাসা করেছি সে সম্পর্কে আপনার যদি পরামর্শ / মন্তব্য থাকে তবে আমিও এটির জন্য উন্মুক্ত!
সামান্য ব্যাকগ্রাউন্ড: আমি একটি ডেটাসেট বিশ্লেষণ করছি যাতে আমি যা বলব তার উপর পর্যবেক্ষণ রয়েছে "দৃ production় উত্পাদনের ত্রুটি"। আমার বিস্মিত পরিদর্শনের আগে এবং পরে উত্পাদন প্রক্রিয়াতে ত্রুটিগুলি সম্পর্কে একটি পর্যবেক্ষণ রয়েছে এবং বিশ্লেষণের একটি লক্ষ্য এই প্রশ্নের উত্তর দেওয়া, "তদন্তের ত্রুটিগুলির প্রমাণিত সংখ্যার মধ্যে কোনও পার্থক্য রয়েছে কি?"
ডেটা সেটটি দেখতে এমন কিছু দেখাচ্ছে:
ID, errorsBefore, errorsAfter, size_large, size_medium, typeA, typeB, typeC, typeD
0123,1,1,1,0,1,1,1,0
2345,1,0,0,0,0,1,1,0
6789,2,1,0,1,0,1,0,0
1234,8,8,0,0,1,0,0,0
মোটামুটি 4000 পর্যবেক্ষণ আছে। অন্যান্য পরিবর্তনশীল হ'ল সংঘের বৈশিষ্ট্যগুলি বর্ণনাকারী ক্যাটাগরিয়াল পর্যবেক্ষণ। আকার ছোট, মাঝারি বা বড় হতে পারে এবং প্রতিটি ফার্ম এইগুলির মধ্যে একটি এবং কেবল একটি। ফার্মগুলি যে কোনও বা সমস্ত "প্রকারের" হতে পারে।
সমস্ত সংস্থাগুলি এবং বিভিন্ন সাব-গ্রুপিংয়ের (পরিমাপ ও প্রকারের ভিত্তিতে) পরিদর্শন করার আগে এবং পরে পরিদর্শনকৃত ত্রুটি হারের পরিসংখ্যানগতভাবে উল্লেখযোগ্য পার্থক্য রয়েছে কিনা তা জানতে আমাকে কিছু সাধারণ পরীক্ষা চালিয়ে যেতে বলা হয়েছিল। টি-টেস্টগুলি আউট ছিল কারণ ডেটা আগে এবং পরে উভয়ই গুরুতরভাবে স্কিউ করা হয়েছিল, উদাহরণস্বরূপ, আর-এর আগে ডেটা এমনভাবে দেখাচ্ছিল:
summary(errorsBefore)
# Min. 1st Qu. Median Mean 3rd Qu. Max
# 0.000 0.000 4.000 12.00 13.00 470.0
(এগুলি তৈরি করা হয়েছে - আমি ভয় করি যে মালিকানা / গোপনীয়তার সমস্যাগুলির কারণে আমি প্রকৃত ডেটা বা এটির কোনও আসল হস্তক্ষেপ পোস্ট করতে পারি না - আমার ক্ষমা চাই!)
জোড়যুক্ত পার্থক্যগুলি আরও কেন্দ্রীভূত ছিল তবে সাধারণ বিতরণে এখনও এটি খুব ভালভাবে ফিট ছিল না - অনেক বেশি শিখর। পার্থক্যগুলির ডেটা এরকম কিছু দেখায়:
summary(errorsBefore-errorsAfter)
# Min. 1st Qu. Median Mean 3rd Qu. Max
# -110.0 -2.000 0.000 0.005 2.000 140.0
এটি প্রস্তাবিত হয়েছিল যে আমি উইলকক্সন স্বাক্ষরিত র্যাঙ্ক পরীক্ষাটি ব্যবহার করব, এবং? উইলকক্স.স্টেস্ট এবং উইকিপিডিয়া সংক্ষিপ্ত প্ররোচনার পরে এবং এখানে, এটি ব্যবহারের মতো পরীক্ষার মতো বলে মনে হচ্ছে। উপরের অনুমানগুলি বিবেচনা করে, আমি বিশ্বাস করি (1) ডেটা উত্পন্ন করার প্রক্রিয়াটি দেওয়া ঠিক আছে। অনুমান (২. এ) আমার ডেটা-র জন্য কঠোরভাবে সত্য নয়, তবে এখানে আলোচনা: বিতরণ অবিচ্ছিন্ন না হলে উইলকক্সন পরীক্ষার বিকল্প? মনে হচ্ছে যে এটি খুব একটা উদ্বেগের বিষয় নয়। অনুমান (3) ঠিক আছে। আমার একমাত্র উদ্বেগ (আমি বিশ্বাস করি) হ'ল অনুমান (২.২)।
একটি অতিরিক্ত নোট , কয়েক বছর পরে: আমি অবশেষে একটি দুর্দান্ত নন-প্যারাম্যাট্রিক স্ট্যাটাস কোর্স নিয়েছি এবং র্যাঙ্ক-সামনের পরীক্ষাগুলিতে প্রচুর সময় ব্যয় করেছি। অনুমানের মধ্যে এম্বেড করা (২. এ), "প্রতিটি জিৎ একই ধারাবাহিক জনগোষ্ঠী থেকে আসে", এই ধারণাটিই যে উভয় নমুনা মাশ সমান বৈচিত্র্যের সাথে জনসংখ্যা থেকে আসে - এটি ব্যবহারিকভাবে বলতে গেলে অত্যন্ত গুরুত্বপূর্ণ বলে প্রমাণিত হয় । আপনার জনসংখ্যার (যেমন আপনি নমুনাগুলি আঁকেন) আলাদা করার বিষয়ে আপনার যদি উদ্বেগ থাকে তবে আপনার ডাব্লুএমডাব্লু ব্যবহার সম্পর্কে উদ্বিগ্ন হওয়া উচিত।