একটি অ-প্যারাম্যাট্রিক পরীক্ষা ঠিক কী সম্পাদন করে এবং ফলাফলগুলি দিয়ে আপনি কী করেন?


22

আমার মনে হচ্ছে এটি অন্য কোথাও জিজ্ঞাসা করা হয়েছে, তবে আমার যে ধরণের বেসিক বিবরণ প্রয়োজন তা সত্য নয় with আমি জানি যে নন-প্যারামেট্রিক তুলনা করার মাধ্যমের পরিবর্তে মিডিয়ায় নির্ভর করে ... কিছু। আমি বিশ্বাস করি এটি স্ট্যান্ডার্ড বিচ্যুতির পরিবর্তে "স্বাধীনতার ডিগ্রি" (?) এর উপর নির্ভর করে। যদিও আমি ভুল হলে আমাকে সংশোধন করুন।

আমি বেশ ভাল গবেষণা করেছি, বা তাই আমি ভাবলাম, ধারণাটি বোঝার চেষ্টা করেছি, এর পিছনে কী কাজ রয়েছে, পরীক্ষার ফলাফলগুলি আসলে কী বোঝায়, এবং / অথবা এমনকি পরীক্ষার ফলাফলগুলি দিয়ে কী করবে; যাইহোক, কেউ কখনও সে অঞ্চলে everোকা বলে মনে হয় না।

সরলতার স্বার্থে আসুন মান-হুইটনি ইউ-টেস্টের সাথে লেগে থাকি যা আমি লক্ষ্য করেছি যে এটি বেশ জনপ্রিয় (এবং কারও "বর্গাকার মডেলটিকে একটি বৃত্তের ছিদ্রে" চাপিয়ে দেওয়ার জন্যও আপাতদৃষ্টিতে অপব্যবহার ও অতিরিক্ত ব্যবহার করা হয়েছে)। আপনি যদি অন্য পরীক্ষাগুলিরও বর্ণনা করতে চান তবে নির্দ্বিধায়, যদিও আমি একবার বুঝতে পেরে একবার অনুভব করি, আমি অন্য টি-টেস্ট ইত্যাদির দিকে অন্যান্য বিষয়গুলিকে অভিন্ন উপায়ে বুঝতে পারি etc.

ধরা যাক আমি আমার ডেটা দিয়ে একটি প্যারামিমেট্রিক পরীক্ষা চালাচ্ছি এবং আমি এই ফলাফলটি ফিরে পেয়েছি:

2 Sample Mann-Whitney - Customer Type       

Test Information        
H0: Median Difference = 0       
Ha: Median Difference ≠ 0       

Size of Customer    Large   Small
Count                    45    55
Median                    2     2

Mann-Whitney Statistic: 2162.00 
p-value (2-sided, adjusted for ties):   0.4156  

আমি অন্যান্য পদ্ধতির সাথে পরিচিত, তবে এখানে কী আলাদা? আমাদের কি পি-ভ্যালু .05 এর চেয়ে কম হওয়া উচিত? "মান-হুইটনি পরিসংখ্যান" এর অর্থ কী? এর কি কোন ব্যবহার আছে? এখানে এই তথ্যটি যাচাই করে বা যাচাই করে না যে আমার কাছে থাকা ডেটাগুলির একটি নির্দিষ্ট উত্স ব্যবহার করা উচিত বা করা উচিত নয়?

আমার কাছে রিগ্রেশন এবং বেসিকগুলির সাথে যুক্তিসঙ্গত অভিজ্ঞতা রয়েছে তবে আমি এই "বিশেষ" নন-প্যারাম্যাট্রিক স্টাফ সম্পর্কে খুব কৌতূহলী - যা আমি জানি এটির নিজস্ব ঘাটতি থাকবে।

শুধু কল্পনা করুন যে আমি পঞ্চম শ্রেণীর এবং আপনি যদি তা আমাকে ব্যাখ্যা করতে পারেন তা দেখুন।


4
হ্যাঁ, আমি অনেকবার পড়েছি। কখনও কখনও উইকিপিডিয়া যে জার্গনটি ব্যবহার করে সেগুলি অপ্রতিরোধ্য হয়ে উঠতে পারে এবং এর একটি সঠিক বিবরণ থাকলেও - যে অঞ্চলটি শেখার চেষ্টা শুরু করেছে এমন ব্যক্তির কাছে এটির স্পষ্ট বিবরণ নেই। কারা কমেছে তা নিশ্চিত নয়, তবে আমি বৈধভাবে কেবল একটি মৌলিক, পরিষ্কার, ব্যাখ্যা চাই যে প্রায় সবাই বুঝতে পারে। হ্যাঁ, আমি এটি বিশ্বাস করি বা না বিশ্বাস করার জন্য আমি চেষ্টা করেছি। তাত্ক্ষণিকভাবে আমাকে নীচে নামিয়ে উইকিপিডিয়ায় লিঙ্ক করার দরকার নেই। কেউ কি কখনও খেয়াল করেন যে কিছু শিক্ষক অন্যের চেয়ে কীভাবে ভাল? আমি যে ধারণায় আটকে আছি তার জন্য আমি একজন ভাল "শিক্ষক" খুঁজছি।
তাল

1
তারপরে স্প্রেন্ট এবং স্মিটন, হল্যান্ডার এবং ওল্ফ, কনভারের মতো একটি ভাল বেসিক ননপ্যারমেট্রিক সংখ্যার পাঠ্যে যান। অথবা একটি প্রাথমিক পাঠ্য সন্ধান করুন যাতে মান-হুইটনি অন্তর্ভুক্ত রয়েছে।
নিক কক্স

1
আপনার প্রশ্নটি এবং আপনি যে ইন্টারনেটটি সম্প্রতি ইন্টারনেট ব্যবহার করে জিজ্ঞাসা করেছিলেন তা অন্য দিকে তাকানো থেকে আপনার পক্ষে ভাল কাজ হচ্ছে না, কারণ আপনি সম্ভবত খুব বিভ্রান্ত হয়ে পড়েছেন। এজন্য @ পিটার ফ্লুম এবং আমি বইয়ের পরামর্শ দিচ্ছি। আমি রিজার্ভে অন্যান্য পরামর্শ পাইনি। আমি আরও সুপারিশ করছি - আন্তরিকভাবে এবং আপনার সর্বোত্তম স্বার্থে - আরও সংক্ষিপ্ত, কম বিড়বিড় প্রশ্ন লিখার চেষ্টা করছি। আপনার ডিগ্রিটিভ স্টাইল আপনার প্রশ্নগুলি পরিষ্কার করতে সহায়তা করে না।
নিক কক্স

1
ইন্টারনেট একা সত্যই আমার পক্ষে সত্যবাদী হওয়ার জন্য যে কোনও বই বা ক্লাসের চেয়ে ভাল কাজ করেছে - এবং এটি যে কোনও বিষয়ের পক্ষে যায়। "চ্যাটি" প্রশ্ন লেখার জন্য আমি ক্ষমা চেয়ে নিচ্ছি।
তাল

3
না এটি ভাল বইয়ের পাশাপাশি কাজ করছে বলে মনে হয় না। স্টিফেন সেনের প্যারাফ্রেজ করার জন্য, এটি আশ্চর্যের নয় যে পরিসংখ্যানই একমাত্র বিজ্ঞানের দাবি যা মানুষকে প্রথম দেখায় বোধগম্য হতে পারে।
ফ্র্যাঙ্ক হ্যারেল

উত্তর:


41

আমি জানি নন-প্যারামিট্রিক গড়ের পরিবর্তে মিডিয়ানের উপর নির্ভর করে

কোনও ননপ্রেমেট্রিক পরীক্ষা আসলেই এই অর্থে মিডিয়ানদের "নির্ভর" করে তোলে। আমি কেবল একটি দম্পতি সম্পর্কে ভাবতে পারি ... এবং কেবলমাত্র আমিই প্রত্যাশা করি যে আপনি সম্ভবত শুনেছেন সাইন টেস্ট।

তুলনা করা ... কিছু।

যদি তারা মিডিয়ানদের উপর নির্ভর করে তবে সম্ভবত এটি মেডিয়ানদের তুলনা করা। তবে - বেশ কয়েকটি উত্স আপনাকে যা বলার চেষ্টা করেছে তা সত্ত্বেও - স্বাক্ষরিত র‌্যাঙ্ক পরীক্ষা, বা উইলকক্সন-মান-হুইটনি বা ক্রুসকল-ওয়ালিসের মতো পরীক্ষাগুলি আদৌ মিডিয়ানের পরীক্ষা নয়; যদি আপনি কিছু অতিরিক্ত অনুমান করেন, আপনি উইলকক্সন-মান-হুইটনি এবং ক্রুসকল-ওয়ালিসকে মধ্যস্থদের পরীক্ষা হিসাবে বিবেচনা করতে পারেন, তবে একই অনুমানের অধীনে (যতক্ষণ না বিতরণের উপায় বিদ্যমান রয়েছে) আপনি তাদেরকে সমানভাবে উপায় হিসাবে পরীক্ষা হিসাবে বিবেচনা করতে পারেন ।

স্বাক্ষরিত র‌্যাঙ্ক পরীক্ষার সাথে সম্পর্কিত প্রকৃত অবস্থান-অনুমান নমুনার মধ্যে জুটি গড় গড়ের মধ্যস্থতা, উইলকক্সন-মান-হুইটনি (এবং জড়িতভাবে, ক্রুসকল-ওয়ালিসে) এক-জুটি-জুড়ে পার্থক্যগুলির মধ্যবর্তী ।

আমিও বিশ্বাস করি এটি "স্বাধীনতার ডিগ্রি" এর উপর নির্ভর করে? পরিবর্তে স্ট্যান্ডার্ড বিচ্যুতি। আমি ভুল থাকলে আমাকে সংশোধন করুন।

সর্বাধিক ননপ্যারামেট্রিক টেস্টে 'ডিগ্রি অফ স্বাধীনতা' থাকে না, যদিও নমুনা আকারের সাথে অনেকগুলি বন্টন হয় এবং আপনি বিবেচনা করতে পারেন যে কিছুটা স্বাধীনতার ডিগ্রির সাথে এই অর্থে যে সারণিগুলি নমুনা আকারের সাথে পরিবর্তিত হয়। নমুনাগুলি অবশ্যই তাদের বৈশিষ্ট্যগুলি বজায় রাখে এবং সেই অর্থে স্বাধীনতার n ডিগ্রি থাকে তবে একটি পরীক্ষার পরিসংখ্যান বিতরণে স্বাধীনতার ডিগ্রি সাধারণত আমাদের সম্পর্কিত কিছু নয়। এটি ঘটতে পারে যে স্বাধীনতার ডিগ্রিগুলির মতো আপনার আরও কিছু রয়েছে - উদাহরণস্বরূপ, আপনি অবশ্যই একটি যুক্তি দিতে পারেন যে ক্রুশাল-ওয়ালিসের মূলত একইভাবে একটি চি-বর্গক্ষেত্রের স্বাধীনতার ডিগ্রি রয়েছে, তবে সাধারণত এটির দিকে নজর দেওয়া হয় না এইভাবে (উদাহরণস্বরূপ, কেউ যদি কোনও ক্রুসকল-ওয়ালিসের স্বাধীনতার ডিগ্রি সম্পর্কে কথা বলে থাকে তবে তারা প্রায় সবসময় ডিএফকে বোঝায়

স্বাধীনতার ডিগ্রি সম্পর্কে একটি ভাল আলোচনা এখানে পাওয়া যাবে /

আমি বেশ ভাল গবেষণা করেছি, বা তাই আমি ভাবলাম, ধারণাটি বোঝার চেষ্টা করেছিলাম, এর পিছনে কী কাজ রয়েছে, পরীক্ষার ফলাফলগুলি আসলে কী বোঝায়, এবং / অথবা এমনকি পরীক্ষার ফলাফলগুলি দিয়ে কী করবে; তবে কেউ কখনও সে অঞ্চলে ুকেছে বলে মনে হয় না।

আপনি এটার অর্থ কী তা আমি নিশ্চিত নই।

আমি কনভারের প্রাকটিক্যাল ননপ্যারামেট্রিক স্ট্যাটিস্টিক্সের মতো কয়েকটি বইয়ের পরামর্শ দিতে পারলাম এবং যদি আপনি এটি পেতে পারেন তবে নেভ অ্যান্ড ওয়ার্থিংটনের বই ( বিতরণ-মুক্ত টেস্ট ), তবে আরও অনেকগুলি রয়েছে - ম্যারাস্কুইলো এবং ম্যাকসুইনিয়ে, হল্যান্ডার এবং ওল্ফ, বা উদাহরণস্বরূপ ড্যানিয়েলের বই। আমি আপনাকে পরামর্শ দিচ্ছি যে আপনি আপনার সাথে সবচেয়ে ভাল কথা বলুন তাদের মধ্যে কমপক্ষে 3 বা 4 টি পড়ুন, সম্ভবত যেগুলি বিষয়গুলিকে যতটা সম্ভব পৃথকভাবে ব্যাখ্যা করে (এর অর্থ কমপক্ষে 3 বা স্যুটটি খুঁজে পেতে 6 বা 7 টি বই পড়তে হবে)।

সরলতার খাতিরে মান হুইটনি ইউ পরীক্ষাটি আটকে দিন, আমি লক্ষ্য করেছি যে এটি বেশ জনপ্রিয়

এটিই যা আপনার বক্তব্যটি সম্পর্কে আমাকে বিস্মিত করেছিল "" কেউ কখনও সে অঞ্চলে প্রবেশ করেনি বলে মনে হয় না "- এই পরীক্ষাগুলি ব্যবহার করা অনেকেই আপনি যে অঞ্চলের বিষয়ে কথা বলছিলেন তা 'এলাকায় প্রবেশ করে' venture

- এবং আপাতদৃষ্টিতে অপব্যবহার এবং অত্যধিক ব্যবহৃত

আমি বলতে চাই nonparametric পরীক্ষা সাধারণত underused যদি কিছু (Wilcoxon-মান-হুইটনি সহ) - সবচেয়ে বিশেষত বিন্যাস / র্যান্ডোমাইজেশন পরীক্ষা যদিও আমি অগত্যা বিতর্ক যে, তারা ঘন ঘন অপব্যবহার হবে করছি (কিন্তু তাই স্থিতিমাপ পরীক্ষা হয়, এমনকি তাই আরো).

ধরা যাক আমি আমার ডেটা দিয়ে একটি প্যারামিমেট্রিক পরীক্ষা চালাচ্ছি এবং আমি এই ফলাফলটি ফিরে পেয়েছি:

[স্নিপ]

আমি অন্যান্য পদ্ধতির সাথে পরিচিত, তবে এখানে কী আলাদা?

আপনি অন্য কোন পদ্ধতি বোঝাতে চান? আপনি কি আমার সাথে এটি তুলনা করতে চান?

সম্পাদনা: আপনি পরে প্রতিরোধের কথা উল্লেখ করেছেন; আমি তখন ধরেই নিয়েছি যে আপনি একটি দ্বি-নমুনা টি-টেস্টের সাথে পরিচিত (যেহেতু এটি সত্যই রিগ্রেশনের একটি বিশেষ ঘটনা)।

সাধারণ দুটি-নমুনা টি-টেস্টের অনুমানের অধীনে, নাল অনুমানটি হ'ল দুটি জনসংখ্যা অভিন্ন, বিকল্পগুলির মধ্যে যে কোনও একটি বিতরণ স্থানান্তরিত হয়েছে তার বিপরীতে। নীচের উইলকক্সন-মান-হুইটনিতে অনুমানের দুটি সেটগুলির প্রথমটি যদি আপনি দেখেন তবে সেখানে পরীক্ষা করা হচ্ছে এমন প্রাথমিক জিনিসটি প্রায় অভিন্ন; এটি ঠিক যে টি-টেস্টটি নমুনাগুলি অভিন্ন স্বাভাবিক বিতরণ (সম্ভাব্য অবস্থান-স্থানান্তর ব্যতীত) থেকে আসে তা ধরে নেওয়ার ভিত্তিতে is যদি নাল অনুমানটি সত্য হয় এবং সাথে অনুমানগুলি সত্য হয় তবে পরীক্ষার পরিসংখ্যানটির টি-বিতরণ থাকে। যদি বিকল্প অনুমানটি সত্য হয়, তবে পরীক্ষা-পরিসংখ্যানগুলি এমন মান গ্রহণের সম্ভাবনা বেশি করে যা নাল অনুমানের সাথে সামঞ্জস্যপূর্ণ নয় তবে বিকল্পের সাথে সামঞ্জস্যপূর্ণ দেখায় - আমরা সর্বাধিক অস্বাভাবিক,

উইলকক্সন-মান-হুইটনির সাথে পরিস্থিতি অনেকটা সাদৃশ্যপূর্ণ তবে এটি নাল থেকে বিচ্যুতিটি কিছুটা আলাদাভাবে পরিমাপ করে। আসলে, যখন টি-টেস্টের অনুমানগুলি সত্য হয় *, এটি সর্বোত্তম সম্ভাব্য পরীক্ষার (যা টি-টেস্ট) হিসাবে প্রায় ভাল।

* (যা বাস্তবে কখনও হয় না, যদিও এটি আসলে যতটা সমস্যা মনে হয় ততটা সমস্যা নয়)

নাল এবং বিকল্পের অধীনে ডাব্লুএমডাব্লু

প্রকৃতপক্ষে, উইলকসন-মান-হুইটনিটিকে কার্যকরভাবে উপাত্তের মঞ্চে সঞ্চালিত "টি-টেস্ট" হিসাবে বিবেচনা করা সম্ভব - যদিও এর টি-বিতরণ নেই; পরিসংখ্যানটি ডেটা র‌্যাঙ্কে গণনা করা দুটি-নমুনা টি-স্ট্যাটিস্টিকের মনোটোনিক ফাংশন, সুতরাং এটি নমুনা স্পেসে একই ক্রম ** প্রেরণা দেয় (যা র‌্যাঙ্কগুলিতে একটি "টি-পরীক্ষা" - যথাযথভাবে সম্পাদিত হয় - উইলকক্সন-মান-হুইটনি) এর মতো একই পি-মানগুলি তৈরি করতে পারে, তাই এটি ঠিক একই ক্ষেত্রে প্রত্যাখ্যান করে।

** (কঠোরভাবে, আংশিক অর্ডারিং, তবে আসুন এটি একপাশে ছেড়ে দিন)

[আপনি ভাবেন যে স্রেফ র‌্যাঙ্কগুলি ব্যবহার করে প্রচুর তথ্য ছুঁড়ে দেওয়া হবে, কিন্তু যখন একই বিপরীতে সাধারণ জনসংখ্যা থেকে তথ্য আঁকানো হয়, তখন অবস্থান-স্থানান্তর সম্পর্কে প্রায় সমস্ত তথ্যই র‌্যাঙ্কগুলির ধরণীতে থাকে। আসল ডেটা মানগুলি (তাদের মর্যাদায় শর্তযুক্ত) এতে খুব সামান্য অতিরিক্ত তথ্য যুক্ত করে। আপনি যদি স্বাভাবিকের চেয়ে ভারী-লেজুড়ে যান তবে উইলকক্সন-মান-হুইটনি পরীক্ষার আরও ভাল ক্ষমতা থাকার খুব বেশি আগে নয়, পাশাপাশি এর নামমাত্র তাত্পর্য স্তর বজায় রাখা যাতে শেষ পর্যন্ত র‌্যাঙ্কের উপরে 'অতিরিক্ত' তথ্য কেবল অজানা নয় বরং কিছু ক্ষেত্রে পরিণত হয় বোধ, বিভ্রান্তিকর। যাইহোক, কাছাকাছি-প্রতিসম ভারী-লেজুভাব একটি বিরল পরিস্থিতি; আপনি প্রায়শই বাস্তবে যা দেখেন তা হ'ল স্কিউনেস]

বুনিয়াদি ধারণাগুলি একেবারে সমান, পি-মানগুলির একই ব্যাখ্যা রয়েছে (নাল অনুমানটি যদি সত্য হয় তবে ফলাফলের সম্ভাবনা, বা আরও চরম) - ঠিক যদি অবস্থান তৈরি হয় তবে আপনি যদি ব্যাখ্যা করেন তবে প্রয়োজনীয় অনুমান (এই পোস্টের শেষের নিকটবর্তী অনুমানের আলোচনা দেখুন)।

যদি আমি টি-টেস্টের জন্য উপরের প্লটগুলির মতো একই সিমুলেশনটি করি, প্লটগুলি খুব অনুরূপ দেখাবে - x- এবং y- অক্ষের স্কেলটি দেখতে অন্যরকম দেখাবে, তবে মূল চেহারাটি একই রকম হবে।

আমাদের কি পি-ভ্যালু .05 এর চেয়ে কম হওয়া উচিত?

আপনার সেখানে কিছু "চাওয়া" উচিত নয়। ধারণাটি হ'ল নমুনাগুলি সুযোগের দ্বারা ব্যাখ্যা করা যায় তার চেয়ে বেশি আলাদা (কোনও অবস্থান-অর্থে) কোনও নির্দিষ্ট ফলাফলের 'ইচ্ছা' নয়।

যদি বলি "আপনি দেখতে কি রঙ রাজের গাড়ী দয়া করে যেতে পারি?", আমি যদি এটা একজন নিরপেক্ষ মূল্যায়ন চান আমি আপনি যেতে থেকে "ম্যান, আমি সত্যিই সত্যিই, আশা করি এটা নীল চাই না! এটা ঠিক আছে হতে নীল "। পরিস্থিতি কী তা দেখার জন্য সেরা, কারও সাথে 'আমার কিছু হওয়া দরকার' এর সাথে না গিয়ে।

আপনার নির্বাচিত তাত্পর্য স্তর যদি 0.05 হয়, তবে পি-মান 0.05 এর নীচে থাকলে আপনি নাল অনুমানটি বাতিল করবেন। তবে প্রায়শই প্রাসঙ্গিক প্রভাব-আকারগুলি সনাক্ত করতে আপনার কাছে যথেষ্ট পরিমাণে নমুনার আকার থাকলে তা প্রত্যাখ্যান করতে ব্যর্থতা কমপক্ষে আকর্ষণীয়, কারণ এটি বলে যে কোনও পার্থক্য বিদ্যমান যা ছোট।

"মান হুইটলি" নম্বরটির অর্থ কী?

মান-হুইটনি পরিসংখ্যান

নাল অনুমানটি সত্য হলে (উপরের চিত্রটি দেখুন) যে মানগুলি নিতে পারে সেগুলির তুলনায় এটি কেবলমাত্র অর্থবহ এবং কোনও বিশেষ প্রোগ্রাম কোনটি নির্দিষ্ট সংজ্ঞা ব্যবহার করতে পারে তার উপর নির্ভর করে।

এর কি কোন ব্যবহার আছে?

সাধারণত আপনি যথাযথ মানটির বিষয়ে চিন্তা করেন না, তবে এটি নাল-বিতরণে কোথায় রয়েছে (নাল অনুমানটি সত্য হওয়ার সময় আপনার যে মূল্যবোধগুলি দেখা উচিত সেগুলি কম-বেশি হয় বা এটি আরও চরম কিনা)

P(X<Y)

এখানে থাকা এই ডেটাটি কি কেবল যাচাই করে বা যাচাই করে না যে আমার কাছে থাকা ডেটাগুলির একটি নির্দিষ্ট উত্স ব্যবহার করা উচিত বা করা উচিত নয়?

এই পরীক্ষাটি "আমার থাকা ডেটার একটি নির্দিষ্ট উত্স ব্যবহার করা উচিত বা ব্যবহার করা উচিত নয়" সম্পর্কে কিছুই বলে না।

নীচের ডাব্লুএমডাব্লু অনুমানের দিকে তাকানোর দুটি উপায় সম্পর্কে আমার আলোচনা দেখুন।

আমার কাছে রিগ্রেশন এবং বেসিকগুলির সাথে যুক্তিসঙ্গত পরিমাণ অভিজ্ঞতা রয়েছে তবে আমি এই "বিশেষ" নন-প্যারাম্যাট্রিক স্টাফ সম্পর্কে খুব কৌতূহলী

ননপ্যারমেট্রিক টেস্টগুলির জন্য বিশেষভাবে কিছুই নেই (আমি বলব যে 'স্ট্যান্ডার্ড' সাধারণত বিভিন্ন প্যারামেট্রিক টেস্টের তুলনায় অনেক বেশি মৌলিক) - যতক্ষণ না আপনি বাস্তবে হাইপোথিসিস পরীক্ষার বিষয়টি বোঝেন understand

তবে সম্ভবত এটি অন্য একটি প্রশ্নের একটি বিষয়।


উইলকক্সন-মান-হুইটনি হাইপোথিসিস পরীক্ষাটি দেখার জন্য দুটি প্রধান উপায় রয়েছে।

i) একটি বলতে হবে "আমি লোকেশন-শিফটে আগ্রহী - এটি হ'ল নকল অনুমানের অধীনে, দুটি জনগোষ্ঠীর বিকল্পটির পরিবর্তে" স্থানান্তরিত "বা নীচে পরিবর্তিত হওয়ার বিপরীতে দুটি জনসংখ্যার একই (ধারাবাহিক) বন্টন হয় অন্যান্য "

উইলকক্সন-মান-হুইটনি খুব ভাল কাজ করে যদি আপনি এই অনুমানটি করেন (আপনার বিকল্পটি কেবলমাত্র একটি স্থানের শিফট)

এক্ষেত্রে উইলকক্সন-মান-হুইটনি আসলে মিডিয়ানদের জন্য একটি পরীক্ষা ... তবে সমানভাবে এটি অর্থের জন্য পরীক্ষা, বা সত্যই কোনও অন্য স্থান-সমতুল্য পরিসংখ্যান (উদাহরণস্বরূপ, বা ছাঁটাইযুক্ত উপায়, বা যে কোনও সংখ্যক অন্যান্য জিনিস), যেহেতু তারা সবাই অবস্থান-শিফটে একইভাবে প্রভাবিত।

এ সম্পর্কে দুর্দান্ত জিনিসটি এটি খুব সহজেই ব্যাখ্যাযোগ্য - এবং এই অবস্থান-স্থানান্তরের জন্য একটি আস্থার ব্যবধান উত্পন্ন করা সহজ।

অবস্থান শিফট

তবে উইলকক্সন-মান-হুইটনি পরীক্ষা লোকেশন শিফটের চেয়ে অন্য ধরণের পার্থক্যের জন্য সংবেদনশীল।

1212

পি (এক্স <ওয়াই) এ 1/2 থেকে শিফট করুন


আমি আনুমানিক নাল ডিস্ট্রিবিউশনটি আঁকলাম (নতুন শীর্ষগ্রাফের লাল রঙের মধ্যে) যেন এটি অবিচ্ছিন্ন ... তবে প্রকৃত বিতরণটি পৃথক। ছবিটি সেভাবে কম বিশৃঙ্খলা হয় না।
গ্লেন_বি -রিনস্টেট মনিকা

3
+1 দুর্দান্ত উত্তর। আমি জানি উইলকক্সন-মান-হুইটনি পরীক্ষার সেরা এবং সর্বাধিক অ্যাক্সেসযোগ্য ব্যাখ্যা। ধন্যবাদ.
COOLSerdash

"এই ক্ষেত্রে, উইলকক্সন-মান-হুইটনি প্রকৃতপক্ষে মিডিয়ানদের জন্য একটি পরীক্ষা ... তবে সমানভাবে এটি অর্থের জন্য একটি পরীক্ষা" তবে, কিছু বিতরণের অর্থ নেই যেখানে তাদের মধ্যমা সুস্পষ্টভাবে সংজ্ঞায়িত (যেমন কৌচি)।
কারাকাল

@ কারাকাল সত্য (যদিও এটি এখানে আমি বেশ কয়েকবার করেছি), জনসংখ্যার সমতার জন্য যদি কারও পরীক্ষার অর্থ হয়, সম্ভবত তারা ইতিমধ্যে ধরে নিয়েছে যে তারা জনসংখ্যার অর্থ সীমাবদ্ধ। যদি তারা তা না করে তবে তাদের পরীক্ষা পছন্দ করার বিন্দুতে পৌঁছানোর আগেই তাদের সমস্যা ভাল। সমান (এবং এর মাধ্যমে সসীম) জনসংখ্যার একটি হাইপোথিসিস রয়েছে বলে বিবেচনা করে গ্রহণ করা, একই ধরণের অধীনে সাধারণত এটি মিডিয়েনদের পরীক্ষা করার জন্য ব্যবহৃত হয় (শিফ্ট বিকল্প), ডাব্লুএমডাব্লুও একটি উপায়ের পরীক্ষা।
গ্লেন_বি -রিনস্টেট মনিকা

17

মনে করুন আপনি এবং আমি ট্র্যাক দল কোচিং করছি। আমাদের ক্রীড়াবিদরা একই স্কুল থেকে আসে, একই বয়সের এবং একই লিঙ্গ (যেমন, তারা একই জনসংখ্যার থেকে আঁকা) তবে আমি দাবি করি যে একটি বিপ্লবী নতুন প্রশিক্ষণ সিস্টেম আবিষ্কার করেছে যা আমার দলের সদস্যদের তুলনায় আরও দ্রুত চালিত করবে পুলিশের। আমি কীভাবে আপনাকে বোঝাতে পারি যে এটি সত্যিই কাজ করে?

আমাদের একটা রেস আছে।

এরপরে, আমি বসে আমার দলের সদস্যদের জন্য গড় সময় এবং আপনার সদস্যদের জন্য গড় সময় গণনা করি। আমি যদি আমার ক্রীড়াবিদদের জন্য গড় সময়টি কেবল আপনার সময়ের গড়ের চেয়ে দ্রুত না হয় তবে আমি বিজয়ের দাবি করব, তবে আমাদের ফলাফলগুলির "বিক্ষিপ্ত" বা মানক বিচ্যুতির তুলনায় পার্থক্যটিও বড়।


t


"তবে ম্যাট", আপনি অভিযোগ করেছেন, "এটি মোটামুটি ন্যায্য নয়। আমাদের দলগুলি বেশ সমান, তবে আপনি - খাঁটি সুযোগের কারণে - জেলার দ্রুততম রানারকে দিয়ে শেষ করেছেন He তিনি সবার মতো একই লিগে নেই He অন্যথায় তিনি প্রকৃতির প্রকৃতির একটি পরকীয়া। তিনি পরবর্তী দ্রুততম ফিনিশারের 3 মিনিটের আগে শেষ করেছিলেন, যা আপনার গড় সময়কে অনেকটাই কমিয়ে দেয়, তবে বাকি প্রতিযোগীরা বেশ সমানভাবে মিশ্রিত হয় instead পরিবর্তে ফিনিশিং অর্ডারটি দেখুন Ifআপনার পদ্ধতি যদি সত্যিই কাজ করে, আগের ফিনিশারগুলি বেশিরভাগই আপনার দলের হতে হবে, তবে এটি যদি শেষ না হয় তবে এটি বেশ র্যান্ডম হওয়া উচিত This এটি আপনার সুপার-স্টারকে অযৌক্তিক ওজন দেয় না! "


t

p

ttt


আপনি আমার প্রশ্নের উত্তরটি ঠিক ঠিক উত্তর দিয়েছিলেন, এবং আমি ঠিক বলতে চাইছিলাম, আমি যেভাবে উত্তরটি চেয়েছি তা চাই। গ্লেন আরও বেশি গাণিতিক দিক থেকে কিনেছিলেন এবং এই দুটি প্রতিক্রিয়ার সংমিশ্রণটি আমার জন্য ক্লিক করেছে। যদিও আমি তার কাছ থেকে পুরষ্কারটি নিতে পারি না - তার মানে ... তিনি আপনার প্রতিক্রিয়ার স্পষ্টতা সত্ত্বেও গ্রাফগুলি আঁকছেন। আমার একটা অনুভূতি আছে যে আপনি অতীতে কিছুটা শিক্ষাদানের কাজ করেছেন। আমি জানি যে প্রতিক্রিয়াগুলিতে এখানে কিছু সাধারণীকরণ হতে পারে তবে আমি জানতাম যে কোনও স্তরের ব্যবহারিকভাবে নন-প্যারাম্যাট্রিক প্রয়োগ করতে সক্ষম হতে আমার কোনও বই কিনতে হবে এবং তীব্রভাবে অধ্যয়ন করতে হবে না
তালিকায়

t

এই বিদ্রূপটি হ'ল আমি এটিকে সম্ভবত ব্যবহার করতে যাচ্ছি না, এটি কেবল আমাকে বিরক্ত করেছিল যে আমি কী তা নিয়ে একটি সরাসরি উত্তর পেতে পারি না। গ্লেনের উত্তর আমার প্রত্যাশার চেয়ে অনেক বেশি এবং মূলত পেয়েছি - আমার মনে হয় যে সেরা উত্তরগুলি আমি বর্ণনা করতে পারি না কারণ কোনও বিবরণ অপর্যাপ্ত প্রমাণিত হবে। রঙ নীল দেখতে কেমন তা কাউকে বলার মতো। যদি আপনি হোয়াইটের কোনও জিনিস পড়ে থাকেন তবে মনে হয় আপনার একই রকম স্বাদ থাকতে পারে ...
তাল


6

আপনি ভুল হলে সংশোধন করতে বলেছেন। @ পিটার ফ্লমের ইতিবাচক পরামর্শগুলি পরিপূরক করতে এই শিরোনামে এখানে কিছু মন্তব্য দেওয়া হয়েছে।

  • "নন-প্যারাম্যাট্রিকটি গড়ের পরিবর্তে মিডিয়ানের উপর নির্ভর করে": প্রায়শই অনুশীলনে, তবে এটি কোনও সংজ্ঞা নয়। বেশ কয়েকটি নন-প্যারাম্যাট্রিক পরীক্ষার (যেমন চি-স্কোয়ার) মিডিয়ানদের সাথে কোনও সম্পর্ক নেই।

  • স্ট্যান্ডার্ড বিচ্যুতির পরিবর্তে স্বাধীনতার ডিগ্রিগুলির উপর নির্ভর করে; এটা খুব বিভ্রান্ত স্বাধীনতার ডিগ্রিগুলির ধারণা কোনও অর্থে মানক বিচ্যুতির বিকল্প নয়; একটি ধারণা হিসাবে স্বাধীনতার ডিগ্রী সরাসরি পরিসংখ্যান জুড়ে প্রযোজ্য।

  • "আমার কাছে থাকা ডেটাগুলির একটি নির্দিষ্ট উত্স ব্যবহার করা উচিত বা ব্যবহার করা উচিত নয়": আপনি যে তাত্পর্য প্রয়োগ করেছিলেন তার সাথে এই প্রশ্নের কোনও সম্পর্ক নেই, যা কেবলমাত্র ডেটা সাবসেটের মধ্যে পার্থক্যের বিষয়ে এবং মিডিয়ানদের মধ্যে পার্থক্যের ক্ষেত্রে শব্দযুক্ত।


আমি বিশ্বাস করি যে আপনার "আমার যেখানে ভুল সেখানে সংশোধন করতে" বলার বিষয়ে আপনার প্রতিবাদটি এ পর্যন্ত সেরা সাড়া ফেলেছে। আমি মনে করি আমার কিছু নাল হাইপোথিসিস খণ্ডন করা বা নির্মূল প্রক্রিয়া অনুসারে শিখতে হবে। আপনার প্রতিক্রিয়া আমাকে বুঝতে নতুন তথ্য দিয়েছে - বিষয়টি সম্পর্কে আমার বোঝার মধ্যে এখনও কিছু বড় ছিদ্র রয়েছে, তবে আমি পরিপূর্ণতা আশা করতে পারি না। সম্ভবত এই প্রশ্নটি লেখার সময় ally ছিদ্রগুলি মূলত আমার প্রত্যাশার চেয়ে বড় and
তাল

4

আপনি যে কোনও অন্য পরীক্ষায় চান এমন পি-মান থেকে একই জিনিসগুলি "চাই" "

টি স্ট্যাটিস্টিক, বিজোড় অনুপাত, এফ পরিসংখ্যান, বা আপনার কাছে যা আছে তার মতো ইউ স্ট্যাটিস্টিক একটি গণনার ফলাফল। সূত্রটি প্রচুর জায়গা পাওয়া যায়। এটি খুব স্বজ্ঞাত নয়, তবে, অন্য পরীক্ষার পরিসংখ্যানগুলি যতক্ষণ না আপনি সেগুলি ব্যবহার করেন (আপনি 2 এর উল্লেখযোগ্য পরিসরে রয়েছেন কারণ আমরা তাদের সব সময় দেখি।

আপনার ব্লক পাঠ্যের বাকী আউটপুট পরিষ্কার হওয়া উচিত।

ননপ্যারমেট্রিক পরীক্ষাগুলির আরও সাধারণ পরিচিতির জন্য আমি @ নিককক্স প্রতিধ্বনি করছি .... একটি ভাল বই পেয়েছি। নন-প্যারাম্যাট্রিকের অর্থ "পরামিতিবিহীন"; বিবিধ উদ্দেশ্যে বহুবিধ প্যারাম্যাট্রিক পরীক্ষা এবং পরিসংখ্যান রয়েছে।


হ্যাঁ, আদর্শভাবে, একটি ভাল বই সাহায্য করবে; তবে এটি আজকের সংস্থান (যেমন স্ট্যাকেক্সচেঞ্জ), উইকিপিডিয়া (কখনও কখনও), ইউটিউব বাজারের প্রতিযোগিতা (আপনি কি জানেন যে প্রতি মিলিয়ন ভিউর জন্য কেউ জানেন যে তারা $ 4000 পাবে?), পাশাপাশি বিভিন্ন সংস্থার বিভিন্ন সংস্থান রয়েছে। আমি সাধারণত, আমার শেখার স্টাইল হিসাবে, সাধারণ বই শেখার ক্ষেত্রেও খুব ব্যর্থ fail
তাল

1
আমি আপনার পোস্টের প্রশংসা করি, তবে এটি ইতিমধ্যে আমি ইতিমধ্যে যা জানি বা দুর্ভাগ্যক্রমে ধরে নিয়েছি তার বেশিরভাগটির পুনরাবৃত্তি করে। কিছু ধরণের প্যাটার্ন বলে মনে হচ্ছে যেখানে প্রায় প্রতিটি ব্যাখ্যা আমি এই একটি নির্দিষ্ট পয়েন্টে থামি। সম্ভবত এই বিষয়টি যেখানে এটি ব্যাখ্যা করা খুব জটিল বা অত্যধিক প্রচেষ্টা হয়ে যায় - আমি নিশ্চিত নই। যেভাবেই হোক না কেন, এটি এমন একটি প্যাটার্ন যা আমি সাধারণত ব্যবহার করি এমন প্রতিটি তথ্যের উত্স থেকে অভিজ্ঞতা পেয়েছি - যা প্রত্যেকের বইয়ের বিবৃতিটিকে বিদ্রূপাত্মকভাবে পুনর্ব্যক্ত করবে। সম্ভবত উত্তরটি এত জটিল ছিল আমি বুঝতে পারি নি; তারপরে আবার আমি এসই-তে কিছু তীব্র উত্তর দেখেছি।
তাল

2
প্রথমে আপনি আমাদের সরল করতে বলুন, তারপরে আপনি অভিযোগ করেন যে আমাদের উত্তরগুলি সহজ! আপনি যদি ইউ (বা অন্য কিছু) জন্য সূত্রটি বুঝতে চান তবে এটি দেখুন। আপনি যদি কিছু সাধারণ চান, তবে জটিলতাগুলি জিজ্ঞাসা করবেন না! উইকিপিডিয়া এন্ট্রি সমস্ত বিবরণ সহ একটি দুর্দান্ত, বিস্তারিত এন্ট্রি। আপনি এটা বুঝতে পারবেন না। So. আপনি কি চান?
পিটার ফ্লুম - মনিকা পুনরায়

1
আমার মনে হয় এর মাঝে কোথাও। আমি স্বীকার করেছি যে যোগাযোগের ক্ষেত্রে সেরা নই, এবং আমি বুঝতে পারি আপনি হতাশ হেই, হেই। এটি আমার একটি বৈশিষ্ট্য যা আমি আসলে খুব সচেতন। সত্য কথা বলতে গেলে, আমার মনে হয় আমি আসলে যা চাই তা নিয়ে ভাবতে হবে - যেমনটি আমি প্রায় ঠিক তেমন প্রশ্নকে এমনভাবে ঠেলে দিতে চাইছি যেখানে এটি আমার জানা ছিল না বা আগে জানা ছিল না এমন অঞ্চলে এটি কোথায় ওভারল্যাপ হয়ে যায়? সম্পর্কিত. আপনি সাধারণভাবে বুঝতে পারেন না এমন কিছু সম্পর্কে জিজ্ঞাসা করা শক্ত। আমি মনে করি এটির জন্য আমাকে ফিরে আসতে হবে।
তাল

1

সম্প্রতি বন্ধ হওয়া প্রশ্নের প্রতিক্রিয়া হিসাবে , এটি উপরেরগুলিকেও সম্বোধন করে। ব্র্যাডলির ক্লাসিক ডিস্ট্রিবিউশন-ফ্রি স্ট্যাটিস্টিকাল টেস্টের (১৯ 19৮, পি। ১৫-১–) একটি উদ্ধৃতি নীচে দেওয়া হয়েছে , যা কিছুটা লম্বা হলেও বেশ পরিষ্কার ব্যাখ্যা, আমি বিশ্বাস করি।

ননপ্যারমেট্রিক এবং ডিস্ট্রিবিউশন-মুক্ত পদার্থ সমার্থক নয় এবং আদর্শ হিসাবে পরিসংখ্যানের শ্রেণীর বিষয়ে তারা সম্পূর্ণরূপে সন্তোষজনক বর্ণনা প্রদান করে যার দিকে তারা উল্লেখ করতে চায়…… মোটামুটি কথা বলতে গেলে একটি ননপ্যারমেট্রিক পরীক্ষা এমন একটি যা প্যারামিটারের মান সম্পর্কে কোনও অনুমান তৈরি করে না makes একটি পরিসংখ্যানগত ঘনত্ব ফাংশনে, অন্যদিকে বিতরণ-মুক্ত পরীক্ষা এমন একটি যা নমুনাযুক্ত জনগোষ্ঠীর সুনির্দিষ্ট রূপ সম্পর্কে কোনও অনুমান করে না। সংজ্ঞাগুলি পারস্পরিক একচেটিয়া নয় এবং একটি পরীক্ষা উভয়ই বিতরণ-মুক্ত এবং প্যারাম্যাট্রিক হতে পারে distribution… বিতরণ-মুক্ত বলতে কী বোঝায় সে সম্পর্কে পুরোপুরি পরিষ্কার হওয়ার জন্য, তিনটি বিতরণের মধ্যে পার্থক্য করা প্রয়োজন: (ক) এর নমুনাযুক্ত জনসংখ্যা; (খ) প্রকৃতপক্ষে পরীক্ষার দ্বারা ব্যবহৃত পর্যবেক্ষণ-বৈশিষ্ট্যযুক্ত; এবং (গ) পরীক্ষার পরিসংখ্যানগুলির। যে বিতরণ থেকে পরীক্ষাগুলি "বিনামূল্যে" হয় তা হ'ল (ক), নমুনাযুক্ত জনসংখ্যা। এবং তারা যে স্বাধীনতা উপভোগ করে তা সাধারণত আপেক্ষিক… ... তবে অনুমানগুলি কখনও এমন জনসংখ্যাকে বোঝানো যায় না যার বন্টন সম্পূর্ণ নির্দিষ্ট করা আছে…… কারণটি খুব সহজ: চূড়ান্ততাগুলি [ননপ্যারমেট্রিক) পরীক্ষায় যেমন ব্যবহার করা হয় না, বা অন্য কোনও দৃ .়তার সাথে সংযুক্ত জনসংখ্যার বৈশিষ্ট্য নয়। পরিবর্তে বা অন্য কোনও দৃ .়তার সাথে সংযুক্ত জনসংখ্যার বৈশিষ্ট্য নয়। পরিবর্তে বা অন্য কোনও দৃ .়তার সাথে সংযুক্ত জনসংখ্যার বৈশিষ্ট্য নয়। পরিবর্তেনমুনা -linked এর charachteristics প্রাপ্ত পর্যবেক্ষণ ... পরীক্ষার পরিসংখ্যান দ্বারা ব্যবহৃত informatikon প্রদান। ... সুতরাং যখন উভয় স্থিতিমাপ এবং nonparametric পরীক্ষার প্রয়োজন যে ফর্ম চ একটি বন্টন, পর্যবেক্ষণের সঙ্গে যুক্ত সম্পূর্ণরূপে পরিচিত হবে, যে জ্ঞান, স্থিতিমাপ ক্ষেত্রে, সাধারণভাবে আসন্ন বিজ্ঞাপনের প্রয়োজনীয় বন্টন হয় মাত্রার "অধিকৃত" বা আনুমানিক বা অসম্পূর্ণ তথ্যের ভিত্তিতে অনুমিত তাই হতে হবে। ননপ্যারমেট্রিক ক্ষেত্রে, অন্যদিকে এবং পর্যবেক্ষণের ক্ষোভ বৈশিষ্ট্যটিরসাধারণত একটি অগ্রাধিকার বিবেচনা থেকে স্পষ্টভাবে পরিচিত হয় এবং প্রয়োজন হয় না, সুতরাং, "অনুমান করা" হবে না। পার্থক্যটি, তবে, প্রয়োজনীয়তার মধ্যে একটি নয় বরং প্রয়োজনীয়টি এবং প্রয়োজনটি পূরণ করা হবে তা নিশ্চিত হওয়ার চেয়ে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.