আমি জানি নন-প্যারামিট্রিক গড়ের পরিবর্তে মিডিয়ানের উপর নির্ভর করে
কোনও ননপ্রেমেট্রিক পরীক্ষা আসলেই এই অর্থে মিডিয়ানদের "নির্ভর" করে তোলে। আমি কেবল একটি দম্পতি সম্পর্কে ভাবতে পারি ... এবং কেবলমাত্র আমিই প্রত্যাশা করি যে আপনি সম্ভবত শুনেছেন সাইন টেস্ট।
তুলনা করা ... কিছু।
যদি তারা মিডিয়ানদের উপর নির্ভর করে তবে সম্ভবত এটি মেডিয়ানদের তুলনা করা। তবে - বেশ কয়েকটি উত্স আপনাকে যা বলার চেষ্টা করেছে তা সত্ত্বেও - স্বাক্ষরিত র্যাঙ্ক পরীক্ষা, বা উইলকক্সন-মান-হুইটনি বা ক্রুসকল-ওয়ালিসের মতো পরীক্ষাগুলি আদৌ মিডিয়ানের পরীক্ষা নয়; যদি আপনি কিছু অতিরিক্ত অনুমান করেন, আপনি উইলকক্সন-মান-হুইটনি এবং ক্রুসকল-ওয়ালিসকে মধ্যস্থদের পরীক্ষা হিসাবে বিবেচনা করতে পারেন, তবে একই অনুমানের অধীনে (যতক্ষণ না বিতরণের উপায় বিদ্যমান রয়েছে) আপনি তাদেরকে সমানভাবে উপায় হিসাবে পরীক্ষা হিসাবে বিবেচনা করতে পারেন ।
স্বাক্ষরিত র্যাঙ্ক পরীক্ষার সাথে সম্পর্কিত প্রকৃত অবস্থান-অনুমান নমুনার মধ্যে জুটি গড় গড়ের মধ্যস্থতা, উইলকক্সন-মান-হুইটনি (এবং জড়িতভাবে, ক্রুসকল-ওয়ালিসে) এক-জুটি-জুড়ে পার্থক্যগুলির মধ্যবর্তী ।
আমিও বিশ্বাস করি এটি "স্বাধীনতার ডিগ্রি" এর উপর নির্ভর করে? পরিবর্তে স্ট্যান্ডার্ড বিচ্যুতি। আমি ভুল থাকলে আমাকে সংশোধন করুন।
সর্বাধিক ননপ্যারামেট্রিক টেস্টে 'ডিগ্রি অফ স্বাধীনতা' থাকে না, যদিও নমুনা আকারের সাথে অনেকগুলি বন্টন হয় এবং আপনি বিবেচনা করতে পারেন যে কিছুটা স্বাধীনতার ডিগ্রির সাথে এই অর্থে যে সারণিগুলি নমুনা আকারের সাথে পরিবর্তিত হয়। নমুনাগুলি অবশ্যই তাদের বৈশিষ্ট্যগুলি বজায় রাখে এবং সেই অর্থে স্বাধীনতার n ডিগ্রি থাকে তবে একটি পরীক্ষার পরিসংখ্যান বিতরণে স্বাধীনতার ডিগ্রি সাধারণত আমাদের সম্পর্কিত কিছু নয়। এটি ঘটতে পারে যে স্বাধীনতার ডিগ্রিগুলির মতো আপনার আরও কিছু রয়েছে - উদাহরণস্বরূপ, আপনি অবশ্যই একটি যুক্তি দিতে পারেন যে ক্রুশাল-ওয়ালিসের মূলত একইভাবে একটি চি-বর্গক্ষেত্রের স্বাধীনতার ডিগ্রি রয়েছে, তবে সাধারণত এটির দিকে নজর দেওয়া হয় না এইভাবে (উদাহরণস্বরূপ, কেউ যদি কোনও ক্রুসকল-ওয়ালিসের স্বাধীনতার ডিগ্রি সম্পর্কে কথা বলে থাকে তবে তারা প্রায় সবসময় ডিএফকে বোঝায়
স্বাধীনতার ডিগ্রি সম্পর্কে একটি ভাল আলোচনা এখানে পাওয়া যাবে /
আমি বেশ ভাল গবেষণা করেছি, বা তাই আমি ভাবলাম, ধারণাটি বোঝার চেষ্টা করেছিলাম, এর পিছনে কী কাজ রয়েছে, পরীক্ষার ফলাফলগুলি আসলে কী বোঝায়, এবং / অথবা এমনকি পরীক্ষার ফলাফলগুলি দিয়ে কী করবে; তবে কেউ কখনও সে অঞ্চলে ুকেছে বলে মনে হয় না।
আপনি এটার অর্থ কী তা আমি নিশ্চিত নই।
আমি কনভারের প্রাকটিক্যাল ননপ্যারামেট্রিক স্ট্যাটিস্টিক্সের মতো কয়েকটি বইয়ের পরামর্শ দিতে পারলাম এবং যদি আপনি এটি পেতে পারেন তবে নেভ অ্যান্ড ওয়ার্থিংটনের বই ( বিতরণ-মুক্ত টেস্ট ), তবে আরও অনেকগুলি রয়েছে - ম্যারাস্কুইলো এবং ম্যাকসুইনিয়ে, হল্যান্ডার এবং ওল্ফ, বা উদাহরণস্বরূপ ড্যানিয়েলের বই। আমি আপনাকে পরামর্শ দিচ্ছি যে আপনি আপনার সাথে সবচেয়ে ভাল কথা বলুন তাদের মধ্যে কমপক্ষে 3 বা 4 টি পড়ুন, সম্ভবত যেগুলি বিষয়গুলিকে যতটা সম্ভব পৃথকভাবে ব্যাখ্যা করে (এর অর্থ কমপক্ষে 3 বা স্যুটটি খুঁজে পেতে 6 বা 7 টি বই পড়তে হবে)।
সরলতার খাতিরে মান হুইটনি ইউ পরীক্ষাটি আটকে দিন, আমি লক্ষ্য করেছি যে এটি বেশ জনপ্রিয়
এটিই যা আপনার বক্তব্যটি সম্পর্কে আমাকে বিস্মিত করেছিল "" কেউ কখনও সে অঞ্চলে প্রবেশ করেনি বলে মনে হয় না "- এই পরীক্ষাগুলি ব্যবহার করা অনেকেই আপনি যে অঞ্চলের বিষয়ে কথা বলছিলেন তা 'এলাকায় প্রবেশ করে' venture
- এবং আপাতদৃষ্টিতে অপব্যবহার এবং অত্যধিক ব্যবহৃত
আমি বলতে চাই nonparametric পরীক্ষা সাধারণত underused যদি কিছু (Wilcoxon-মান-হুইটনি সহ) - সবচেয়ে বিশেষত বিন্যাস / র্যান্ডোমাইজেশন পরীক্ষা যদিও আমি অগত্যা বিতর্ক যে, তারা ঘন ঘন অপব্যবহার হবে করছি (কিন্তু তাই স্থিতিমাপ পরীক্ষা হয়, এমনকি তাই আরো).
ধরা যাক আমি আমার ডেটা দিয়ে একটি প্যারামিমেট্রিক পরীক্ষা চালাচ্ছি এবং আমি এই ফলাফলটি ফিরে পেয়েছি:
[স্নিপ]
আমি অন্যান্য পদ্ধতির সাথে পরিচিত, তবে এখানে কী আলাদা?
আপনি অন্য কোন পদ্ধতি বোঝাতে চান? আপনি কি আমার সাথে এটি তুলনা করতে চান?
সম্পাদনা: আপনি পরে প্রতিরোধের কথা উল্লেখ করেছেন; আমি তখন ধরেই নিয়েছি যে আপনি একটি দ্বি-নমুনা টি-টেস্টের সাথে পরিচিত (যেহেতু এটি সত্যই রিগ্রেশনের একটি বিশেষ ঘটনা)।
সাধারণ দুটি-নমুনা টি-টেস্টের অনুমানের অধীনে, নাল অনুমানটি হ'ল দুটি জনসংখ্যা অভিন্ন, বিকল্পগুলির মধ্যে যে কোনও একটি বিতরণ স্থানান্তরিত হয়েছে তার বিপরীতে। নীচের উইলকক্সন-মান-হুইটনিতে অনুমানের দুটি সেটগুলির প্রথমটি যদি আপনি দেখেন তবে সেখানে পরীক্ষা করা হচ্ছে এমন প্রাথমিক জিনিসটি প্রায় অভিন্ন; এটি ঠিক যে টি-টেস্টটি নমুনাগুলি অভিন্ন স্বাভাবিক বিতরণ (সম্ভাব্য অবস্থান-স্থানান্তর ব্যতীত) থেকে আসে তা ধরে নেওয়ার ভিত্তিতে is যদি নাল অনুমানটি সত্য হয় এবং সাথে অনুমানগুলি সত্য হয় তবে পরীক্ষার পরিসংখ্যানটির টি-বিতরণ থাকে। যদি বিকল্প অনুমানটি সত্য হয়, তবে পরীক্ষা-পরিসংখ্যানগুলি এমন মান গ্রহণের সম্ভাবনা বেশি করে যা নাল অনুমানের সাথে সামঞ্জস্যপূর্ণ নয় তবে বিকল্পের সাথে সামঞ্জস্যপূর্ণ দেখায় - আমরা সর্বাধিক অস্বাভাবিক,
উইলকক্সন-মান-হুইটনির সাথে পরিস্থিতি অনেকটা সাদৃশ্যপূর্ণ তবে এটি নাল থেকে বিচ্যুতিটি কিছুটা আলাদাভাবে পরিমাপ করে। আসলে, যখন টি-টেস্টের অনুমানগুলি সত্য হয় *, এটি সর্বোত্তম সম্ভাব্য পরীক্ষার (যা টি-টেস্ট) হিসাবে প্রায় ভাল।
* (যা বাস্তবে কখনও হয় না, যদিও এটি আসলে যতটা সমস্যা মনে হয় ততটা সমস্যা নয়)
প্রকৃতপক্ষে, উইলকসন-মান-হুইটনিটিকে কার্যকরভাবে উপাত্তের মঞ্চে সঞ্চালিত "টি-টেস্ট" হিসাবে বিবেচনা করা সম্ভব - যদিও এর টি-বিতরণ নেই; পরিসংখ্যানটি ডেটা র্যাঙ্কে গণনা করা দুটি-নমুনা টি-স্ট্যাটিস্টিকের মনোটোনিক ফাংশন, সুতরাং এটি নমুনা স্পেসে একই ক্রম ** প্রেরণা দেয় (যা র্যাঙ্কগুলিতে একটি "টি-পরীক্ষা" - যথাযথভাবে সম্পাদিত হয় - উইলকক্সন-মান-হুইটনি) এর মতো একই পি-মানগুলি তৈরি করতে পারে, তাই এটি ঠিক একই ক্ষেত্রে প্রত্যাখ্যান করে।
** (কঠোরভাবে, আংশিক অর্ডারিং, তবে আসুন এটি একপাশে ছেড়ে দিন)
[আপনি ভাবেন যে স্রেফ র্যাঙ্কগুলি ব্যবহার করে প্রচুর তথ্য ছুঁড়ে দেওয়া হবে, কিন্তু যখন একই বিপরীতে সাধারণ জনসংখ্যা থেকে তথ্য আঁকানো হয়, তখন অবস্থান-স্থানান্তর সম্পর্কে প্রায় সমস্ত তথ্যই র্যাঙ্কগুলির ধরণীতে থাকে। আসল ডেটা মানগুলি (তাদের মর্যাদায় শর্তযুক্ত) এতে খুব সামান্য অতিরিক্ত তথ্য যুক্ত করে। আপনি যদি স্বাভাবিকের চেয়ে ভারী-লেজুড়ে যান তবে উইলকক্সন-মান-হুইটনি পরীক্ষার আরও ভাল ক্ষমতা থাকার খুব বেশি আগে নয়, পাশাপাশি এর নামমাত্র তাত্পর্য স্তর বজায় রাখা যাতে শেষ পর্যন্ত র্যাঙ্কের উপরে 'অতিরিক্ত' তথ্য কেবল অজানা নয় বরং কিছু ক্ষেত্রে পরিণত হয় বোধ, বিভ্রান্তিকর। যাইহোক, কাছাকাছি-প্রতিসম ভারী-লেজুভাব একটি বিরল পরিস্থিতি; আপনি প্রায়শই বাস্তবে যা দেখেন তা হ'ল স্কিউনেস]
বুনিয়াদি ধারণাগুলি একেবারে সমান, পি-মানগুলির একই ব্যাখ্যা রয়েছে (নাল অনুমানটি যদি সত্য হয় তবে ফলাফলের সম্ভাবনা, বা আরও চরম) - ঠিক যদি অবস্থান তৈরি হয় তবে আপনি যদি ব্যাখ্যা করেন তবে প্রয়োজনীয় অনুমান (এই পোস্টের শেষের নিকটবর্তী অনুমানের আলোচনা দেখুন)।
যদি আমি টি-টেস্টের জন্য উপরের প্লটগুলির মতো একই সিমুলেশনটি করি, প্লটগুলি খুব অনুরূপ দেখাবে - x- এবং y- অক্ষের স্কেলটি দেখতে অন্যরকম দেখাবে, তবে মূল চেহারাটি একই রকম হবে।
আমাদের কি পি-ভ্যালু .05 এর চেয়ে কম হওয়া উচিত?
আপনার সেখানে কিছু "চাওয়া" উচিত নয়। ধারণাটি হ'ল নমুনাগুলি সুযোগের দ্বারা ব্যাখ্যা করা যায় তার চেয়ে বেশি আলাদা (কোনও অবস্থান-অর্থে) কোনও নির্দিষ্ট ফলাফলের 'ইচ্ছা' নয়।
যদি বলি "আপনি দেখতে কি রঙ রাজের গাড়ী দয়া করে যেতে পারি?", আমি যদি এটা একজন নিরপেক্ষ মূল্যায়ন চান আমি আপনি যেতে থেকে "ম্যান, আমি সত্যিই সত্যিই, আশা করি এটা নীল চাই না! এটা ঠিক আছে হতে নীল "। পরিস্থিতি কী তা দেখার জন্য সেরা, কারও সাথে 'আমার কিছু হওয়া দরকার' এর সাথে না গিয়ে।
আপনার নির্বাচিত তাত্পর্য স্তর যদি 0.05 হয়, তবে পি-মান 0.05 এর নীচে থাকলে আপনি নাল অনুমানটি বাতিল করবেন। তবে প্রায়শই প্রাসঙ্গিক প্রভাব-আকারগুলি সনাক্ত করতে আপনার কাছে যথেষ্ট পরিমাণে নমুনার আকার থাকলে তা প্রত্যাখ্যান করতে ব্যর্থতা কমপক্ষে আকর্ষণীয়, কারণ এটি বলে যে কোনও পার্থক্য বিদ্যমান যা ছোট।
"মান হুইটলি" নম্বরটির অর্থ কী?
মান-হুইটনি পরিসংখ্যান ।
নাল অনুমানটি সত্য হলে (উপরের চিত্রটি দেখুন) যে মানগুলি নিতে পারে সেগুলির তুলনায় এটি কেবলমাত্র অর্থবহ এবং কোনও বিশেষ প্রোগ্রাম কোনটি নির্দিষ্ট সংজ্ঞা ব্যবহার করতে পারে তার উপর নির্ভর করে।
এর কি কোন ব্যবহার আছে?
সাধারণত আপনি যথাযথ মানটির বিষয়ে চিন্তা করেন না, তবে এটি নাল-বিতরণে কোথায় রয়েছে (নাল অনুমানটি সত্য হওয়ার সময় আপনার যে মূল্যবোধগুলি দেখা উচিত সেগুলি কম-বেশি হয় বা এটি আরও চরম কিনা)
P(X<Y)
এখানে থাকা এই ডেটাটি কি কেবল যাচাই করে বা যাচাই করে না যে আমার কাছে থাকা ডেটাগুলির একটি নির্দিষ্ট উত্স ব্যবহার করা উচিত বা করা উচিত নয়?
এই পরীক্ষাটি "আমার থাকা ডেটার একটি নির্দিষ্ট উত্স ব্যবহার করা উচিত বা ব্যবহার করা উচিত নয়" সম্পর্কে কিছুই বলে না।
নীচের ডাব্লুএমডাব্লু অনুমানের দিকে তাকানোর দুটি উপায় সম্পর্কে আমার আলোচনা দেখুন।
আমার কাছে রিগ্রেশন এবং বেসিকগুলির সাথে যুক্তিসঙ্গত পরিমাণ অভিজ্ঞতা রয়েছে তবে আমি এই "বিশেষ" নন-প্যারাম্যাট্রিক স্টাফ সম্পর্কে খুব কৌতূহলী
ননপ্যারমেট্রিক টেস্টগুলির জন্য বিশেষভাবে কিছুই নেই (আমি বলব যে 'স্ট্যান্ডার্ড' সাধারণত বিভিন্ন প্যারামেট্রিক টেস্টের তুলনায় অনেক বেশি মৌলিক) - যতক্ষণ না আপনি বাস্তবে হাইপোথিসিস পরীক্ষার বিষয়টি বোঝেন understand
তবে সম্ভবত এটি অন্য একটি প্রশ্নের একটি বিষয়।
উইলকক্সন-মান-হুইটনি হাইপোথিসিস পরীক্ষাটি দেখার জন্য দুটি প্রধান উপায় রয়েছে।
i) একটি বলতে হবে "আমি লোকেশন-শিফটে আগ্রহী - এটি হ'ল নকল অনুমানের অধীনে, দুটি জনগোষ্ঠীর বিকল্পটির পরিবর্তে" স্থানান্তরিত "বা নীচে পরিবর্তিত হওয়ার বিপরীতে দুটি জনসংখ্যার একই (ধারাবাহিক) বন্টন হয় অন্যান্য "
উইলকক্সন-মান-হুইটনি খুব ভাল কাজ করে যদি আপনি এই অনুমানটি করেন (আপনার বিকল্পটি কেবলমাত্র একটি স্থানের শিফট)
এক্ষেত্রে উইলকক্সন-মান-হুইটনি আসলে মিডিয়ানদের জন্য একটি পরীক্ষা ... তবে সমানভাবে এটি অর্থের জন্য পরীক্ষা, বা সত্যই কোনও অন্য স্থান-সমতুল্য পরিসংখ্যান (উদাহরণস্বরূপ, বা ছাঁটাইযুক্ত উপায়, বা যে কোনও সংখ্যক অন্যান্য জিনিস), যেহেতু তারা সবাই অবস্থান-শিফটে একইভাবে প্রভাবিত।
এ সম্পর্কে দুর্দান্ত জিনিসটি এটি খুব সহজেই ব্যাখ্যাযোগ্য - এবং এই অবস্থান-স্থানান্তরের জন্য একটি আস্থার ব্যবধান উত্পন্ন করা সহজ।
তবে উইলকক্সন-মান-হুইটনি পরীক্ষা লোকেশন শিফটের চেয়ে অন্য ধরণের পার্থক্যের জন্য সংবেদনশীল।
1212