ননপ্যারমেট্রিক পরিসংখ্যানগুলিতে বন্ধনগুলি কেন এত কঠিন?


14

আমার ননপ্যারমেট্রিক টেক্সট, প্রাকটিকাল ননপ্যারমেট্রিক স্ট্যাটিস্টিক্স প্রায়শই প্রত্যাশা, বৈকল্পিকতা, পরীক্ষার পরিসংখ্যান এবং এর মতো পরিষ্কার সূত্র দেয় তবে এই সংস্থানটি অন্তর্ভুক্ত করে যা আমরা যদি সম্পর্কগুলিকে উপেক্ষা করি তবেই এটি কাজ করে। মান-হুইটনি ইউ স্ট্যাটিস্টিক গণনা করার সময়, উত্সাহিত করা হয় যে আপনি কোনটি বড় is

আমি জানি যে বন্ধনগুলি আসলে কোন জনসংখ্যা বেশি সে সম্পর্কে খুব বেশি কিছু আমাদের জানায় না (যদি আমরা এটিতে আগ্রহী তবে) যেহেতু কোনও গ্রুপই অপরের চেয়ে বড় নয়, তবে অ্যাসিম্পটোটিক বিতরণগুলি বিকাশ করার সময় এটি মনে হয় না।

তবে কেন এটি কিছু ননপ্যারমেট্রিক পদ্ধতিতে বন্ধনগুলির সাথে এ জাতীয় কলঙ্কজনক আচরণ করা হচ্ছে? বন্ধনগুলি থেকে কেবল ছুঁড়ে ফেলে দেওয়ার পরিবর্তে কোনও কার্যকর তথ্য আহরণের কোনও উপায় আছে কি?

সম্পাদনা: @ হুঁশিয়ার মন্তব্য সম্পর্কিত, আমি আবার আমার উত্সগুলি পরীক্ষা করে দেখেছি এবং কিছু পদ্ধতিগুলি সম্পূর্ণরূপে বাঁধা মানগুলি বাদ দেওয়ার পরিবর্তে গড়ে গড়ে গড়ে ওঠে use যদিও তথ্য বজায় রাখার প্রসঙ্গে এটি আরও বোধগম্য মনে হয়, তবে এটি আমার কাছে মনে হয় যে এতে কঠোরতা নেই। প্রশ্নের চেতনা এখনও দাঁড়িয়ে আছে।


আপনি কি বলছেন যে প্রাকটিকাল ননপ্যারামেট্রিক স্ট্যাটিস্টিক্স আপনাকে বাঁধা অবস্থায় ডেটা " ফেলে দিতে " বলে ? আপনি সম্ভবত এর পরামর্শ ভুল ব্যাখ্যা করতে পারেন? আপনি কি ঠিক তা উদ্ধৃত করতে পারেন?
শুক্র

হ্যাঁ, এটি সম্ভব যে আমি পরামর্শটির ভুল ব্যাখ্যা করছি। একই লেখকের কাছ থেকে: jstor.org/stable/2284536 " উইলকক্সন প্রাথমিকভাবে ডেটা থেকে জিরোগুলি নামিয়ে দেওয়ার এবং উপাত্তের হ্রাস করা সেটটিতে পরীক্ষা করার পরামর্শ দিয়েছিলেন। যদি কোনও ননজারো সম্পর্ক না থাকে তবে শর্তাধীন এই ফলাফলের (সংখ্যাটি দেওয়া হয়েছে) জিরো) বিতরণ নিখরচায় পরীক্ষার জন্য এবং সমালোচনামূলক মানগুলির বিদ্যমান সঠিক টেবিলগুলি সক্ষম করে তোলে this এজন্য ননপ্যারমেট্রিকের পরিসংখ্যান সম্পর্কিত বেশিরভাগ বই উইলকক্সনের পদ্ধতিটিকে তাদের পরীক্ষার বিবরণটিতে অন্তর্ভুক্ত করে "
ক্রিস্টোফার অ্যাডেন

মঞ্জুর, এটি উইলকক্সন স্বাক্ষরিত র‌্যাঙ্ক পরীক্ষার প্রসঙ্গে, তবে আমি অন্যান্য এনপি পদ্ধতিতেও অনুরূপ পরামর্শ শুনেছি। মান-হুইটনি উদাহরণের ক্ষেত্রে, আমি ফিরে গিয়ে বইটিতে চেক করেছিলাম এবং আপনি ঠিক বলেছেন যে আমি ভুল করে ফেলেছি। মান-হুইটনি সহ বইটি বাঁধা মানগুলির র‌্যাঙ্ক গড় গড়ে সুপারিশ করে, যেমন: যদি and এবং ks র‌্যাঙ্কগুলি বাঁধা থাকে, প্রত্যেককে একটি করে .5.৫ মান দেওয়া হয়।
ক্রিস্টোফার অ্যাডেন

2
ধন্যবাদ. বাঁধা গোষ্ঠীগুলির জন্য অ্যাকাউন্ট করার জন্য কঠোর উপায় রয়েছে। সেন্সরযুক্ত (তবে ধারাবাহিক) ডেটা নিয়ে কাজ করার সময় এগুলি গুরুত্বপূর্ণ, কারণ ঘন ঘন সেন্সর করা মানগুলি একটি বড় বাঁধা গোষ্ঠী গঠন করে। কৃষ্কাল-ওয়ালিস এবং উইলকক্সন র‌্যাঙ্ক সামের পরীক্ষার জন্য, আরও গিলবার্টের অধ্যায় ১৮ দেখুন, * পরিবেশ দূষণ পর্যবেক্ষণের জন্য পরিসংখ্যানগত পদ্ধতি। "বাঁধা ডেটা সম্পর্কিত সূত্রগুলি জটিল হতে পারে, তবে কিছু ক্ষেত্রে (কেডাব্লু টেস্টের মতো) আপনার যা করতে হবে তা করা উচিত all পদমর্যাদার জন্য একটি আনোভা টেবিল গণনা করা হয়
হুবুহু

উত্তর:


14

নন-প্যারাম্যাট্রিক্সের বেশিরভাগ কাজটি মূলত ধরে নিয়েই করা হয়েছিল যে এখানে অন্তর্নিহিত ধারাবাহিক বিতরণ রয়েছে যার মধ্যে বন্ধনগুলি অসম্ভব (যদি যথাযথভাবে পরিমাপ করা হয়)। তত্ত্বটি তখন অর্ডার পরিসংখ্যানগুলির বিতরণ (যা সম্পর্কগুলি ছাড়াই অনেক সহজ) বা অন্যান্য সূত্রের ভিত্তিতে তৈরি করা যেতে পারে। কিছু ক্ষেত্রে পরিসংখ্যানগুলি প্রায় স্বাভাবিক হিসাবে কাজ করে যা জিনিসগুলি সত্যই সহজ করে তোলে। যখন ডেটাটি বৃত্তাকার বা প্রাকৃতিকভাবে পৃথক হয়ে যাওয়ার কারণে বন্ধনগুলি প্রবর্তিত হয়, তখন মানক অনুমানগুলি ধারণ করে না। অনুমানের পরিমাণটি এখনও কিছু ক্ষেত্রে যথেষ্ট ভাল হতে পারে তবে অন্যদের মধ্যে নয়, প্রায়শই করা সহজ কাজটি কেবল একটি সতর্কতা দেয় যে এই সূত্রগুলি সম্পর্কগুলির সাথে কাজ করে না।

কিছু স্ট্যান্ডার্ড নন-প্যারাম্যাট্রিক পরীক্ষার জন্য সরঞ্জাম রয়েছে যা বন্ধন উপস্থিত থাকার সময় সঠিক বিতরণটি কার্যকর করেছিল। আর এর জন্য নির্ভুলআরঙ্কটেষ্ট প্যাকেজ একটি উদাহরণ।

সম্পর্কের সাথে মোকাবিলা করার একটি সহজ উপায় হ'ল নির্গমন পরীক্ষা বা বুটস্ট্র্যাপিংয়ের মতো এলোমেলোকরণ পরীক্ষা ব্যবহার করা। এহিম্পোটোটিক বিতরণগুলি নিয়ে তারা চিন্তা করবেন না, তবে ডেটা যেমন আছে তেমন ব্যবহার করুন, বন্ধন এবং সমস্ত (নোট করুন যে অনেকগুলি বন্ধন সহ, এমনকি এই কৌশলগুলিও কম শক্তি থাকতে পারে)।

কয়েক বছর আগে এখানে একটি নিবন্ধ ছিল (আমি আমেরিকান পরিসংখ্যানবিদদের মধ্যে ভেবেছিলাম, তবে আমি এটি খুঁজে পাচ্ছি না) যা সম্পর্কের ধারণা এবং তাদের সাথে আপনি কী করতে পারেন সেগুলি নিয়ে কিছু আলোচনা করেছিল। একটি বিষয় হ'ল এটি নির্ভর করে যে আপনি কোন প্রশ্ন জিজ্ঞাসা করছেন তার উপর নির্ভর করে যে সম্পর্কগুলির সাথে কী করবেন তা উচ্চতরত্বের বনাম বনাম একটি হীনমন্যতা পরীক্ষায় খুব আলাদা হতে পারে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.