বক্স প্লট নোট বনাম টুকি-ক্র্যামার অন্তর


10

'আর' -র বক্সপ্লট থেকে "খাঁজ" সহায়তা নথি ( বা মূল পাঠ্য ) নিম্নলিখিতটি দেয়:

যদি দুটি প্লটের খাঁজগুলি ওভারল্যাপ না হয় তবে এটি 'দৃ evidence় প্রমাণ' যে দুটি মিডিয়ানের পার্থক্য রয়েছে (চেম্বারস এট আল, 1983, পৃষ্ঠা 62)। ব্যবহৃত গণনাগুলির জন্য boxplot.stats দেখুন।

এবং ' boxplot.stats ' নিম্নলিখিতটি দেয়:

Notches (যদি অনুরোধ করা হয়) +/- 1.58 IQR / sqrt (n) পর্যন্ত প্রসারিত হয়। এটি ম্যাকগিল এট আল (1978, পৃষ্ঠা 16) দেওয়া চেম্বারস এট আল (1983, পৃষ্ঠা 62) -র 1.57 সহ সূত্রের মতো একই গণনার উপর ভিত্তি করে বলে মনে হচ্ছে। এগুলি দুটি মধ্যস্থদের তুলনায় তুলনামূলকভাবে মধ্যম হিসাবে অ্যাসিপটোটিক স্বাভাবিকতা এবং মোটামুটি সমান নমুনা আকারের উপর ভিত্তি করে তৈরি হয় এবং বলা হয় যে নমুনাগুলির অন্তর্নিহিত বিতরণে বরং সংবেদনশীল হতে পারে। ধারণাটি দুটি মধ্যমাধ্যমের পার্থক্যের জন্য প্রায় 95% আত্মবিশ্বাসের ব্যবধান দেবে বলে মনে হয়।

কলামের মাধ্যমের সাথে তুলনা করার জন্য এখন আমি টুকি-ক্রামার পরীক্ষার জেএমপি সংস্করণটি ব্যবহার করার সাথে আরও পরিচিত। জেএমপির জন্য ডকুমেন্টেশন এটি দেয়:

উপায়গুলির মধ্যে সমস্ত পার্থক্যের জন্য আকারযুক্ত একটি পরীক্ষা দেখায়। এটি টুকি বা টুকি-ক্রামার এইচএসডি (সততার সাথে গুরুত্বপূর্ণ পার্থক্য) পরীক্ষা। (টুকি 1953, ক্র্যামার 1956)। এই পরীক্ষাটি হুবহু আলফা-স্তরের পরীক্ষা যদি নমুনার আকার একই হয় এবং রক্ষণশীল যদি নমুনার আকারগুলি পৃথক হয় (হাইটার 1984)।

প্রশ্ন: দুটি পদ্ধতির মধ্যে সংযোগের প্রকৃতি কী? একজনকে অন্যটিতে রূপান্তর করার কোনও উপায় আছে কি?

দেখে মনে হচ্ছে যে কেউ মধ্যমা জন্য আনুমানিক 95% সিআই খুঁজছেন এবং সেখানে ওভারল্যাপ রয়েছে কিনা তা নির্ধারণ করছেন; এবং অন্যটি হ'ল দুটি সেট নমুনার মিডিয়ান একে অপরের যুক্তিসঙ্গত পরিসরের মধ্যে রয়েছে কিনা তা নির্ধারণের জন্য একটি "সঠিক আলফা পরীক্ষা" (আমার নমুনা একই আকারের)।

আমি প্যাকেজগুলি উল্লেখ করি, তবে আমি যুক্তির পিছনে গণিতে আগ্রহী interested

উত্তর:


11

যতক্ষণ না খালি বক্সপ্লট যায়, আপনার প্রশ্নে উল্লিখিত ম্যাকগিল এট আল [1] রেফারেন্সে বেশ সম্পূর্ণ বিবরণ রয়েছে (আমি এখানে বলি এমন সমস্ত কিছুই সেখানে স্পষ্টভাবে উল্লেখ করা হয়নি, তবে তা সুনির্দিষ্টভাবে বিশ্লেষণ করার জন্য এটি যথেষ্ট বিশদ)।

ইন্টারভালটি হ'ল এক গৌরবময় তবে গাউস-ভিত্তিক

কাগজটি notches জন্য নিম্নলিখিত ব্যবধান উদ্ধৃত (যেখানে নমুনা মিডিয়ান এবং নমুনা আন্তঃখণ্ড পরিধি):MR

M±1.7×1.25R/(1.35N)

কোথায়:

  • 1.35আইকিউআরগুলিকে অনুমানে রূপান্তরিত করার জন্য একটি অ্যাসিম্পটোটিক রূপান্তর ফ্যাক্টর - বিশেষত, এটি একটি আদর্শ সাধারণের 0.75 কোয়ান্টাইল এবং 0.25 কোয়ান্টাইলের মধ্যে প্রায় পার্থক্য; জনসংখ্যার কোয়ার্টাইলগুলি প্রায় 1.35 বিচ্ছিন্ন, সুতরাং এর কাছাকাছি মানের মান (আরও নির্ভুলভাবে, প্রায় 1.349) এর একটি সামঞ্জস্যপূর্ণ (asympototically নিরপেক্ষ) অনুমান করা উচিত ।σσR/1.35σ

  • 1.25 আসে কারণ আমরা মাঝের চেয়ে অ্যাসিম্পটোটিক স্ট্যান্ডার্ড ত্রুটিটি মোকাবেলা করছি। বিশেষত, স্যাম্পল মিডিয়ানের অ্যাসিম্পটোটিক ভেরিয়েন্সটি যেখানে হ'ল ঘনত্বের উচ্চতা। একটি সাধারণ বিতরণের জন্য, হ'ল , সুতরাং নমুনা মান ত্রুটি ।14nf02f0f012πσ0.3989σ12Nf0=π/2σ/N1.253σ/N

    স্টাসক যেমন এখানে উল্লেখ করেছেন , তত ছোট হবে, এটি আরও সন্দেহজনক হবে (প্রথম স্থানে সাধারণ বিতরণটি ব্যবহার করার যুক্তিসঙ্গততার সাথে তার তৃতীয় কারণটি প্রতিস্থাপন করুন।N

    উপরের প্রায় স্ট্যান্ডার্ড ত্রুটির একটি অ্যাসিম্পটোটিক অনুমান । ম্যাকগিল এট এটিকে ক্যানডাল এবং স্টুয়ার্টের কাছে ক্রেডিট করে (আমি মনে করি না যে নির্দিষ্ট সূত্রটি সেখানে উপস্থিত রয়েছে কিনা, তবে উপাদানগুলি হবে)।1.25R/(1.35N)

  • সুতরাং যে সমস্ত আলোচনা করতে বাকি আছে তা 1.7 এর ফ্যাক্টর।

    মনে রাখবেন যে আমরা যদি একটি নমুনা একটি স্থিত মানের (একটি অনুমানযুক্ত মধ্যক বলি) সাথে তুলনা করি তবে আমরা 5% পরীক্ষার জন্য 1.96 ব্যবহার করব; ফলস্বরূপ, যদি আমাদের দুটি খুব আলাদা স্ট্যান্ডার্ড ত্রুটি থাকে (একটি তুলনামূলকভাবে বড়, একটি খুব ছোট), তবে এটি ব্যবহারের ফ্যাক্টর সম্পর্কে হবে (যেহেতু নালটি সত্য ছিল, পার্থক্যটি প্রায় সম্পূর্ণরূপে বৃহত্তর সাথে একটিতে পরিবর্তনের কারণে হবে) স্ট্যান্ডার্ড ত্রুটি, এবং ছোটটি - প্রায় - কার্যকরভাবে স্থির হিসাবে গণ্য হতে পারে)।

    অন্যদিকে, যদি দুটি স্ট্যান্ডার্ড ত্রুটি একই রকম হয়, তবে 1.96 অনেক বড় একটি ফ্যাক্টর হবে, যেহেতু উভয় নোটের সেট এটিতে আসে - দুটি সেট নোটের ওভারল্যাপে ব্যর্থ না হওয়ার জন্য আমরা প্রতিটিটির একটিতে যুক্ত করছি। এটি সঠিক ফ্যাক্টরটি make asyptotically তৈরি করবে।1.96/21.386

    কোথাও এর মধ্যে, আমাদের কাছে মোটামুটি আপস ফ্যাক্টর হিসাবে 1.7 রয়েছে। ম্যাকগিল এট এটিকে "অভিজ্ঞতাই নির্বাচিত" হিসাবে বর্ণনা করেন। এটি ভেরিয়েন্সগুলির একটি নির্দিষ্ট অনুপাত ধরে নেওয়ার খুব কাছাকাছি আসে, সুতরাং আমার অনুমান (এবং এটি এর চেয়ে বেশি কিছু নয়) যে অনুভূতি নির্বাচন (সম্ভবত কিছু সিমুলেশন ভিত্তিক) বৈকল্পিকগুলির জন্য গোল-মান অনুপাতের সেটগুলির মধ্যে ছিল (যেমন 1: 1, 2: 1,3: 1, ...), যার মধ্যে ": সেরা সমঝোতা" থেকে অনুপাতটি তখন দুটি সংখ্যায় পরিণত হয় । কমপক্ষে এটি 1.7 এর খুব কাছাকাছি পৌঁছনোর একটি প্রশংসনীয় উপায়।r : 1 1.96 / rr:11.96/1+1/r

তাদের সমস্ত (1.35,1.25 এবং 1.7) এক সাথে রাখলে প্রায় 1.57 দেয়। কিছু উত্স 1.35 বা 1.25 (বা উভয়) আরও নির্ভুলভাবে গণনা করে 1.58 পান তবে 1.386 এবং 1.96 এর মধ্যে একটি সমঝোতা হিসাবে, যে 1.7 দুটি উল্লেখযোগ্য পরিসংখ্যানের সাথেও সঠিক নয় (এটি কেবল একটি বলপার্ক সমঝোতার মান), সুতরাং অতিরিক্ত নির্ভুলতা হ'ল অর্থহীন (তারা পাশাপাশি পুরো জিনিসটি কেবল ১. to এ পরিণত হয়েছে এবং এটি দিয়ে সম্পন্ন হবে)।

মনে রাখবেন যে এখানে কোথাও একাধিক তুলনার জন্য কোনও সমন্বয় নেই।


টুকি-ক্রামার এইচএসডির পার্থক্যের জন্য আত্মবিশ্বাসের সীমাতে কিছু স্বতন্ত্র উপমা রয়েছে :

y¯iy¯j±qα;k;Nk2σ^ε1ni+1nj

তবে নোট করুন

  • এই একটি সম্মিলিত ব্যবধান, একটি পার্থক্য অবদান পৃথক না দুই (তাই আমরা একটি শব্দ আছে বদলে দুই আলাদাভাবে অবদান এবং এবং আমরা ধ্রুবক ভ্যারিয়েন্স অনুমান (তাই আমরা সঙ্গে আপস সঙ্গে তার আচরণ করছি না - যখন আমাদের খুব আলাদা বৈকল্পিক হতে পারে - অ্যাসিপটোটিক কেসের চেয়ে) কেc.1ni+1nj কেk.1ni 1.961.96/k.1nj1.961.96/2

  • এটি মাধ্যমের ভিত্তিতে নয়, মিডিয়ানের ভিত্তিতে নয় (সুতরাং কোনও 1.35 নেই)

  • এটি এর উপর ভিত্তি করে তৈরি হয়েছে , যার অর্থ বৃহত্তর পার্থক্যের উপর ভিত্তি করে তৈরি হয়েছে (সুতরাং এটির মধ্যে কোনও 1.96 অংশ নেই, এমনকি দ্বারা বিভক্ত একটি অংশও রয়েছে )। একাধিক বাক্সের প্লটের তুলনা করার বিপরীতে, মিডিয়ানদের মধ্যে সবচেয়ে বড় পার্থক্যের ভিত্তিতে খাঁজগুলি ভিত্তি করার বিষয়ে কোনও বিবেচনা নেই, এগুলি সবই নিখুঁতভাবে জোড়াযুক্ত।q2

সুতরাং উপাদানগুলির ফর্মের পিছনে বেশ কয়েকটি ধারণাগুলি কিছুটা সাদৃশ্যপূর্ণ হলেও তারা যা করছেন তা আসলে তারা বেশ আলাদা।

[1] ম্যাকগিল, আর।, টুকি, জেডাব্লু এবং লারসেন, ডাব্লুএ (1978) বক্স প্লটের বিভিন্নতা। আমেরিকান পরিসংখ্যানবিদ 32, 12-16।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.