কিউকিউ প্লটটি স্বাভাবিক দেখায় তবে শাপিরো-উইলক পরীক্ষা অন্যথায় বলে


12

আর-তে আমার 348 টি পরিমাপের একটি নমুনা রয়েছে এবং আমি ভবিষ্যতে পরীক্ষার জন্য এটি সাধারণত বিতরণ করা হয়েছে তা ধরে নিতে পারি কিনা তা জানতে চাই।

মূলত অন্য স্ট্যাকের উত্তর অনুসরণ করে , আমি ঘনত্ব প্লট এবং কিউকিউ প্লটটির সাথে দেখছি:

plot(density(Clinical$cancer_age))

এখানে চিত্র বর্ণনা লিখুন

qqnorm(Clinical$cancer_age);qqline(Clinical$cancer_age, col = 2)

এখানে চিত্র বর্ণনা লিখুন

আমার কাছে পরিসংখ্যানগুলিতে শক্তিশালী অভিজ্ঞতা নেই তবে এগুলি আমি দেখেছি এমন সাধারণ বিতরণের উদাহরণগুলির মতো দেখতে।

তারপরে আমি শাপিরো-উইলক পরীক্ষাটি চালাচ্ছি:

shapiro.test(Clinical$cancer_age)

> Shapiro-Wilk normality test

data:  Clinical$cancer_age
W = 0.98775, p-value = 0.004952

যদি আমি এটি সঠিকভাবে ব্যাখ্যা করি তবে এটি আমাকে নাল অনুমানকে প্রত্যাখ্যান করা নিরাপদ বলে জানিয়েছে, যা বিতরণটি স্বাভাবিক।

যাইহোক, আমি দুটি স্ট্যাক পোস্টের মুখোমুখি হয়েছি ( এখানে এবং এখানে ), যা দৃ the়ভাবে এই পরীক্ষার কার্যকারিতা হ্রাস করে। দেখে মনে হচ্ছে নমুনাটি বড় (348 কে বড় হিসাবে বিবেচনা করা হয়?), এটি সর্বদা বলবে যে বিতরণটি স্বাভাবিক নয়।

আমি কিভাবে এই সমস্ত ব্যাখ্যা করা উচিত? আমার কি কিউকিউ প্লটের সাথে থাকা উচিত এবং ধরে নেওয়া উচিত যে আমার বিতরণটি স্বাভাবিক?


4
কিউকিউ প্লটটি লেজগুলিতে স্বাভাবিক থেকে প্রস্থান দেখায়। এছাড়াও ফিটের ধার্মিকতার কোনও কার্যকর পরীক্ষা খুব বড় নমুনায় অস্বীকার করবে কেবল কারণ স্বাভাবিকতা থেকে ছোট প্রস্থানগুলি সনাক্ত করা হবে .. এটি শাপিরো - উইলক পরীক্ষার সমালোচনা নয় বরং ফিটের সচ্ছলতার জন্য পরীক্ষার বৈশিষ্ট্য।
মাইকেল আর চেরনিক

4
আপনার কাছে একটি সাধারণ বিতরণ কেন গুরুত্বপূর্ণ? এই অনুমানের ভিত্তিতে আপনি কী করতে চান?
রোল্যান্ড

6
কেবল রোল্যান্ডের মন্তব্যে যুক্ত করার জন্য- অনেকগুলি পরীক্ষা যেগুলি আনুষ্ঠানিকভাবে একটি সাধারণ বিতরণকে ধরে নেয় তা স্বাভাবিকতা থেকে সামান্য প্রস্থান (উদাহরণস্বরূপ, কারণ পরীক্ষার পরিসংখ্যানের বিতরণটি asyptotically সঠিক) under আপনি যা করতে চান তা সম্পর্কে যদি আপনি বিস্তারিত বলতে পারেন তবে আপনি আরও সহায়ক উত্তর পেতে পারেন।
পি.বাইন্ড্রিজ

1
@ এমডিউইউ, তীক্ষ্ণ পর্যবেক্ষণ! এটি ঘটনার ক্ষেত্রে বয়স নয়, তবে টিএনএর মেথিলিকেশন দ্বারা টিউমারটির "বয়স" পরিমাপ করা হয়।
ফ্রাঙ্কোসক্রোল

2
আমি মনে করি কেবলমাত্র পরিমাপের ত্রুটি কিনা তা পরীক্ষা করার জন্য খুব কম সংখ্যক চরম পর্যবেক্ষণগুলি পরীক্ষা করা মূল্যবান হবে।
mdewey

উত্তর:


11

আপনার এখানে সমস্যা নেই। আপনার ডেটা আমার সামান্য অস্বাভাবিক হতে পারে তবে এটি যথেষ্ট স্বাভাবিক যে এটি কোনও সমস্যা না করে। অনেক গবেষক আপনার কাছে থাকা তুলনায় খুব কম স্বাভাবিক ডেটা দিয়ে স্বাভাবিকতা ধরে ধরে পরিসংখ্যান পরীক্ষা করেন ।

আমি আপনার চোখ বিশ্বাস করব। লেজগুলির উপর কিছুটা ধনাত্মক স্কিউ সত্ত্বেও ঘনত্ব এবং কিউকিউ প্লটগুলি যুক্তিসঙ্গত দেখাচ্ছে। আমার মতে, এই ডেটার জন্য আপনার অ-স্বাভাবিকতা নিয়ে চিন্তা করার দরকার নেই।

আপনার প্রায় 350 এর একটি এন রয়েছে এবং পি-মানগুলি নমুনা আকারের উপর খুব নির্ভরশীল। একটি বৃহত নমুনা সহ, প্রায় কিছুই উল্লেখযোগ্য হতে পারে। এটি এখানে আলোচনা করা হয়েছে।

খুব জনপ্রিয় এই পোস্টে কিছু অবিশ্বাস্য উত্তর রয়েছে যা মূলত এই সিদ্ধান্তে আসে যে অ-স্বাভাবিকতার জন্য নাল-হাইপোথিসিসের তাত্পর্য পরীক্ষা করা "মূলত অকেজো"। এই পোস্টে স্বীকৃত উত্তরটি একটি চমত্কার প্রদর্শন যা প্রায় গাউসিয়ান প্রক্রিয়া থেকে ডেটা তৈরি করা হলেও , একটি উচ্চ পর্যাপ্ত নমুনার আকার অ-স্বাভাবিক পরীক্ষাটিকে তাৎপর্যযুক্ত করে তোলে।


দুঃখিত, আমি বুঝতে পেরেছি যে আপনি আপনার মূল প্রশ্নে উল্লিখিত একটি পোস্টের সাথে লিঙ্ক করেছি। যদিও আমার উপসংহারটি এখনও দাঁড়িয়ে আছে: আপনার ডেটাটি এতটা সাধারণ নয় যে এটির জন্য সমস্যা তৈরি হওয়া উচিত।


কেবলমাত্র কিছু.সন্ধানকারী খুব ম্লান হওয়ার অর্থ এই নয় যে আপনি কিছুটা slড়ু হতে পারেন :)। তবে আমি প্রচুর পরিসংখ্যানগত পরীক্ষার সাথে একমত যেগুলি আনুষ্ঠানিকভাবে স্বাভাবিকতা অনুমান করে যে আপনি যা খাওয়ান তা আসলে মোটামুটি সহনশীল
পি উইন্ড্রিজ

2
"কিছু কারণ অনুসন্ধানকারীরা খুব আস্তে আক্রান্ত হওয়ার অর্থ এই নয় যে আপনি কিছুটা opড়ু হতে পারেন :)" ফেয়ার পয়েন্ট; এটা আমার পক্ষে একটি খারাপ তর্ক ছিল। "তবে আমি প্রচুর পরিসংখ্যান পরীক্ষার সাথে একমত যেগুলি আনুষ্ঠানিকভাবে স্বাভাবিকতা অনুমান করে যে আপনি তাদের খাওয়ান তা আসলে মোটামুটি সহনশীল।" হ্যাঁ, সত্যিই। যে কোনও কোয়ান্ট প্রফেসর আমি এইরকম কিউকিউ প্লটের দিকে নজর রেখে বলেছিলাম, "হ্যাঁ, ঠিক আছে।"
মার্ক হোয়াইট

4

আপনার বিতরণটি স্বাভাবিক নয় । লেজগুলি দেখুন (বা এর অভাব)। নীচে সাধারণ কিউকিউ প্লট থেকে আপনি যা প্রত্যাশা করবেন তা নীচে।

এখানে চিত্র বর্ণনা লিখুন

পড়ুন এই কিভাবে বিভিন্ন কিউকিউ প্লট ব্যাখ্যা করা পোস্ট করুন।

মনে রাখবেন যে কোনও বিতরণ প্রযুক্তিগতভাবে স্বাভাবিক না হলেও এটি স্বাভাবিক হতে পারে এমন অ্যালগরিদমগুলির জন্য যোগ্যতা অর্জনের পক্ষে যথেষ্ট স্বাভাবিক which


1
আপনি কী সম্পর্কে কথা বলছেন, আমি 9 টি সাধারণ কিউকি প্লট প্লট করে নমুনাগুলি সরাসরি কোড সেট.সিড (100) সমান (এমফ্রো = সি (3,3%)) এর জন্য আই আই ব্যবহার করে একটি সাধারণ বন্টন তৈরি করেছি i x < - rnorm (350) qqnorm (x) qqline (x) plot এবং প্লট (3,2) অপের অবস্থার সাথে খুব মিল দেখাচ্ছে।
জোশ

1
সাধারণত, আপনি লেজগুলিতে মনোনিবেশ করতে চান না কারণ এগুলি প্রায়শই অদ্ভুত হয়ে যায়, যদিও অত্যন্ত খারাপ লেজগুলি আপনাকে খারাপ ফলাফল দেয়। আপনি সত্যিই মাঝখানে ফোকাস করতে চান।
জোশ

আপনি ভুল জোশ স্বাভাবিকের নাল অনুমানটি বাতিল হয় কিনা তা যাচাই করার জন্য দয়া করে একটি সাধারণ পরীক্ষার জন্য আবেদন করুন।
প্রতিকার করুন

1
তুমি ঠিক বলছো. আমি প্রথমদিকে আপনার পোস্টটি পড়েছিলাম কারণ কিউকিউ প্লটগুলি যথেষ্ট স্বাভাবিক ছিল না এবং আমি ক্ষমা চাইছি।
জোশ

2
@ জোশ, বিতরণের মাঝামাঝি হাইপোথিসিস পরীক্ষার পক্ষে খুব কমই গুরুত্বপূর্ণ; এটা লেজ যে ব্যাপার। আপনার পেছনের দিকে।
গুং - মনিকা পুনরায়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.