আর: রৈখিক মডেলের অবশিষ্টাংশগুলির স্বাভাবিকতা পরীক্ষা করুন - যা অবশিষ্টাংশগুলি ব্যবহার করতে হবে


13

স্বাভাবিকতা যাচাই করার জন্য আমি একটি শ্যাপিরো উইলকের ডাব্লু টেস্ট এবং কোলমোগোরভ-স্মারনভ পরীক্ষা করতে চাই normal আমি কেবল ভাবছিলাম যে এর জন্য কী কী অবশিষ্টাংশগুলি ব্যবহার করা উচিত - কাঁচা অবশিষ্টাংশ, পিয়ারসনের অবশিষ্টাংশ, স্টাডিটেড রেসিডুয়াল বা মানকৃত অবশিষ্টাংশ? শাপিরো-উইলকের ডাব্লু পরীক্ষার জন্য এটি কাঁচা ও পিয়ারসনের অবশিষ্টাংশগুলির ফলাফল একইরকম তবে অন্যদের জন্য নয় বলে মনে হয়।

fit=lm(mpg ~ 1 + hp + wt, data=mtcars)
res1=residuals(fit,type="response")
res2=residuals(fit,type="pearson")
res3=rstudent(fit)
res4=rstandard(fit)
shapiro.test(res1) # W = 0.9279, p-value = 0.03427
shapiro.test(res2) # W = 0.9279, p-value = 0.03427
shapiro.test(res3) # W = 0.9058, p-value = 0.008722
shapiro.test(res4) # W = 0.9205, p-value = 0.02143

কেএসের জন্য একই প্রশ্ন, এবং অবশিষ্টাংশগুলি যেমন সাধারণ বিতরণ (পনরম) এর মতো পরীক্ষা করা উচিত কিনা

ks.test(res1, "pnorm") # D = 0.296, p-value = 0.005563

বা স্বাধীনভাবে এন কে -২ ডিগ্রি সহ টি-শিক্ষার্থী বিতরণ

ks.test(res3, "pt",df=nrow(mtcars)-2-2) 

কোন পরামর্শ সম্ভবত? এছাড়াও, পরীক্ষার পরিসংখ্যান ডাব্লু (> 0.9?) এবং ডি এর বিতরণ পর্যাপ্ত পরিমাণে স্বাভাবিকতার কাছাকাছি থাকার জন্য এবং আপনার অনুমানকে খুব বেশি প্রভাবিত না করার জন্য প্রস্তাবিত মানগুলি কী বলে?

অবশেষে, এই পদ্ধতিরটি কি লাগানো এলএম সহগের অনিশ্চয়তা বিবেচনায় নিয়েছে বা cumres()প্যাকেজের কাজ gof()এই ক্ষেত্রে আরও ভাল হতে পারে?

চিয়ার্স, টম


9
এ জাতীয় পরীক্ষার কোনও দৃষ্টিকোণ পাওয়া বিরল। নিজেকে জিজ্ঞাসা করুন যদি অবশিষ্টাংশগুলি "সাধারণভাবে" অস্বাভাবিক হিসাবে দেখা দেয় তবে আপনি কোন নির্দিষ্ট পদক্ষেপ নেবেন। অভিজ্ঞতা আপনাকে শেখায় যে এটি নির্ভর করে কিভাবে এবং কীভাবে তারা স্বাভাবিকতা থেকে আলাদা। এগুলির কোনওটিই সরাসরি (বা পর্যাপ্তভাবে) এসডাব্লু, কেএস বা অন্য কোনও আনুষ্ঠানিক বিতরণ পরীক্ষার দ্বারা পরিমাপ করা হয় না। এই কাজের জন্য আপনি অনুসন্ধান গ্রাফিক্স নিয়োগ করতে চান , আনুষ্ঠানিক পরীক্ষা নয়। কোন প্রশ্নটি অবশিষ্টাংশগুলি প্লট করার জন্য উপযুক্ত হতে পারে তা এখনও দাঁড়িয়ে আছে, তবে বাকী প্রশ্নগুলি অপ্রাসঙ্গিক বলে পথের দিকে পড়ে।
whuber

হ্যাঁ আমি লক্ষ করেছি যে অনেক পরিসংখ্যানবিদ এই অবস্থানের পক্ষে ছিলেন। তবে আমি এখনও এই পরীক্ষাগুলির পরীক্ষার পরিসংখ্যানগুলি পরীক্ষা করতে চাই (উদাঃ শাপিরো উইলক্স ডাব্লুটির মান 0.9 এর চেয়ে বেশি কিনা তা পরীক্ষা করে দেখুন)। এবং বড় বিচ্যুতির ক্ষেত্রে স্বাভাবিকতা উন্নত করতে আমি সর্বদা একটি বক্স-কক্স রূপান্তর বা এর মতো কিছু করতে পারি। প্লাস আমার প্রশ্নটিও আংশিক ধারণাবাদী ছিল - উদাহরণস্বরূপ, যদি
সাধারনত

উত্তর:


9

একটি মন্তব্যের জন্য খুব দীর্ঘ।

  1. একটি সাধারণ রিগ্রেশন মডেলের জন্য (যেমন এটি লাগানো হবে lm), আপনি বিবেচনা করা প্রথম দুটি অবশিষ্টাংশের মধ্যে কোনও পার্থক্য নেই; type="pearson"নন-গাউসিয়ান জিএলএমগুলির জন্য প্রাসঙ্গিক, তবে গাউসীয় responseমডেলগুলির মতোই ।

  2. আপনি যে পরীক্ষাগুলি আপনার পরীক্ষাগুলিতে প্রয়োগ করেন (কিছু অংশের অবশিষ্টাংশ) তা স্বাধীন নয়, তাই স্বাভাবিক পরিসংখ্যানগুলিতে সঠিক বিতরণ হয় না don't আরও কঠোরভাবে বলতে গেলে, আপনি যে অবশিষ্টাংশগুলি বিবেচনা করছেন সেগুলির কোনওটিই ঠিক স্বাভাবিক হবে না, কারণ আপনার ডেটা কখনই সাধারণ হবে না। [ফর্মাল টেস্টিং ভুল প্রশ্নের উত্তর দেয় - আরও প্রাসঙ্গিক প্রশ্নটি হবে 'এই অ-স্বাভাবিকতাটি আমার অনুক্রমকে কতটা প্রভাবিত করবে?'), ফিট হাইপোথিসিস পরীক্ষার স্বাভাবিক সদ্ব্যবহার দ্বারা উত্তর দেওয়া হয়নি এমন একটি প্রশ্নের উত্তর।]

  3. এমনকি যদি আপনার ডেটাটি হ'ল স্বাভাবিক হয় তবে তৃতীয় বা চতুর্থ ধরণের অবকাশগুলিও ঠিক স্বাভাবিক হবে না। তবুও লোকেদের কাঁচা অবশিষ্টাংশের চেয়ে (কিউকিউ প্লট বলে) এটি পরীক্ষা করা অনেক বেশি সাধারণ।

  4. আপনি 2 এবং 3 তে কয়েকটি সমস্যা কাটিয়ে উঠতে পারেন (রেসিডুয়ালের উপর নির্ভরতা পাশাপাশি মানকৃত অবশিষ্টাংশগুলিতে অস্বাভাবিকতা) আপনার ডিজাইনের ম্যাট্রিক্সের শর্তসাপেক্ষে সিমুলেশন ( ), যার অর্থ আপনি পছন্দমতো যা অবশিষ্টাংশ ব্যবহার করতে পারেন (তবে আপনি "সেইরকম সমস্যাটির উত্তর ইতিমধ্যে জানেন" একটি অপ্রয়োজনীয় প্রশ্নের জবাব দেওয়ার সাথে মোকাবেলা করতে পারবেন না)।X

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.