অ্যাডজাস্টেড আর-স্কোয়ারের জন্য আরে ব্যবহৃত সঠিক সূত্রটি কী lm()
? আমি কীভাবে এটি ব্যাখ্যা করতে পারি?
সমন্বিত আর-স্কোয়ার সূত্র
অ্যাডজাস্টেড আর-স্কোয়ার গণনা করার জন্য বেশ কয়েকটি সূত্র বিদ্যমান বলে মনে হচ্ছে।
- ওয়ারির সূত্র:
- ম্যাকনামারের সূত্র:
- প্রভুর সূত্র:
- স্টেইনের সূত্র:
পাঠ্যপুস্তকের বিবরণ
- ফিল্ডের পাঠ্যপুস্তক অনুসারে, আবিষ্কারের পরিসংখ্যানগুলি ব্যবহার করে আর (2012, পৃষ্ঠা 273) আর ওয়েরির সমীকরণটি ব্যবহার করেছেন যা "আমাদের জানায় যে নমুনাটি নেওয়া হয়েছিল এমন জনগোষ্ঠী থেকে যদি মডেলটি উত্পন্ন হয় তবে" ওয়াইয়ের মধ্যে কতটা বৈচিত্রের জন্য দায়বদ্ধ হত "। তিনি ওয়ারির জন্য সূত্রটি দেন না। তিনি মডেলের ক্রস-বৈধতা কতটা ভাল তা যাচাই করতে স্টেইনের সূত্রটি (হাত ধরে) ব্যবহার করার পরামর্শ দিয়েছেন।
- Kleiber / Zeileis, প্রয়োগকৃত(২০০৮, পি) দাবি করেছেন যে এটি "অ্যাডজাস্টেড আর-স্কোয়ার্ড" এবং একাধিক আর-স্কোয়ার থেকে এর ব্যাখ্যা কীভাবে পরিবর্তিত হয় ঠিক তা বলবেন না।
- ডালগার্ড, আর (২০০৮, পৃষ্ঠা ১১৩) সহ সূচী পরিসংখ্যান লিখেছেন যে "আপনি যদি [সমন্বিত আর-স্কোয়ার্ড] 100% দ্বারা গুণিত করেন তবে এটি '% ভেরিয়েন্স হ্রাস' হিসাবে ব্যাখ্যা করা যেতে পারে"। এটি কোন সূত্রের সাথে মিলে যায় তা তিনি বলেননি।
আমি আগে ভেবেছিলাম, এবং ব্যাপকভাবে পড়েছি যে, আর-স্কোয়ার মডেলটিতে অতিরিক্ত ভেরিয়েবল যুক্ত করার জন্য শাস্তি দেয়। এখন এই বিভিন্ন সূত্রের ব্যবহার বিভিন্ন ব্যাখ্যার জন্য কল বলে মনে হচ্ছে। আমি স্ট্যাক ওভারফ্লো সম্পর্কিত একটি প্রশ্ন ( একাধিক আর-স্কোয়ার্ড এবং অ্যাডজাস্টেড আর-স্কোয়ারের মধ্যে একটি একক-ভেরিয়েট ন্যূনতম স্কোয়ার রিগ্রেশন-এর মধ্যে পার্থক্য কী? ), এবং ইউপেন-এ ওয়ার্টন স্কুলের পরিসংখ্যানক অভিধান দেখেছি ।
প্রশ্নাবলি
- কোন সূত্রটি আর-এর দ্বারা বর্ধিত স্কোয়ারের জন্য ব্যবহৃত হয়
lm()
? - আমি কীভাবে এটি ব্যাখ্যা করতে পারি?
ans$adj.r.squared <- 1 - (1 - ans$r.squared) * ((n - df.int)/rdf)
सारांश.এলএম () থেকে: যেখানে উত্তর $ r.squared = আর; 2; n = n, rdf = অবশিষ্ট অবধি, df.int = ইন্টারসেপ্ট ডিএফ (0 বা 1)।