আর এম-তে এল-এর সমন্বিত আর-স্কোয়ার সূত্রটি কী এবং এটি কীভাবে ব্যাখ্যা করা উচিত?


35

অ্যাডজাস্টেড আর-স্কোয়ারের জন্য আরে ব্যবহৃত সঠিক সূত্রটি কী lm() ? আমি কীভাবে এটি ব্যাখ্যা করতে পারি?

সমন্বিত আর-স্কোয়ার সূত্র

অ্যাডজাস্টেড আর-স্কোয়ার গণনা করার জন্য বেশ কয়েকটি সূত্র বিদ্যমান বলে মনে হচ্ছে।

  • ওয়ারির সূত্র:1(1R2)(n1)(nv)
  • ম্যাকনামারের সূত্র:1(1R2)(n1)(nv1)
  • প্রভুর সূত্র:1(1R2)(n+v1)(nv1)
  • স্টেইনের সূত্র: 1[(n1)(nk1)(n2)(nk2)(n+1)n](1R2)

পাঠ্যপুস্তকের বিবরণ

  • ফিল্ডের পাঠ্যপুস্তক অনুসারে, আবিষ্কারের পরিসংখ্যানগুলি ব্যবহার করে আর (2012, পৃষ্ঠা 273) আর ওয়েরির সমীকরণটি ব্যবহার করেছেন যা "আমাদের জানায় যে নমুনাটি নেওয়া হয়েছিল এমন জনগোষ্ঠী থেকে যদি মডেলটি উত্পন্ন হয় তবে" ওয়াইয়ের মধ্যে কতটা বৈচিত্রের জন্য দায়বদ্ধ হত "। তিনি ওয়ারির জন্য সূত্রটি দেন না। তিনি মডেলের ক্রস-বৈধতা কতটা ভাল তা যাচাই করতে স্টেইনের সূত্রটি (হাত ধরে) ব্যবহার করার পরামর্শ দিয়েছেন।
  • Kleiber / Zeileis, প্রয়োগকৃত(২০০৮, পি) দাবি করেছেন যে এটি "অ্যাডজাস্টেড আর-স্কোয়ার্ড" এবং একাধিক আর-স্কোয়ার থেকে এর ব্যাখ্যা কীভাবে পরিবর্তিত হয় ঠিক তা বলবেন না।
  • ডালগার্ড, আর (২০০৮, পৃষ্ঠা ১১৩) সহ সূচী পরিসংখ্যান লিখেছেন যে "আপনি যদি [সমন্বিত আর-স্কোয়ার্ড] 100% দ্বারা গুণিত করেন তবে এটি '% ভেরিয়েন্স হ্রাস' হিসাবে ব্যাখ্যা করা যেতে পারে"। এটি কোন সূত্রের সাথে মিলে যায় তা তিনি বলেননি।

আমি আগে ভেবেছিলাম, এবং ব্যাপকভাবে পড়েছি যে, আর-স্কোয়ার মডেলটিতে অতিরিক্ত ভেরিয়েবল যুক্ত করার জন্য শাস্তি দেয়। এখন এই বিভিন্ন সূত্রের ব্যবহার বিভিন্ন ব্যাখ্যার জন্য কল বলে মনে হচ্ছে। আমি স্ট্যাক ওভারফ্লো সম্পর্কিত একটি প্রশ্ন ( একাধিক আর-স্কোয়ার্ড এবং অ্যাডজাস্টেড আর-স্কোয়ারের মধ্যে একটি একক-ভেরিয়েট ন্যূনতম স্কোয়ার রিগ্রেশন-এর মধ্যে পার্থক্য কী? ), এবং ইউপেন-এ ওয়ার্টন স্কুলের পরিসংখ্যানক অভিধান দেখেছি

প্রশ্নাবলি

  • কোন সূত্রটি আর-এর দ্বারা বর্ধিত স্কোয়ারের জন্য ব্যবহৃত হয় lm() ?
  • আমি কীভাবে এটি ব্যাখ্যা করতে পারি?

8
ans$adj.r.squared <- 1 - (1 - ans$r.squared) * ((n - df.int)/rdf)सारांश.এলএম () থেকে: যেখানে উত্তর $ r.squared = আর; 2; n = n, rdf = অবশিষ্ট অবধি, df.int = ইন্টারসেপ্ট ডিএফ (0 বা 1)।
EDi

আমি এখানে আসল সমস্যার উত্তর দিতে যাচ্ছি, এটি "কী ধরণের আর ^ 2 ..." নয়। আপনার (এবং আরও অনেকের) অভাবের তথ্যটি হ'ল: সমস্ত আর প্যাকেজ, এমনকি মূল, উত্স কোডটি উপলব্ধ করে। এমনকি ডিস্ট্রসগুলিতে সংকলিত স্টাফগুলি সিআরএএন বা অন্যান্য সংগ্রহস্থলগুলিতে {প্যাকেজ নামগুলি tar .tar.gz এ উপলব্ধ।
কার্ল উইথফট

ওপি এখানে: এই দুর্দান্ত ইনপুট জন্য আপনাকে ধন্যবাদ। আমার দ্বিতীয় প্রশ্নটি সম্পর্কে: আমি কীভাবে এটি ব্যাখ্যা করতে পারি? আমি অ্যাডজের অনেকগুলি বিভিন্ন ব্যাখ্যা পড়েছি। আর-স্কোয়ার যা কখনও কখনও এমন সূত্রের উপর ভিত্তি করে বলে মনে হয় যা ভেরির হতে পারে না?

উত্তর:


29

1. কি সূত্র না lm1.আরজেডে আর-স্কোয়ারের জন্য ব্যবহার করে?

ইতিমধ্যে উল্লিখিত হিসাবে, টাইপিং summary.lmআপনাকে এমন কোড দেবে যা আরজেড আর স্কোয়ার গণনা করতে আর ব্যবহার করে। আপনি যে সর্বাধিক প্রাসঙ্গিক লাইন পান সেটি এক্সট্রাক্ট করা:

ans$adj.r.squared <- 1 - (1 - ans$r.squared) * ((n - df.int)/rdf)

যা গাণিতিক স্বরলিপি মিলছে:

Radj2=1(1R2)n1np1

df.int=1nprdfn-p-1

npnp1 )। তারা প্রস্তাব দেয় যে ঘটনাগুলির ক্রম হিসাবে এটি সবচেয়ে প্রচলিত নামগুলি হ'ল "ওয়েরি সূত্র", "ইজিকিয়েল ফর্মলুয়া", "ওয়েরি / ম্যাকনেমার সূত্র" এবং "কোহেন / কোহেন সূত্র"।

২. কেন অনেকগুলি সমন্বিত আর-বর্গ সূত্র রয়েছে?

Radj2ρ2ρ2 )।

আপনি সমস্ত সূত্রগুলির সাথে দেখতে পাবেন, মধ্যে পার্থক্যR2Radj2 নমুনা আকার বৃদ্ধির ছোট পায়। নমুনার আকার অসীমের দিকে ঝোঁক হওয়ায় পার্থক্য শূন্যের কাছে পৌঁছে। কম ভবিষ্যদ্বাণীকারীদের সাথে পার্থক্যটি আরও ছোট হয়।

Radj2

Radj2ρ2ρ2R2

তথ্যসূত্র

  • R2

9

আপনার প্রথম প্রশ্নটি সম্পর্কে: আপনি কীভাবে এটি গণনা করা হয় তা না জানলে কোডটি দেখুন! আপনি যদি summary.lmআপনার কনসোলটি টাইপ করেন তবে আপনি এই ফাংশনের কোড পাবেন। আপনি কোড এর মধ্য দিয়ে সর পড়া আপনি একটি লাইন খুঁজে পাবেন: ans$adj.r.squared <- 1 - (1 - ans$r.squared) * ((n - df.int)/rdf)। আপনি যদি এই লাইনের উপরে কিছু লাইন দেখতে পান তবে আপনি লক্ষ্য করবেন:

  • ans$r.squaredR2
  • n অবশিষ্টাংশের সংখ্যা = পর্যবেক্ষণের সংখ্যা
  • df.int 0 বা 1 (যদি আপনার একটি ইন্টারসেপ্ট থাকে তা নির্ভর করে)
  • rdf আপনার অবশিষ্ট df হয়

R2R2

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.