এটি একটি ভাল প্রশ্ন, কারণ "বিভিন্ন পরিমাণে" তেমন কোনও ব্যাখ্যা বলে মনে হয় না।
ব্যবহার সম্পর্কে সতর্ক হওয়ার জন্য দুটি গুরুত্বপূর্ণ কারণ রয়েছে R2এই মডেলগুলির সাথে তুলনা করতে: এটি খুব অশোধিত (এটি সত্যই ফিটের সদ্ব্যবহারাকে মূল্যায়ন করে না ) এবং এটি কমপক্ষে একটি মডেলের পক্ষে অনুপযুক্ত হতে চলেছে। এই উত্তরটি দ্বিতীয় ইস্যুটিকে সম্বোধন করে।
তাত্ত্বিক চিকিত্সা
R2মডেলের অবশিষ্টাংশগুলির প্রকরণটির প্রতিক্রিয়াগুলির বৈকল্পিকের সাথে তুলনা করে। ভেরিয়েন্সটি কোনও ফিট থেকে কোনও গড় বর্ধিত বিচ্যুতি। যেমন, আমরা বুঝতে পারিR2 প্রতিক্রিয়া দুটি মডেল তুলনা হিসাবে y।
"বেস" মডেলটি হ'ল
yi=μ+δi(1)
কোথায় μ একটি প্যারামিটার (তাত্ত্বিক গড় প্রতিক্রিয়া) এবং δi স্বতন্ত্র এলোমেলো "ত্রুটি", প্রতিটি শূন্যের সাথে এবং এর সাধারণ বৈকল্পিক τ2।
লিনিয়ার রিগ্রেশন মডেল ভেক্টরগুলির সাথে পরিচয় করিয়ে দেয়xi ব্যাখ্যামূলক ভেরিয়েবল হিসাবে:
yi=β0+xiβ+εআমি।(2)
সংখ্যা β0 এবং ভেক্টর βপ্যারামিটারগুলি (ইন্টারসেপ্ট এবং ""ালু")। দ্যεআমি আবার স্বতন্ত্র এলোমেলো ত্রুটি, প্রতিটি শূন্য এবং গড় বৈকল্পিক সহ σ2।
আর2 বৈকল্পিকতা হ্রাস অনুমান, τ2-σ2, মূল বৈকল্পিকের সাথে তুলনা করুন τ2।
আপনি যখন লগারিদমগুলি গ্রহণ করেন এবং মডেলটির সাথে মানানসই করতে সর্বনিম্ন স্কোয়ার ব্যবহার করেন , আপনি স্পষ্টভাবে ফর্মের একটি সম্পর্ককে তুলনা করছেন
লগ(Yআমি) = ν+ +ζআমি(1 ক)
ফর্ম এক
log(yi)=γ0+xiγ+ηi.(2a)
এগুলি ঠিক মডেলের মতো (1) এবং (2)কিন্তু লগ প্রতিক্রিয়া সঙ্গে। যদিও তারা প্রথম দুটি মডেলের সমতুল্য নয়। উদাহরণস্বরূপ, উভয় পক্ষের ক্ষতিকারক(2a) দিতে হবে
yi=exp(log(yi))=exp(γ0+xiγ)exp(ηi).
ত্রুটির শর্তাবলী exp(ηi)অন্তর্নিহিত সম্পর্কটি এখন গুন করুনyi=exp(γ0+xiγ)। ফলস্বরূপ প্রতিক্রিয়াগুলির বৈচিত্রগুলি
Var(yi)=exp(γ0+xiγ)2Var(eηi).
রূপগুলি নির্ভর করে xi। এটা মডেল নয়(2), যা ভেরিয়েন্সগুলি সমস্ত ধ্রুবকের সমান বলে মনে করে σ2।
সাধারণত, মডেলগুলির এই সেটগুলির মধ্যে কেবল একটিই তথ্যের যুক্তিসঙ্গত বিবরণ হতে পারে। দ্বিতীয় সেট প্রয়োগ করা(1a) এবং (2a) যখন প্রথম সেট (1) এবং (2)একটি ভাল মডেল, বা প্রথম যখন দ্বিতীয়টি ভাল হয়, একটি ননলাইনার, হেটেরোসেসটাস্টিক ডেটাসেটের সাথে কাজ করার পরিমাণ, যার ফলে একটি লিনিয়ার রিগ্রেশন সহ ভালভাবে ফিট হওয়া উচিত। যখন এই পরিস্থিতিগুলির মধ্যে একটির ক্ষেত্রে, আমরা আরও ভাল মডেলটি বৃহত্তর প্রদর্শনের জন্য আশা করতে পারিR2। যাইহোক, যদি উভয় ক্ষেত্রে না হয় তবে কী হবে ? আমরা কি এখনও বড় আশা করতে পারি?R2 আমাদের আরও ভাল মডেল সনাক্ত করতে সাহায্য করতে?
বিশ্লেষণ
কিছু দিক থেকে এটি একটি ভাল প্রশ্ন নয়, কারণ দুটি মডেলই যদি উপযুক্ত না হয় তবে আমাদের তৃতীয় মডেলটি খুঁজে পাওয়া উচিত। তবে আমাদের সামনে সমস্যাটি এর ইউটিলিটি নিয়ে উদ্বেগ প্রকাশ করেছেR2আমাদের এই সংকল্পটি তৈরি করতে সহায়তা করতে। তদুপরি, অনেকেই প্রথমে আকার সম্পর্কে চিন্তা করেন মধ্যে সম্পর্কেরx এবং y--এটি লিনিয়ার, এটি লোগারিটিমিক, এটি কি অন্য কিছু - রিগ্রেশন ত্রুটির বৈশিষ্ট্যগুলি নিয়ে উদ্বিগ্ন না হয়ে εi অথবা ηi। আসুন আমরা আমাদের এমন একটি পরিস্থিতি বিবেচনা করি যেখানে আমাদের মডেলটি সম্পর্কটি সঠিকভাবে পায় তবে এর ত্রুটি কাঠামো সম্পর্কে ভুল বা তদ্বিপরীত ।
এই জাতীয় একটি মডেল (যা সাধারণত দেখা যায়) হ'ল একটি ঘনঘন সম্পর্কের সাথে সর্বনিম্ন স্কোয়ার ফিট করে,
yi=exp(α0+xiα)+θi.(3)
এখন লগারিদম yএকটি রৈখিক ফাংশনxহিসাবে, হিসাবে (2a), তবে ত্রুটির শর্তাবলীθi additive হয় হয়(2)। এই ক্ষেত্রেR2 এর মধ্যে ভুল সম্পর্কের সাথে মডেলটি বেছে নেওয়ার ক্ষেত্রে আমাদের বিভ্রান্ত করতে পারে x এবং y।
এখানে মডেল একটি চিত্রণ দেওয়া হয় (3)। সেখানে300 জন্য পর্যবেক্ষণ xi (একটি 1-ভেক্টর সমানভাবে বিতরণ করা 1.0 এবং 1.6)। বাম প্যানেলটি মূলটি দেখায়(x,y) ডান প্যানেলটি যখন দেখায় তখন ডেটা (x,log(y))রূপান্তরিত তথ্য। ড্যাশযুক্ত লাল রেখাগুলি সত্যিকারের অন্তর্নিহিত সম্পর্কের পরিকল্পনা করে, যখন শক্ত নীল রেখাগুলি সর্বনিম্ন-স্কোয়ার ফিট করে। উভয় প্যানেলে ডেটা এবং সত্য সম্পর্ক একই: কেবলমাত্র মডেল এবং তাদের ফিট আলাদা fits
লগ প্রতিক্রিয়াগুলির ডানদিকে স্পষ্টভাবে ফিট ভাল: এটি প্রায় সত্য সম্পর্কের সাথে মিলিত হয় এবং উভয়ই লিনিয়ার। বাম দিকের মূল প্রতিক্রিয়ার সাথে মানানসই আরও খারাপ: সত্যিকারের সম্পর্কটি তাত্পর্যপূর্ণ হলেও এটি লিনিয়ার। দুর্ভাগ্যক্রমে, এর একটি উল্লেখযোগ্যভাবে বৃহত্তর মান রয়েছেR2: 0.70 তুলনা করা 0.56। এজন্য আমাদের বিশ্বাস করা উচিত নয়R2আমাদের আরও ভাল মডেলের দিকে নিয়ে যেতে যে কারণে আমাদের ফিট থাকা সত্ত্বেও সন্তুষ্ট হওয়া উচিত নয়R2 "উচ্চ" (এবং অনেক অ্যাপ্লিকেশনগুলিতে, এর মান হয়) 0.70 প্রকৃতপক্ষে উচ্চ বিবেচনা করা হবে)।
ঘটনাক্রমে, এই মডেলগুলি নির্ধারণের আরও ভাল পদ্ধতির মধ্যে ফিট টেস্টের ধার্মিকতা (যা ডানদিকে লগ মডেলের শ্রেষ্ঠত্ব নির্দেশ করবে) এবং অবশিষ্টাংশের স্থিরতার জন্য ডায়াগনস্টিক প্লট অন্তর্ভুক্ত করে (যা উভয় মডেলের সমস্যাগুলিকেই আলোকপাত করবে)। এই ধরনের মূল্যায়ন প্রাকৃতিকভাবে একটি ওজনযুক্ত সর্বনিম্ন-স্কোয়ারের দিকে নিয়ে যায়log(y) বা সরাসরি মডেল (3) নিজেই, যা সর্বোচ্চ সম্ভাবনা বা অ-লাইন ন্যূনতম ন্যূনতম স্কোয়ার পদ্ধতি ব্যবহার করে ফিট থাকতে হবে fit