"সংকল্পের সহগ" এবং "স্কোয়ার ত্রুটির অর্থ" এর মধ্যে পার্থক্য কী?


32

রিগ্রেশন সমস্যার জন্য, আমি দেখেছি লোকেরা মডেল নির্বাচন সম্পাদন করতে "সংকল্পের গুণফল" (ওরফে আর স্কোয়ার্ড) ব্যবহার করে, যেমন, নিয়মিতকরণের জন্য উপযুক্ত জরিমানা সহগ খুঁজে পাওয়া।

তবে, রিগ্রেশন নির্ভুলতার পরিমাপ হিসাবে "গড় স্কোয়ার্ড ত্রুটি" বা "রুট গড় স্কোয়ার্ড ত্রুটি" ব্যবহার করাও সাধারণ।

তাহলে এই দুজনের মধ্যে মূল পার্থক্য কী? এগুলি "নিয়মিতকরণ" এবং "রিগ্রেশন" কার্যগুলির জন্য বিনিময়যোগ্য হিসাবে ব্যবহার করা যেতে পারে? এবং অনুশীলনে যেমন মেশিন লার্নিং, ডেটা মাইনিংয়ের কাজগুলির প্রত্যেকটির প্রধান ব্যবহার কী?

উত্তর:


40

R2=1SSESST , যেখানে হল স্কোয়ার ত্রুটির সমষ্টি (রিগ্রেশন লাইন থেকে অবশিষ্টাংশ বা বিচ্যুতি) এবং হ'ল নির্ভরতার এর মধ্য থেকে স্কোয়ার বিচ্যুতির যোগফল ।এস এস টি ওয়াইSSESSTY

MSE=SSEnm , যেখানে নমুনার আকার এবং হল মডেলের পরামিতিগুলির সংখ্যা (ইন্টারসেপ্ট সহ, যদি থাকে তবে)।মিnm

R2 হ'ল নমুনায় পূর্বাভাসের ডিগ্রির মানকৃত মান বা ফিট fit হ'ল জনসংখ্যার অবশিষ্টাংশের উপযুক্ততা বা উপযুক্ত নয়। দুই ব্যবস্থা পরিষ্কারভাবে, সম্পর্কিত হিসেবে সবচেয়ে স্বাভাবিক সূত্র দেখা স্থায়ী (এর হিসাব জনসংখ্যার জন্য):MSE আর 2R2R2

Radj2=1(1R2)n1nm=1SSE/(nm)SST/(n1)=1MSEσy2


2
আমি ভেবেছিলাম এমএসই ত্রুটিগুলির গড়, যার অর্থ এমএসই = এসএসই / এন, আমরা কোন উপলক্ষে এমএসই = এসএসই / (এনএম) ব্যবহার করি? দয়া করে ব্যাখ্যা করুন. ধন্যবাদ
সিনকোল ব্রান্স

@SincoleBrans দয়া করে দেখতে en.wikipedia.org/wiki/Mean_squared_error , বিভাগ "রিগ্রেশন"।
ttnphns

আমি কিছুটা বিভ্রান্ত। মার্টিন - থোমা / রেগ্রেশন- এর ফলাফলগুলি দেখায় যে কোনও মডেল আর ^ 2 এর সাথে ভাল (অন্য কয়েকটি মডেলের তুলনায়) ভাল হতে পারে তবে একই সময়ে এমএসইয়ের সাথে খারাপ। আপনি এটা ব্যাখ্যা করতে পারেন?
মার্টিন থোমা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.