সবচেয়ে ভালো উপায় এই সম্পর্কে চিন্তা করার জন্য পয়েন্ট scatterplot কল্পনা করা হয় উল্লম্ব অক্ষ এবং এর এক্স অনুভূমিক অক্ষ দ্বারা প্রতিনিধিত্ব। এই কাঠামোটি দেওয়া, আপনি পয়েন্টের মেঘ দেখতে পাচ্ছেন, যা অস্পষ্টভাবে বিজ্ঞপ্তিযুক্ত হতে পারে বা উপবৃত্তে দীর্ঘায়িত হতে পারে। আপনি রিগ্রেশনেশনে যা করার চেষ্টা করছেন সেটি হ'ল 'সেরা ফিটের লাইন' বলা যেতে পারে। যাইহোক, এটি সোজা মনে হলেও, আমাদের 'বেস্ট' বলতে কী বোঝায় তা আমাদের খুঁজে বের করা উচিত এবং এর অর্থ একটি লাইন ভাল হওয়ার জন্য, বা একটি লাইন অন্যটির চেয়ে ভাল হওয়ার জন্য আমাদের কী তা নির্ধারণ করতে হবে, বিশেষত , আমাদের অবশ্যই একটি ক্ষতি ফাংশন নির্ধারণ করতে হবেYএক্স। ক্ষতির ফাংশন আমাদের কীভাবে 'খারাপ' কিছু তা বলার উপায় দেয় এবং এইভাবে আমরা যখন এটি হ্রাস করি তখন আমরা আমাদের লাইনটিকে যথাসম্ভব 'ভাল' হিসাবে তৈরি করি, বা 'সেরা' লাইনটি পাই।
Ditionতিহ্যগতভাবে, আমরা যখন একটি রিগ্রেশন বিশ্লেষণ পরিচালনা করি তখন আমরা opeাল এবং সংক্ষেপের অনুমানগুলি খুঁজে পাই যাতে স্কোয়ার ত্রুটির যোগফল কমিয়ে আনতে পারে । এগুলি নিম্নলিখিত হিসাবে সংজ্ঞায়িত করা হয়:
এসএসই= ∑i = 1এন( y)আমি- ( β)^0+ + β^1এক্সআমি) )2
আমাদের স্ক্যাটারপ্লোটের ক্ষেত্রে, এর অর্থ আমরা পর্যবেক্ষণ করা ডেটা পয়েন্ট এবং লাইনের মধ্যে উল্লম্ব দূরত্বগুলি (স্কোয়ারের যোগফল) হ্রাস করছি ।
অন্যদিকে, এটা পুরোপুরি প্রত্যাবর্তন করতে যুক্তিযুক্ত সম্মুখের Y , কিন্তু যে ক্ষেত্রে, আমরা রাখতেন এক্স উল্লম্ব অক্ষ উপর, ইত্যাদি। যদি আমরা আমাদের চক্রান্ত রাখা (সঙ্গে হিসাবে এক্স অনুভূমিক অক্ষের উপর), regressing এক্স সম্মুখের Y (আবার, সাথে উপরে সমীকরণের একটি সামান্য অভিযোজিত সংস্করণ ব্যবহার এক্স এবং ওয়াই সুইচড) মানে হল, আমরা এর সমষ্টি কমানোর হবে অনুভূমিক দূরত্বএক্সyxxxyxyপর্যবেক্ষণ করা ডেটা পয়েন্ট এবং লাইনের মধ্যে between এটি খুব অনুরূপ শোনাচ্ছে তবে এটি একই জিনিস নয়। (এটি স্বীকৃতি দেওয়ার উপায়টি এটি উভয়ভাবেই করা, এবং তারপরে বীজগণিতভাবে প্যারামিটারের একটি অনুমানের সেটটিকে অন্যের শর্তে রূপান্তর করা the প্রথম মডেলের সাথে দ্বিতীয় মডেলের পুনরায় সাজানো সংস্করণটির সাথে তুলনা করা সহজ হয় যে তারা এগুলি একই নয়.)
নোট করুন যে কোনওভাবেই একই লাইনটি তৈরি করা সম্ভব হবে না আমরা যদি স্বজ্ঞাগতভাবে আঁকতাম যে কোনও গ্রাফ পেপারের সাথে এটি প্লট করা পয়েন্ট সহ আমাদের হাতে দেয়। সেক্ষেত্রে, আমরা সোজা সেন্টারের মাধ্যমে একটি রেখা আঁকা, কিন্তু উল্লম্ব দূরত্ব কমানোর একটি লাইন যে সামান্য যা উৎপাদ জপান যেহেতু অনুভূমিক দূরত্ব কমানোর একটি লাইন যে সামান্য যা উৎপাদ, (অর্থাত, একটি অগভীর ঢাল সহ) steeper ।
xyyxryxxy (তবে নীচে @DilipSarwate মন্তব্যটি নোট করুন)।
yxy। এটি কথোপকথন বলতে খুব আলাদা। এটি একটি আকর্ষণীয় historicalতিহাসিক পর্বে গুরুত্বপূর্ণ ছিল: মার্কিন যুক্তরাষ্ট্রে 70 এর দশকের শেষের দিকে এবং 80 এর দশকের প্রথমদিকে, মামলাটি তৈরি করা হয়েছিল যে কর্মক্ষেত্রে নারীদের প্রতি বৈষম্য ছিল এবং এই সমালোচনা বিশ্লেষণের সাথে সমর্থন করা হয়েছিল যে দেখায় যে সমান পটভূমির মহিলারা (উদাহরণস্বরূপ) , যোগ্যতা, অভিজ্ঞতা ইত্যাদি) গড়ে পুরুষদের চেয়ে কম দেওয়া হত। সমালোচকরা (বা কেবল অতিরিক্ত লোকেরা যারা যুক্ত ছিলেন) যুক্তি দিয়েছিলেন যে এটি যদি সত্য হয় তবে পুরুষদের সাথে সমানভাবে বেতন দেওয়া মহিলাদের আরও উচ্চ দক্ষ হতে হবে, তবে এটি যখন পরীক্ষা করা হয়েছিল তখন দেখা গেছে যে ফলাফলগুলি 'তাৎপর্যপূর্ণ' যখন ছিল এক উপায়ে মূল্যায়ন করা হয়েছে, অন্য উপায়ে চেক করার সময় এগুলি 'তাৎপর্যপূর্ণ' ছিল না, যা জড়িত প্রত্যেককে একটি অত্যাচারের মধ্যে ফেলেছিল। এখানে দেখুন একটি বিখ্যাত কাগজ যা সমস্যাটি পরিষ্কার করার চেষ্টা করেছিল for
(অনেক পরে আপডেট হয়েছে) এখানে এটি সম্পর্কে চিন্তা করার আরও একটি উপায় যা দৃষ্টিভঙ্গির পরিবর্তে সূত্রগুলির মাধ্যমে বিষয়টির দিকে এগিয়ে যায়:
yxxy
β^1=Cov(x,y)Var(x)y on x β^1=Cov(y,x)Var(y)x on y
Var(x)Var(y)SD(x)SD(y)β^1rr=Cov(x,y)SD(x)SD(y)correlating x with y r=Cov(y,x)SD(y)SD(x)correlating y with x