রিগ্রেশন এবং আরও বেশি মাত্রার সাথে আরও একটি ভেরিয়েবল যুক্ত করার সময় স্লিপ ফ্লিপ করুন


9

বেসিক সেটআপ:

রিগ্রেশন মডেল: যেখানে সি নিয়ন্ত্রণ ভেরিয়েবলের ভেক্টর।y=constant+β1x1+β2x2+β3x3+β4x4+αC+ϵ

আমি আগ্রহী এবং expect এবং নেতিবাচক প্রত্যাশা করছি । যাইহোক, মডেল multicollinearity সমস্যা, পারস্পরিক সম্পর্কের সহগ দ্বারা, Corr (দেওযা হল , 0.9345, Corr ( , 0,1765, Corr ( , 0,3019।ββ1β2x1x2)=x1x3)=x2x3)=

সুতরাং এবং অত্যন্ত পরস্পর সম্পর্কিত, এবং তাদের কার্যত একই তথ্য সরবরাহ করা উচিত। আমি তিনটি রাষ্ট্র চালাচ্ছি: x1x2

  1. পরিবর্তনশীল বাদ দিন ; 2. পরিবর্তনশীল বাদ দিন ; ৩. এবং উভয়ই মূল মডেল ।x1x2x1x2

ফলাফল:
রিগ্রেশন 1 এবং 2 এর জন্য, এটি যথাক্রমে এবং এর প্রত্যাশিত চিহ্নটি প্রদান করে এবং একই সাথে। আর এবং উভয় মডেল 10% স্তর উল্লেখযোগ্য পর আমি মান ভুলবশত hạc সংশোধন না হয়। ইতিবাচক তবে উভয় মডেলের ক্ষেত্রে তাৎপর্যপূর্ণ নয়।β2β1β2β1β3

তবে 3 এর জন্য, প্রত্যাশিত চিহ্ন রয়েছে, তবে জন্য পরম মানের in চেয়ে দ্বিগুণ সাথে ইতিবাচক । এবং এবং উভয়ই তুচ্ছ। অধিকন্তু, রিগ্রেশন 1 এবং 2 এর তুলনায় প্রায় অর্ধেক হ্রাস করে।β1β2β1β1β2β3

আমার প্রশ্নটি হ'ল:

3-এ কেন, ইতিবাচক এবং absolute চেয়ে নিখুঁত মান হয়ে যায়? এমন কোনও পরিসংখ্যানগত কারণ রয়েছে যা সাইন ফ্লিপ করতে পারে এবং এর বিশালতা রয়েছে? বা এটি কি কারণ মডেল 1 এবং 2 বাদ দেওয়া ভেরিয়েবল সমস্যায় যা প্রদত্ত প্রদত্ত y এর উপর ইতিবাচক প্রভাব ফেলবে? তবে তারপরে রিগ্রেশন মডেল 1 এবং 2 তে, এবং উভয়ই নেতিবাচক পরিবর্তে ইতিবাচক হওয়া উচিত, কারণ রিগ্রেশন মডেল 3- এ মোট এবং এর মোট প্রভাব ইতিবাচক।β2β1β2β3x2β2β1x1x2

উত্তর:


8

এই উদাহরণটি চিন্তা করুন:

জনগণের পকেটে মুদ্রার উপর ভিত্তি করে একটি ডেটাসেট সংগ্রহ করুন, y ভেরিয়েবল / প্রতিক্রিয়া মুদ্রার মোট মান, ভেরিয়েবল এক্স 1 হ'ল মুদ্রার সংখ্যা এবং x2 হল মুদ্রার সংখ্যা যা কোয়ার্টার নয় (বা বৃহত্তম মান যাই হোক না কেন) সাধারণ কয়েন স্থানীয় জন্য)।

এটি সহজেই দেখতে পাওয়া যায় যে এক্স 1 বা এক্স 2 এর সাথে রিগ্রেশনটি একটি ধনাত্মক opeাল দিবে, তবে মডেলটিতে উভয়কে অন্তর্ভুক্ত করার সময় এক্স 2 এর slালটি নেতিবাচক হবে কারণ মোট মুদ্রার সংখ্যা বাড়িয়ে না রেখে ছোট মুদ্রার সংখ্যা বাড়ানো প্রতিস্থাপনের অর্থ হবে বৃহত্তর কয়েনগুলির সাথে ছোট এবং সামগ্রিক মান হ্রাস (y)।

আপনি যখন x পরিবর্তনশীল সংশোধন করতে পারেন তখন একই জিনিস ঘটতে পারে, যখন কোনও শব্দ নিজে থেকেই এবং অন্যের উপস্থিতিতে থাকে তখন লক্ষণগুলি সহজেই এর মধ্যে বিপরীত হতে পারে।


3

আপনি আপনার নিজের প্রশ্নের উত্তর দিয়েছেন - এখানে মিল রয়েছে।

কিছুটা ব্যাখ্যা: এবং অত্যন্ত কোলাইনারি highly আপনি যখন উভয়কে রিগ্রেশনটিতে প্রবেশ করেন, তখন অন্যান্য ভেরিয়েবলের প্রভাবের জন্য রিগ্রেশন নিয়ন্ত্রণ করার চেষ্টা করছে। অন্য কথায়, ধ্রুবক ধরে রাখুন , কী পরিবর্তন করে । তবে এগুলি যে এতটা সম্পর্কিত তা এই যে এই প্রশ্নটি নিরীহ এবং অদ্ভুত জিনিসগুলি ঘটতে পারে।x1x2x1x2y


অনেক ধন্যবাদ. তবে যেহেতু তাত্ত্বিকতায় কেবল বৈচিত্র্যকে স্ফীত করে তবে উচ্চতর সম্পর্কযুক্ত ভেরিয়েবলগুলির সামগ্রিক পূর্বাভাস শক্তিকে প্রভাবিত করে না, তাই আমি ভেবেছিলাম মডেল 1 বা 2 এর মতো ফলাফল প্রদান করা উচিত মডেল 2-তে এক্স 1, যেহেতু এক্স 3 এর সাথে এক্স 1 এক্স 2 এর জোড় সংযুক্তি বেশি নয় (আসলে এটি আমার বিভ্রান্তিমূলক অংশ)। তবে যেহেতু পারস্পরিক সম্পর্ক সত্যই অগোছালো হতে পারে এবং বাস্তবে, আমার এটি আশা করা উচিত নয় যেহেতু আমার মডেলটি কেবল ডিজিপির একটি অনুমান এবং অন্যান্য ভেরিয়েবল সম্পর্কিত সম্পর্কের সাথে সম্পর্কিত। β1x1+β2x2β2x2β1x1
Ting

আপনি যদি এই বিষয়ে গণিতে প্রবেশ করতে চান তবে আমি ডেভিড বেলসিলির বইগুলির সুপারিশ করছি।
পিটার ফ্লুম

দুর্দান্ত, আপনাকে অনেক ধন্যবাদ !!!
সবেমাত্র

2

3-এ কেন, β2 এর চিহ্নটি ধনাত্মক এবং পরম মানের β1 এর চেয়ে অনেক বেশি হয়ে যায়? এমন কোনও পরিসংখ্যানগত কারণ আছে যে β2 সাইন ফ্লিপ করতে পারে এবং এর বিশালতা রয়েছে?

এর সহজ উত্তর হ'ল এর কোন গভীর কারণ নেই।

এটি সম্পর্কে চিন্তাভাবনা করার উপায়টি হল যে মাল্টিকোল্লাইনারি যখন নিখুঁতভাবে পৌঁছায়, আপনি সুনির্দিষ্ট মানগুলি যে ফিটিংটি থেকে শেষ করেন তা তথ্যের ছোট এবং ছোট বিবরণের উপর আরও বেশি নির্ভরশীল হয়ে ওঠে। আপনি যদি একই অন্তর্নিহিত বিতরণ থেকে একই পরিমাণের ডেটা নমুনা করতে চান এবং তারপরে ফিট হয়ে যান তবে আপনি সম্পূর্ণ আলাদা আলাদা মানযুক্ত মানগুলি অর্জন করতে পারেন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.