আপনার প্রথম প্রশ্নের উত্তর দেওয়ার জন্য, আপনি সঠিক যে নমুনা নির্বাচনটি প্রসূতির একটি নির্দিষ্ট ফর্ম (অন্তঃসত্ত্বা এবং সাধারণ প্রতিকারগুলির একটি ভাল বেসিক পর্যালোচনার জন্য অ্যান্টোনাকিস এট আল। 2010 দেখুন) তবে আপনি চিকিত্সা হওয়ার সম্ভাবনাটি বলার ক্ষেত্রেও সঠিক নন অন্তঃসত্ত্বা পরিবর্তনশীল, কারণ এটি চিকিত্সা পরিবর্তনশীল নিজেই ("নন-র্যান্ডম ট্রিটমেন্ট অ্যাসাইনমেন্ট") - তার চিকিত্সা হওয়ার সম্ভাবনার চেয়ে - এটি নমুনা নির্বাচনের অন্তঃসত্ত্বা। স্মরণ করুন যে দীর্ঘস্থায়ীত্বটি এমন একটি পরিস্থিতিতে নির্দেশ করে যেখানে আপনি ভুলভাবে ফ্যাক্টর এক্স এবং ফ্যাক্টর ওয়াইয়ের মধ্যে একটি কার্যকরী সম্পর্ক চিহ্নিত করেছেন, যখন পরিলক্ষিত "সম্পর্ক" আসলে অন্য কারণের জেড এর কারণে যা এক্স এবং ওয়াই উভয়কেই প্রভাবিত করে another :
yi=β0+β1xi+...+ϵi
অন্তঃসত্ত্বা ঘটে যখন আপনার এক বা একাধিক ভবিষ্যদ্বাণী মডেলের ত্রুটি শর্তের সাথে সম্পর্কিত। এটি যখন ।Cov(x,ϵ)≠0
অন্তঃসত্ত্বার সাধারণ কারণগুলির মধ্যে রয়েছে:
- নির্ধারিত ভেরিয়েবল (কিছু জিনিস যা আমরা কেবল পরিমাপ করতে পারি না)
- প্রেরণা / পছন্দ
- ক্ষমতা / প্রতিভা
- স্বয়ং-নির্বাচন
- পরিমাপ ত্রুটি
(আমরা অন্তর্ভুক্ত করতে চাই , তবে আমরা কেবল পর্যবেক্ষণ করি )x j ∗xjxj∗
- যুগপততা / দ্বিপাক্ষিকতা (5 বছরের কম বয়সী বাচ্চাদের মধ্যে, পুষ্টির স্থিতি সূচক "বয়সের জন্য ওজন" এবং সন্তানের সাম্প্রতিক অসুস্থতা ছিল কিনা তা যুগপত হতে পারে the
বিভিন্ন ধরণের সমস্যার জন্য সামান্য ভিন্ন সমাধানের প্রয়োজন হয়, যেখানে চতুর্থ এবং হেকম্যান-ধরণের সংশোধনের মধ্যে পার্থক্য থাকে। অবশ্যই এই পদ্ধতির অন্তর্নিহিত যান্ত্রিকগুলির মধ্যে পার্থক্য রয়েছে, তবে এর ভিত্তিটি একই রকম: যা হ'ল চিত্তাকর্ষকতা অপসারণ করা, আদর্শভাবে একটি বর্জনীয় নিষেধাজ্ঞার মাধ্যমে, অর্থাত চতুর্থ ক্ষেত্রে এক বা একাধিক যন্ত্র বা নির্বাচনকে প্রভাবিত করে এমন একটি পরিবর্তনশীল যা নির্বাচনকে প্রভাবিত করে না হেকম্যানের ক্ষেত্রে ফলাফল।
আপনার দ্বিতীয় প্রশ্নের উত্তর দেওয়ার জন্য, আপনাকে এই ডেটা সীমাবদ্ধতার ধরণের পার্থক্য সম্পর্কে চিন্তা করতে হবে যা এই সমাধানগুলির বিকাশের জন্ম দিয়েছে। আমি ভাবতে চাই যে এক বা একাধিক ভেরিয়েবলগুলি অন্তঃসত্ত্বা হলে ইনস্ট্রুমেন্টাল ভেরিয়েবল (চতুর্থ) পদ্ধতির ব্যবহার হয় এবং প্রসূতিটি সরিয়ে দেওয়ার জন্য মডেলটিতে দৃ stick়তার জন্য খুব ভাল প্রক্সি থাকে না, তবে সমস্ত পর্যবেক্ষণের জন্য কোভেরিয়েটস এবং ফলাফলগুলি পর্যবেক্ষণ করা হয়। অন্যদিকে হেকম্যান-ধরণের সংশোধনগুলি ব্যবহৃত হয় যখন আপনি কেটে ফেলেন, অর্থাত নমুনায় তাদের ক্ষেত্রে তথ্যটি পর্যবেক্ষণ করা হয় না যেখানে নির্বাচনের ভেরিয়েবলের মান == 0 হয়।
ইনস্ট্রুমেন্টাল ভেরিয়েবল (চতুর্থ) পদ্ধতির
দ্বি-পর্যায়ে সর্বনিম্ন স্কোয়ার (2 এসএলএস) অনুমানকারী সহ আইভি রিগ্রেশনের জন্য ক্লাসিক একনোমেট্রিক উদাহরণটি চিন্তা করুন: উপার্জনের উপর শিক্ষার প্রভাব।
Earningsi=β0+β1OwnEdi+ϵi (1)
এখানে শিক্ষাগত অর্জনের স্তরটি প্রচলিত কারণ এটি আংশিকভাবে ব্যক্তির প্রেরণা এবং ক্ষমতা দ্বারা নির্ধারিত হয়, উভয়ই কোনও ব্যক্তির উপার্জনকেও প্রভাবিত করে। প্রেরণা এবং দক্ষতা সাধারণত পরিবার বা অর্থনৈতিক সমীক্ষায় মাপা হয় না। সমীকরণ 1 সুতরাং স্পষ্টভাবে অনুপ্রেরণা এবং ক্ষমতা অন্তর্ভুক্ত লিখতে পারেন:
Earningsi=β0+{β1OwnEdi+β2Motivi+β3Abili}+ϵi (২)
যেহেতু এবং প্রকৃতপক্ষে পর্যবেক্ষণ করা হয় না, সমীকরণ 2 এ হিসাবে লেখা যেতে পারে:এ বি আই এলMotivAbil
Earningsi=β0+β1OwnEdi+ui (3),
যেখানে (4)।ui=β2Motivi+β3Abili+ϵi
সুতরাং ওএলএসের মাধ্যমে আয়ের উপর শিক্ষার প্রভাবের একটি নির্দোষ অনুমান পক্ষপাতমূলক হবে। এই অংশটি আপনি ইতিমধ্যে জানেন।
অতীতে, লোকেরা তাদের নিজস্ব স্তরের শিক্ষার স্তরের জন্য পিতামাতার শিক্ষাকে যন্ত্র হিসাবে ব্যবহার করেছে, কারণ তারা বৈধ উপকরণের ( ) জন্য প্রয়োজনীয় 3 টি প্রয়োজনীয়তা মেনে চলে :z
- 𝐶 𝑜 𝑣 ( 𝑧 , 𝑥 ) ≠ 0z অবশ্যই অন্তঃসত্ত্বা পূর্বাভাসকারী - ,Cov(z,x)≠0
- 𝐶 𝑜 𝑣 ( 𝑧 , 𝑦 ) = 0z সরাসরি ফলাফলের সাথে সম্পর্কিত হতে পারে না - , এবংCov(z,y)=0
- z 𝐶 𝑜 𝑣 ( 𝑧 , 𝑢 ) = 0z u) বৈশিষ্ট্যযুক্ত (যেটি বহিরাগত) - সাথে সম্পর্কিত হতে পারে নাzCov(z,u)=0
আপনি যখন বিষয় শিক্ষার (অনুমান ) বাবা-মায়ের শিক্ষা (ব্যবহার এবং (প্রথম পর্যায়ে) এবং শিক্ষার পূর্বাভাস মান ব্যবহার ) অনুমান করার জন্য দ্বিতীয় পর্যায়ে, আপনি (খুব সরল পদ) হয় , এর অংশের ভিত্তিতে যা প্রেরণা / ক্ষমতা দ্বারা নির্ধারিত হয় না।এম ণ মি ই ঘ ডি একটি ঘ ই ঘ ^ হে W এন ই ঘ ই একটি দ N আমি এন জি গুলি ই একটি দ N আমি এন জি গুলি হে W এন ই ঘOwnEdMomEdDadEdOwnEdˆEarningsEarningsOwnEd
হেকম্যান-ধরণের সংশোধন
যেমনটি আমরা আগেও প্রতিষ্ঠিত করেছি, নন-এলোমেলো নমুনা নির্বাচন একটি নির্দিষ্ট ধরণের দীর্ঘস্থায়ীত্ব। এই ক্ষেত্রে, বাদ দেওয়া পরিবর্তনশীল হ'ল কীভাবে লোকে নমুনায় নির্বাচিত হয়েছিল। সাধারণত, যখন আপনার একটি নমুনা নির্বাচনের সমস্যা রয়েছে, আপনার ফলাফল কেবলমাত্র তাদের জন্য নমুনা বাছাই করা হয় variable == 1
। এই সমস্যাটিকে "ঘটনামূলক কাটকাটি" নামেও পরিচিত এবং সমাধানটি সাধারণত হেকম্যান সংশোধন হিসাবে পরিচিত। ইকোনোমেট্রিক্সের সর্বোত্তম উদাহরণ হ'ল বিবাহিত মহিলাদের মজুরি অফার:
Wagei=β0+β1Educi+β2Experiencei+β3Experience2i+ϵi (5)
এখানে সমস্যাটি হ'ল কেবলমাত্র সেই মহিলাদের জন্য মজুরি হিসাবে পালন করা হয় যারা মজুরির জন্য কাজ করেছিল, সুতরাং একজন নির্দোষ অনুমানকারী পক্ষপাতদুষ্ট হবে, যেহেতু আমরা জানি না যারা শ্রমশক্তিতে অংশ নেন না তাদের জন্য নির্বাচনের পরিবর্তনশীল । 5 টি সমীকরণটি এটির জন্য আবারও লেখা যায় যে এটি দুটি সুপ্ত মডেল দ্বারা যৌথভাবে নির্ধারিত হয়েছে:এসWages
Wage∗i=Xβ′+ϵi ())
LaborForce∗i=Zγ′+νi (7)
তা হল, আইএফএফ এবং আইএফএফ L a b o r F O r c e ∗ i > 0 W a g e = । এল একটি খ ণ দ এফ ণ দ গ ঙ * আমি ≤ 0Wage=Wage∗iLaborForce∗i>0Wage=.LaborForce∗i≤0
এখানে সমাধানটি হ'ল প্রথম পর্যায়ে শ্রমশক্তিতে অংশ নেওয়ার সম্ভাবনা ভবিষ্যদ্বাণী করা একটি প্রবিট মডেল ব্যবহার এবং বর্জনীয় নিষেধাজ্ঞার (বৈধ যন্ত্রগুলির জন্য একই মানদণ্ড এখানে প্রয়োগ করা হয়), পূর্বাভাসিত ইনভার্স মিলের অনুপাত গণনা করুন ( ) প্রতিটি পর্যবেক্ষণের জন্য, এবং দ্বিতীয় পর্যায়ে, মডেলের ভবিষ্যদ্বাণী হিসাবে in in using ব্যবহার করে মজুরি অফারের অনুমান করুন (ওয়াল্ড্রিজ ২০০৯)। যদি on এর পরিসংখ্যানগতভাবে শূন্যের সমান হয় তবে নমুনা নির্বাচনের কোনও প্রমাণ নেই (অন্তঃসত্ত্বা), এবং ওএলএস ফলাফলগুলি সামঞ্জস্যপূর্ণ এবং উপস্থাপিত হতে পারে। যদি ল্যাম্বদা on তে সহগ হয়λ^λ^λ^λ^ পরিসংখ্যানগতভাবে শূন্য থেকে উল্লেখযোগ্যভাবে পৃথক, আপনি সংশোধিত মডেল থেকে সহগের রিপোর্ট করতে হবে।
তথ্যসূত্র
- অ্যান্টোনাকিস, জন, স্যামুয়েল বেন্দাহান, ফিলিপ জ্যাকোয়ার্ট, এবং রাফায়েল লালিভ। 2010. "কার্যকারিতা দাবি করার বিষয়ে: একটি পর্যালোচনা এবং প্রস্তাবনা।" নেতৃত্বের ত্রৈমাসিক 21 (6): 1086–1120। ডোই: 10,1016 / j.leaqua.2010.10.010।
- ওয়াল্ড্রিজ, জেফ্রি এম। ২০০৯। প্রবর্তক একনোমেট্রিক্স: একটি আধুনিক পদ্ধতি। চতুর্থ সংস্করণ। ম্যাসন, ওএইচ, ইউএসএ: দক্ষিণ-পশ্চিমা, সেনেজ লার্নিং।