স্বতন্ত্র স্তরের প্যানেল ডেটার সাথে পার্থক্য-পার্থক্য


11

স্বতন্ত্র স্তরের প্যানেল ডেটা সহ পার্থক্য মডেলটিতে পার্থক্য নির্দিষ্ট করার সঠিক উপায় কী?

এখানে সেটআপটি রয়েছে: ধরে নিন যে আমার কাছে ব্যক্তিগত স্তরের প্যানেল ডেটা একাধিক বছর ধরে শহরগুলিতে এম্বেড করা আছে এবং চিকিত্সা নগর-বছরের স্তরে পরিবর্তিত হয়। আনুষ্ঠানিকভাবে যাক পৃথক পরিণতি হতে আমি শহরে গুলি এবং বছরের টি এবং ডি গুলি টন জন্য একটি ডামি হতে কিনা হস্তক্ষেপ আক্রান্ত শহর গুলি বছরের মধ্যে টি । বার্ট্র্যান্ড এট আল (2004, পি। 250) তে বর্ণিত একের মতো একটি সাধারণ ডিআইডি অনুমানক একটি সাধারণ ওএলএস মডেলের উপর ভিত্তি করে শহর এবং বছরের জন্য স্থির প্রভাবের শর্তাদি:yistiগুলিটিডিগুলিটিগুলিটি

Yআমিগুলিটি=একজনগুলি+ +বিটি+ +এক্সআমিগুলিটি+ +βডিগুলিটি+ +εআমিগুলিটি

কিন্তু সেই অনুমানকারী কী স্বতন্ত্র-স্তরের প্যানেল কাঠামোকে উপেক্ষা করে (যেমন শহরগুলির মধ্যে প্রতিটি ব্যক্তির জন্য একাধিক পর্যবেক্ষণ)? এই মডেলটি কোনও স্বতন্ত্র-স্তরের স্থির প্রভাবের শব্দ দিয়ে প্রসারিত করার অর্থ কী? অনেক ডিআইডি অ্যাপ্লিকেশন পৃথক স্তরের প্যানেল ডেটা ছাড়া বারবার ক্রস-বিভাগের ডেটা ব্যবহার করে।এসআমি


বার্ট্রান্ড, মেরিয়েন, এস্টার ডুফ্লো এবং সেন্ডিল মুল্লাইনাথন। 2004. "পার্থক্য-পার্থক্যের প্রাক্কলন অনুসারে আমাদের কতটা বিশ্বাস করা উচিত?" অর্থনীতি ত্রৈমাসিক জার্নাল 119 (1): 249–75।


আপনি যদি সত্তার ডমিগুলির প্রভাবগুলি ক্যাপচার করতে চান তবে একটি স্থির প্রভাবের মডেল কেন করবেন না? ডিআইডি 2 টি পিরিয়ডের সাথে ডাইমি সমেত সমান এবং তারপরে ডিআইডি করা তাদেরকে বাদ দেয়।
ভিসিজি

আমি ভুল হলে আমাকে সংশোধন করুন তবে আমি দুটি পার্থক্য দেখতে পাচ্ছি: ক) কোনও ফী মডেল তার প্রভাবের অনুমানের জন্য ইউনিটের অভ্যন্তরীণ ব্যবহার করবে (উদাহরণস্বরূপ আয় কোনও নির্দিষ্ট ইভেন্টের পরে আয় বেশি বা কম)। ডিআইডি পদ্ধতির ধারণা হ'ল চিকিত্সা ছাড়াই কী ঘটেছিল তা ক্যাপচারের জন্য অন্যান্য পর্যবেক্ষণগুলি নিয়ন্ত্রণের প্রবণতা হিসাবে ব্যবহার করা। খ) ডিআইডি পৃথক স্তরের চিকিত্সা নয় বরং একটি গ্রুপ স্তরের উপর দৃষ্টি নিবদ্ধ করে। এখন প্রশ্নটি হল যদি আমি আমার উদাহরণের সমীকরণের জন্য একটি স্বতন্ত্র স্তরের ফে শব্দটি যুক্ত করি তবে কী হয়। এটি কি নিয়ন্ত্রণ প্রবণতা হিসাবে নিয়ন্ত্রণ ওবস ব্যবহার করে? সমস্ত নিয়ন্ত্রণ obs চিকিত্সার ক্ষেত্রে পরিবর্তিত হয় না ...
গ্রেগ

উত্তর:


11

ফারাক-ইন-ডিফারেন্সের (ডিআইডি) একটি দুর্দান্ত বৈশিষ্ট্যটি হ'ল এটির জন্য আপনাকে প্যানেল ডেটার দরকার নেই। চিকিত্সা একত্রিতকরণের কিছু স্তর (আপনার ক্ষেত্রে শহরগুলিতে) ঘটেছিল তা প্রদত্ত, আপনার কেবল চিকিত্সার আগে এবং পরে শহরগুলি থেকে এলোমেলো ব্যক্তিদের নমুনা দেওয়া দরকার। এটি আপনাকে y i s t = A g + B t + β D s t + c X i s t + ϵ i s t অনুমান করতে দেয়

Yআমিগুলিটি=একজন+ +বিটি+ +βডিগুলিটি+ +এক্সআমিগুলিটি+ +εআমিগুলিটি
নিয়ন্ত্রণের জন্য প্রত্যাশিত প্রাক-ফলাফলের পার্থক্য হিসাবে চিকিত্সা বিয়োগের জন্য প্রত্যাশিত পূর্ব-ফলাফলের পার্থক্য হিসাবে চিকিত্সার কার্যকারণ প্রভাবটি পান।

Yআমিটি=αআমি+ +বিটি+ +βডিআমিটি+ +এক্সআমিটি+ +εআমিটি
ডিআমিটি স্টিভ পিসচে।

একজন

এখানে একটি কোড উদাহরণ রয়েছে যা দেখায় যে এটি কেস। আমি স্টাটা ব্যবহার করি তবে আপনি এটি আপনার পছন্দসই পরিসংখ্যান প্যাকেজে প্রতিলিপি করতে পারেন। এখানকার "ব্যক্তি" প্রকৃতপক্ষে দেশ তবে কিছু চিকিত্সা সূচক অনুসারে সেগুলি এখনও গ্রুপে রয়েছে।

* load the data set (requires an internet connection)
use "http://dss.princeton.edu/training/Panel101.dta"

* generate the time and treatment group indicators and their interaction
gen time = (year>=1994) & !missing(year)
gen treated = (country>4) & !missing(country)
gen did = time*treated

* do the standard DiD regression
reg y_bin time treated did

------------------------------------------------------------------------------
       y_bin |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
        time |       .375   .1212795     3.09   0.003     .1328576    .6171424
     treated |   .4166667   .1434998     2.90   0.005       .13016    .7031734
         did |  -.4027778   .1852575    -2.17   0.033    -.7726563   -.0328992
       _cons |         .5   .0939427     5.32   0.000     .3124373    .6875627
------------------------------------------------------------------------------

 * now repeat the same regression but also including country fixed effects
 areg y_bin did time treated, a(country)

------------------------------------------------------------------------------
       y_bin |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
        time |       .375    .120084     3.12   0.003     .1348773    .6151227
     treated |          0  (omitted)
         did |  -.4027778   .1834313    -2.20   0.032    -.7695713   -.0359843
       _cons |   .6785714    .070314     9.65   0.000       .53797    .8191729
-------------+----------------------------------------------------------------

সুতরাং আপনি দেখতে পাচ্ছেন যে পৃথক ফিক্সড এফেক্টগুলি অন্তর্ভুক্ত করার সময় ডিআইডি সহগটি একই থাকে (স্টাতায় aregউপলব্ধ স্থির প্রভাবগুলির মূল্যায়ন কমান্ডগুলির মধ্যে একটি)। স্ট্যান্ডার্ড ত্রুটিগুলি কিছুটা কড়া হয় এবং আমাদের আসল চিকিত্সার সূচকটি পৃথক নির্দিষ্ট প্রভাব দ্বারা শোষিত হয় এবং তাই রিগ্রেশনটিতে নেমে যায়।

মন্তব্যের প্রতিক্রিয়ায়
আমি পিস্ককে উদাহরণটি উল্লেখ করার জন্য উল্লেখ করেছি যখন লোকেরা চিকিত্সা গোষ্ঠী সূচকের পরিবর্তে পৃথক স্থির প্রভাবগুলি ব্যবহার করে। আপনার সেটিংটিতে একটি সংজ্ঞায়িত গোষ্ঠী কাঠামো রয়েছে যাতে আপনি নিজের মডেলটি যেভাবে লিখেছেন তা পুরোপুরি ঠিক। নগর পর্যায়ে স্ট্যান্ডার্ড ত্রুটিগুলি ক্লাস্টার করা উচিত, অর্থাত্ চিকিত্সা সংঘটিত হওয়ার স্তরের স্তরে (বার্ট্র্যান্ড এট আল পেপারের দ্বারা প্রদর্শিত উদাহরণ হিসাবে স্ট্যান্ডার্ড ত্রুটিগুলি সংশোধন করা দরকার উদাহরণ কোডে আমি এটি করি নি তবে ডিআইডি সেটিংসে স্ট্যান্ডার্ড ত্রুটিগুলি সংশোধন করা দরকার) )।

ডিগুলিটিগুলিটি

=[(Yআমিগুলিটি|গুলি=1,টি=1)-(Yআমিগুলিটি|গুলি=1,টি=0)]-[(Yআমিগুলিটি|গুলি=0,টি=1)-(Yআমিগুলিটি|গুলি=0,টি=0)]

(Yআমিগুলিটি|গুলি=1,টি=1)(Yআমিগুলিটি|গুলি=0,টি=1)। সময়ের সাথে গোষ্ঠীগত পার্থক্য থেকে না কেন আন্দোলনকারীদের কাছ থেকে শনাক্তকরণ আসে তা পরিষ্কার করার জন্য আপনি এটিকে একটি সাধারণ গ্রাফ দিয়ে কল্পনা করতে পারবেন। মনে করুন ফলাফলের পরিবর্তনটি কেবলমাত্র চিকিত্সার কারণে এবং এটির সমসাময়িক প্রভাব রয়েছে। যদি চিকিত্সা শুরু হওয়ার পরে যদি আমাদের কোনও ব্যক্তি চিকিত্সা করা শহরে থাকেন তবে তারা একটি নিয়ন্ত্রণ শহরে চলে যান, তাদের ফলাফল চিকিত্সা করার আগে যা ছিল তা ফিরে আসা উচিত। এটি নীচের স্টাইলাইজড গ্রাফটিতে দেখানো হয়েছে।

এখানে চিত্র বর্ণনা লিখুন

আপনি এখনও অন্য কারণে মুভিংদের সম্পর্কে ভাবতে চাইতে পারেন। উদাহরণস্বরূপ, যদি চিকিত্সার স্থায়ী প্রভাব থাকে (যেমন ব্যক্তি পৃথক হওয়া সত্ত্বেও এটি ফলাফলটিকে প্রভাবিত করে)


2
চমৎকার উত্তর. আপনি কি এখানে শহর পর্যায়ের ত্রুটিগুলি ক্লাস্টারিংয়ের সুপারিশ করবেন?
দিমিত্রি ভি। মাস্টারভ

দুর্দান্ত উত্তর, ধন্যবাদ। আপনার eq 3 পৃষ্ঠা 12 থেকে eq 3, ডান? পিস্কে এই অংশটির সাথে পরিচয় করিয়ে দিয়েছিলেন "তবে, কখনও কখনও এমন কোনও প্রাকৃতিক ইউনিট থাকে না যেখানে চিকিত্সা নির্ধারিত হয়। পরিবর্তে কিছু ব্যক্তি নির্দিষ্ট সময়ে নির্দিষ্ট সময়ে চিকিত্সা করেন এবং অন্যরা তা করেন না"। তবে বাস্তবে তা হয় না। আমার সেটিংয়ে শহরের (বা যে কোনও গ্রুপ) স্তরের চিকিত্সাটি রয়েছে + আমার কাছে প্যানেল ডেটা রয়েছে। এটি এখনও ক্লাস্টার্ড সেটের সাথে সঠিক মডেল হতে পারে। তুমি কি বলবে? যদি ব্যক্তি বছরের পর বছর ধরে শহরের মধ্যে চলাফেরা করতে পারে? সেক্ষেত্রে, 'চিকিত্সা' করার জন্য কোফটি মুভরদের ভিত্তিতে চিহ্নিত করা হবে, তাই না?
গ্রেগ

@ দিমিত্রিভি.মাস্টারভ বার্ট্র্যান্ড এট আল-এর পরামর্শ অনুযায়ী, গ্রুপ পর্যায়ে যে চিকিত্সা হয় সেখানে স্ট্যান্ডার্ড ত্রুটিগুলি ক্লাস্টার করা উচিত। বিকল্পভাবে আপনি প্রতিস্থাপনের সাথে একটি ব্লক বুটস্ট্র্যাপ ব্যবহার করতে পারেন যদিও এটি আবার শহর পর্যায়ের হবে।
অ্যান্ডি

@ গ্রেগ আমি আপনার মন্তব্যে কিছুটা বিশদ সহ প্রতিক্রিয়া জানাতে উত্তর সম্পাদনা করেছি। আমি আশা করি এটি সাহায্য করে :-)
অ্যান্ডি

যদি আমরা একাধিক পিরিয়ড ব্যবহার করি তবে এটির কি পার্থক্য রয়েছে? ডামি ডি_আই_টি ইভেন্টের আগে সমস্ত সময়কালের জন্য শূন্য হবে এবং যাইহোক ইভেন্টের পরে সমস্ত সময়ের জন্য এটি এক হবে। আমি কি কেবল দুটি পিরিয়ড ব্যবহার করলে এটি একই হবে না? @ অ্যান্ডি
জিনুয়া ওয়াং

1

সংক্ষিপ্ত উত্তরটি হ'ল ইউনিট বা চিকিত্সা গোষ্ঠী পর্যায়ে স্থির প্রভাব ব্যবহার অনুমানের পরিবর্তন করে না, কেবল অনুমিতি। সাধারণত, ইউনিট ফিক্সড-এফেক্ট ব্যবহার করা আরও তাত্পর্য শোষণ করবে এবং তাই আপনার কাছে ছোট স্ট্যান্ডার্ড ত্রুটি থাকবে।

ইউনিটগুলি একই সমষ্টিগত গোষ্ঠীতে রয়েছে কিনা তা এই ফলাফলটি পরিবর্তন করে না (এটি কেবলমাত্র আপনার চিকিত্সা গোষ্ঠী স্তরটি কীভাবে সংজ্ঞায়িত করা হয় তা পরিবর্তন করে এবং বারবার ক্রস-সেকশনগুলির পরিবর্তে আপনার প্যানেল লাগবে)।

তবে লক্ষ করুন যে সমান্তরালতা কেবল তখনই ধারণ করে যখন কোনও কোভারিয়েট এক্স থাকে না you আপনার এক্স থাকলেই, ফলাফলগুলি পৃথক হয় আপনি ইউনিট বা গ্রুপ স্থির প্রভাব ব্যবহার করেন কিনা।

নীচের উদাহরণে এক্স এর সাথে এবং ছাড়াই দুটি ক্ষেত্রে তিনটি অনুমানকারীকে তুলনা করা হয় Es

  1. OLS ঔজ্জ্বল্যের প্রেক্ষাপটে
  2. (চিকিত্সা) গ্রুপ স্থির প্রভাব সহ ফে
  3. ইউনিট স্থির প্রভাব সহ ফে

#>              OLS         FE treated  FE unit   OLS x       FE treated x  FE unit x
#> ----------------------------------------------------------------------------------
#> (Intercept)   0.500 ***                         0.491 ***                         
#>              (0.094)                           (0.107)                            
#> did          -0.403 *    -0.403 *    -0.403 *  -0.407 *    -0.407 *      -0.460 * 
#>              (0.185)     (0.185)     (0.183)   (0.189)     (0.189)       (0.187)  
#> x1                                              0.018       0.018         0.220   
#>                                                (0.104)     (0.104)       (0.165)  
#> ----------------------------------------------------------------------------------
#> Num. obs.    70          70          70        70          70            70       
#> ==================================================================================
#> *** p < 0.001, ** p < 0.01, * p < 0.05

কোড:

library(tidyverse)
library(haven)
library(texreg)
library(lfe)


dat <- read_dta("http://dss.princeton.edu/training/Panel101.dta")  %>% 
  mutate(time = (year>=1994) ,
         treated = (country>4),
         did = time*treated)

reg_ols <- lm(y_bin~ time+ treated+ did, data = dat)
reg_fe_a <- felm(y_bin~ did | time+ treated, data = dat)
reg_fe_b <- felm(y_bin~ did | time+ country, data = dat)

reg_ols_x <- update(reg_ols, .~.+x1)
reg_fe_a_x <- update(reg_fe_a, .~.+x1)
reg_fe_b_x <- update(reg_fe_b, .~.+x1)



screenreg(list(reg_ols, reg_fe_a, reg_fe_b, reg_ols_x, reg_fe_a_x, reg_fe_b_x), 
          omit.coef = "time|treated", digits=3, 
          include.rsquared = FALSE, include.adjrs = FALSE, include.rmse = FALSE,
          custom.model.names = c("OLS", "FE treated", "FE unit", "OLS x", "FE treated x", "FE unit x"))
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.