ফলাফল পরিবর্তনশীল ক্ষেত্রে / নিয়ন্ত্রণের স্থিতি না হলে কেস-নিয়ন্ত্রণ ডিজাইনে লজিস্টিক রিগ্রেশন সহগের অনুমান করা


10

নিম্নলিখিত আকারে আকারের জনসংখ্যার থেকে ডেটা নমুনা বিবেচনা করুন :Nk=1,...,N

  1. স্বতন্ত্র "রোগ" স্থিতি পর্যবেক্ষণ করুনk

  2. তাদের যদি এই রোগ হয় তবে তাদের সম্ভাব্যতার সাথে নমুনায় অন্তর্ভুক্ত করুনpk1

  3. তারা রোগ না থাকে তাহলে তাদের সম্ভাব্যতা অন্তর্ভুক্ত ।pk0

ধরা যাক আপনি বাইনারি ফলাফলের পরিবর্তনশীল এবং ভেক্টর , বিষয়গুলি এইভাবে নমুনা হিসাবে দেখেছেন । ফলাফল পরিবর্তনশীল না "রোগ" স্থিতি। আমি লজিস্টিক রিগ্রেশন মডেলের পরামিতিগুলি অনুমান করতে চাই:YiXii=1,...,n

log(P(Yi=1|Xi)P(Yi=0|Xi))=α+Xiβ

সকল আমি যত্ন সম্পর্কে (লগ) মতভেদ অনুপাত হয় β । ইন্টারসেপ্টটি আমার কাছে অপ্রাসঙ্গিক।

আমার প্রশ্নটি হল: নমুনা সম্ভাবনাগুলি ignoring I p_ {i1}, p_ {i0} \} , i = 1, ..., n কে উপেক্ষা করে আমি কী fit \ বোল্ডসিম্বল \ বিটা sens এর বুদ্ধিমান অনুমান পেতে পারি এবং মডেলটিকে এমনভাবে ফিট করেছি যেন? এটি একটি সাধারণ এলোমেলো নমুনা ছিল?β{pi1,pi0}i=1,...,n


আমি বেশ নিশ্চিত যে এই প্রশ্নের উত্তর "হ্যাঁ"। আমি যা খুঁজছি তা হল একটি রেফারেন্স যা এটি বৈধ করে।

উত্তর সম্পর্কে আমি আত্মবিশ্বাসের দুটি প্রধান কারণ রয়েছে:

  1. আমি অনেক সিমুলেশন অধ্যয়ন করেছি এবং তাদের কেউই এর বিরোধিতা করে না এবং and

  2. এটি দেখানো সহজবোধ্য, জনসংখ্যা যদি উপরের মডেল দ্বারা পরিচালিত হয়, তবে নমুনাযুক্ত ডেটা পরিচালিত মডেলটি হ'ল

log(P(Yi=1|Xi)P(Yi=0|Xi))=log(pi1)log(pi0)+α+Xiβ

যদি স্যাম্পলিংয়ের সম্ভাবনাগুলি উপর নির্ভর না করে , তবে এটি ইন্টারসেপ্টে একটি সরল শিফট উপস্থাপন করবে এবং of এর বিন্দু অনুমানটি স্পষ্টভাবে প্রভাবিত হবে না। তবে, যদি প্রতিটি ব্যক্তির জন্য অফসেটগুলি পৃথক হয় তবে এই যুক্তিটি পুরোপুরি প্রয়োগ হয় না কারণ আপনি অবশ্যই আলাদা পয়েন্টের প্রাক্কলনটি পাবেন, যদিও আমি সন্দেহ করি যে অনুরূপ কিছু ঘটেছিল। iβ

সম্পর্কিত: প্রেন্টিস এবং পাইকের ক্লাসিক পেপারে বলা হয়েছে যে কেস-নিয়ন্ত্রণ থেকে লজিস্টিক রিগ্রেশন সহগ (ফলাফল হিসাবে রোগের স্থিতি সহ) সম্ভাব্য গবেষণা থেকে প্রাপ্ত সংগ্রহগুলির মতো একই বিতরণ রয়েছে have আমি সন্দেহ করি যে এখানে একই ফলাফল কার্যকর হবে তবে আমি অবশ্যই স্বীকার করব যে আমি কাগজের প্রতিটি বিট পুরোপুরি বুঝতে পারি না।

কোন মন্তব্য / রেফারেন্স জন্য আগাম ধন্যবাদ।


1
আপনি উল্লেখ করেছেন যে "ফলাফল পরিবর্তনশীল রোগের অবস্থা নয়"। কী বোঝায়? সিভি, বিটিডব্লু ফিরে আসুন। Yi=1
গুং - মনিকা পুনরায়

1
Yi একটি ভিন্ন পরিবর্তনশীল। আমার অর্থ হ'ল যে পরিবর্তনশীল যা আপনার নমুনা সম্ভাবনা (সাধারণত কোনও ক্ষেত্রে নিয়ন্ত্রণের ক্ষেত্রে রোগের অবস্থা) নির্দেশ করে তা ফলাফলের পরিবর্তনশীল হিসাবে একই নয় - কোনও ডেটা সেটের গৌণ বিশ্লেষণ ভাবেন think উদাহরণস্বরূপ, বলুন যে নমুনাটি নিয়মিতভাবে ওষুধ ব্যবহারকারীদের নমুনা তৈরি করে এবং অ ড্রাগ ড্রাগ ব্যবহারকারীর একটি অতিরিক্ত (ফ্রিকোয়েন্সি ম্যাচ করা, কিছু নির্দিষ্ট covariates) সেট তৈরি করে তৈরি হয়েছিল তবে আপনি যে ফলাফলের পরিবর্তনশীল যা অধ্যয়ন করছেন সেটি অন্য কিছু আচরণগত পরিমাপ। এই ক্ষেত্রে স্যাম্পলিং স্কিমটি একটি উপদ্রব। ধন্যবাদ, বিটিডব্লিউ!
ম্যাক্রো

উত্তর:


8

এটি ইকোনোমেট্রিক্সে নির্বাচন মডেলটির একটি প্রকরণ। এখানে কেবলমাত্র নির্বাচিত নমুনা ব্যবহার করে অনুমানের বৈধতা । এখানে হয় এর রোগ অবস্থা।Pr(Yi=1Xi,Di=1)=Pr(Yi=1Xi,Di=0)Dii

আরও বিশদ দেওয়ার জন্য, নিম্নলিখিত স্বরলিপিগুলি সংজ্ঞায়িত করুন: এবং ; সেই ঘটনাকে বোঝায় যে নমুনাতে রয়েছি। তদুপরি, সরলতার জন্য of এর থেকে স্বতন্ত্র ।π1=Pr(Di=1)π0=Pr(Di=0)Si=1iDiXi

সম্ভাব্যতা একটি ইউনিট জন্য নমুনা রয়েছে ite পুনরাবৃত্ত কাণ্ডের আইন অনুসারে। রোগ অবস্থা শর্তসাপেক্ষ ধরুন এবং অন্যান্য covariates , ফলাফল স্বাধীন । ফলস্বরূপ, Yi=1i

Pr(Yi=1Xi,Si=1)=E(YiXi,Si=1)=E{E(YiXi,Di,Si=1)Xi,Si=1}=Pr(Di=1Si=1)Pr(Yi=1Xi,Di=1,Si=1)+Pr(Di=0Si=1)Pr(Yi=1Xi,Di=0,Si=1),
DiXiYiSi
Pr(Yi=1Xi,Si=1)=Pr(Di=1Si=1)Pr(Yi=1Xi,Di=1)+Pr(Di=0Si=1)Pr(Yi=1Xi,Di=0).
to সহজেই দেখতে পাওয়া যায় যে এখানে এবং হিসাবে আপনার নমুনা প্রকল্পের সংজ্ঞা দেওয়া আছে। সুতরাং,
Pr(Di=1Si=1)=π1pi1π1pi1+π0pi0 and Pr(Di=0Si=1)=π0pi0π1pi1+π0pi0.
pi1pi0
Pr(Yi=1Xi,Si=1)=π1pi1π1pi1+π0pi0Pr(Yi=1Xi,Di=1)+π0pi0π1pi1+π0pi0Pr(Yi=1Xi,Di=0).
যদি , আমাদের কাছে এবং আপনি নমুনা নির্বাচন সমস্যা বাদ দিতে পারেন। অন্যদিকে, যদি , সাধারণভাবে । একটি বিশেষ কেস হিসাবে, লগিট মডেল বিবেচনা করুন, Pr(Yi=1Xi,Di=1)=Pr(Yi=1Xi,Di=0)
Pr(Yi=1Xi,Si=1)=Pr(Yi=1Xi),
Pr(Yi=1Xi,Di=1)Pr(Yi=1Xi,Di=0)
Pr(Yi=1Xi,Si=1)Pr(Yi=1Xi)
Pr(Yi=1Xi,Di=1)=eXiα1+eXiα and Pr(Yi=1Xi,Di=0)=eXiβ1+eXiβ.
এমনকি যখন এবং জুড়ে অবিচ্ছিন্ন থাকে , ফলস্বরূপ বিতরণ লজিট গঠনে রাখে না। আরও গুরুত্বপূর্ণ, পরামিতিগুলির ব্যাখ্যাটি সম্পূর্ণ আলাদা হবে। আশা করি, উপরোক্ত যুক্তিগুলি আপনার সমস্যাটি কিছুটা পরিষ্কার করতে সহায়তা করে।pi1pi0i

an কে একটি অতিরিক্ত ব্যাখ্যামূলক পরিবর্তনশীল হিসাবে অন্তর্ভুক্ত করতে , এবং উপর ভিত্তি করে মডেলটি অনুমান করা যায় । ব্যবহারের বৈধতা প্রমাণ করার জন্য, আমাদের প্রমাণ করতে হবে যে , যা শর্তের সমান একটি যথেষ্ট পরিসংখ্যাত হয় । আপনার নমুনা প্রক্রিয়া সম্পর্কে আরও তথ্য ছাড়া, আমি নিশ্চিত না যে এটি সত্য কিনা is আসুন একটি বিমূর্ত স্বরলিপি ব্যবহার করুন। বলুন, পর্যবেক্ষণের পরিবর্তনশীল এবং অন্যান্য র্যান্ডম ভেরিয়েবলের র্যান্ডম ফাংশন হিসাবে দেখা যেতে পারে , বলুনDiPr(YiXi,Di)Pr(YiXi,Di)Pr(YiXi,Di,Si=1)=Pr(YiXi,Di)DiSiSiDiZi । বোঝাতে । তাহলে স্বাধীন উপর শর্তাধীন এবং , আমরা স্বাধীনতার সংজ্ঞা অনুসারে তবে, যদি এবং on কন্ডিশনার পরে of এর থেকে স্বতন্ত্র না হয় , স্বজ্ঞাতভাবে সম্পর্কে কিছু প্রাসঙ্গিক তথ্য ধারণ করে , এবং সাধারণভাবে এটি প্রত্যাশিত নয়Si=S(Di,Zi)ZiYiXiDiPr(YiXi,Di,S(Di,Zi))=Pr(YiXi,Di)ZiYiXiDiZiYiPr(YiXi,Di,S(Di,Zi))=Pr(YiXi,Di) । সুতরাং, 'তবে' ক্ষেত্রে, নমুনা নির্বাচনের অজ্ঞতা অনুমানের জন্য বিভ্রান্তিকর হতে পারে। আমি একোমেট্রিক্সে নমুনা নির্বাচনের সাহিত্যের সাথে খুব বেশি পরিচিত নই। আমি Microeconometrics: methods and applications' by Cameron and Trivedi (especially the Roy model in that chapter). Also G. S. Maddala's classic bookএকনোমেট্রিক্সে সীমাবদ্ধ-নির্ভর ও গুণগত পরিবর্তনশীলগুলির অধ্যায় 16 এর প্রস্তাব দেব sample নমুনা নির্বাচন এবং পৃথক ফলাফল সম্পর্কিত বিষয়গুলির একটি পদ্ধতিগত চিকিত্সা।


2
ধন্যবাদ। এটি দুর্দান্ত উত্তর এবং সঠিক ধারণা দেয়। আমার অ্যাপ্লিকেশনটিতে, অনুমান যে বাস্তববাদী নয়। কিন্তু, এটা ঠিক ভাল হিসাবে যোগ করার জন্য হবে একটি predictor যেমন ও বন্টন বিবেচনা । একটি অনুরূপ ব্যবহার করে, আমি মনে করি আপনি যদি থাকেন তবে আপনি ভাল আছেন। এটি আমার ক্ষেত্রে একটি যুক্তিসঙ্গত ধারণা। আপনি কি মনে করেন? বিটিডাব্লু, আপনার কি এমন কোনও উল্লেখ আছে যা এই সমস্যার উল্লেখ করে? আমি একনোমেট্রিক্স সাহিত্যের সাথে পরিচিত নই। P(Yi|Xi,Di=1)=P(Yi|Xi,Di=0)DiP(Yi|Xi,Di)P(Yi=1|Xi,Di,Si=1)=P(Yi=1|Xi,Di,Si=0)
ম্যাক্রো

আমি বার্নৌল্লি ট্রায়াল হিসাবে নির্বাচন প্রক্রিয়াটি ভাবতে স্বাচ্ছন্দ্য বোধ করি এই ডেটা উত্পন্ন অনুমানের অধীনে, এই বার্নোল্লি ট্রায়ালটি শর্তাধীন স্বাধীন , তাই আমি মনে করি আমরা ভাল আছি। আমি এই সমস্যার জন্য আপনার প্রচেষ্টা এবং অন্তর্দৃষ্টি প্রশংসা করি এবং উত্তর গ্রহণ করছি। ধরে নিচ্ছি যে আমি ঠিক যে রেফারেন্সটি খুঁজছি তার সাথে কেউই আসে না (আমি বরং প্রসারিত আলোচনার মাধ্যমে ডিগ্রি না দিয়ে বরং এই সমস্যাটিকে "উদ্ধৃত" করতে সক্ষম হয়েছি), আমি আপনাকে এই অনুগ্রহও প্রদান করব। চিয়ার্স।
Si|Di=d,Xi=xBernoulli(p(x,d))
Yi
ম্যাক্রো

এই নির্বাচন প্রক্রিয়া আপনার কৌশল ফিট করে। যেমন একটি নির্বাচন সমস্যার উপর ভিত্তি করে, আপনার সমস্যা নিখোঁজ তথ্য সাহিত্যে এলোমেলোভাবে (এমএআর) হারিয়ে যাওয়ার উদাহরণ হয়ে যায়। আপনার পুরষ্কার জন্য ধন্যবাদ।
সেমিব্রুইন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.