একাধিক অনুমানের পরে প্রপেনসিটির স্কোর মিলছে


34

আমি এই কাগজটি উল্লেখ করি : হেইস জেআর, গ্রোনার জেআই। "ট্রমা রেজিস্ট্রি ডেটা থেকে আঘাতের তীব্রতার উপর গাড়ির আসন এবং সিট বেল্ট ব্যবহারের প্রভাব পরীক্ষা করার জন্য একাধিক অনুমান এবং প্রবণতা স্কোর ব্যবহার করা হচ্ছে।" জে পেডিয়াট্রিক সার্জ। 2008 মে; 43 (5): 924-7।

এই সমীক্ষায়, 15 টি সম্পূর্ণ ডেটাসেটগুলি অর্জন করার জন্য একাধিক অনুশাসন সম্পাদন করা হয়েছিল। প্রোপেনসিটির স্কোরগুলি তখন প্রতিটি ডেটাসেটের জন্য গণনা করা হত। তারপরে, প্রতিটি পর্যবেক্ষণ ইউনিটের জন্য, সম্পূর্ণ 15 ডেটাসেটের মধ্যে একটি সম্পর্কিত রেকর্ডটি এলোমেলোভাবে বেছে নেওয়া হয়েছিল (সম্পর্কিত প্রবণতা স্কোর সহ) যার ফলে একটি একক চূড়ান্ত ডেটাসেট তৈরি হয়েছিল যার জন্য প্রপেনসিটি স্কোর মিলের মাধ্যমে বিশ্লেষণ করা হয়েছিল।

আমার প্রশ্নগুলি হ'ল: একাধিক অনুমানের পরে কি প্রপেনসিটি স্কোরের সাথে মিলের এই বৈধ উপায়? এটি করার বিকল্প উপায় আছে?

প্রসঙ্গে: আমার নতুন প্রকল্পে, আমি 2 টি চিকিত্সা পদ্ধতির প্রভাবগুলির সাথে তুলনা করার লক্ষ্য রেখেছি ens অনুপস্থিত ডেটা রয়েছে এবং আমি MICEআর প্যাকেজটি অনুপস্থিত মানগুলি গণনা twangকরার জন্য , তারপরে প্রপেনসিটি স্কোরের মিলটি lme4করতে এবং তার সাথে ম্যাচ করা ডেটা বিশ্লেষণ করার উদ্দেশ্যে ব্যবহার করতে চাইছি ।

Update1:

আমি এই কাগজটি খুঁজে পেয়েছি যা একটি ভিন্ন পদ্ধতির গ্রহণ করে: মিত্র, রবিন এবং রিটার, জেরোম পি। (২০১১) পুনরাবৃত্ত, অনুক্রমিক একাধিক অনুমানের মাধ্যমে অনুপস্থিত কোভারিটির সাথে মিলের প্রপেনসিটি স্কোর [ওয়ার্কিং পেপার]

এই গবেষণাপত্রে লেখকরা সমস্ত অভিযুক্ত ডেটাসেটগুলিতে প্রপেনসিটি স্কোরগুলি গণনা করেন এবং তারপরে গড়ে গড়ে তোলেন, যা রুবিনের নিয়মের বিন্দু অনুমানের জন্য একাধিক অভিশাপের চেতনাতে রয়েছে - তবে কী এটি প্রপেনসিটির স্কোরের জন্য সত্যই প্রযোজ্য?

সত্যিই খুব ভাল লাগবে যদি সিভিতে থাকা কেউ এই 2 টি পৃথক পদ্ধতির, এবং / অথবা অন্য কোনও বিষয়ে মন্তব্য সহ একটি উত্তর সরবরাহ করতে পারে ...

উত্তর:


20

প্রথম কথাটি হ'ল আমার কাছে, পদ্ধতি 1 (নমুনা) খুব বেশি যোগ্যতা ছাড়াই বলে মনে হচ্ছে - এটি একাধিক অনুমানের সুবিধাগুলি বর্জন করছে এবং স্টাসের দ্বারা উল্লিখিত প্রতিটি পর্যবেক্ষণের জন্য একক অনুমানকে হ্রাস করবে। এটি ব্যবহার করে আমি কোনও সুবিধা দেখতে পাচ্ছি না।

পার্বত্য, জে: পার্বত্য অনুপস্থিত ডেটার সাথে প্রবৃত্তি স্কোর বিশ্লেষণ পার্শ্ববর্তী বিষয় একটি চমৎকার আলোচনা (2004) নেই "ডেটা অনুপস্থিত থেকে পর্যবেক্ষণ কেন্দ্রিক গবেষণাও দুঃখকষ্ট চিকিত্সা প্রভাব প্রাক্কলন মধ্যে বায়াস কমানো" ISERP ওয়ার্কিং পেপারস, 2004. এটা থেকে ডাউনলোডযোগ্য এখানে

কাগজটি একাধিক অনুমান (এবং অনুপস্থিত ডেটা নিয়ে ডিল করার অন্যান্য পদ্ধতি) এবং প্রবণতা স্কোরগুলি ব্যবহার করার দুটি পদ্ধতির বিবেচনা করে:

  • একাধিক অনুমানের পরে প্রপেনসিটি স্কোরের গড়, তারপরে কার্যকারণ সূচনা (উপরে আপনার পোস্টে পদ্ধতি 2)

  • কার্যকারিতা অনুমানের গড় অনুসরণ করে একাধিক অভিব্যক্তি থেকে প্রসারিত স্কোরগুলির প্রতিটি সেট ব্যবহার করে কার্যকারণ সূচক।

অতিরিক্তভাবে, কাগজটি ফলশ্রুতি মডেলটিতে ভবিষ্যদ্বাণী হিসাবে অন্তর্ভুক্ত করা উচিত কিনা তা বিবেচনা করে।

হিল দৃser়ভাবে দাবি করে যে একাধিক অভিব্যক্তি অনুপস্থিত তথ্য নিয়ে কাজ করার অন্যান্য পদ্ধতির তুলনায় অগ্রাধিকার দেওয়া হয়, সাধারণভাবে, কোনও অগ্রাধিকার নেইঅন্যগুলির চেয়ে এই কৌশলগুলির মধ্যে একটি পছন্দ করার কারণ। তবে প্রবণতা স্কোরের গড় গড় পছন্দ করার কারণগুলি থাকতে পারে, বিশেষত নির্দিষ্ট ম্যাচিং অ্যালগরিদম ব্যবহার করার সময়। হিল একই কাগজটিতে এএ সিমুলেশন অধ্যয়ন করেছিল এবং প্রমাণিত হয়েছিল যে কার্যকারিতা অনুমানের আগে প্রসেসিটি স্কোরগুলির গড় গড়, যখন অভিবাসন মডেলটির ফলাফল সহ গড় স্কোয়ার ত্রুটির ক্ষেত্রে সর্বোত্তম ফলাফল উত্পন্ন করে এবং প্রথমে স্কোরগুলির গড় গড়ে, তবে ফলাফল ছাড়াই অভিবাসন মডেলটিতে, গড় পক্ষপাতের ক্ষেত্রে সেরা ফলাফল (আনুমানিক এবং সত্য চিকিত্সার প্রভাবের মধ্যে পরম পার্থক্য) উত্পাদন করে produced সাধারণত, ফলস্বরূপ মডেলটিতে ফলাফল অন্তর্ভুক্ত করার পরামর্শ দেওয়া হয় (উদাহরণস্বরূপ এখানে দেখুন )।

সুতরাং মনে হয় আপনার 2 পদ্ধতিটিই উপায়।


1
আমি 2 নম্বর পদ্ধতিটি বুঝতে পারি, তবে কীভাবে এটি আর তে প্রয়োগ করা যায় সে সম্পর্কে আমি একটি ক্ষতির মুখোমুখি anyone
সাম

2
উভয় পদ্ধতির জন্য আর কোড cobalt"জটিল জটিল ডেটা সহ কোবাল্ট ব্যবহার করা" শিরোনামের প্যাকেজটির জন্য ভিগনেটে সরবরাহ করা হয় । আপনি এখানে এটি অ্যাক্সেস করতে পারেন: CRAN.R-project.org/package=cobalt
নূহ

13

দুটি দৃষ্টান্তের সংঘর্ষ হতে পারে। একাধিক অনুবর্তন একটি ভারী মডেল-ভিত্তিক বায়েশিয়ান সমাধান: যথাযথ অভিব্যক্তির ধারণাটি মূলত বলে দেয় যে আপনাকে ডেটাটির সুসংজ্ঞায়িত উত্তরোত্তর বিতরণ থেকে নমুনা নিতে হবে, অন্যথায় আপনি ত্রুটিযুক্ত। অন্যদিকে, প্রপেনসিটি স্কোরের মিলটি একটি আধা-প্যারামিট্রিক পদ্ধতি: একবার আপনি যখন নিজের প্রপেনসিটি স্কোর গণনা করেন (তবে আপনি কোনও কার্নেলের ঘনত্বের প্রাক্কলনটি ব্যবহার করতে পারতেন, লগইটের মডেল নয়), আপনি বাকীটি করতে পারেন কেবল একই প্রবণতা স্কোরের সাথে চিকিত্সা এবং চিকিত্সাবিহীন পর্যবেক্ষণের মধ্যে পার্থক্য গ্রহণের মাধ্যমে, যা এখন অন্য ধরণের পিতামাতার জন্য নিয়ন্ত্রণকারী কোনও মডেল নেই as আমি নাআবাদি এবং ইম্বেন্স (২০০৮) আলোচনা করেছেন যে এটি কিছু মিলের পরিস্থিতিতে মানক ত্রুটিগুলি সঠিকভাবে পাওয়া অসম্ভব করে তোলে)) বিপরীত প্রবণতা দ্বারা ওজন করার মতো মসৃণ পদ্ধতির উপর আমি আরও বেশি বিশ্বাস দেব trust এ সম্পর্কে আমার প্রিয় উল্লেখটি হল "মোস্টলি হার্মলেস একনোমেট্রিক্স" , "এম্পিরিসিস্ট কম্পিয়ন" উপশিরোনামযুক্ত এবং অর্থনীতিবিদদের লক্ষ্য, তবে আমি মনে করি এই বইটি অন্যান্য সমাজ বিজ্ঞানী, বেশিরভাগ বায়োস্ট্যাটালিস্টিয়ান এবং নন-বায়ো স্ট্যাটিস্টিস্টদেরও প্রয়োজনীয় পাঠ হওয়া উচিত be যে তারা জানে যে অন্যান্য শাখাগুলি কীভাবে ডেটা বিশ্লেষণে আসে।

যে কোনও হারে, প্রতি পর্যবেক্ষণে 15 টির মধ্যে সিমুলেটেড সম্পূর্ণ ডেটা লাইন ব্যবহার করা একক অনুমানের সমতুল্য। ফলস্বরূপ, আপনি সমস্ত 15 টি সম্পন্ন ডেটা সেটগুলির তুলনায় দক্ষতা হারাবেন এবং আপনি স্ট্যান্ডার্ড ত্রুটিগুলি সঠিকভাবে অনুমান করতে পারবেন না। কোনও কোণ থেকে আমার কাছে একটি ঘাটতি প্রক্রিয়া বলে মনে হচ্ছে।

অবশ্যই, আমরা আনন্দের সাথে কার্পেটের নীচে এই ধারণাটি ধরে রেখেছি যে একাধিক ইমপুটেশন মডেল এবং প্রপেনসিটি মডেল উভয়ই সঠিক ফাংশনাল ফর্মগুলিতে সমস্ত সঠিক ভেরিয়েবল থাকার অর্থে সঠিক। এটি যাচাই করার খুব কম উপায় আছে (যদিও আমি এই দুটি পদ্ধতির ডায়াগনস্টিক ব্যবস্থা সম্পর্কে অন্যথায় শুনে খুশি হব)।


(+1) বিশেষত মিলে যাওয়ার আক্ষরিক বাস্তবায়নের মাধ্যমে চালু হওয়া বিচ্ছিন্নতাগুলি সম্পর্কে আমি ভাল বোধ করি না (প্রপেনসিটির স্কোরের নিকটতম সম্ভাব্য মানের সাথে নিয়ন্ত্রণটি সন্ধান করুন এবং বাকীগুলি উপেক্ষা করুন) । প্রোপেনসিটি স্কোরিং আমাকে সর্বদা যেহেতু বেশ রুক্ষ প্রক্রিয়া হিসাবে আঘাত করেছে।
কার্ডিনাল

@ কার্ডিনাল, আপডেট দেখুন।
স্টাসকে

আমি অন্যান্য পদ্ধতিগুলির সাথে আমার তুলনায় আইপিটিডব্লুয়ের সমালোচনা বেশি দেখেছি (আমাকে পড়তে হবে)। প্রপেনসিটি স্কোরের মাধ্যমে ওজন সংক্রান্ত চাপগুলি দেখুন ( ফ্রিডম্যান এবং বার্ক, ২০০৮ ), এবং প্রয়োগকৃত উদাহরণের জন্য দেখুন জের্ক, ২০০৯ । আপনি কেন এখানে প্রতিক্রিয়াতে ক্ষতিকারক একনোমেট্রিক্সের প্রস্তাব দিচ্ছেন তা সম্পর্কে আমি নিশ্চিত নই , তবে পর্যবেক্ষণে পড়াশুনায় আগ্রহী যে কেউই কম-বেশি নয় তার পক্ষে এটি একটি ভাল সুপারিশ।
অ্যান্ডি

অ্যান্ডি, ফ্রিডম্যান এবং বার্ক টুকরো মনে হয় অনেক সহজ পরিস্থিতি মোকাবেলা করবে যখন আপনি লজিস্টিক রিগ্রেশনটিতে সমস্ত কিছুকে মডেল করতে পারবেন। আমার বোধগম্যতা হল যে পিএসএমের মতো পদ্ধতিগুলি আরও মেসেরিয়াল পরিস্থিতিতে প্রয়োগ করা হয় যখন আপনার আরও অনেক সংখ্যক সম্রাট থাকে এবং আপনি সঠিকভাবে নির্দিষ্ট করে ধরে নিয়েছেন এমন মডেলটিকে যথেষ্ট বিশ্বাস করেন না। তারা লক্ষ্য করেছেন যে পরিস্থিতি ওজন করার পক্ষে অনুকূল ছিল, তবে আমি মনে করি এটি অন্যান্য সম্ভাব্য পদ্ধতির তুলনায় মডেলটির পক্ষে অনুকূল ছিল।
স্টাসকে

2
কারণ আপনার ডেটা আইড নয় এবং বিপরীত হেসিয়ান এবং গ্রেডিয়েন্টের বাইরের পণ্যটির সাম্যতা সম্পর্কে দুর্দান্ত সর্বাধিক সম্ভাবনা উপপাদ্যটি আর ধরে রাখে না এবং এগুলির উভয়ই বৈকল্পিকগুলির একটি সুসংগত অনুমান নয়। একের জন্য স্যান্ডউইচ ভেরিয়েন্স অনুমানক, জরিপের পরিসংখ্যানগুলিতে ওরফে লিনিয়ারাইজেশন অনুমানক, একনোমেট্রিক্সে ওরফে হোয়াইট মজবুত অনুমানক ব্যবহার করা দরকার।
StasK

10

আমি প্রশ্নের তাত্ত্বিক দিকগুলির সাথে সত্যই কথা বলতে পারি না, তবে আমি PS / IPTW মডেল এবং একাধিক অনুবর্তন ব্যবহার করে আমার অভিজ্ঞতা দেব।

  1. আমি কখনও শুনিনি যে কোনও একক ডেটা সেট তৈরির জন্য গুণিতকৃত ডেটা সেট এবং এলোমেলোভাবে নমুনা ব্যবহার করছে। এর অর্থ এই নয় যে এটি ভুল but তবে এটি ব্যবহার করার জন্য এটি একটি অদ্ভুত পদ্ধতি। ডেটা সেটটিও এত বড় নয় যে আপনার সময় ও গণনা বাঁচানোর জন্য কেবল একটির পরিবর্তে 3-5 মডেল চালানোর জন্য সৃজনশীল হওয়া দরকার।
  2. রুবিনের নিয়ম এবং পুলিং পদ্ধতিটি বেশ সাধারণ সরঞ্জাম। পোল্ড দেওয়া, গুণিত অনুমানযুক্ত ফলাফলগুলি কেবলমাত্র বৈকল্পিক এবং অনুমানগুলি ব্যবহার করে গণনা করা যেতে পারে, আমি দেখতে পাবার কারণ নেই যে এটি আপনার প্রকল্পের জন্য ব্যবহার করা যায়নি - অভিযুক্ত ডেটা তৈরি করা, প্রতিটি সেটে বিশ্লেষণ সম্পাদন করা এবং তারপরে পুলিং। এটি আমি যা করেছি, এটিই আমি দেখেছি এবং এটি না করার কোনও নির্দিষ্ট যৌক্তিকতা না পাওয়া পর্যন্ত আমি সত্যিই আরও বেশি বিদেশী কিছু নিয়ে যাওয়ার কারণ দেখতে পাচ্ছি না - বিশেষত আপনি যদি বুঝতে না পারেন তবে পদ্ধতি নিয়ে চলছে।

+1 এটি এমন একটি প্রশ্ন যা এর মতো একটি উচ্চতর বিশেষজ্ঞের কাগজ বলে মনে হয় বলে একটি ভাল উত্তর প্রদান করা কঠিন। তবে পূর্ববর্তী অনুরূপ একটি প্রশ্নে অনুগ্রহ হারানোর দাবি করার পাশাপাশি, ওপি একটি প্রশ্ন যুক্ত করেছে যা মেটায় স্থানান্তরিত সমাধানগুলির জন্য ভিক্ষা করে। আমি আমার উত্তর সেখানে আপনার অনুরূপ মন্তব্য। আমি বিশেষত ডেটার গুণিত সেট থেকে নমুনা সম্পর্কে সন্দেহজনক।
মাইকেল আর চেরনিক

ধন্যবাদ! পদ্ধতি 2 ব্যবহার করা হয়েছে সেখানে আপনার কি কোনও রেফারেন্স রয়েছে?
জো কিং

@ জোকিং দুঃখজনকভাবে, আমার মাথার উপরের অংশটি বন্ধ নয়।
ফোমেট
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.