একটি পরিসংখ্যানগত দৃষ্টিকোণ থেকে, কেউ পর্যবেক্ষণের স্টাডি দিয়ে প্রপেনসিটি স্কোর ব্যবহার করে কার্যকারিতা নির্ণয় করতে পারে?


27

প্রশ্ন: পরিসংখ্যানবিদ (বা একজন চিকিত্সক) এর দৃষ্টিকোণ থেকে, কেউ পর্যবেক্ষণের স্টাডি ( পরীক্ষা নয় ) দিয়ে প্রপেনসিটি স্কোর ব্যবহার করে কার্যকারিতা নির্ণয় করতে পারে ?

দয়া করে শিখা যুদ্ধ বা ধর্মান্ধ বিতর্ক শুরু করতে চান না।

পটভূমি: আমাদের স্ট্যাটাস পিএইচডি প্রোগ্রামের মধ্যে আমরা কার্যকারী গ্রুপ এবং কয়েকটি বিষয় সেশনের মাধ্যমে কেবল কার্যনির্বাহীকরণের বিষয়টি স্পর্শ করেছি। তবে অন্যান্য বিভাগগুলিতে (যেমন এইচডিএফএস, সমাজবিজ্ঞান) কিছু অতি বিশিষ্ট গবেষক রয়েছেন যারা এগুলি সক্রিয়ভাবে ব্যবহার করছেন।

আমি ইতিমধ্যে এই বিষয়ে কিছু উত্তপ্ত তর্ক বিতর্ক প্রত্যক্ষ করেছি। এখানে একটি শুরু করা আমার উদ্দেশ্য নয়। সে বলেছিল, আপনি কোন রেফারেন্সের মুখোমুখি হয়েছিলেন? আপনার কী মতামত আছে? উদাহরণস্বরূপ, প্রপঞ্চতা স্কোরের বিরুদ্ধে একটি যুক্তি যা আমি কার্যকারণ সূচনা কৌশল হিসাবে শুনেছি তা হ'ল বাদ দেওয়া পরিবর্তনশীল পক্ষপাতিত্বের কারণে কেউ কখনই কার্যকারিতা অনুমান করতে পারে না - যদি আপনি গুরুত্বপূর্ণ কিছু ছেড়ে যান তবে আপনি কার্যকারণ শৃঙ্খলাটি ভেঙে দেন। এটি কি সমাধানযোগ্য সমস্যা?

দাবি অস্বীকার : এই প্রশ্নের সঠিক উত্তর নাও থাকতে পারে - সিডব্লিউ ক্লিক করে সম্পূর্ণ শীতল, তবে আমি ব্যক্তিগতভাবে প্রতিক্রিয়াগুলিতে খুব আগ্রহী এবং কয়েকটি ভাল রেফারেন্সের সাথে খুশি হব যা বাস্তব-বিশ্বের উদাহরণগুলি অন্তর্ভুক্ত করে।

উত্তর:


16

মহামারীবিজ্ঞানে পিএস ব্যবহারের প্রচারের লক্ষ্যে একটি নিবন্ধের শুরুতে ওকস এবং চার্চ (1) এপিডেমিওলজিতে (2) বিভ্রান্তিকর প্রভাব সম্পর্কে হার্নান এবং রবিনের দাবির উল্লেখ করেছেন:

আপনি কি গ্যারান্টি দিতে পারবেন যে আপনার পর্যবেক্ষণের অধ্যয়ন থেকে ফলাফলগুলি অপ্রকাশিত বিভ্রান্তির দ্বারা প্রভাবিত হয়েছে? একজন মহামারীবিদ কেবলমাত্র উত্তর দিতে পারেন তা হ'ল 'না।

এটি কেবল এটুকু বলা যায় না যে আমরা পর্যবেক্ষণ গবেষণা থেকে প্রাপ্ত ফলাফল নিরপেক্ষ বা অকেজো বলে নিশ্চিত করতে পারি না (কারণ @ প্রপোফোল বলেছে যে, তাদের ফলাফলগুলি আরসিটি ডিজাইনের জন্য কার্যকর হতে পারে), তবে এটিও যে পিএসরা অবশ্যই এর সম্পূর্ণ সমাধান সরবরাহ করে না সমস্যা, বা কমপক্ষে অগত্যা অন্যান্য ম্যাচিং বা মাল্টিভারিয়েট পদ্ধতিগুলির তুলনায় ভাল ফলাফল দেয় না (উদাহরণস্বরূপ (10))।

প্রবৃত্তি স্কোর (দ্রষ্টব্য), নির্মাণ দ্বারা, হয় সম্ভাব্য না কার্যকারণ সূচক। প্রচলিত স্কোর ফাংশনে প্রবেশকারী কোভারিয়েটগুলির পছন্দটি তার নির্ভরযোগ্যতা নিশ্চিত করার জন্য একটি মূল উপাদান এবং তাদের দুর্বলতা, যেমনটি বলা হয়েছে, মূলত অরক্ষিত কনফন্ডারদের জন্য নিয়ন্ত্রণ না করা থেকে বোঝায় (যা প্রত্যাবর্তনমূলক বা কেস-নিয়ন্ত্রণ স্টাডিতে বেশিরভাগ ক্ষেত্রে সম্ভবত ) । অন্যান্য বিষয়গুলি বিবেচনা করতে হবে: (ক) মডেল অপব্যবহারের সরাসরি প্রভাবের প্রাক্কলনগুলিতে প্রভাব ফেলবে (যদিও ওএলএসের ক্ষেত্রে এর চেয়ে বেশি নয়,) (খ) কোভেরিয়েটগুলির স্তরে ডেটা অনুপস্থিত থাকতে পারে, (গ) পিএসএস কার্যকারণ ব্যাখ্যা (8,9) প্রভাবিত জানেন যে synergistic প্রভাব অতিক্রম না।

রেফারেন্স হিসাবে, আমি রজার নিউজনের স্লাইডগুলি পেয়েছি - কার্যকারিতা, কনফাউন্ডার্স এবং প্রপেনসিটি স্কোরগুলি - প্রকৃত গবেষণার চিত্রগুলির সাথে প্রপেনসিটি স্কোরগুলি ব্যবহারের পক্ষে এবং তুলনামূলক তুলনামূলক তুলনামূলকভাবে সুষম। মেডিসিন ইন স্ট্যাটিস্টিকসে দুই বছর আগে পর্যবেক্ষণ অধ্যয়ন বা পরিবেশের মহামারীগুলিতে প্রপেনসিটি স্কোর ব্যবহার নিয়ে আলোচনা করার জন্য বেশ কয়েকটি ভাল কাগজপত্রও ছিল, এবং আমি তাদের শেষে কয়েকটি জুড়েছি (3-6)। তবে আমি পার্লের পর্যালোচনা পছন্দ করি ()) কারণ এটি কার্যকারিতা সম্পর্কিত বিষয়ে বৃহত্তর দৃষ্টিভঙ্গি সরবরাহ করে (পিএসগুলি পি। ১১7 এবং ১৩০ আলোচনা করা হয়)। স্পষ্টতই, আপনি প্রয়োগিত গবেষণা দেখে আরও অনেক চিত্র খুঁজে পাবেন। আমি উইলিয়াম আর শাদিশের সাম্প্রতিক দুটি নিবন্ধ যুক্ত করতে চাই যা এন্ড্রু গেলম্যানের ওয়েবসাইটে (১১,১২) জুড়ে এসেছে। প্রপেনসিটি স্কোর ব্যবহার নিয়ে আলোচনা করা হয় তবে দুটি গবেষণাপত্র পর্যবেক্ষণের গবেষণায় (এবং এটি এলোমেলো সেটিংসের সাথে কীভাবে তুলনা করে) কার্যকারিতা অনুক্রমের দিকে বেশি জোর দেয়।

তথ্যসূত্র

  1. ওকেস, জেএম এবং চার্চ, টিআর (2007)। আমন্ত্রিত ধারাভাষ্য: এপিডেমোলোজি মধ্যে আগুয়ান প্রবৃত্তি স্কোর পদ্ধতিআমেরিকান জার্নাল অফ এপিডেমিওলজি , 165 (10), 1119-1121।
  2. হার্নান এমএ এবং রবিন্স জেএম (2006)। কার্যকারিতা নির্ধারণের জন্য সরঞ্জাম: একটি মহামারী বিশেষজ্ঞের স্বপ্ন? এপিডেমিওলজি , 17, 360-72।
  3. রুবিন, ডি। (2007) কার্যকারক প্রভাবগুলির জন্য পর্যবেক্ষণমূলক স্টাডিগুলির বিশ্লেষণ বনাম নকশা: এলোমেলোভাবে পরীক্ষার নকশার সাথে সমান্তরালমেডিসিনে পরিসংখ্যান , 26, 20-36।
  4. শ্রির, আই। (২০০৮)। সম্পাদককে চিঠিমেডিসিনে পরিসংখ্যান , 27, 2740–2741।
  5. মুক্তা, জে। (২০০৯) প্রপেনসিটি স্কোর পদ্ধতি সম্পর্কে মন্তব্যমেডিসিনে পরিসংখ্যান , 28, 1415–1424।
  6. স্টুয়ার্ট, ইএ (২০০৮)। প্রবণতা স্কোর ব্যবহারের জন্য ব্যবহারিক সুপারিশগুলির বিকাশ: পিটার অস্টিনের দ্বারা ১৯৯ 1996 এবং ২০০৩ সালের মধ্যে মেডিকেল সাহিত্যে 'প্রপেনসিটি স্কোর ম্যাচের একটি সমালোচনামূলক মূল্যায়ন' আলোচনামেডিসিনে পরিসংখ্যান , 27, 2062–2065।
  7. মুক্তা, জে। (২০০৯) পরিসংখ্যানগুলিতে কার্যকারিতা অনুক্রম: একটি ওভারভিউপরিসংখ্যান সমীক্ষা , 3, 96-146।
  8. ওকেস, জেএম এবং জনসন, পিজে (2006)। সামাজিক মহামারীবিদ্যার জন্য প্রপেনসিটির স্কোরের মিল । ইন সামাজিক এপিডেমোলোজি পদ্ধতি , জে এম Oakes ও এস KAUFMAN, (এডু।), পিপি। 364-386। Jossez-বাস।
  9. হাফলার, এম (2005) জবাবদিহি উপর ভিত্তি করে কার্যকারিতা অনুমানবিএমসি মেডিকেল গবেষণা পদ্ধতি , 5, 28।
  10. উইঙ্কেলমায়ার, ডব্লিউসি এবং কুর্থ, টি। (2004)। প্রচারের স্কোর: সহায়তা বা হাইপ? নেফ্রোলজি ডায়ালাইসিস ট্রান্সপ্ল্যান্টেশন , 19 (7), 1671-1673।
  11. শাদিশ, ডব্লিউআর, ক্লার্ক, এমএইচ, এবং স্টেইনার, প্রধানমন্ত্রী (২০০৮)। ননর্যান্ডমাইজড পরীক্ষাগুলি সঠিক উত্তর দিতে পারে? এলোমেলো পরীক্ষা এবং র্যান্ডম এবং ননর্যান্ডম অ্যাসাইনমেন্টগুলির সাথে তুলনা করাজাসা , 103 (484), 1334-1356।
  12. কুক, টিডি, শাদিশ, ডাব্লুআর, এবং ওং, ভিসি (২০০৮)। তিনটি শর্তাবলী যার অধীনে পরীক্ষা-নিরীক্ষা ও পর্যবেক্ষণ অধ্যয়ন তুলনামূলক কার্যকারণ অনুমান করে: অভ্যন্তরীণ-অধ্যয়নের তুলনা থেকে নতুন অনুসন্ধাননীতি বিশ্লেষণ ও পরিচালনা জার্নাল , 27 (4), 724-750।

11

প্রচারের স্কোরগুলি সাধারণত ম্যাচের সাহিত্যে ব্যবহৃত হয়। প্রবণতা স্কোর চিকিত্সা প্রাপ্তির সম্ভাবনা অনুমান করতে প্রাক-চিকিত্সা কোভারিয়েট ব্যবহার করে। মূলত, একটি রেজ্রেশন (কেবলমাত্র নিয়মিত ওএলএস বা লজিট, প্রবিট ইত্যাদি) চিকিত্সার সাহায্যে প্রপেনসিটি স্কোর গণনা করতে ব্যবহার করা হয় কারণ আপনার ফলাফল এবং চিকিত্সার প্রাক পরিবর্তনগুলি আপনার সহকারী হয় are একবার প্রপেনসিটি স্কোর সম্পর্কে একটি ভাল অনুমান পাওয়া গেলে, একই ধরণের প্রপেনসিটি স্কোর সহ বিষয়গুলি, তবে প্রাপ্ত বিভিন্ন চিকিত্সা, একে অপরের সাথে মিলে যায়। চিকিত্সার প্রভাব এই দুটি গ্রুপের মধ্যে পার্থক্য।

রোজেনবাউম এবং রুবিন (১৯৮৩) দেখায় যে কেবলমাত্র প্রপেনসিটি স্কোর ব্যবহার করে চিকিত্সা এবং নিয়ন্ত্রণের বিষয়গুলির সাথে ম্যাচ স্কোরটি তৈরির জন্য ব্যবহৃত পর্যবেক্ষণ প্রাক-চিকিত্সা কোভারিয়েটগুলি থেকে উদ্ভূত চিকিত্সার প্রভাব অনুমানের সমস্ত পক্ষপাত দূর করতে যথেষ্ট। নোট করুন যে এই প্রমাণটির জন্য অনুমানের চেয়ে সত্য প্রপেনসিটি স্কোর ব্যবহার করা দরকার। এই পদ্ধতির সুবিধাটি হ'ল এটি একাধিক মাত্রায় (প্রতিটি প্রাক-চিকিত্সার কোভারিয়েটের জন্য একটি) মিলের সমস্যাটিকে অবিবাহিত মিলের ক্ষেত্রে পরিণত করে --- একটি দুর্দান্ত সরলকরণ।

রোজেনবাউম, পল আর এবং ডোনাল্ড বি রুবিন। 1983. " কার্যকারণ প্রভাবের জন্য পর্যবেক্ষণ স্টাডিজের প্রপেনসিটি স্কোরের কেন্দ্রীয় ভূমিকা " " Biometrika। 70 (1): 41--55।


8

কেবলমাত্র সম্ভাব্য এলোমেলোভাবে পরীক্ষা কার্যকারিতা নির্ধারণ করতে পারে। পর্যবেক্ষণমূলক গবেষণায়, সর্বদা একটি অপ্রাপ্ত বা অজানা কোভারিয়েটের সম্ভাবনা থাকবে যা কার্যকারিতাটিকে অসম্ভব করে তোলে।

তবে, পর্যবেক্ষণমূলক পরীক্ষাগুলি এক্স এবং ওয়াইয়ের মধ্যে দৃ association় সংযোগের প্রমাণ সরবরাহ করতে পারে এবং তাই অনুমানের উত্সের জন্য দরকারী। এই অনুমানগুলি তখন এলোমেলোভাবে পরীক্ষার মাধ্যমে নিশ্চিত হওয়া দরকার।


আমি সম্পূর্ণরূপে আপনার সাথে একমত। পর্যবেক্ষণের সমীক্ষায় এমন কিছু সমিতি উদঘাটনের পক্ষে ভাল হতে পারে যেগুলি পরিবর্তে আরও অনেক কঠোর কাঠামো ব্যবহার করে পরীক্ষা করতে পারে (আপনার পরামর্শ অনুসারে এলোমেলোভাবে বিচার)।
সিম্পা

ঝরঝরে ভাব। X এবং y এর মধ্যে 'শক্তিশালী' সংযোগটি দিয়ে আপনার সাথে আরও একমত হতে পারে না।
কেভিন কং

7

প্রশ্নটিতে দুটি বিষয় জড়িত বলে মনে হচ্ছে যা সত্যই আলাদাভাবে বিবেচনা করা উচিত। প্রথমত, কোনও পর্যবেক্ষণমূলক গবেষণা থেকে কেউ কার্যকারিতা অনুধাবন করতে পারে কিনা এবং তার উপর আপনি পার্ল (২০০৯) এর মতামতের বিপরীতে থাকতে পারেন, যিনি এই প্রক্রিয়াটি যথাযথভাবে মডেল করতে পারলে হ্যাঁ তর্ক করেছেন, @ প্রোপোফোল দেখুন, কে করবেন পরীক্ষামূলক শাখায় অনেক সহযোগী সন্ধান করুন এবং যারা গারবার এট আল (2004) র রচনা (একটি বরং অস্পষ্ট তবে তবুও ভাল) রচনায় কিছু ভাবনা ভাগ করতে পারেন। দ্বিতীয়ত, ধরে নিলেন যে আপনি মনে করেন যে পর্যবেক্ষণের তথ্য থেকে কার্যকারিতা অনুমান করা যেতে পারে, আপনি ভাবতে পারেন যে প্রপেনসিটি স্কোর পদ্ধতিগুলি এটি করার ক্ষেত্রে কার্যকর কিনা। প্রচারের স্কোর পদ্ধতিতে কন্ডিশনার কৌশল এবং বিপরীত প্রবণতা ওজন অন্তর্ভুক্ত। লুনসফোর্ড এবং ডেভিডিয়ান (2004) একটি দুর্দান্ত পর্যালোচনা দিয়েছেন।

যদিও কিছুটা রিঙ্কেল: প্রপেনসিটি স্কোর ম্যাচিং এবং ওজনও এলোমেলোভাবে পরীক্ষাগুলির বিশ্লেষণে ব্যবহৃত হয় যখন উদাহরণস্বরূপ, "অপ্রত্যক্ষ প্রভাবগুলি" গণনা করতে আগ্রহী হয় এবং যখন সম্ভাব্য অ-এলোমেলো অ্যাট্রিটিশন বা ড্রপ আউট এর সমস্যাগুলিও রয়েছে ( এই ক্ষেত্রে আপনার যা আছে তা পর্যবেক্ষণ সমীক্ষার সাদৃশ্যপূর্ণ)।

তথ্যসূত্র

গারবার এ, ইত্যাদি। 2004. "পর্যবেক্ষণ গবেষণা থেকে শেখার মায়া।" শাপিরো প্রথম, এট আল, রাজনীতির স্টাডিতে সমস্যা এবং পদ্ধতিগুলি , কেমব্রিজ বিশ্ববিদ্যালয় প্রেস।

লুনসফোর্ড জে কে, ডেভিডিয়ান এম 2004 মেডিসিনে পরিসংখ্যান 23 (19): 2937–2960।

পার্ল জে। ২০০৯. কার্যকারিতা (২ য় সংস্করণ) , কেমব্রিজ বিশ্ববিদ্যালয় প্রেস।


ভাল যে আপনি মুক্তার পুরো বইটি উদ্ধৃত করেছেন।
chl

0

প্রচলিত জ্ঞান বলে যে কেবল এলোমেলোভাবে নিয়ন্ত্রিত পরীক্ষাগুলি ("বাস্তব" পরীক্ষাগুলি) কার্যকারিতা সনাক্ত করতে পারে।

তবে এটি এতটা সহজ নয়।

র্যান্ডমাইজেশন যথেষ্ট না হওয়ার একটি কারণ হ'ল "ছোট" নমুনায় প্রতিটি এবং সমস্ত পার্থক্য ভারসাম্যপূর্ণ তা নিশ্চিত করার জন্য বড় সংখ্যার আইন "যথেষ্ট শক্তিশালী" নয় not প্রশ্নটি হল: "খুব ছোট" কী এবং কখন "যথেষ্ট বড়" শুরু হয়? সেন্ট-মন্ট (2015) এখানে যুক্তি দেখিয়েছে যে "বড় যথেষ্ট" হাজারে শুরু হতে পারে (n> 1000)!

সর্বোপরি, মূল বিষয়টি হ'ল দলগুলির মধ্যে পার্থক্যের ভারসাম্য রক্ষা করা, পার্থক্যের জন্য নিয়ন্ত্রণ করা। সুতরাং, এমনকি পরীক্ষাগুলিতেও, গ্রুপগুলির মধ্যে পার্থক্য ভারসাম্য রক্ষার জন্য দুর্দান্ত যত্ন নেওয়া উচিত। সেন্ট-মন্টের হিসাব অনুসারে (২০১৫) এটি ভাল হতে পারে যে ছোট নমুনাগুলিতে ম্যাচ করা (ম্যানুয়ালি ভারসাম্যযুক্ত) নমুনাগুলি দিয়ে কেউ যথেষ্ট ভাল হতে পারে।

সম্ভাবনা হিসাবে। অবশ্যই সম্ভাবনা চূড়ান্ত (শূন্য বা এক) না হলে - কখনই কোনও চূড়ান্ত উত্তর দিতে সক্ষম হয় না । যাইহোক, বিজ্ঞানে, আমরা পরিস্থিতিগুলির সাথে নিজেকে প্রায়শই মুখোমুখি হতে দেখেছি আমরা স্টাফগুলি কঠিন হওয়ায় আমরা একটি চূড়ান্ত উত্তর দিতে অক্ষম। সুতরাং সম্ভাবনা প্রয়োজন। সম্ভাব্যতা বিবৃতিতে আমাদের অনিশ্চয়তা প্রকাশের উপায় ছাড়া আর কিছুই নয়। যেমনটি, এটি যুক্তির অনুরূপ; ব্রিগেস (২০১ 2016) এখানে দেখুন

সুতরাং, সম্ভাবনা আমাদের সহায়তা করবে তবে চূড়ান্ত উত্তর দেবে না, কোনও নিশ্চিততা নেই। তবে এটির দুর্দান্ত ব্যবহার - অনিশ্চয়তা প্রকাশ করতে।

আরও মনে রাখবেন যে কার্যকারিতা মূলত কোনও পরিসংখ্যানমূলক প্রশ্ন নয়। ধরুন দুটি অর্থ "উল্লেখযোগ্যভাবে" আলাদা হয়। গ্রুপিং ভেরিয়েবলটি কি পরিমাপযোগ্য ভেরিয়েবলের পার্থক্যের কারণ নয়? না (অগত্যা নয়)। কোনও নির্দিষ্ট পরিসংখ্যান যেগুলি ব্যবহার করে তা বিবেচনাধীন নয় - প্রপেনসিটি স্কোর, পি-ভ্যালু, বেয়েস ফ্যাক্টর এবং আরও অনেক কিছু - এই জাতীয় পদ্ধতিগুলি (কার্যতঃ) কার্যকারণ দাবী ব্যাকআপ করার পক্ষে পর্যাপ্ত নয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.