ভেরিয়েবলের জন্য ম্যাচিং এবং পরিসংখ্যানগতভাবে নিয়ন্ত্রণের মতো পদ্ধতির মধ্যে কী লিঙ্ক?


10

প্রায়শই গবেষণা নিবন্ধগুলিতে আপনি পড়েন গবেষকরা নির্দিষ্ট ভেরিয়েবলের জন্য নিয়ন্ত্রণ করেছেন controlled এটি ম্যাচিং, ব্লকিং ইত্যাদি পদ্ধতি দ্বারা করা যেতে পারে

তবে আমি সবসময় ভেবেছিলাম ভেরিয়েবলের জন্য নিয়ন্ত্রণ করা কিছু পরিসংখ্যান পরিমাপের মাধ্যমে পরিসংখ্যানগতভাবে কিছু করা হয়েছিল যা প্রভাবের হতে পারে এবং সেগুলি সম্পর্কে কিছু পরিসংখ্যানগত বিশ্লেষণ করে যা সত্য এবং পরিমাণে উভয় পরীক্ষায় করা যেতে পারে। সুতরাং, উদাহরণস্বরূপ আপনার একটি সমীক্ষা বা অন্য পরীক্ষা হবে যাতে আপনি স্বাধীন ভেরিয়েবল এবং কিছু সম্ভবত বিভ্রান্তিকর ভেরিয়েবলগুলি পরিমাপ করতে পারেন এবং কিছু বিশ্লেষণ করবেন।

  • আধা পরীক্ষায় ভেরিয়েবলের জন্য নিয়ন্ত্রণ করা সম্ভব?
  • ভেরিয়েবলের জন্য ম্যাচিং এবং পরিসংখ্যানগতভাবে নিয়ন্ত্রণের মতো পদ্ধতির মধ্যে কী লিঙ্ক?

উত্তর:


6

অ্যাডামোর মতোই, আমিও মনে করি এই প্রশ্নের উত্তরের মূল চাবিকাঠিটি কার্যকারণ অনুমানের ধারণা এবং পর্যবেক্ষণমূলক সেটআপগুলি ব্যবহার করে কোনও কার্যকারিতা মডেলকে কীভাবে "দিকে" পাওয়া যায়।

একটি নিখুঁত বিশ্বে আমাদের কাছে এমন কিছু হবে যা কাউন্টারফ্যাক্টুয়াল জনসংখ্যা বলে । অধ্যয়নের জনসংখ্যা, আমরা আগ্রহী একক জিনিস ব্যতীত সকল ক্ষেত্রে অভিন্ন that এই পার্থক্যের ভিত্তিতে এই দুটি জনসংখ্যার মধ্যে পার্থক্য একটি সত্যিকার কার্যকারণমূলক ফলাফল।

স্পষ্টতই, আমাদের এটি থাকতে পারে না।

এর কাছাকাছি যাওয়ার চেষ্টা করার উপায় রয়েছে:

  • র্যান্ডমাইজেশন: এই তাত্ত্বিকভাবে (যদি র্যান্ডমাইজেশন সঠিকভাবে করা হয়) তবে আপনাকে চিকিত্সার পরে-র‌্যান্ডমাইজেশন বাদে দুটি জনসংখ্যা অভিন্ন হিসাবে দেওয়া উচিত।

  • স্তরবিন্যাস: আপনি কোভারিয়েট স্তরগুলির মধ্যে এমন একটি জনসংখ্যার দিকে নজর রাখতে পারেন যেখানে আপনি "লাইক উইথ" তুলনা করছেন। এটি অল্প সংখ্যক স্তরের জন্য দুর্দান্তভাবে কাজ করে তবে দ্রুত জটিল হয়ে ওঠে।

  • মিল: ম্যাচ ম্যাচিং একটি অধ্যয়ন জনসংখ্যাকে একত্রিত করার একটি প্রচেষ্টা যা গ্রুপ এ গ্রুপ বি এর অনুরূপ, এবং এইভাবে তুলনা করার জন্য উপযুক্ত is

  • পরিসংখ্যানগত সামঞ্জস্য: কোনও রিগ্রেশন মডেল সহ কোভারিয়টসকে অন্তর্ভুক্ত করে কোভারিটেটের স্তরগুলির মধ্যে কোনও প্রভাবের অনুমানের অনুমতি দেয় - আবার, পছন্দ মতো বা কমপক্ষে চেষ্টা করার সাথে তুলনা করা।

সবই সেই পাল্টা জনসংখ্যার কাছাকাছি যাওয়ার চেষ্টা। কীভাবে এটি পাবেন তা নির্ভর করে আপনি কী বেরিয়ে আসতে চান এবং আপনার পড়াশুনার চেহারা কেমন like


অপূর্ব ব্যাখ্যা। আরও অনেক সংক্ষিপ্ত এবং আরও ভাল মূল প্রশ্নটি সম্বোধন করে। এই পদ্ধতিগুলির সাথে আমি যুক্ত করতে পারি, খালি স্ট্রটা থাকার সমস্যাটির জন্য কেবল পরিসংখ্যানগত সামঞ্জস্যই অভেদ্য। কেস-নিয়ন্ত্রণ স্টাডিতে, আমরা যদি বয়সের সাথে জনসংখ্যার তুলনা, মিল, স্তরবদ্ধকরণ এবং (ব্লক) এলোমেলোকরণের জন্য 50 বছরের পুরানো কেসকে 51 বছরের পুরানো নিয়ন্ত্রণের সাথে তুলনা করার জন্য মোটা বা বিনিং প্রয়োজন ning
অ্যাডামো

লজিস্টিক রিগ্রেশনে, তবে আপনি এই তুলনাটি করতে লিনিয়ার বা ভিত্তি স্প্লাইন অ্যাডজাস্টেড বয়সের মতো গোটা দলগুলিতে স্পষ্টভাবে তথ্য ধার করতে অবিরত তথ্য ব্যবহার করতে পারেন। এটি রিগ্রেশন মডেলিংকে একটি অন্যতম শক্তিশালী এবং দরকারী পরিসংখ্যান পদ্ধতি উপলভ্য করে তোলে।
অ্যাডামো

@ অ্যাডামো একমত হয়েছেন - উপরের লিঙ্কিত প্রশ্নের আমার উত্তরে আমি উল্লেখ করেছি যে এটি কোনও তথ্যের ক্ষেত্রগুলিকে মসৃণ করতে ব্যবহার করা যেতে পারে, যতক্ষণ না তথ্যের অভাব সুযোগ এবং বিনোদনের কারণে হয়। তবে হ্যাঁ - রিগ্রেশন দুর্দান্ত reg
ফোমেট

2

আমি মনে করি কার্যকারণ মডেলিং এই প্রশ্নের উত্তর দেওয়ার মূল চাবিকাঠি। ডেটা দেখার আগেও আগ্রহের সঠিক অ্যাডজাস্ট / স্ট্রেইটেড / কন্ট্রোলড ইফেক্ট চিহ্নিত করার জন্য শুরুতে একজন মুখোমুখি হয় । যদি আমি প্রাপ্তবয়স্কদের মধ্যে উচ্চতা / ফুসফুসের ক্ষমতার সম্পর্কের অনুমান করতে পারি তবে আমি ধূমপানের স্থিতির জন্য সামঞ্জস্য করব যেহেতু ধূমপানটি বৃদ্ধি বৃদ্ধি এবং ফুসফুসের ক্ষমতাকে প্রভাবিত করে। কনফাউন্ডারগুলি ভেরিয়েবল যা কার্যকরীভাবে আগ্রহের পূর্বাভাসকের সাথে সম্পর্কিত এবং আগ্রহের ফলাফলের সাথে যুক্ত। জুডিয়া পার্ল, দ্বিতীয় সংস্করণ থেকে কার্যকারিতা দেখুন। তথ্য সংগ্রহের প্রক্রিয়া এমনকি যুক্তিসঙ্গত যুক্তি এবং পূর্ববর্তী অনুসন্ধানী গবেষণার পূর্ববর্তী জ্ঞান ব্যবহার শুরু করার আগে একটিকে সঠিক বিভ্রান্তিমূলক ভেরিয়েবলগুলির জন্য তাদের বিশ্লেষণ নির্দিষ্ট করা এবং শক্তি দেওয়া উচিত।

তবে এর অর্থ এই নয় যে কিছু গবেষক সামঞ্জস্যতা ভেরিয়েবলগুলি নির্বাচন করতে ডেটা-চালিত পদ্ধতির উপর নির্ভর করেন না। নিশ্চিতকরণ বিশ্লেষণ পরিচালনা করার সময় আমি বাস্তবে এটি করার সাথে একমত নই। একাধিক সমন্বিত মডেলগুলির জন্য মডেল নির্বাচনের কিছু সাধারণ কৌশল হ'ল ফরোয়ার্ড / পশ্চাৎপদ মডেল নির্বাচন যেখানে আপনি মডেলগুলির ক্লাসগুলিতে সীমাবদ্ধ করতে পারেন যা আপনি কমপক্ষে প্রশংসনীয় বলে মনে করেন। এর জন্য ব্ল্যাকবক্স এআইসি নির্বাচনের মানদণ্ড সম্ভাবনার সাথে সম্পর্কিত এবং তাই, হ্রাসের ডিগ্রিআর2এই সমন্বয় ভেরিয়েবলের জন্য রৈখিক মডেলগুলির জন্য। মহামারীবিদ্যায় প্রচলিত আরেকটি প্রক্রিয়া হ'ল যেখানে পরিবর্তনগুলি কেবলমাত্র মডেলটিতে যুক্ত হয় যদি তারা মূল প্রভাবের (যেমন একটি প্রতিকূল অনুপাত বা বিপদ অনুপাত) এর অনুমানকে কমপক্ষে 10% পরিবর্তন করে। যদিও এটি এআইসি ভিত্তিক মডেল নির্বাচনের চেয়ে "আরও" সঠিক, তবুও আমি মনে করি এই পদ্ধতির মধ্যে বড় ধরনের সতর্কতা রয়েছে।

আমার সুপারিশটি অনুমানের অংশ হিসাবে পছন্দসই বিশ্লেষণকে পূর্বনির্ধারণ করা। বয়স সমন্বিত ধূমপান / ক্যান্সারের ঝুঁকি একটি পৃথক প্যারামিটার এবং এটি অশোধিত ধূমপান / ক্যান্সারের ঝুঁকির চেয়ে নিয়ন্ত্রিত গবেষণায় বিভিন্ন রকমের অনুক্রমের দিকে পরিচালিত করে। রিগ্রেশন বিশ্লেষণগুলিতে সামঞ্জস্যের জন্য ভবিষ্যদ্বাণী নির্বাচন করার জন্য, বা পরীক্ষামূলক এবং কোয়েসেক্সের্পিমেন্টাল ডিজাইনের বিশিষ্ট বিশ্লেষণের বিভিন্ন ধরণের "স্ট্র্যাটিফিকেশন, ম্যাচিং" বা ওজন পরিবর্তনশীল হিসাবে বিষয় সম্পর্কিত জ্ঞান ব্যবহার করা সেরা উপায়।


2

ম্যাচ এবং রিগ্রেশনের মধ্যে সম্পর্কের গল্পটি এখানে একটি ব্লগ পোস্টে সংক্ষিপ্তভাবে সংক্ষিপ্ত করা হয়েছে । সংক্ষেপে

"ডি [একটি চিকিত্সার সূচক] -এ রেজিস্ট্রেশন করুন এক্স এর জন্য সম্পূর্ণ ডামিগুলির একটি সম্পূর্ণ সেট (অর্থাত্ স্যাচুরেটেড) মডেল of এক্স উপর শর্তসাপেক্ষ চিকিত্সা "

সম্পূর্ণরূপে ক্ষতিকারক একনোমেট্রিক্সের বিভাগ ৩.৩ বা একটি সম্পূর্ণ আলোচনার জন্য কাউন্টারফ্যাক্টুয়ালস এবং কার্যকারণ অনুক্রমের বিভাগ ৫.৩ দেখুন, ডি প্রদত্ত এক্স ওজন যা রেজিস্ট্রেশনটি সুস্পষ্টভাবে সরবরাহ করে তার বিপরীতে এবং কার্যকারিতা সহ।

@ এপিগ্রাড আপনার প্রথম প্রশ্নটিতে একটি ভাল সূচনা দেয়। উপরের লিঙ্কযুক্ত বইগুলি এটি প্রায় একচেটিয়াভাবে আচরণ করে। আপনার যদি কম্পিউটার বিজ্ঞান / গণিতের পটভূমি না থাকে তবে আপনি পার্লটিকে শক্তভাবে দেখতে পাবেন (যদিও শেষ পর্যন্ত এটি মূল্যবান!)

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.