একাধিক রিগ্রেশন কীভাবে সত্যের "নিয়ন্ত্রণের" পক্ষে যেতে পারে?


45

আমরা সকলে পর্যবেক্ষণমূলক স্টাডিজের সাথে পরিচিত যা একটি ননর্যান্ডমাইজড প্রেডিক্টর এক্স এর মধ্যে একটি কার্যকারণ যোগসূত্র স্থাপনের চেষ্টা করে এবং একাধিক রিগ্রেশন মডেলটিতে প্রতিটি কল্পনাশক্তি সম্পন্ন কনফন্ডারকে অন্তর্ভুক্ত করে একটি ফলাফলের চেষ্টা করে। সমস্ত বিভ্রান্তকারীকে এভাবে "নিয়ন্ত্রণ" করার মাধ্যমে যুক্তিটি চলে যায়, আমরা আগ্রহের পূর্বাভাসকারীটির প্রভাবকে আলাদা করি।

আমি এই ধারণার সাথে ক্রমবর্ধমান অস্বস্তি বিকাশ করছি, মূলত আমার পরিসংখ্যান শ্রেণীর বিভিন্ন অধ্যাপকদের দ্বারা করা মন্তব্যের ভিত্তিতে। তারা কয়েকটি প্রধান বিভাগে পড়ে:

1. আপনি কেবলমাত্র সেই কোয়ারিয়েটগুলির জন্য নিয়ন্ত্রণ করতে পারেন যা আপনি ভাবেন এবং পরিমাপ করেন।
এটি সুস্পষ্ট, তবে আমি অবাক হয়েছি যে এটি আসলেই সবচেয়ে ক্ষতিকারক এবং দুর্গম।

২. পদ্ধতির অতীতে কুরুচিপূর্ণ ভুল হয়েছে।

উদাহরণস্বরূপ, পেটিটি অ্যান্ড ফ্রিডম্যান (২০০৫) আলোচনা করেছেন কীভাবে দশকের দশক ধরে পরিসংখ্যানগতভাবে সমন্বিত পর্যবেক্ষণ গবেষণায় হৃদরোগের ঝুঁকিতে হরমোন রিপ্লেসমেন্ট থেরাপির প্রভাব সম্পর্কে বিপর্যয়করভাবে ভুল সিদ্ধান্তে আসে। পরে আরসিটিগুলি প্রায় বিপরীত প্রভাব খুঁজে পেয়েছে।

৩. আপনি যখন covariates নিয়ন্ত্রণ করেন তখন ভবিষ্যদ্বাণীকারী-ফলাফল সম্পর্কটি অদ্ভুত আচরণ করতে পারে।

ইউ-কং তু, গুনেল এবং গিলথর্প (২০০৮) লর্ডসের প্যারাডক্স, সিম্পসনের প্যারাডক্স এবং দমনকারী ভেরিয়েবল সহ কিছু আলাদা প্রকাশ নিয়ে আলোচনা করেছেন।

৪. একক মডেল (একাধিক রিগ্রেশন) এর পক্ষে কোভারিয়েটগুলির জন্য পর্যাপ্ত পরিমাণে সামঞ্জস্য করা এবং একই সাথে ভবিষ্যদ্বাণী-ফলাফল সম্পর্কের মডেল করা কঠিন difficult

আমি এটিকে শুনেছি যে বিভ্রান্তির স্কোনেস এবং স্ট্যান্ডার্ডাইজেশনের মতো পদ্ধতির শ্রেষ্ঠত্বের কারণ হিসাবে আমি এটিকে শুনেছি তবে আমি নিশ্চিত নই যে আমি এটি সত্যই বুঝতে পেরেছি।

৫. অ্যানকোভা মডেলটির স্বাবলম্বী এবং স্বাবলম্বী স্বতন্ত্র হওয়ার প্রয়োজন।

অবশ্যই, আমরা কনফন্ডারদের জন্য যথাযথভাবে সামঞ্জস্য করি কারণ তারা আগ্রহের পূর্বাভাসকের সাথে সম্পর্কযুক্ত, সুতরাং, মনে হয়, মডেল যখন আমরা এটি সবচেয়ে বেশি চাই তখন সঠিক দৃষ্টিতে ব্যর্থ হবে। যুক্তি দেখা যায় যে র‌্যান্ডমাইজড ট্রায়ালগুলিতে শব্দ-হ্রাসের জন্য সামঞ্জস্যতা কেবলমাত্র উপযুক্ত। মিলার এবং চ্যাপম্যান, 2001 একটি দুর্দান্ত পর্যালোচনা দেয়।

সুতরাং আমার প্রশ্নগুলি হ'ল:

  1. এই সমস্যাগুলি এবং অন্যেরা আমি জানি না যে কতটা গুরুতর?
  2. "সমস্ত কিছুর জন্য নিয়ন্ত্রণ" এমন একটি গবেষণা দেখলে আমার কী ভয় হওয়া উচিত?

(আমি আশা করি এই প্রশ্নটি খুব বেশি আলোচনার অঞ্চলে প্রবেশ করছে না এবং আনন্দের সাথে এর উন্নতির জন্য কোনও পরামর্শের জন্য আমন্ত্রণ জানিয়েছে))

সম্পাদনা : আমি একটি নতুন রেফারেন্স সন্ধানের পরে পয়েন্ট 5 যুক্ত করেছি।


1
প্রশ্ন 2 এর জন্য, আমি মনে করি 'সমস্ত কিছুর জন্য নিয়ন্ত্রণ' নির্দিষ্টকরণের আরও সাধারণ সমস্যা। প্যারামিট্রিক মডেলটি সঠিকভাবে নির্দিষ্ট করা হয়েছে এমন পরিস্থিতিতে ভাবতে আমার সমস্যা হয়। বলা হচ্ছে, একটি মডেল বাস্তবকে সরল করে তোলে এবং সেখানেই এই ধরণের অধ্যয়নের শিল্পটি নিহিত। মডেলটিতে কোনটি গুরুত্বপূর্ণ এবং কী গুরুত্বপূর্ণ তা গবেষককে সিদ্ধান্ত নিতে হবে।
কির্ক

4
এই প্রশ্নটি দিয়ে আপনি আমাকে ভক্ত করে তুলেছেন।
Rolando2

1
আমি মনে করি এটি কিছু খুব ভাল পয়েন্ট উত্থাপন; তবে আমি মনে করি উত্তরগুলি কঠোর পরিসংখ্যানের ক্ষেত্রের বাইরে। সুতরাং, কোনও পরিসংখ্যানগত ফলাফল এটি আরও মূল্যবান যদি এটি 1) প্রতিলিপি করা হয় 2) যথেষ্ট কার্যকরভাবে সক্ষম হয় ইত্যাদি। এছাড়াও ম্যাজিকের মানদণ্ড এবং অ্যাবেলসন সাধারণ যুক্তি দেখুন।
পিটার ফ্লুম - মনিকা পুনরায়

1
পয়েন্ট # 5 একেবারে মিথ্যা। মিলার এবং চ্যাপম্যান পেপার সম্পূর্ণ ভুল, পুরো স্টপ।
জেক ওয়েস্টফল

1
@ অর্ধ পাস এই বিষয়ে কাগজের কেন্দ্রীয় দাবী ছাড়া অন্য আর কী বলবেন তা নিশ্চিত নন - অর্থাত্ ফোকাল প্রেডিকটর এক্স এবং কোভেরিয়েট সি অবশ্যই অনিয়ন্ত্রিত থাকতে হবে - এটি ঠিক সত্য নয়। খেয়াল করুন যে আনকোভা কেবল একটি রিগ্রেশন মডেল, সুতরাং যুক্তিযুক্ত এই একই লাইনটি সম্ভবত একাধিক রিগ্রেশন সম্পর্কিত প্রায় সমস্ত বাস্তব-বিশ্বের ব্যবহারকে অবৈধ করে দেবে! আমি বেশ কয়েক মাস আগে এই জঘন্য কাগজটি সম্পর্কে কিছু টুইটার আলোচনা করেছি: twitter.com/CookieSci/status/902298218494644228
জেক ওয়েস্টফল

উত্তর:


4

এখানে একটি বহুল স্বীকৃত, অ-পরিসংখ্যানগত সম্ভবত এর জবাব রয়েছে - কোওরিয়েটদের জন্য সত্যিকার অর্থে নিয়ন্ত্রণ করা হয়েছে এমন দাবি করার জন্য কোন অনুমানগুলি করা দরকার।

এটি জুডিয়া পার্লের কার্যকারণ গ্রাফগুলি এবং ক্যালকুলাস দিয়ে করা যেতে পারে ।

দেখুন http://ftp.cs.ucla.edu/pub/stat_ser/r402.pdf পাশাপাশি তার ওয়েবসাইটে অন্যান্য উপাদান।

পরিসংখ্যানবিদ হিসাবে এখন আমরা জানি যে সমস্ত মডেলগুলি মিথ্যা, এবং আসল পরিসংখ্যানগত প্রশ্নটি হ'ল এমন চিহ্নিত অনুমানগুলি খুব বেশি ভুল না হওয়ার কারণ আমাদের উত্তরটি প্রায় ঠিক আছে approximately পার্ল এটি সম্পর্কে অবগত এবং এটি তার কাজ নিয়ে আলোচনা করে তবে সম্ভবত কোনও পরিসংখ্যানবিদদের উত্তর না থাকার দাবি নিয়ে তাড়াহুড়ো করা এড়িয়ে যাওয়ার পক্ষে যথেষ্ট নয় (যা আমি বিশ্বাস করি যা অনুমান করা উচিত তার জন্য তার কাজ করে ? )।

(বর্তমানে এএসএ পরিসংখ্যান কোর্সে এই পদ্ধতিগুলি অন্তর্ভুক্ত করার জন্য শিক্ষাদান সামগ্রীর জন্য একটি পুরস্কার দিচ্ছে ) এখানে দেখুন )


একটি মার্জিত গ্রাফিকাল উপস্থাপনা দুর্দান্ত রেফারেন্স, আপনাকে ধন্যবাদ।
অর্ধ-পাস

0

প্রশ্নের উত্তর 1:

  • গম্ভীরতার প্রবণতা প্রাসঙ্গিক উপায়ে সর্বোত্তম মূল্যায়ন করা হয় (যেমন, বৈধতার ক্ষেত্রে অবদান রাখার সমস্ত কারণ বিবেচনা করা উচিত)।
  • গম্ভীরতার মাত্রাটি একটি বিশিষ্ট উপায়ে মূল্যায়ন করা উচিত নয়। উদাহরণ হ'ল অধ্যয়ন ডিজাইনের জন্য অনুক্রমের শ্রেণিবিন্যাসের ধারণা (উদাহরণস্বরূপ কেস রিপোর্টগুলি সর্বনিম্ন এবং আরসিটিগুলি সর্বোচ্চভাবে সর্বাধিক) are দ্রুত উচ্চ মানের প্রমাণ সনাক্তকরণের জন্য এই ধরণের স্কিমটি প্রায়শই মেডিকেল স্কুলে একটি সহজ হিউরিস্টিক হিসাবে শেখানো হয়। এই ধরণের চিন্তাভাবনার সমস্যাটি হ'ল এটি অ্যালগরিদমিক এবং অত্যধিক নির্বিচারবাদী বাস্তবে উত্তরটি নিজেই অত্যধিক নির্ধারিত। যখন এটি ঘটে তখন আপনি যে পদ্ধতিগুলিতে দুর্বল নকশা করা আরসিটিগুলি একটি ভালভাবে ডিজাইন করা পর্যবেক্ষণ অধ্যয়নের চেয়ে খারাপ ফলাফল পেতে পারে তা মিস করতে পারেন।
  • কোনও এপিডেমিওলজিস্টের দৃষ্টিকোণ থেকে রথম্যান (রোথম্যান, 2014) থেকে উপরোক্ত বিষয়গুলির সম্পূর্ণ আলোচনার জন্য এই সহজ পর্যালোচনাটি পড়ুন দেখুন ।

প্রশ্নের উত্তর 2:

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.