সরল ইংরাজীতে মডেল সমন্বয় ব্যাখ্যা কর


14

পরিসংখ্যানগত বিশ্লেষণের পদ্ধতি এবং ফলাফলগুলি সম্পর্কে পড়া, বিশেষত এপিডেমিওলজিতে, আমি প্রায়শই মডেলগুলির সমন্বয় বা নিয়ন্ত্রণ সম্পর্কে শুনে থাকি ।

কোনও অ-পরিসংখ্যানবিদকে আপনি কীভাবে এটি ব্যাখ্যা করবেন? নির্দিষ্ট পরিবর্তনশীলের জন্য নিয়ন্ত্রণের পরে আপনি কীভাবে আপনার ফলাফলগুলি ব্যাখ্যা করবেন?

স্টাটা বা আর-তে ছোট হাঁটাচলা, বা একটি অনলাইন পয়েন্টার, একটি সত্য রত্ন হবে।

উত্তর:


29

উদাহরণের মাধ্যমে ব্যাখ্যা করা সবচেয়ে সহজ:

অধ্যয়নের মাধ্যমে কল্পনা করুন যে বিশ্বকাপ ফাইনালটি দেখেছেন এমন লোকেরা ম্যাচ চলাকালীন সময়ে বা পরবর্তী 24 ঘন্টা যারা এটি দেখেনি তাদের চেয়ে হার্ট অ্যাটাকের ঝুঁকির সম্ভাবনা বেশি ছিল। সরকারকে কি টিভি থেকে ফুটবল নিষিদ্ধ করা উচিত? তবে পুরুষরা মহিলাদের চেয়ে ফুটবল দেখার সম্ভাবনা বেশি, এবং পুরুষদেরও মহিলাদের চেয়ে হার্ট অ্যাটাক হওয়ার সম্ভাবনা বেশি। সুতরাং সমিতি ফুটবল পর্যবেক্ষক এবং হার্ট এটাক মধ্যে একটি দ্বারা ব্যাখ্যা করা যেতে পারে তৃতীয় ফ্যাক্টর যেমন উভয় প্রভাবিত করে সেক্স করে। (সমাজবিজ্ঞানীরা এখানে লিঙ্গ , একটি সাংস্কৃতিক গঠন যা ফুটবল দেখা এবং যৌনতার সাথে জড়িত তার মধ্যে পার্থক্য করবেন, একটি জৈবিক বিভাগ যা হার্ট-অ্যাটাকের ঘটনার সাথে সম্পর্কিত, তবে দু'টি খুব দৃ corre়ভাবে সম্পর্কযুক্ত তাই আমি সরলতার জন্য সেই তাত্পর্যকে এড়িয়ে যাচ্ছি))

পরিসংখ্যানবিদরা এবং বিশেষত এপিডেমিওলজিস্টরা এই জাতীয় তৃতীয় বিষয়টিকে বিভ্রান্তকারী এবং ঘটনাটিকে বিভ্রান্ত বলে অভিহিত করেন । সমস্যাটি সরিয়ে নেওয়ার সর্বাধিক সুস্পষ্ট উপায় হ'ল পুরুষ এবং মহিলাদের মধ্যে পৃথকভাবে যৌনতা বা জড়িত হয়ে ফুটবল দেখার এবং হার্ট-অ্যাটাকের ঘটনার মধ্যে সংযুক্তি । যদি আমরা দেখতে পেলাম যে সমিতি (এখনও সেখানে একটি রয়েছে) উভয় লিঙ্গের ক্ষেত্রে একই রকম হয়, তবে আমরা দুটি লিঙ্গ জুড়েই সমিতির দুটি অনুমানকে একত্রিত করতে বেছে নিতে পারি। ফুটবল-পর্যবেক্ষণ এবং হার্ট-অ্যাটাকের ঘটনাগুলির মধ্যে সংঘবদ্ধতার ফলস্বরূপ অনুমানটি তখন যৌনতার জন্য সামঞ্জস্য বা নিয়ন্ত্রিত বলে বলা হয় ।

আমরা সম্ভবত অন্যান্য কারণের জন্য একইভাবে নিয়ন্ত্রণ করতে চাই। বয়স হ'ল আরেকটি সুস্পষ্ট বিষয় (বাস্তবে এপিডেমিওলজিস্টরা হয় বয়স এবং লিঙ্গের দ্বারা প্রায় প্রতিটি সংযোগকে স্থির করে বা সমন্বয় / নিয়ন্ত্রণ)। আর্থ-সামাজিক শ্রেণি সম্ভবত অন্য এক। অন্যরা কৌশলযুক্ত হয়ে উঠতে পারে, যেমন ম্যাচটি দেখার সময় আমাদের বিয়ারের জন্য সামঞ্জস্য করা উচিত? হতে পারে হ্যাঁ, আমরা যদি একাই ম্যাচ দেখার চাপের প্রভাব নিয়ে আগ্রহী; তবে সম্ভবত না, আমরা যদি বিশ্বকাপ ফুটবলের সম্প্রচারকে নিষিদ্ধ করার বিষয়টি বিবেচনা করি এবং এটি বিয়ারের খরচও হ্রাস করে। প্রদত্ত পরিবর্তনশীল কোনও বিবাদকারী কিনা তা সঠিকভাবে নির্ভর করে যে আমরা কোন প্রশ্নটি মোকাবিলা করতে চাই তার উপর নির্ভর করে এবং এর জন্য খুব সতর্কতার সাথে চিন্তাভাবনা করা দরকার এবং বেশ জটিল এবং এমনকি বিতর্কিত হতে পারে।

স্পষ্টতই, আমরা বেশ কয়েকটি বিষয়গুলির জন্য সামঞ্জস্য / নিয়ন্ত্রণ করতে চাইতে পারি, যার কয়েকটি কয়েকটি বিভাগে (যেমন সামাজিক শ্রেণি) পরিমাপ করা যেতে পারে তবে অন্যরা অবিচ্ছিন্ন হতে পারে (যেমন বয়স)। আমরা অবিচ্ছিন্ন ব্যক্তিদের সাথে (বয়স-) গ্রুপগুলিতে বিভক্ত হয়ে তাদেরকে শ্রেণীবদ্ধে রূপান্তরিত করতে পারি। সুতরাং বলুন যে আমাদের কাছে 2 লিঙ্গ, 5 টি সামাজিক শ্রেণির গ্রুপ এবং 7 টি বয়সের গ্রুপ রয়েছে। আমরা এখন 2 × 5 × 7 = 70 স্তরে ফুটবল-পর্যবেক্ষণ এবং হার্ট-অ্যাটাকের ঘটনাগুলির মধ্যে সংযোগটি দেখতে পারি। তবে যদি আমাদের অধ্যয়ন মোটামুটি ছোট হয়, সুতরাং এই স্তরের কয়েকটিতে খুব কম লোক থাকে, আমরা এই পদ্ধতির সাথে সমস্যাগুলিতে চলে যাব। এবং অনুশীলনে আমরা এক ডজন বা আরও ভেরিয়েবলের জন্য সামঞ্জস্য করতে পারি। ভেরিয়েবলগুলির জন্য সমন্বয় / নিয়ন্ত্রণের একটি বিকল্প উপায় যা বিশেষত কার্যকর যখন তাদের অনেকগুলি থাকে তখন রিগ্রেশন বিশ্লেষণ দ্বারা সরবরাহ করা হয়একাধিক নির্ভরশীল ভেরিয়েবল সহ, কখনও কখনও মাল্টিভারেবল রিগ্রেশন বিশ্লেষণ হিসাবে পরিচিত । (ফলাফলের পরিবর্তনশীলের ধরণের উপর নির্ভর করে বিভিন্ন ধরণের রিগ্রেশন মডেল রয়েছে: ন্যূনতম স্কোয়ার রিগ্রেশন, লজিস্টিক রিগ্রেশন, আনুপাতিক বিপত্তি (কক্স) রিগ্রেশন ...)। পর্যবেক্ষণে অধ্যয়নগুলিতে, পরীক্ষাগুলির বিপরীতে, আমরা প্রায়শই অনেকগুলি সম্ভাব্য কনফন্ডারদের জন্য সামঞ্জস্য করতে চাই, সুতরাং কনফাউন্ডারদের জন্য অনুশীলনে সামঞ্জস্য / নিয়ন্ত্রণ প্রায়শই রিগ্রেশন বিশ্লেষণ দ্বারা করা হয়, যদিও অন্যান্য বিকল্পগুলিও রয়েছে যেমন মানীকরণ, ওজন, প্রবণতা স্কোর মিল ...


3
+1 (যদিও এটি কমপক্ষে +3 প্রাপ্য) - খুব পুঙ্খানুপুঙ্খ এবং ব্যাপক। পুরো বিষয়টি আমার জন্য আরও স্পষ্ট করে তুলেছে। ধন্যবাদ!
radek

"ভেরিয়েবলগুলির জন্য অ্যাডজাস্ট / কন্ট্রোল করার একটি বিকল্প উপায় যা বিশেষত কার্যকর যখন তাদের মধ্যে অনেকগুলি থাকে তখন একাধিক নির্ভরশীল ভেরিয়েবলগুলির সাথে রিগ্রেশন বিশ্লেষণ দ্বারা সরবরাহ করা হয়, কখনও কখনও মাল্টিভেরিয়েবল রিগ্রেশন বিশ্লেষণ হিসাবে পরিচিত" " এটি কি "স্বাধীন" হওয়ার কথা নাকি আমি ভুল বুঝাবুঝি করছি? এবং এটির জন্য আরও সাধারণ জারগন, "একাধিক প্রতিরোধ"? (আমি জানি এটি বিতর্কযোগ্য)
রিচার্ড ডিসালভো

10

অনস্টপ এটি বেশ ভালভাবে ব্যাখ্যা করেছে, আমি মেক আপ ডেটা সহ একটি সহজ আর উদাহরণ দেব। বলুন এক্স ওজন এবং y উচ্চতা, এবং আমরা পুরুষ এবং স্ত্রীদের মধ্যে পার্থক্য আছে কিনা তা খুঁজে পেতে চাই:

set.seed(69)
x <- rep(1:10,2)
y <- c(jitter(1:10, factor=4), (jitter(1:10, factor=4)+2))
sex <- rep(c("f", "m"), each=10)
df1 <- data.frame(x,y,sex)
with(df1, plot(y~x, col=c(1,2)[sex]))
lm1 <- lm(y~sex, data=df1)
lm2 <- lm(y~sex+x, data=df1)
anova(lm1); anova(lm2)

আপনি দেখতে পাচ্ছেন যে ওজন নিয়ন্ত্রণ না করে (আনোভা (এলএম 1) তে লিঙ্গগুলির মধ্যে খুব কম পার্থক্য রয়েছে, তবে যখন ওজনকে কোভারিয়েট হিসাবে অন্তর্ভুক্ত করা হয় (এলএম 2-এর জন্য নিয়ন্ত্রিত) তখন তফাত আরও স্পষ্ট হয় becomes

#In case you want to add the fitted lines to the plot
coefs2 <- coef(lm2)
abline(coefs2[1], coefs2[3], col=1)
abline(coefs2[1]+coefs2[2], coefs2[3], col=2)
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.