জেনারাইজড লিনিয়ার মডেল এবং জেনারাইজড লিনিয়ার মিশ্রিত মডেলগুলির মধ্যে পার্থক্য


34

আমি ভাবছি মিশ্রিত এবং অমীমাংসিত জিএলএমগুলির মধ্যে পার্থক্যগুলি কী। উদাহরণস্বরূপ, এসপিএসএস-এ ড্রপ ডাউন মেনু ব্যবহারকারীদের যে কোনও একটিতে ফিট করতে দেয়:

  • analyze-> generalized linear models-> generalized linear models &
  • analyze-> mixed models-> generalized linear

তারা কি অনুপস্থিত মানগুলির সাথে আলাদাভাবে আচরণ করে?

আমার নির্ভরশীল পরিবর্তনশীল বাইনারি এবং আমার বেশ কয়েকটি শ্রেণিবদ্ধ এবং অবিচ্ছিন্ন স্বতন্ত্র ভেরিয়েবল রয়েছে।


উত্তর:


62

জেনারালাইজড লিনিয়ার মডেলগুলির আবির্ভাব আমাদের প্রতিক্রিয়া ভেরিয়েবলের বিতরণ যখন স্বাভাবিক হয় না - উদাহরণস্বরূপ, যখন আপনার ডিভি বাইনারি হয় data (আপনি যদি জিএলআইএমএস সম্পর্কে আরও কিছু জানতে চান তবে আমি এখানে যথেষ্ট বিস্তৃত উত্তর লিখেছি , যা প্রসঙ্গে ভিন্ন হলেও কার্যকর হতে পারে useful) তবে, একটি জিএলআইএম, যেমন লজিস্টিক রিগ্রেশন মডেল, ধরে নেয় যে আপনার ডেটা স্বাধীন । উদাহরণস্বরূপ, এমন একটি গবেষণা কল্পনা করুন যা দেখে কোনও শিশু হাঁপানির বিকাশ করেছে কিনা looks প্রতিটি সন্তানের অবদান একঅধ্যয়নের দিকে ডেটা নির্দেশ করে - তাদের হয় হাঁপানি হয় বা হয় না। যদিও কখনও কখনও ডেটা স্বাধীন হয় না। আরেকটি গবেষণা বিবেচনা করুন যা দেখায় যে স্কুল বছরের বিভিন্ন সময় কোনও সন্তানের শীত রয়েছে কিনা। এই ক্ষেত্রে, প্রতিটি শিশু অনেকগুলি ডেটা পয়েন্ট অবদান রাখে । এক সময় শিশুটির সর্দি হতে পারে, পরে তারা নাও থাকতে পারে এবং পরেও তাদের অন্যরকম ঠান্ডা লাগতে পারে। এই ডেটাগুলি স্বাধীন নয় কারণ তারা একই শিশু থেকে এসেছে। এই ডেটাগুলি যথাযথভাবে বিশ্লেষণ করার জন্য আমাদের কোনওভাবেই এই অ-স্বাধীনতাকে বিবেচনায় নেওয়া উচিত। দুটি উপায় আছে: একটি উপায় হ'ল সাধারণ অনুমানের সমীকরণগুলি (যা আপনি উল্লেখ করেন না, তাই আমরা এড়িয়ে যাব) use অন্য উপায়টি হ'ল সাধারণীকরণীয় রৈখিক মিশ্র মডেল ব্যবহার করা use। জিএলআইএমএমগুলি এলোমেলো প্রভাব (@ মিশেলচেরনিক নোট হিসাবে) যুক্ত করে স্ব-স্বাধীনতার জন্য অ্যাকাউন্ট করতে পারে। সুতরাং, উত্তরটি হ'ল আপনার দ্বিতীয় বিকল্পটি অ-স্বাভাবিক পুনরাবৃত্তি ব্যবস্থা (বা অন্যথায় স্ব-স্বতন্ত্র) ডেটার জন্য। (@ ম্যাক্রোর এই মন্তব্যকে সামনে রেখে আমি উল্লেখ করা উচিত যে সাধারণ আকারের লিনিয়ার মিশ্রিত মডেলগুলিতে একটি বিশেষ কেস হিসাবে রৈখিক মডেল অন্তর্ভুক্ত থাকে এবং এটি সাধারণত বিতরণ করা ডেটার সাথে ব্যবহার করা যেতে পারে However তবে, সাধারণ ব্যবহারে শব্দটি অ-স্বাভাবিক তথ্যকে বোঝায়))

আপডেট: (ওপি জিআইই সম্পর্কেও জিজ্ঞাসা করেছে, তাই তিনটি কীভাবে একে অপরের সাথে সম্পর্কিত সে সম্পর্কে আমি একটু লিখব।)

এখানে একটি প্রাথমিক ওভারভিউ রয়েছে:

  • একটি সাধারণ জিএলআইএম (আমি প্রোটোটাইপিকাল কেস হিসাবে লজিস্টিক রিগ্রেশন ব্যবহার করব) আপনাকে কোওরিয়্যেটগুলির ফাংশন হিসাবে একটি স্বাধীন বাইনারি প্রতিক্রিয়া মডেল করতে দেয়
  • একটি জিএলএমএম আপনাকে স্বতঃস্ফূর্ত (বা ক্লাস্টারযুক্ত) বাইনারি প্রতিক্রিয়া শর্তসাপেক্ষে প্রতিটি পৃথক ক্লাস্টারের বৈশিষ্ট্যকে কোভারিয়েটগুলির ফাংশন হিসাবে মডেল করতে দেয়
  • Gee আপনি মডেল দেয় জনসংখ্যা গড় প্রতিক্রিয়া এর অ স্বাধীন covariates এর কার্যকারিতা হিসেবে বাইনারি ডেটা

যেহেতু আপনার প্রতি অংশগ্রহণকারী প্রতি একাধিক ট্রায়াল রয়েছে তাই আপনার ডেটা স্বতন্ত্র নয়; যেমনটি আপনি সঠিকভাবে লক্ষ্য করেছেন, "[টি] একজন অংশগ্রহণকারীর মধ্যে রিয়ালগুলি পুরো গ্রুপের তুলনায় বেশি মিল থাকতে পারে"। অতএব, আপনার একটি জিএলএমএম বা জিইই ব্যবহার করা উচিত।

তবে সমস্যাটি কীভাবে আপনার পরিস্থিতির জন্য জিএলএমএম বা জিইই আরও উপযুক্ত হবে তা চয়ন করবেন। এই প্রশ্নের উত্তর আপনার গবেষণার বিষয়ের উপর নির্ভর করে - বিশেষত, আপনি যে অভ্যাসটি তৈরি করবেন আশা করি তার লক্ষ্য। আমি উপরে উল্লিখিত হিসাবে, একটি জিএলএমএম দিয়ে, বিটাগুলি তাদের স্বতন্ত্র বৈশিষ্ট্যগুলি বিবেচনা করে একটি বিশেষ অংশগ্রহণকারীদের উপর আপনার সমবায় একটি ইউনিট পরিবর্তনের প্রভাব সম্পর্কে আপনাকে বলছে। অন্যদিকে জিইইর সাথে, বিটাগুলি আপনাকে প্রায় পুরো জনগণের প্রতিক্রিয়া হিসাবে প্রশ্নের উত্তর দিয়ে আপনার সমবায়গুলিতে এক ইউনিট পরিবর্তনের প্রভাব সম্পর্কে বলছে। এটি উপলব্ধি করা একটি কঠিন পার্থক্য, বিশেষত কারণ লিনিয়ার মডেলগুলির সাথে এই জাতীয় কোনও পার্থক্য নেই (এই ক্ষেত্রে উভয় একই জিনিস হয়)।

logit(pi)=β0+β1X1+bi
logit(p)=ln(p1p),     &      bN(0,σb2)
p β0(β0+ +আমি)biβ0β1pilogitএখানে চিত্র বর্ণনা লিখুন
β1- প্রতিটি শিক্ষার্থীর জন্য একই (এটি একটি এলোমেলো slাল নেই)। নোট করুন, যদিও, ছাত্রদের বেসলাইন ক্ষমতা তাদের মধ্যে পৃথক হয় - সম্ভবত আইকিউ (যেমন, একটি এলোমেলোভাবে বিরতি আছে) এর মতো বিষয়ের পার্থক্যের কারণে। সামগ্রিকভাবে ক্লাসের গড় সম্ভাবনা, তবে, শিক্ষার্থীদের চেয়ে আলাদা প্রোফাইল অনুসরণ করে। আকর্ষণীয়ভাবে পাল্টা-স্বজ্ঞাত ফলাফল: এটির অতিরিক্ত সময় নির্দেশনা পরীক্ষায় উত্তীর্ণ প্রতিটি শিক্ষার্থীর সম্ভাব্যতার উপর একটি বিশাল প্রভাব ফেলতে পারে তবে পাস করা শিক্ষার্থীদের সম্ভাব্য মোট অনুপাতের তুলনামূলকভাবে খুব কম প্রভাব ফেলতে পারে । এটি কারণ কিছু শিক্ষার্থীর মধ্যে ইতিমধ্যে পাস করার একটি বৃহত সুযোগ থাকতে পারে অন্যদের এখনও কম সুযোগ থাকতে পারে।

আপনার একটি জিএলএমএম ব্যবহার করা উচিত বা জিইই এই প্রশ্নটি আপনি এই ফাংশনগুলির মধ্যে কোনটি অনুমান করতে চান তা প্রশ্ন। আপনি একটি প্রদত্ত ছাত্র পাসিং সম্ভাবনা সম্পর্কে জানতে (যদি বলো, আপনি চেয়েছিলেন ছিল ছাত্র, বা ছাত্রের পিতা বা মাতা), আপনি একটি GLMM ব্যবহার করতে চান। অন্যদিকে, আপনি যদি জনসংখ্যার উপর প্রভাব সম্পর্কে জানতে চান (যদি উদাহরণস্বরূপ, আপনি শিক্ষক বা অধ্যক্ষ ছিলেন) তবে আপনি জিইই ব্যবহার করতে চাইবেন।

অন্যটির জন্য আরও গাণিতিকভাবে বিশদ, এই উপাদানটির আলোচনা, @ ম্যাক্রোর এই উত্তরটি দেখুন ।


2
এটি একটি উত্তম উত্তর তবে আমি মনে করি এটি, বিশেষত শেষ বাক্যটি প্রায় ইঙ্গিত করে যে আপনি কেবলমাত্র নন-নরমাল ডেটার জন্য জিএলএম বা জিএলএমএম ব্যবহার করেন যা সম্ভবত গাউসীয় লিনিয়ার (মিশ্র) মডেলগুলিও এর অধীনে আসে since জিএল (এম) বিভাগে।
ম্যাক্রো

@ ম্যাক্রো, আপনি ঠিক বলেছেন, আমি সবসময় এটি ভুলে যাই। আমি এটি পরিষ্কার করতে উত্তর সম্পাদনা করেছি। আপনার যদি মনে হয় এটির আরও প্রয়োজন হয় তবে আমাকে জানান।
গুং - মনিকা পুনরায়

আমি সাধারণ অনুমানের সমীকরণগুলিও পরীক্ষা করে দেখেছি। এটি কি ঠিক যে জিএলআইএমের মতো, জিআইই অনুমান করে যে আমার ডেটা স্বাধীন? প্রতি অংশগ্রহণকারী প্রতি আমার একাধিক ট্রায়াল রয়েছে। একজন অংশগ্রহীতার মধ্যে পরীক্ষাগুলি পুরো গ্রুপের তুলনায় বেশি মিল থাকতে পারে।
ব্যবহারকারী 9203

@ গুং, যদিও জিইই "জনসংখ্যা-গড়" সহগ উত্পাদন করতে পারে, যদি আমি প্রকৃত জনসংখ্যার জুড়ে সম্ভাব্যতার স্কোয়ারের গড় চিকিত্সার প্রভাব (এটিই) অনুমান করতে চাইতাম , বাইনারি সুদের হারের জন্য, তবে আমাকে কোনও গ্রহণ করার দরকার পড়েনি বিষয়-নির্দিষ্ট পদ্ধতির? আমার জ্ঞান অনুসারে এটিই গণনা করার উপায় হ'ল চিকিত্সা করা বা তার ব্যতীত প্রতিটি ব্যক্তির জন্য ভবিষ্যদ্বাণী করা সম্ভাবনাটি অনুমান করা এবং তারপরে এই পার্থক্যগুলি গড়ে গড়ে তোলা। এর জন্য কি কোনও রিগ্রেশন পদ্ধতির প্রয়োজন হয় না যা প্রতিটি ব্যক্তির জন্য পূর্বাভাসযুক্ত সম্ভাবনা তৈরি করতে পারে (তবুও এগুলির গড় বেড়েছে তার পরেও)?
ইয়াক্কানোমিকা

1
@ ইয়াক্কনোমিক, যদি আপনি এটি চান তবে নিশ্চিত।
গুং - মনিকা পুনরায়

6

মূলটি র্যান্ডম এফেক্টগুলির পরিচিতি। গুংয়ের লিঙ্কটিতে এটি উল্লেখ করা হয়েছে। তবে আমি মনে করি এটি সরাসরি উল্লেখ করা উচিত ছিল। এটিই মূল পার্থক্য।


+1, আপনি ঠিক বলেছেন। আমার এ সম্পর্কে পরিষ্কার হওয়া উচিত ছিল। এই উত্তরটি অন্তর্ভুক্ত করার জন্য আমি আমার উত্তর সম্পাদনা করেছি।
গুং - মনিকা পুনরায়

যখনই আমি মডেলটিতে একটি র্যান্ডম ইন্টারসেপ্টের মতো একটি র্যান্ডম এফেক্ট যুক্ত করি তখনই আমি একটি ত্রুটি বার্তা পাই। আমি মনে করি এলোমেলো প্রভাব যুক্ত করার মতো পর্যাপ্ত ডেটা-পয়েন্ট আমার কাছে নেই। যে ক্ষেত্রে হতে পারে? ত্রুটির বার্তা: গ্লিম্ম: চূড়ান্ত হেসিয়ান ম্যাট্রিক্স ইতিবাচক নির্দিষ্ট নয় যদিও সমস্ত রূপান্তর মানদণ্ড সন্তুষ্ট। এই সতর্কতা সত্ত্বেও প্রক্রিয়াটি অব্যাহত রয়েছে। উত্পাদিত পরবর্তী ফলাফলগুলি সর্বশেষ পুনরাবৃত্তির উপর ভিত্তি করে। মডেল ফিটের বৈধতা অনিশ্চিত।
ব্যবহারকারী 9203

3

আমি আপনাকে কিছু সময় আগে জিজ্ঞাসা করা একটি প্রশ্নের উত্তরও পরীক্ষা করার পরামর্শ দিচ্ছি:

জেনারেল লিনিয়ার মডেল বনাম জেনারালাইজড লিনিয়ার মডেল (একটি পরিচয় লিঙ্ক ফাংশন সহ?)


5
আমি মনে করি না যে জিএলএম এবং মিশ্র-প্রভাব মডেলগুলি চালানোর জন্য এসপিএসএস ক্ষমতা সম্পর্কে এবং কীভাবে এটি অনুপস্থিত মানগুলি পরিচালনা করে সে সম্পর্কে সত্যই সেই প্রশ্নের উত্তর দেয়। এটির পরিবর্তে কোনও মন্তব্য হওয়ার উদ্দেশ্য ছিল? অন্যথায়, দয়া করে পরিষ্কার করুন।
chl

দুঃখিত, শুরুর পোস্টটিতে দুটি "প্রশ্ন" রয়েছে বলে মনে হয়েছে। ১. আমি কী ভাবছি .... এবং ২. তারা কী অনুপস্থিত মানগুলির সাথে আলাদাভাবে আচরণ করে? আমি প্রথম প্রশ্নটি সাহায্য করার চেষ্টা করছিলাম।
বেহাকাদ

1
যথেষ্ট ফর্সা। আরও ব্যাখ্যা ব্যতীত, আমি এখনও মনে করি এটি ওপিতে মন্তব্য করার মতো উপযুক্ত।
chl
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.