মাল্টিলেভেল মডেল বনাম প্রতিটি স্তরের জন্য পৃথক মডেল


10

বনাম মাল্টিলেভেল মডেলিংয়ের পৃথক মডেল চালানোর সুবিধা এবং অসুবিধাগুলি কী কী?

আরও বিশেষত, ধরুন যে কোনও গবেষণায় রোগীরা দেশগুলিতে বাসা বেঁধেছে ডাক্তারদের অনুশীলনগুলির মধ্যে বাসা বেঁধেছে examined তিনটি স্তরের নেস্টেড মডেল বনাম প্রতিটি দেশের জন্য পৃথক মডেল চালানোর সুবিধা / অসুবিধাগুলি কী কী?


2
আপনি যদি কোনও 3-স্তরের মডেলের পক্ষপাতদুষ্ট প্যারামিটারের অনুমান পেতে চলেছেন তবে প্রযুক্তিগতভাবে আপনার বেশ কয়েকটি স্তরের -3 ইউনিট প্রয়োজন (সাধারণভাবে বলতে গেলে যে কোনও মাল্টিলেভেল মডেলের নমুনার আকার উচ্চ স্তরের ক্ষেত্রে বিশেষত গুরুত্বপূর্ণ) তাই আপনার যদি না থাকে দেশগুলির একটি বিশাল এলোমেলো নমুনা (সম্ভবত ৫০++), আপনার সম্ভবত পৃথক ২-স্তরের মডেল চালানো বিবেচনা করা উচিত, বা যদি আপনার কয়েকটি দেশ থাকে তবে আপনি দেশটিকে একটি 2-স্তরের মডেলগুলিতে শ্রেণিবদ্ধ স্তর -2 ভবিষ্যদ্বাণী হিসাবে বিবেচনা করতে পারেন
প্যাট্রিক কলম্বো

হাই @ গুং আমি দূরে ছিলাম, আমি এখন তাদের দিকে নজর দেব।
পিটার ফ্লুম

উত্তর:


6

প্রশ্নটি তারিখযুক্ত তবে আমি মনে করি এটি অত্যন্ত গুরুত্বপূর্ণ। আমি যে উত্তম উত্তর পেতে পারি তা হ'ল জোপ জে হক্স (২০১০) বই "মাল্টিলেভেল এনালাইসিস টেকনিকস অ্যান্ড অ্যাপ্লিকেশনস, দ্বিতীয় সংস্করণ" থেকে।

ধরুন , নিম্ন স্তরে p ব্যাখ্যামূলক ভেরিয়েবল এবং উচ্চ স্তরে q ব্যাখ্যামূলক ভেরিয়েবল সহ দ্বি-স্তরের শ্রেণিবদ্ধ তথ্য data তারপরে 55 পৃষ্ঠায় তিনি লিখেছেন:

একই তথ্যের জন্য একটি সাধারণ একক-স্তরের রিগ্রেশন মডেল কেবলমাত্র বিরতি, একটি ত্রুটির বৈকল্পিক এবং p + q রিগ্রেশন opালু অনুমান করে। মাল্টিলেভাল রিগ্রেশন মডেলের শ্রেষ্ঠত্ব স্পষ্ট, যদি আমরা বিবেচনা করি যে ডেটাগুলি গ্রুপে ক্লাস্টার করা আছে। আমাদের যদি 100 টি গোষ্ঠী থাকে তবে প্রতিটি গোষ্ঠীতে একটি সাধারণ একাধিক রিগ্রেশন মডেলকে আলাদাভাবে অনুমান করার জন্য q গ্রুপ-স্তর ভেরিয়েবলগুলির সাথে 100% 1 (1 রিগ্রেশন ইন্টারসেপ্ট + 1 রেসিডুয়াল ভেরিয়েন্স + পি রিগ্রেশন opালু) এবং সম্ভাব্য মিথস্ক্রিয়া অনুমানের প্রয়োজন হয়। মাল্টিলেভাল রিগ্রেশন এই রিসিডুয়ালের জন্য একটি সাধারণ বিতরণ ধরে ধরে, গ্রুপগুলির মধ্যে একটি গড় ইন্টারসেপ্ট প্লাস এর অবশিষ্টাংশের ভিন্নতা অনুমান করে 100 টি ইন্টারসেপ্টের বিশ্লেষণের পরিবর্তে। সুতরাং, মাল্টিলেভাল রিগ্রেশন অ্যানালাইসিস দুটি পৃথক পরামিতি (ইন্টারসেপ্টগুলির গড় এবং বৈকল্পিক), এবং একটি স্বাভাবিকতা অনুমানের অনুমান করে 100 পৃথক ইন্টারসেপ্টগুলি অনুমান করে প্রতিস্থাপন করে। একই সরলকরণটি রিগ্রেশন opালের জন্য ব্যবহৃত হয়। ব্যাখ্যামূলক চলক ছাত্র লিঙ্গের জন্য 100 opালগুলি অনুমান করার পরিবর্তে, আমরা বিভিন্ন গোষ্ঠীগুলির মধ্যে তার বৈচিত্রের সাথে গড় opeালটি অনুমান করি এবং ধরে নিই যে opালুগুলির বিতরণ স্বাভাবিক is তবুও, এমনকি সংখ্যক সংখ্যক ব্যাখ্যামূলক ভেরিয়েবল সহ, বহু-স্তরের রিগ্রেশন বিশ্লেষণ একটি জটিল মডেলকে বোঝায়। সাধারণত, আমরা সম্পূর্ণ মডেলটি অনুমান করতে চাই না, প্রথমে কারণ এটি আমাদের কম্পিউটারের সমস্যার মধ্যে ফেলতে পারে তবে এটি একটি জটিল মডেলটির ব্যাখ্যা করা খুব কঠিন বলেও।

এটি বর্ণনার জন্য। এখন 29-30 পৃষ্ঠাগুলি আপনার প্রশ্নের উত্তর আরও নির্ভুলভাবে দেবে।

100 ক্লাসের জন্য পূর্বাভাসপ্রাপ্ত ইন্টারসেপ্ট এবং opালগুলি আমরা প্রাপ্ত মানগুলির সাথে একরকম নয় যদি আমরা স্ট্যান্ডার্ড সাধারণ ন্যূনতম স্কোয়ার (ওএলএস) কৌশলগুলি ব্যবহার করে 100 শ্রেণীর প্রত্যেকটিতে 100 পৃথক সাধারণ রিগ্রেশন বিশ্লেষণ করতাম। যদি আমরা একাধিক স্তরের রিগ্রেশন বিশ্লেষণ থেকে প্রাপ্ত মানগুলির সাথে পৃথক 100 টি ওএলএস রিগ্রেশন বিশ্লেষণ থেকে ফলাফলগুলি তুলনা করি তবে আমরা দেখতে পাব যে পৃথক বিশ্লেষণের ফলাফলগুলি আরও পরিবর্তনশীল। এটি কারণ 100 ক্লাসের রিগ্রেশন সহগের বহুস্তর অনুমানগুলি ওজনযুক্ত। এগুলিকে তথাকথিত এম্পিরিকাল বেইস (ইবি) বা সংকোচনের প্রাক্কলন: প্রতিটি শ্রেণীর নির্দিষ্ট ওএলএস অনুমানের ওজন গড় এবং সামগ্রিক রেগ্রেশন সহগ, একই ধরণের সমস্ত শ্রেণীর জন্য অনুমান করা হয়।

ফলস্বরূপ, রিগ্রেশন সহগগুলি পুরো ডেটা সেটের জন্য গড় সহগের দিকে ফিরে সঙ্কুচিত হয়। সঙ্কুচিত ওজন অনুমান সহগের নির্ভরযোগ্যতার উপর নির্ভর করে। ছোট নির্ভুলতার সাথে অনুমান করা সহগগুলি খুব সঠিকভাবে অনুমান করা সহগের চেয়ে বেশি সঙ্কুচিত হয়। অনুমানের নির্ভুলতা দুটি কারণের উপর নির্ভর করে: গ্রুপের নমুনা আকার এবং গ্রুপ-ভিত্তিক অনুমান এবং সামগ্রিক অনুমানের মধ্যে দূরত্ব। ছোট গ্রুপগুলির জন্য অনুমানগুলি কম নির্ভরযোগ্য এবং বড় গ্রুপগুলির অনুমানের চেয়ে বেশি সঙ্কুচিত হয়। অন্যান্য জিনিস সমান, সামগ্রিক প্রাক্কলন থেকে অনেক দূরে যে অনুমানগুলি কম নির্ভরযোগ্য বলে ধরে নেওয়া হয় এবং সামগ্রিক গড়ের কাছাকাছি থাকা অনুমানের তুলনায় এগুলি আরও সঙ্কুচিত হয়। ব্যবহৃত পরিসংখ্যান পদ্ধতির বলা হয় এম্পিরিকাল বেইস অনুমান। এই সঙ্কুচিত প্রভাবের কারণে, বুদ্ধিমান বায়াস অনুমানকারী পক্ষপাতদুষ্ট। তবে এগুলি সাধারণত আরও সুনির্দিষ্ট, এমন একটি সম্পত্তি যা প্রায়শই পক্ষপাতহীন হওয়ার চেয়ে বেশি কার্যকর ((দেখুন কেন্ডাল, ১৯৫৯)।

আমি আশা করি এটি সন্তোষজনক


2

একটি এলোমেলো প্রভাব নির্দিষ্ট করে ধরে নেওয়া হয় যে এই স্তরগুলির মাধ্যমগুলি একটি সাধারণ বন্টন থেকে প্রাপ্ত নমুনা। এগুলিকে প্রভাব হিসাবে নির্দিষ্ট করা আরও ভাল, এ কেএ ডামি ভেরিয়েবলগুলি যদি এই ধারণাটি আপনার ডেটা ফিট করে না। এইভাবে আপনি মধ্যম (সেই স্তরে) গোষ্ঠীগত ভিন্ন ভিন্নতার জন্য নিয়ন্ত্রণ করছেন, তবে আপনি আপনার নিম্ন-স্তরের ভেরিয়েবলের প্রতিক্রিয়াগুলিতে বৈধবৃত্তির অনুমতি দিচ্ছেন না।

আপনি যদি আপনার নিম্ন-স্তরের ব্যাখ্যামূলক ভেরিয়েবলের প্রতিক্রিয়াতে বৈকল্পিকতা প্রত্যাশা করেন, আপনি আলাদাভাবে মডেলগুলি বোধগম্য হন, যদি না আপনি কিছুটা এলোমেলো সহগীয় মডেল চালাতে চান (যার মধ্যে আবার এই ধারণাটি জড়িত থাকে যে সহগুণগুলি সাধারণত বিতরণ করা হয়)।

(আমি বিশ্বাস করি যে নরমাল এলোমেলো প্রভাবের জন্য কয়েকটি পদ্ধতি রয়েছে তবে লামের মতো বহুল ব্যবহৃত বা অ্যাক্সেসযোগ্য কোনও কিছুই নেই)


1

সুবিধা: ক্লাস্টার দ্বারা পরামিতিগুলির মধ্যে পার্থক্যগুলির জন্য স্পষ্টভাবে পরীক্ষা করার ক্ষমতা (অর্থাত্ তাত্পর্যপূর্ণ তাত্পর্যটি উল্লেখযোগ্য পার্থক্য বোঝায় না)।


2
এই উত্তরটি খুব সংক্ষিপ্ত। একটি উত্তর চেয়ে মন্তব্য।
এরিক পিটারসন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.