কোন অবস্থার অধীনে একাধিক স্তর / শ্রেণিবিন্যাস বিশ্লেষণ ব্যবহার করা উচিত?


36

কোন মৌলিক / ieতিহ্যগত বিশ্লেষণের (যেমন, আনোভা, ওএলএস রিগ্রেশন ইত্যাদি) বিপরীতে মাল্টিলেভেল / হায়ারারিকিকাল বিশ্লেষণকে ব্যবহার করার বিষয়ে কারও বিবেচনা করা উচিত? এমন কোনও পরিস্থিতি রয়েছে যেখানে এটিকে বাধ্যতামূলক হিসাবে বিবেচনা করা যেতে পারে? এমন কোন পরিস্থিতি রয়েছে যেখানে মাল্টিলেভেল / শ্রেণিবদ্ধ বিশ্লেষণগুলি অনুপযুক্ত? শেষ অবধি, মাল্টিলেভেল / শ্রেণিবিন্যাস বিশ্লেষণ শিখতে শিক্ষানবিদের জন্য কিছু ভাল সংস্থান কী কী?


3
আরও দেখুন: stats.stackexchange.com/a/38430/5739
StasK

উত্তর:


22

যখন আপনার ডেটার কাঠামোটি প্রাকৃতিকভাবে শ্রেণিবদ্ধ বা নেস্টেড থাকে, তখন মাল্টিলেভেল মডেলিং একজন ভাল প্রার্থী। আরও সাধারণভাবে, ইন্টারঅ্যাকশনগুলির মডেল করার এটি একটি পদ্ধতি।

একটি প্রাকৃতিক উদাহরণ হ'ল যখন আপনার ডেটা এমন একটি সংগঠিত কাঠামোর মতো যখন দেশ, রাজ্য, জেলা, যেখানে আপনি সেই স্তরের প্রভাবগুলি পরীক্ষা করতে চান। আপনি যেমন একটি কাঠামো ফিট করতে পারেন যেখানে অন্য একটি উদাহরণ দ্রাঘিমাংশ বিশ্লেষণ, যেখানে আপনি সময়ের সাথে অনেকগুলি বিষয় থেকে বার বার পরিমাপ করেছেন (উদাহরণস্বরূপ কোনও ড্রাগের ডোজ সম্পর্কে কিছু জৈবিক প্রতিক্রিয়া)। আপনার মডেলটির একটি স্তর সময়ের সাথে সমস্ত বিষয়গুলির জন্য একটি গ্রুপ গড় প্রতিক্রিয়া ধরে নেয়। আপনার মডেলের আর একটি স্তর তারপরে পৃথক পার্থক্যের মডেল করার জন্য গোষ্ঠী থেকে ব্যর্থতা (এলোমেলো প্রভাব) এর অনুমতি দেয়।

শুরু করার জন্য একটি জনপ্রিয় এবং ভাল বই হ'ল রিলেশন এবং মাল্টিলেভেল / হায়ারাকিকাল মডেলগুলি ব্যবহার করে গেলম্যানের ডেটা অ্যানালাইসিস


3
আমি এই উত্তরের দ্বিতীয়টি এবং ঠিক এই বিষয়ে আরও একটি দুর্দান্ত রেফারেন্স যুক্ত করতে চাই: সিঙ্গার প্রয়োগযুক্ত অনুদায়ী ডেটা বিশ্লেষণ পাঠ্য < gseacademic.harvard.edu/alda >। যদিও এটি অনুদৈর্ঘ্য বিশ্লেষণের সাথে সুনির্দিষ্ট, এটি সাধারণভাবে এমএলএমের একটি সুন্দর ওভারভিউ দেয়। আমি স্নিডিজার এবং বোকারের মাল্টিলেভেল এনালাইসিস ভাল এবং পঠনযোগ্য < স্ট্যাটাম.আম্ম.আর.গ.এনএল / মাল্টিলেভেল htm > পেয়েছি । জন ফক্স এখানে < cran.r-project.org/doc/contrib/Fox-Companion/… > এ এই মডেলগুলির জন্য একটি দুর্দান্ত পরিচয়ও সরবরাহ করে
ব্রেট

আপনার প্রতিক্রিয়াগুলির জন্য আপনাকে সকলকে ধন্যবাদ :) একটি ফলোআপ প্রশ্ন হিসাবে, বেশিরভাগ ডেটা প্রাকৃতিকভাবে শ্রেণিবদ্ধ / নেস্টেড হিসাবে ধারণা করা যায় না? উদাহরণস্বরূপ, বেশিরভাগ মনস্তাত্ত্বিক অধ্যয়নের ক্ষেত্রে ব্যক্তির মধ্যে নেস্টেড বেশ কয়েকটি নির্ভরশীল ভেরিয়েবল (প্রশ্নাবলী, উদ্দীপনা প্রতিক্রিয়া, ইত্যাদি ...) থাকে যা দুটি বা আরও বেশি গ্রুপের মধ্যে বাসা বেধে থাকে (এলোমেলোভাবে বা অযৌক্তিকভাবে নির্ধারিত)। আপনি কি সম্মত হন যে এটি প্রাকৃতিকভাবে শ্রেণিবিন্যাসিক এবং / অথবা নেস্টেড ডেটা কাঠামোকে উপস্থাপন করে?
প্যাট্রিক

আপনার মধ্যে যদি মাল্টিলেভেল / হায়ারারিকালিকাল গুরুরা কয়েক মিনিট সময় বেঁচে থাকতে পারে তবে আমি খুব কৃতজ্ঞ হব যদি আপনি কোনও আলাদা পোস্টে পোস্ট করা বিশ্লেষণ প্রশ্নগুলিতে বিবেচনা করতে পারেন ( stats.stackexchange.com/questions/1799/… )। বিশেষত, আপনি কি মনে করেন যে সেই পোস্টে বর্ণিত ব্যথা উপলব্ধির ডেটাটি হায়ারারিকিকাল বিশ্লেষণ দ্বারা অ-স্তরবিন্যাস বিশ্লেষণের চেয়ে আরও ভালভাবে বিশ্লেষণ করা যেতে পারে? অথবা এটি কোনও পার্থক্য তৈরি করবে না এমনকি অনুপযুক্তও হবে না? ধন্যবাদ: ডি
প্যাট্রিক

18

মাল্টিলেভেল মডেলিংয়ের জন্য সেন্টারটিতে মাল্টি-লেভেল মডেলিংয়ের জন্য কিছু ভাল ফ্রি অনলাইন টিউটোরিয়াল রয়েছে এবং তাদের এমএলভিএন সফটওয়্যার এবং স্টাটা উভয় ক্ষেত্রেই ফিটিং মডেলের জন্য সফ্টওয়্যার টিউটোরিয়াল রয়েছে।

একে ধর্মবিরোধী হিসাবে বিবেচনা করুন, কারণ আমি বইয়ের একটি অধ্যায়ের চেয়ে বেশি পড়িনি, তবে হায়ারারিকিকাল লিনিয়ার মডেল: অ্যাপ্লিকেশন এবং ডেটা বিশ্লেষণের পদ্ধতিগুলি স্টিফেন ডাব্লু রাউডেনবুশের দ্বারা, অ্যান্টনি এস ব্রাইক অত্যন্ত প্রস্তাবিত। আমি আরও শপথ করেছিলাম যে স্প্রিংগার ইউজ আর-তে আর সফ্টওয়্যার ব্যবহার করে মাল্টি লেভেল মডেলিংয়ের উপর একটি বই ছিল! সিরিজ, তবে আমি এই মুহুর্তে এটির সন্ধান করতে পারছি না (আমি ভেবেছিলাম এটি একই লোকেরা লিখেছিলেন যা আ বিগিনিয়ার গাইড টু আর বইটি লিখেছিল)।

সম্পাদনা: মাল্টি-লেভেল মডেলের জন্য আর ব্যবহারের বইটি হল ইকোলজির মিশ্রিত প্রভাব মডেলস এবং এক্সটেনশনগুলির সাথে জুয়ার, এএফ, আইএনও, এন, ওয়াকার, এন।, সাভেলিভ, এএ, স্মিথ, জিএম

শুভকামনা


9

মাল্টিলেভেল বনাম রিগ্রেশন মডেলগুলি ব্যবহার করার বিষয়ে এখানে অন্য দৃষ্টিভঙ্গি রয়েছে: আফশার্টাস এবং ডি লিউউয়ের একটি আকর্ষণীয় গবেষণাপত্রে তারা দেখায় যে মডেলিংয়ের উদ্দেশ্য যদি ভবিষ্যদ্বাণীপূর্ণ হয় (যা নতুন পর্যবেক্ষণের পূর্বাভাস দেওয়া হয়) তবে মডেলটির পছন্দটি কখন থেকে আলাদা? লক্ষ্যটি হ'ল অনুকরণ (যেখানে আপনি ডেটা স্ট্রাকচারের সাথে মডেলটি মেলানোর চেষ্টা করেন)। আমি যে কাগজটি উল্লেখ করছি তা হ'ল

আফশারটোস, ডি, ডি লিউউ, জে। (2005)। বহুস্তরের মডেলগুলিতে ভবিষ্যদ্বাণী। জে শিক্ষাত। Behav। পরিসংখ্যানবিৎ। 30 (2): 109-139।

আমি এই লেখকদের এখানে অন্য একটি সম্পর্কিত কাগজ সন্ধান করেছি: http://moya.bus.miami.edu/~dafshartous/Afshartous_CIS.pdf


6

yis=αs+Xisβs+ϵis,
yisisXisβsαগুলিεআমিগুলিαগুলি

হাতে থাকা মডেলটি নিয়ে বিষয়টি অনুমানের অন্যতম হয়ে ওঠে। আপনার যদি প্রতিটি বিদ্যালয়ের জন্য প্রচুর স্কুল এবং প্রচুর ডেটা থাকে তবে ওএলএসের দুর্দান্ত বৈশিষ্ট্যগুলি (অ্যাংজিস্ট এবং পিসকে দেখুন, বেশিরভাগ ক্ষতিগ্রস্থ ..., একটি বর্তমান পর্যালোচনার জন্য) প্রস্তাব করুন যে আপনি নির্ভরতাগুলির জন্য অ্যাকাউন্টে মানক ত্রুটির সাথে উপযুক্ত সমন্বয় করে এবং স্কুল স্তরের প্রভাব এবং স্কুল নির্দিষ্ট ইন্টারসেপ্টে পেতে ডামি ভেরিয়েবল এবং ইন্টারঅ্যাকশন ব্যবহার করে এটি ব্যবহার করতে চাইবেন। ওএলএস অদক্ষ হতে পারে তবে এটি এত স্বচ্ছ যে আপনি যদি এটি ব্যবহার করেন তবে সংশয়ী শ্রোতাদের বোঝানো আরও সহজ। তবে যদি আপনার ডেটা নির্দিষ্ট উপায়ে অপ্রতুল হয় --- বিশেষত যদি কিছু বিদ্যালয়ের জন্য আপনার কিছু পর্যবেক্ষণ থাকে --- আপনি সমস্যার জন্য আরও "কাঠামো" চাপিয়ে দিতে চাইতে পারেন। যদি প্রাক্কলনটি কোনও কাঠামো না দিয়ে করা হয় তবে আপনি ছোট-নমুনা স্কুলগুলিতে যে শোরগোলের প্রাক্কলন করতে পারবেন তার গোলমাল অনুমানের উন্নতির জন্য আপনি বৃহত্তর-নমুনা স্কুলগুলির "শক্তি ধার" করতে চাইতে পারেন। তারপরে, আপনি এফজিএলএসের মাধ্যমে অনুমান করা এলোমেলো প্রভাবগুলির মডেলটিতে ফিরে যেতে পারেন,

এই উদাহরণস্বরূপ, একাধিক স্তরের মডেল ব্যবহার (তবে আমরা এটি ফিট করার সিদ্ধান্ত নিই, শেষ পর্যন্ত) স্কুল-স্তরের বাধাগুলিতে সরাসরি আগ্রহের দ্বারা অনুপ্রাণিত হয়। অবশ্যই, অন্যান্য পরিস্থিতিতে এই গ্রুপ স্তরের প্যারামিটারগুলি উপদ্রব ছাড়া আর কিছু হতে পারে না। আপনার তাদের জন্য সামঞ্জস্য করা দরকার কিনা (এবং, তাই এখনও কিছু ধরণের বহুস্তরের মডেল নিয়ে কাজ করা হয়) নির্দিষ্ট শর্তসাপেক্ষ exogeneity অনুমান ধারণ করে কিনা তার উপর নির্ভর করে। তারপরে, আমি প্যানেল ডেটা পদ্ধতিতে একনোমেট্রিক সাহিত্যের সাথে পরামর্শ করার পরামর্শ দেব; সেখান থেকে বেশিরভাগ অন্তর্দৃষ্টিগুলি সাধারণ গোষ্ঠীযুক্ত ডেটা প্রসঙ্গে চলে carry


1
এটি একটি পুরানো থ্রেড, তবে আপনি এটি পড়ার ক্ষেত্রে: ডামি ভেরিয়েবল এবং ইন্টারঅ্যাকশন সহ ওএলএস আপনার উল্লেখ করা অন্যান্য কৌশলগুলির মতো শক্তি ধার করে না, তাই না? আমার কিছু তথ্য রয়েছে যেখানে আমি আমার বিশ্লেষণকে দুটি ভাগে ভাগ করেছি এবং দুটি অংশের মডেল করার জন্য দুটি এলএম (আর লিনিয়ার মডেল) কমান্ড ব্যবহার করেছি। আমি দুটি অংশ চিহ্নিত করার জন্য একটি ডামি ভেরিয়েবল প্রবর্তন করেছি, তারপরে এই "ইউনিফাইড" মডেলটিতে আবার এলএম ব্যবহার করেছি এবং উত্তরগুলি নিকটে রয়েছে, তবে একই নয়। আমার প্রশ্নটি হবে: উত্তরটি কি "ভাল", বা অ্যালগোরিদমের কারণে কেবল আলাদা?
ওয়েইন

@ ওয়াইন: আপনি যদি দ্বিতীয়টিতে ডামি এবং সম্পূর্ণ ইন্টারঅ্যাকশন ব্যবহার করেন তবে পয়েন্টের অনুমানটি একই হবে। স্ট্যান্ডার্ড ত্রুটিগুলি পৃথক হতে পারে কারণ দ্বিতীয় পদ্ধতিটি উচ্চতর ডিগ্রি স্বাধীনতার অনুমান করতে পারে তবে আপনি এটি সঠিক মডেলিং অনুমান কিনা তা পরীক্ষা করতে চান।
সাইরাস এস

6

নামটি যেমন সুপারিশ করে, মাল্টি-লেভেল মডেলিং উপযুক্ত, যখন আপনার ডেটাতে বিভিন্ন স্তরে (স্বতন্ত্র, সময়ের সাথে সাথে, ডোমেনের উপর দিয়ে ইত্যাদি) প্রভাব থাকে। একক স্তরের মডেলিং ধরে নিচ্ছে যে সর্বনিম্ন স্তরে ঘটছে। মাল্টি-লেভেল মডেল আরেকটি জিনিস যা নেস্টেড ইউনিটগুলির মধ্যে পারস্পরিক সম্পর্ক স্থাপন করে। সুতরাং একই স্তর -২ ইউনিটের মধ্যে স্তর -১ ইউনিট পারস্পরিক সম্পর্কযুক্ত হবে।

কিছুটা অর্থে আপনি "স্বতন্ত্রবাদী মিথ্যাবাদ" এবং "বাস্তুসংক্রান্ত তাত্পর্য" এর মধ্যবর্তী স্থলটি খুঁজে পাওয়ার জন্য বহু-স্তরের মডেলিংয়ের কথা ভাবতে পারেন। স্বতন্ত্রবাদী মিথ্যাচার তখন হয় যখন "সম্প্রদায়গত প্রভাবগুলি" যেমন একজন শিক্ষার্থীর শিখার স্টাইলের সাথে একজন শিক্ষকের স্টাইলের সামঞ্জস্যতা যেমন উপেক্ষা করা হয়, উদাহরণস্বরূপ (প্রভাবটি একাকী ব্যক্তি থেকে এসেছে বলে ধরে নেওয়া হয়, তাই কেবল মাত্র 1 পর্যায়ে রিগ্রেশন করুন)। যদিও "বাস্তুসংক্রান্ত তাত্পর্য" এর বিপরীত, এবং মনে করার মতো এটি হবে সেরা শিক্ষকটি সর্বোত্তম গ্রেড সহ শিক্ষার্থীদের নিয়ে থাকে (এবং যাতে স্তর -1 প্রয়োজন হয় না, কেবল মাত্র 2 পর্যায়ে পুরোপুরি রিগ্রেশন করুন)। বেশিরভাগ সেটিংসে উভয়ই উপযুক্ত নয় (ছাত্র-শিক্ষক একটি "শাস্ত্রীয়" উদাহরণ)।

yijj


4

সাধারণত, একটি শ্রেণিবিন্যাসিক বেইসিয়ান (এইচবি) বিশ্লেষণ বললে দক্ষ এবং স্থিতিশীল স্বতন্ত্র স্তরের অনুমানের দিকে পরিচালিত হবে যদি না আপনার ডেটা এমন হয় যে স্বতন্ত্র স্তরের প্রভাব সম্পূর্ণ একজাতীয় (অবাস্তব দৃশ্য) না হয়। এইচবি মডেলের দক্ষতা এবং স্থিতিশীল প্যারামিটার অনুমানগুলি সত্যই গুরুত্বপূর্ণ হয়ে ওঠে যখন আপনার কাছে স্পার্স ডেটা থাকে (যেমন, স্বতন্ত্র স্তরের প্যারামিটারের সংখ্যার চেয়ে কম পরিমাণে) এবং আপনি যখন পৃথক স্তরের অনুমানটি নির্ধারণ করতে চান।

তবে এইচবি মডেলগুলি অনুমান করা সর্বদা সহজ নয়। অতএব, এইচবি বিশ্লেষণ সাধারণত অ-এইচবি বিশ্লেষণকে ট্রাম্প করার সময় আপনার অতীত অভিজ্ঞতা এবং সময় এবং ব্যয়ের ক্ষেত্রে আপনার বর্তমান অগ্রাধিকারের ভিত্তিতে আপেক্ষিক ব্যয় বেনিফিটের তুলনা করতে হয়।

বলার পরেও যে আপনি যদি স্বতন্ত্র স্তরের অনুমানের প্রতি আগ্রহী না হন তবে আপনি কেবল একটি সামগ্রিক স্তরের মডেলটি অনুমান করতে পারেন তবে এই সমস্ত ক্ষেত্রেও স্বতন্ত্র স্তরের প্রাক্কলন ব্যবহার করে এইচবির মাধ্যমে একত্রিত মডেলগুলি অনুমান করা অনেক অর্থবোধ করতে পারে।

সংক্ষেপে, এইচবি মডেলগুলিকে ফিট করার জন্য যতক্ষণ আপনার সময় এবং ধৈর্য থাকে ততক্ষণ সেগুলি প্রস্তাবিত পদ্ধতি। এরপরে আপনার এইচবি মডেলের কার্যকারিতা মূল্যায়নের জন্য আপনি সামগ্রিক মডেলগুলি একটি মানদণ্ড হিসাবে ব্যবহার করতে পারেন।


আপনার বিশদ জবাবের জন্য আপনাকে ধন্যবাদ শ্রীকান্ত :) আমি বর্তমানে বায়সিয়ান বিশ্লেষণের সাথে পরিচিত নই, তবে আমি যে বিষয়গুলির তদন্ত করতে চাচ্ছি তার মধ্যে আমি অন্যতম। এই পৃষ্ঠায় আলোচিত অন্যান্য বহু স্তর / শ্রেণিবদ্ধ বিশ্লেষণগুলির চেয়ে হায়ারার্কিকাল বায়েশিয়ান বিশ্লেষণ কি আলাদা? যদি তাই হয় তবে আপনার কাছে আগ্রহী পক্ষগুলি আরও জানার জন্য প্রস্তাবিত সংস্থান আছে?
প্যাট্রিক

βআমি~এন(β¯,Σ) এবং β¯~এন(,)জনসংখ্যা স্তরে রেফারেন্সের জন্য: অন্যান্য উত্তর দেখুন।

4

আমি স্নিজডার্স এবং বোকারের কাছ থেকে শিখেছি, মাল্টিলেভেল এনালাইসিস: বেসিক এবং অ্যাডভান্সড মাল্টিলেভেল মডেলিংয়ের একটি ভূমিকা। এটি আমার মনে হয় যে শুরুর দিকে এটি খুব ভালভাবে তৈরি হয়েছে, এটি অবশ্যই হওয়া উচিত কারণ আমি এই বিষয়গুলিতে উদ্বিগ্ন এবং এটি আমার কাছে বোধগম্য হয়েছিল।

আমি জেলম্যান এবং হিলকেও দ্বিতীয়, সত্যিকারের একটি উজ্জ্বল বই।


1

যখন শ্রেণিবদ্ধ কাঠামোতে ডেটা বাসা বেঁধে দেওয়া হয়, বিশেষত যখন নির্ভরশীল ভেরিয়েবলের উচ্চ স্তরের ইউনিটের মধ্যে উল্লেখযোগ্য পার্থক্য থাকে (যেমন, শিক্ষার্থীর অর্জনের দিকনির্দেশনা শিক্ষার্থীদের মধ্যে এবং শিক্ষার্থীদের মধ্যে যে ক্লাসগুলির মধ্যেও পার্থক্য থাকে) এর মধ্যে বহু স্তরের মডেলদের নিয়োগ করা উচিত নেস্টেড হয়)। এই পরিস্থিতিতে পর্যবেক্ষণগুলি স্বাধীনের চেয়ে ক্লাস্টারড হয়। ক্লাস্টারিংটিকে অ্যাকাউন্টে না নেওয়ার ফলে প্যারামিটারের অনুমানের ত্রুটি, পক্ষপাতিত্বপূর্ণ তাত্পর্য পরীক্ষা করা এবং নালটিকে বজায় রাখার প্রবণতাটি অস্বীকার করার প্রবণতা দেখা দেয়। বহু স্তরের মডেলগুলি ব্যবহারের যুক্তি, পাশাপাশি বিশ্লেষণগুলি কীভাবে সম্পাদন করতে হবে তার বিশদ বিবরণ সরবরাহ করেছেন

রউদেনবুশ, এসডাব্লু ব্রিক, এএস (2002)। শ্রেণিবদ্ধ রৈখিক মডেল: অ্যাপ্লিকেশন এবং ডেটা বিশ্লেষণ পদ্ধতি। ২ য় সংস্করণ। নিউবারি পার্ক, সিএ: সেজ।

আর অ্যান্ড বি বইটি লেখকদের এইচএলএম সফ্টওয়্যার প্যাকেজের সাথেও ভালভাবে সংহত হয়েছে, যা প্যাকেজ শিখতে দুর্দান্ত সহায়তা করে। কয়েকটি বিকল্পের (যেমন ডামি কোডিং উচ্চ স্তরের ইউনিটগুলির) কেন মাল্টি-লেভেল মডেলগুলি প্রয়োজনীয় এবং পছন্দনীয় তার একটি ব্যাখ্যা একটি ক্লাসিক কাগজে সরবরাহ করা হয়েছে

হফম্যান, ডিএ (1997)। হায়ারিকিকাল লিনিয়ার মডেলগুলির যুক্তি এবং যুক্তিগুলির একটি ওভারভিউ। জার্নাল অফ ম্যানেজমেন্ট, 23, 723-744।

আপনি যদি "হফম্যান 1997 এইচএলএম" গুগল করেন এবং অনলাইনে পিডিএফ অ্যাক্সেস করেন তবে হফম্যান কাগজটি বিনামূল্যে ডাউনলোড করা যাবে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.