একাধিক অভিব্যক্তি ব্যবহার করার সময় মিশ্র-প্রভাবগুলির মডেলটির বৈকল্পিক উপাদানগুলির জন্য আস্থা অন্তরগুলি কীভাবে একত্রিত করা যায়


20

একাধিক অভিব্যক্তির যুক্তি (এমআই) হ'ল অনুপস্থিত মানগুলি একবার নয় বরং বেশ কয়েকটি (সাধারণত এম = 5) বার অঙ্ক করা, ফলস্বরূপ এম সম্পূর্ণ ডেটাসেটের ফলস্বরূপ। এম সম্পূর্ণ হওয়া ডেটাসেটগুলি সম্পূর্ণ ডেটা পদ্ধতিগুলির সাথে বিশ্লেষণ করা হয় যার উপর এম অনুমান করে এবং তাদের স্ট্যান্ডার্ড ত্রুটিগুলি "সামগ্রিক" অনুমান এবং এর স্ট্যান্ডার্ড ত্রুটিটি পেতে রুবিনের সূত্রগুলি ব্যবহার করে মিলিত হয়।

এখনও অবধি দুর্দান্ত, তবে মিশ্র-প্রভাবগুলির মডেলটির ভেরিয়েন্স উপাদানগুলির সাথে সম্পর্কিত হলে এই রেসিপিটি কীভাবে প্রয়োগ করবেন তা আমি নিশ্চিত নই। কোনও বৈকল্পিক উপাদানটির নমুনা বিতরণ অসম্পৃক্ত - তাই সংশ্লিষ্ট আত্মবিশ্বাসের ব্যবধানটি আদর্শ "অনুমান ± 1.96 * সে (অনুমান)" আকারে দেওয়া যায় না। এই কারণে আর প্যাকেজ lme4 এবং nlme এমনকি বৈকল্পিক উপাদানগুলির স্ট্যান্ডার্ড ত্রুটি সরবরাহ করে না, তবে কেবল আত্মবিশ্বাসের অন্তর সরবরাহ করে।

অতএব আমরা একটি এমএটি সম্পাদন করতে পারি ডেটাসেটে এবং তারপরে এম সম্পন্ন ডেটাসেটগুলিতে একই মিশ্র-প্রভাব মডেলটি ফিট করার পরে ভেরিয়েন্স উপাদান প্রতি এম কনফিডেন্স ইন্টারভেলগুলি পেতে পারি। প্রশ্নটি হল এই এম অন্তরগুলিকে কীভাবে একটি "সামগ্রিক" আত্মবিশ্বাসের ব্যবধানে একত্রিত করা যায়।

আমার ধারণা এটি সম্ভব হবে - একটি নিবন্ধের লেখক (ইউসেল এবং ডেমিটারাস (২০১০) এমআই দ্বারা অনুকরণের উপর নরমাল এলোমেলো প্রভাবের প্রভাব) এটি সম্পন্ন হয়েছে বলে মনে হয়, তবে তারা ঠিক কীভাবে তা ব্যাখ্যা করে না।

কোনও টিপস অনেক বাধ্যবাধকতা হবে!

চিয়ার্স, রক


একটি খুব আকর্ষণীয় প্রশ্ন। আপনার ফলাফলগুলি শোনার জন্য আমি অপেক্ষা করছি, যদি আপনি সেগুলি ভাগ করতে চান ...
chl

@ সিএইচএল: ফলাফল শেষ হয়ে গেলে আমি আপনাকে টেবিলগুলি পাঠাতে পারি, তবে আমি সত্যিই নতুন কোনও আবিষ্কার করব না। এখন পর্যন্ত আমি কেবলমাত্র একটি সাধারণ সাধারণ মডেলের (দ্বি-স্তরের কাঠামো, আর প্যাকেজ আদর্শকে উপেক্ষা করে) এবং তালিকাবদ্ধভাবে মুছে ফেলার জন্য একটি দ্বি-স্তরের ইমপুটেশন মডেল (আর প্যাকেজ প্যান) এর অধীনে এমআইকে তুলনা করার পরিকল্পনা করছি। বিভিন্ন নমুনা আকারের অধীনে, বৈকল্পিক উপাদানগুলির মান ইত্যাদি etc. এটি সেমিনারের জন্য যথেষ্ট হওয়া উচিত (আমি পিএইচডি শিক্ষার্থী), তবে একেবারে গ্রাউন্ডব্রেকিং নয়। সিমুলেশন অধ্যয়ন কীভাবে "জাজ আপ" করবেন সে সম্পর্কে আপনার যদি কোনও ধারণা থাকে তবে আমি শুনতে আগ্রহী।
রক

1
অন্য একটি বিষয়: আমি নিশ্চিত নই যে এই সমস্যার সঠিক বিশ্লেষণাত্মক সমাধান এমনকি রয়েছে। আমি কিছু অতিরিক্ত সাহিত্যের দিকে নজর রেখেছি, তবে এই সমস্যাটি মার্জিতভাবে সর্বত্র দেখা গেছে। আমি এটাও লক্ষ্য করেছি যে ইউসেল ও ডেমিটারগুলি (আমি উল্লিখিত নিবন্ধে, পৃষ্ঠা 79৯৮) লিখেছেন: "এই গুণিতকৃত ডেটাসেটগুলি মডেলটি অনুমান করার জন্য ব্যবহৃত হয়েছিল […] আর প্যাকেজ lme4 ব্যবহার করে 10 সেট (বিটা, সে (বিটা)) ব্যবহার করে ), (সিগমা_ বি, সে (সিগমা_ বি)) যা পরে রুবিন দ্বারা নির্ধারিত এমআই সমন্বয়কারী বিধিগুলি ব্যবহার করে মিলিত হয়েছিল। "
রক

দেখে মনে হচ্ছে তারা ভেরিয়েন্স উপাদানটির এসই অনুমান করতে এক ধরণের শর্টকাট ব্যবহার করেছে (যা অবশ্যই, অনুপযুক্ত, যেহেতু সিআই অসমমিত) এবং ক্লাসিক সূত্রটি প্রয়োগ করেছিলেন।
রক

ঠিক আছে, তার জন্য THX। আপনি কি নিজের মন্তব্যগুলিকে একটি উত্তরে রেখে দিতে পারেন যাতে এটি ভোট দেওয়া যায়?
chl

উত্তর:


8

এইটা একটা ভালো প্রশ্ন! নিশ্চিত নয় যে এটি একটি সম্পূর্ণ উত্তর, তবে আমি যদি এই সাহায্য করে তবে এই কয়েকটি লাইন ফেলে দিন।

দেখে মনে হয় যে ইউসেল এবং ডেমিরিটাস (২০১০) জেসিজিএস-এ প্রকাশিত একটি পুরানো কাগজকে উল্লেখ করেছে, অনুপস্থিত মানগুলির সাথে মাল্টিভারিয়েট লিনিয়ার মিক্সড-ইফেক্ট মডেলগুলির গণনার কৌশলগুলি , যা ভিসিগুলির সম্ভাবনা-ভিত্তিক প্রাক্কলন তৈরির জন্য একটি হাইব্রিড ইএম / ফিশার স্কোরিং পদ্ধতির ব্যবহার করে । এটি আর প্যাকেজ এমএমএমএমএম প্রয়োগ করা হয়েছে । আমি জানি না, তবে এটি সিআই তৈরি করে কিনা।

অন্যথায়, আমি অবশ্যই WinBUGS প্রোগ্রামটি যাচাই করব , যা মূলত বহুবিধ মডেলগুলির জন্য ব্যবহৃত হয়, যার মধ্যে হারিয়ে যাওয়া ডেটা রয়েছে including আমি মনে করি মনে হয় এটি কেবলমাত্র তখনই কাজ করবে যদি আপনার এমভি প্রতিক্রিয়ার ভেরিয়েবলে থাকে, না কোভারিটিতে না কারণ আমাদের সাধারণত সম্পূর্ণ শর্তসাপেক্ষ বিতরণ নির্দিষ্ট করতে হয় (যদি এমভি স্বতন্ত্র ভেরিয়েবলগুলিতে উপস্থিত থাকে তবে এর অর্থ আমাদের অবশ্যই একটি অগ্রণী প্রদান করতে হবে) অনুপস্থিত এক্স, এবং এটি উইনবিইউজিএস দ্বারা অনুমান করা পরামিতি হিসাবে বিবেচিত হবে ...)। এটি আর এর সাথেও প্রযোজ্য বলে মনে হচ্ছে, যদি আমি lme, lmer, PROC MIXED- এ থাকা r- sig- মিশ্রিত, অনুপস্থিত ডেটাতে নীচের থ্রেডটি উল্লেখ করি । এছাড়াও, এটি এমএলভিআইএন সফ্টওয়্যারটি দেখার মতো হতে পারে ।


আপনার প্রতিউত্তরের জন্য ধন্যবাদ! নীতিগতভাবে আমি যেভাবে বর্ণনা করেছি তার মতো একটি কংক্রিট সমস্যা কীভাবে সমাধান করা যায় সে সম্পর্কেও আমি আগ্রহী (এইভাবে উইনবিগিজস টিপটির জন্য ধন্যবাদ)। তবে এই মুহুর্তে আমি একটি সেমিনার পেপারের জন্য একটি সিমুলেশন অধ্যয়ন করার চেষ্টা করছি যাতে আমি মডেলকে অপব্যবহারের অধীনে এমআই এর কার্যকারিতা (কভারেজ রেট ইত্যাদি) পরীক্ষা করতাম। আমি মনে করি যদি আমি কোনও সমাধান খুঁজে না পাই এবং স্থির প্রভাবগুলিতে মনোনিবেশ না করি তবে আমি কেবল তারতম্য উপাদানগুলি ভুলে যাব তবে এটি হালকা হতাশ।
রক

@ রোক সিমুলেশন জন্য দুর্দান্ত ধারণা! আমি এই নির্দিষ্ট ইস্যুটির জন্য অপেক্ষা করব আমি মনে করি আপনি ইতিমধ্যে আর-সিগ মিশ্রিত মেইলিং এবং মাল্টিলেভাল রিগ্রেশন সম্পর্কিত গেলম্যানের বইটি অনুসন্ধান করেছেন ...
chl

আমি এখন তাকালাম, রেফারেন্সের জন্য ট্যাঙ্ক! দুর্ভাগ্যক্রমে, আর-সিগ মিশ্রিত সংরক্ষণাগারগুলিতে এমআই-তে কিছুই নেই; এবং জেলম্যান কেবলমাত্র এমআই থেকে ইনফারেন্সগুলি কীভাবে সংযুক্ত করবেন সে সম্পর্কে কেবলমাত্র প্রাথমিক সূত্রটি দেয় যখন আমাদের প্রদত্ত অনুক্রমের মধ্যে এবং § 25.7 এর মধ্যে পার্থক্য থাকে।
রক

6

উপরে থেকে বারবার মন্তব্য:

আমি নিশ্চিত নই যে এই সমস্যার যথাযথ বিশ্লেষণাত্মক সমাধান এমনকি রয়েছে। আমি কিছু অতিরিক্ত সাহিত্যের দিকে নজর রেখেছি তবে এই সমস্যাটি সর্বত্র সর্বদা উপেক্ষা করা হবে। আমি এটাও লক্ষ্য করেছি যে ইউসেল ও ডেমিটারাস (আমি উল্লিখিত নিবন্ধে, পৃষ্ঠা 798) লিখেছেন:

এই গুণিতকৃত ডেটাসেটগুলি মডেলটি অনুমান করার জন্য ব্যবহৃত হয়েছিল […] আর প্যাকেজটি ব্যবহার করে lme410 সেট (বিটা, সে (বিটা)), (সিগমা_বি, সে (সিগমা_ বি)) সেট করে যা পরে সংজ্ঞায়িত এমআই সংমিশ্রণ বিধি ব্যবহার করে মিলিত হয়েছিল ঘষা.

দেখে মনে হচ্ছে তারা ভেরিয়েন্স উপাদানটির এসই অনুমান করতে এক ধরণের শর্টকাট ব্যবহার করেছে (যা অবশ্যই, অনুপযুক্ত, যেহেতু সিআই অসমমিত) এবং ক্লাসিক সূত্রটি প্রয়োগ করেছিলেন।


আমি প্রশংসা করি আপনি এই সমস্যার সাথে আপনার অভিজ্ঞতা ভাগ করে নেওয়ার জন্য ফিরে এসেছিলেন। দুর্ভাগ্যক্রমে, আমার কোনও বাস্তব সমাধান নেই তবে সম্ভবত অন্যান্য পরামর্শও সামনে আসবে।
chl

"মার্জিতভাবে অবহেলিত" ... সাহিত্য পর্যালোচনা করার জন্য এটি একটি দরকারী বাক্যাংশ যদি আমি কখনও শুনি।
ম্যাট পার্কার

3

দাবি অস্বীকার: এই ধারণাটি বোকামি হতে পারে এবং আমি যে প্রস্তাব দিচ্ছি তার তাত্ত্বিক প্রভাবগুলি বোঝার ভান করব না।

" পরামর্শ " : আপনি কেবল 100 টি গণনা করেন না কেন (আমি জানি আপনি সাধারণত 5 টি) ডেটাসেট করেন না, lme4 বা এনএমলে চালান, আত্মবিশ্বাসের অন্তরগুলি পান (আপনার 100 টি রয়েছে) এবং তারপরে:

একটি ছোট ব্যবধানের প্রস্থ ব্যবহার করুন (বলুন পরিসর / 1000 বা কিছু), প্রতিটি প্যারামিটারের সম্ভাব্য মানগুলির পরিসীমা পরীক্ষা করুন এবং কেবলমাত্র সেই ছোট ব্যবধানগুলি অন্তর্ভুক্ত করুন যা 100 সিআই এর অন্তত 95 টিতে প্রদর্শিত হয়। তারপরে আপনার নিজের আত্মবিশ্বাসের ব্যবধানগুলির একটি মন্টি কার্লো "গড়" থাকবে।

আমি নিশ্চিত যে এই পদ্ধতির সাথে সমস্যাগুলি (বা সম্ভবত তাত্ত্বিক সমস্যা) রয়েছে। উদাহরণস্বরূপ, আপনি পারে একটি সেট দিয়ে শেষ টুকরো করা অন্তর। এটি আপনার ক্ষেত্রের উপর নির্ভর করে খারাপ জিনিস হতে পারে বা নাও হতে পারে। নোট করুন যে আপনার যদি কমপক্ষে 95% এরও কম কভারেজ সহ একটি অঞ্চল দ্বারা পৃথক পৃথক পৃথকভাবে অন্তত দুটি সম্পূর্ণ অ-ওভারল্যাপিং আত্মবিশ্বাসের অন্তর থাকে তবে এটি কেবলমাত্র সম্ভব ।

আপনি উত্তরোত্তর বিশ্বাসযোগ্য অঞ্চলটি পাওয়ার জন্য বেইসিয়ান উপাত্তগুলির চিকিত্সার আরও কাছাকাছি বিবেচনা করতে পারেন যা অবশ্যই আরও ভালভাবে গঠন করা হবে এবং আমার তদবির পরামর্শের চেয়ে তাত্ত্বিকভাবে আরও সমর্থনযোগ্য

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.