ফলাফল ভেরিয়েবলের জন্য একাধিক অনুদান


18

আমি কৃষি পরীক্ষায় একটি ডেটাসেট পেয়েছি। আমার প্রতিক্রিয়া পরিবর্তনশীল একটি প্রতিক্রিয়া অনুপাত: লগ (চিকিত্সা / নিয়ন্ত্রণ)। আমি কী পার্থক্যটির মধ্যস্থতা নিয়ে আগ্রহী, তাই আমি আরই মেটা-রেগ্রেশনগুলি চালাচ্ছি (অপরিচ্ছন্ন, কারণ এটি পরিষ্কার স্পষ্ট বলে মনে হয় যে প্রভাবের আকারটি অনুমানের ভিন্নতার সাথে সম্পর্কযুক্ত নয়)।

প্রতিটি সমীক্ষায় শস্যের ফলন, বায়োমাস ফলন বা উভয়ই রিপোর্ট করা হয়। আমি অধ্যয়নগুলি থেকে শস্যের ফলনকে অঙ্কিত করতে পারি না যে বায়োমাসের ফলন একা প্রকাশ করে, কারণ অধ্যয়ন করা সমস্ত গাছপালা শস্যের জন্য কার্যকর ছিল না (উদাহরণস্বরূপ, আখ অন্তর্ভুক্ত রয়েছে)। কিন্তু শস্য উত্পাদনকারী প্রতিটি উদ্ভিদের বায়োমাস ছিল।

অনুপস্থিত covariates জন্য, আমি পুনরাবৃত্তি রিগ্রেশন অভিশাপ ব্যবহার করছি (অ্যান্ড্রু গ্যালম্যানের পাঠ্যপুস্তক অধ্যায় অনুসরণ)। এটি যুক্তিসঙ্গত ফলাফল দেয় বলে মনে হয় এবং পুরো প্রক্রিয়াটি সাধারণত স্বজ্ঞাত। মূলত আমি অনুপস্থিত মানগুলির পূর্বাভাস করি এবং অনুপস্থিত মানগুলির পূর্বাভাস দেওয়ার জন্য সেই পূর্বাভাসিত মানগুলি ব্যবহার করি এবং প্রতিটি ভেরিয়েবল আনুমানিক রূপান্তর না হওয়া পর্যন্ত (বিতরণে) প্রতিটি ভেরিয়েবলের মধ্য দিয়ে লুপ করি।

অনুপস্থিত ফলাফলের ডেটা গণ্য করতে আমি একই প্রক্রিয়াটি ব্যবহার করতে পারি না এমন কোনও কারণ আছে কি? আমি বায়োমাস প্রতিক্রিয়া অনুপাত প্রদত্ত শস্য প্রতিক্রিয়া অনুপাত, শস্যের ধরণ এবং আমার কাছে থাকা অন্যান্য কোভারিয়েটগুলির জন্য সম্ভবত তুলনামূলকভাবে তথ্যমূলক ইমপুটেশন মডেল গঠন করতে পারি। আমি তখন সহগ এবং ভিসিভির গড় গড় করব এবং মান অনুশীলন অনুসারে এমআই সংশোধন যুক্ত করব।

ফলাফলগুলি যখন অঙ্কিত করা হয় তখন এই সহগগুলি কী পরিমাপ করবেন? কোফেরিয়েন্টদের ব্যাখ্যা কি কোয়ারিয়ারেটের জন্য স্ট্যান্ডার্ড এমআই এর চেয়ে আলাদা? এটি নিয়ে চিন্তা করে, আমি নিজেকে বোঝাতে পারি না যে এটি কাজ করে না, তবে আমি সত্যই নিশ্চিত নই। পড়া উপাদান জন্য চিন্তাভাবনা এবং পরামর্শ স্বাগত।


আমি উত্তরটি পাইনি, তবে একটি প্রশ্ন এবং দুটি নোট: 1) একটি অনুপাতের লগ অবশ্যই লগের পার্থক্য। সুতরাং আপনার ডিভি লগ (চিকিত্সা) - লগ (নিয়ন্ত্রণ) এর সমতুল্য। ২) গেলম্যানের কোন পাঠ্যপুস্তকটি আপনি দেখছিলেন?
পিটার ফ্লুম - মনিকা পুনরায়

হ্যাঁ, ডিভি লগ (চিকিত্সা) -লগ (নিয়ন্ত্রণ) এর সমতুল্য। আমি (অপ্রযুক্তিগত) অধ্যায় উপর পুনরাবৃত্ত রিগ্রেশন নিন্দা ভিত্তিবিন্দু করছি অনুপস্থিত তথ্য যে Gelman অনলাইনে পোস্ট করেছে: stat.columbia.edu/~gelman/arm/missing.pdf
generic_user

আমাকে বলা হয়েছে যে ফলাফলটি ফলশ্রুতিতে মন্টি কার্লো ত্রুটির দিকে পরিচালিত করে। পরে কোনও লিঙ্ক খোঁজার চেষ্টা করবে। ভুলে যাবেন না যে আপনাকে সিভেরিয়েটদের জন্য অভিষেকের মডেলগুলিতে ফলাফলটি অন্তর্ভুক্ত করতে হবে তা নিশ্চিত করা দরকার।
ডিএল ডাহলি

উত্তর:


20

আপনার সন্দেহ হিসাবে, ফলাফল পরিমাপের জন্য একাধিক অভিব্যক্তি ব্যবহার করা বৈধ। এমন কিছু ক্ষেত্রে রয়েছে যেখানে এটি কার্যকর, তবে এটি ঝুঁকিপূর্ণও হতে পারে। আমি পরিস্থিতি বিবেচনা করি যেখানে সমস্ত সমবায়ীরা সম্পূর্ণ এবং ফলাফল অসম্পূর্ণ।

যদি ইমপুটেশন মডেলটি সঠিক হয় তবে আমরা অভিযুক্ত ডেটা থেকে প্যারামিটারের অনুমানগুলিতে বৈধ সূচনাগুলি গ্রহণ করব। কেবলমাত্র সম্পূর্ণ কেসগুলি থেকে প্রাপ্ত সূত্রগুলি ভুল হতে পারে যদি অনুপস্থিতির উপর কন্ডিশনার পরে ফলাফলটির সাথে নিখোঁজ হওয়া সম্পর্কিত, যেমন এমএনএআরের অধীনে missing সুতরাং ডেটা এমএনআর হ'ল আমরা যদি (বা সন্দেহভাজন) জানি তবে অভিবাসন কার্যকর useful

এমএআর এর অধীনে, ফলাফলটি গণ্য করার জন্য কোনও সুবিধা নেই এবং সংখ্যার কম সংখ্যক ফলাফলের জন্য সিমুলেশন ত্রুটির কারণে ফলাফলগুলি কিছুটা আরও পরিবর্তনশীল হতে পারে। এটির জন্য একটি গুরুত্বপূর্ণ ব্যতিক্রম রয়েছে। যদি আমাদের একটি অক্সিলারি সম্পূর্ণ ভেরিয়েবল অ্যাক্সেস থাকে যা মডেলের অংশ নয় এবং এটি ফলাফলের সাথে খুব বেশি সংযুক্ত থাকে তবে পূর্ণাঙ্গ ক্ষেত্রে বিশ্লেষণের চেয়ে অনুচ্ছেদ যথেষ্ট দক্ষ হতে পারে, যার ফলে আরও সুনির্দিষ্ট অনুমান এবং সংক্ষিপ্ত আত্মবিশ্বাসের অন্তর অন্তর্ভুক্ত হয়। একটি সাধারণ পরিস্থিতি যেখানে এটি ঘটে তা হ'ল যদি আমাদের প্রত্যেকের জন্য সস্তা ফলাফলের পরিমাপ হয় এবং একটি উপসেটের জন্য ব্যয়বহুল পরিমাপ হয়।

অনেক ডেটা সেটে, হারিয়ে যাওয়া ডেটা স্বতন্ত্র ভেরিয়েবলগুলিতেও ঘটে। এই ক্ষেত্রে, আমাদের ফলাফল ভেরিয়েবলকে গুনতে হবে কারণ স্বাধীন ভেরিয়েবলগুলি গণ্য করার জন্য এর অভিযুক্ত সংস্করণটির প্রয়োজন।


ধন্যবাদ, এটি আমার স্বজ্ঞাততার সাথে সামঞ্জস্যপূর্ণ তবে আপনি সম্ভবত একটি ভালভাবে প্রকাশিত গবেষণার লিঙ্কটি ভাগ করে নিতে পারেন যা নির্ভরশীল ভেরিয়েবলগুলিকে বোঝায়? আমি ফলাফলের ব্যবস্থাগুলি গণ্য করতে চাইছি তার একটি প্রধান কারণ হ'ল জিএএম-এর অর্ধ-প্যারামিমেট্রিক টেনসর পণ্যের মিথস্ক্রিয়া শর্তগুলিতে খুব উচ্চ ডিএফ প্রয়োজনীয়তা রয়েছে (তারা পাওয়ার আগে) দণ্ডিত, এডিএফ হ্রাস)। এমআর আমার ক্ষেত্রে যুক্তিসঙ্গত।
জেনেরিক_উজার

1
আনোভা ভারসাম্যপূর্ণ ডিজাইন পেতে এটি ব্যাপকভাবে অনুশীলন করা হয়েছে। আরজেএ লিটলের পরিচয় দেখুন, নিখোঁজ এক্স এর সাথে জাগ্রত করুন, জাসা 1992. আমি মনে করি আপনি জানেন যে এইভাবে নমুনার আকার বাড়ানো আপনাকে আরও সুনির্দিষ্ট অনুমান পেতে সাহায্য করে না। সহায়ক ভেরিয়েবলের ক্ষেত্রে, ডিবি রুবিনে সুপার-দক্ষতার বিভাগটি পড়ুন, 18+ বছর পরে একাধিক মূল্যায়ন, জাসা 1996
স্টেফ ভ্যান বুউরেন

1
"এমএআর এর অধীনে, ফলাফলটি গণনা করার জন্য কোনও সুবিধা নেই" - আমি এর আগে উল্লেখ করেছি, তবে এর জন্য আমার কোনও রেফারেন্স নেই - আপনি কি দয়া করে একটি সরবরাহ করতে পারেন?
রবার্ট লং

আমি মনে করি আপনি এর জন্য লিটল 1992 tandfonline.com/doi/abs/10.1080/01621459.1992.10476282 উদ্ধৃত করতে পারেন , তবে দয়া করে ব্যতিক্রমগুলি লক্ষ্য করুন।
স্টিফ ভ্যান বুউরেন

1
@ স্টেভভান বুউরেন - বেশিরভাগ অংশের জন্য সহায়ক উত্তর, তবে আমার বোঝাটি হ'ল "যদি আমরা জানি (বা সন্দেহ করি) যে ডেটা এমএনআর" তবে অনুচ্ছেদে সম্পূর্ণ সমস্যা বিশ্লেষণের চেয়ে আমাদের সমস্যাগুলি আর সমাধান করতে পারে না। এটি "বিনামূল্যে লাঞ্চ নয়" বিভাগে পড়ে বলে মনে হচ্ছে।
Rolando2

2

ফলাফলের ডেটা বোঝা খুব সাধারণ এবং এলোমেলো ত্রুটির জন্য অ্যাকাউন্টিং করার সময় সঠিক অনুমানের দিকে পরিচালিত করে।

মনে হচ্ছে আপনি সম্পূর্ণ কেস বিশ্লেষণের অধীনে শর্তাধীন গড় সহ নিখোঁজ মানগুলি গণনা করে যা করছেন তা একক অনুমান is আপনার যা করা উচিত তা হ'ল একাধিক অনুমান যা অবিচ্ছিন্ন কোভেরেটের জন্য, আপনি এলোমেলোভাবে এই নিখোঁজ মানগুলি পরিমাপ করে যদি এলোমেলো ত্রুটিটি লক্ষ্য করেন তবে আপনি লক্ষ্য রাখতে পারেন। EM অ্যালগরিদম সম্ভাব্য পর্যবেক্ষণের বিভিন্ন ফলাফলের গড় ধরে একইভাবে কাজ করে।

যখন কোনও গড়-বৈসাদৃশ্য সম্পর্ক নেই তখন একক অনুমান মডেল প্যারামিটারগুলির সঠিক অনুমান দেয়, তবে এটি স্ট্যান্ডার্ড ত্রুটির প্রাক্কলন দেয় যা শূন্যের দিকে পক্ষপাতযুক্ত, প্রকারের প্রথম ত্রুটির হারকে বাড়িয়ে তোলে। এটি কারণ আপনি যদি এই কারণগুলি পরিমাপ করে থাকেন তবে আপনি যে পরিমাণ ত্রুটি লক্ষ্য করেছিলেন তা সম্পর্কে "আশাবাদী" হয়েছেন।

একাধিক অনুদান হ'ল শর্তসাপেক্ষে গড় অনুমানের জন্য পুনরায় সংযোজনমূলক ত্রুটি উত্পন্ন করার একটি প্রক্রিয়া, যাতে or বা ৮ সিমুলেটেড ইমপ্লুটেশনগুলির মাধ্যমে আপনি মডেলগুলির পরামিতিগুলির সঠিক অনুমান এবং তাদের স্ট্যান্ডার্ড ত্রুটিগুলি পেতে মডেল এবং তাদের ত্রুটিগুলি একত্রিত করতে পারেন। যদি আপনার যৌথভাবে সমাহার এবং ফলাফলগুলি অনুপস্থিত থাকে, তবে এসএএস, স্টাটা এবং আর এর মধ্যে সফ্টওয়্যার রয়েছে যাতে শৃঙ্খলিত সমীকরণের মাধ্যমে একাধিক অভিবাসন বলা হয় যেখানে "সম্পূর্ণ" ডেটাসেটগুলি (স্থির এবং অ-এলোমেলো হিসাবে গণ্যকৃত মানযুক্ত ডেটাসেট) তৈরি করা হয়, মডেল প্রতিটি সম্পূর্ণ ডেটাसेट থেকে অনুমিত প্যারামিটার এবং তাদের প্যারামিটারের অনুমান এবং মানগত ত্রুটিগুলি সঠিক গাণিতিক গঠনের (ভ্যান বুউরেন পেপারের বিশদ) ব্যবহার করে মিলিত হয়।

এমআইতে প্রক্রিয়া এবং আপনি বর্ণিত প্রক্রিয়ার মধ্যে সামান্য পার্থক্য হ'ল আপনি যে হিসাব করেননি তা প্রমাণিত ডেটা ব্যবহার করে ফলাফলের শর্তযুক্ত বিতরণ অনুমান করা নির্ভর করে আপনি কোন নির্দিষ্ট উপাদানকে গুনতে চান তার উপর নির্ভর করবে। এমআই- এর ফলাফল সম্পর্কে অনুপস্থিত কোভেরিয়েট কন্ডিশনার শর্তাধীন বিতরণটি আপনার অনুমান করা উচিত , অন্যথায় আপনি পক্ষপাতদুষ্ট প্যারামিটারের অনুমান পাবেন।


ধন্যবাদ। প্রথমে, আমি আর স্ক্র্যাচ থেকে সমস্ত কিছু প্রোগ্রাম করছি, মাইস বা এমআই ব্যবহার করছি না। দ্বিতীয়বার, আমি শর্তসাপেক্ষ প্রত্যাশা নয়, একটি (মডেলড) ভবিষ্যদ্বাণীপূর্ণ বিতরণের অঙ্কের সাথে অঙ্ক করছি। আপনি কি দ্বিতীয় অনুচ্ছেদে কথা বলছেন? যদি তা না হয় তবে আমি স্পষ্টতার প্রশংসা করব। এছাড়াও, আপনি কোন রয়স্টন কাগজ উল্লেখ করছেন? আপনার শেষ পয়েন্টের জন্য - আপনি "ইমপুটেশন মডেলটিতে আপনার নির্ভরশীল পরিবর্তনশীলটি রাখা উচিত" এর চেয়ে আরও জটিল কিছু বলছেন? যদি তা হয় তবে আমি স্পষ্টতার প্রশংসা করব।
জেনেরিক_উজার

সবশেষে - আমি একক অনুমান করছি না। আমি ডেটা ভরা এবং রবিনের ভি_বি = ডাব্লু + (1 + 1 / মি) বি সূত্র ব্যবহার করে 30 টি মডেল ফিট করছি।
জেনেরিক_উজার

রয়স্টন পেপার হাইপার লিঙ্কযুক্ত ছিল। আমি আসলে ভ্যান বুউরেনকে লিঙ্ক করতে চেয়েছিলাম যিনি এই প্রোগ্রামটি আর-তে প্রয়োগ করেছিলেন এবং এতে গণনার বিবরণ অন্তর্ভুক্ত রয়েছে: ডক্টিউটউইন্ট.এনএল / 9৮৯৩৩ মাইস / এমআই একটি প্রক্রিয়া। আপনি যদি বাড়ির বর্ধিত কোডের উপর ভিত্তি করে বোঝাচ্ছেন তবে আপনার বিশদটি আরও ভালভাবে বোঝানো উচিত। শর্তসাপেক্ষ অর্থ = মডেলটি সঠিক হলে (বা আনুমানিক তাই, একটি প্রয়োজনীয় অনুমান) মানযুক্ত pred "ফলাফল যুক্ত করার" চেয়ে এটি আরও জটিল, এটি হ'ল আপনি বেশ কয়েকটি নিখোঁজ নিদর্শন (কমপক্ষে 3, নিখোঁজ কোভারিয়েট / ফলাফল / যৌথভাবে অনুপস্থিত) ধরে রেখেছেন।
আদমো

আপনি যদি একাই পূর্বাভাসিত মানটি 30 বার অনুমান করছেন তবে আপনার 30 বার একই ফলাফল পাওয়া উচিত। আপনি কীভাবে ত্রুটিটি অনুমান করছেন?
অ্যাডমো

fit,imp
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.