পটভূমি: আমি বর্তমানে বিভিন্ন বায়েশিয়ান শ্রেণিবদ্ধ মডেলের তুলনা করে কিছু কাজ করছি। ডেটা অংশগ্রহনকারী i এবং সময় j এর জন্য মঙ্গলজনক সংখ্যার ব্যবস্থা । আমার প্রায় 1000 অংশগ্রহণকারী এবং প্রতি অংশগ্রহণকারী প্রতি 5 থেকে 10 টি পর্যবেক্ষণ রয়েছে।
বেশিরভাগ দ্রাঘিমাংশীয় ডেটাসেটের মতো, আমিও স্বতঃসম্পর্কতার এমন কিছু রূপ দেখতে প্রত্যাশা করছি যার দ্বারা সময়ের কাছাকাছি থাকা পর্যবেক্ষণগুলির আরও পৃথক পৃথকগুলির চেয়ে আরও বেশি পারস্পরিক সম্পর্ক রয়েছে। কয়েকটি জিনিস সরলকরণের জন্য, মৌলিক মডেলটি নিম্নরূপ:
যেখানে আমি কোনও ল্যাগ মডেল তুলনা করছি:
একটি ল্যাগ মডেল সহ:
যেখানে একজন ব্যক্তি-স্তরের গড় এবং β 1 হ'ল ল্যাগ প্যারামিটার (অর্থাত্ ল্যাগ এফেক্টটি সেই সময়ের বিন্দুর পূর্বাভাসিত মান থেকে পূর্ববর্তী সময় বিন্দু থেকে পর্যবেক্ষণের বিচ্যুতির একাধিক যোগ করে)। Y i 0 (যেমন, প্রথম পর্যবেক্ষণের আগে পর্যবেক্ষণ) অনুমান করার জন্য আমাকে কয়েকটি জিনিসও করতে হয়েছিল ।
আমি যে ফলাফলগুলি পাচ্ছি তা ইঙ্গিত করে যে:
- লেগ প্যারামিটার প্রায় .18, 95% সিআই [.14, .21] এর কাছাকাছি। অর্থাৎ এটি শূন্য নয়
- ল্যাগটি মডেলটিতে অন্তর্ভুক্ত করা হলে গড় বিচ্যুতি এবং ডিআইসি উভয়ই কয়েক শতাধিক বৃদ্ধি পায়
- উত্তরোত্তর ভবিষ্যদ্বাণীমূলক চেকগুলি দেখায় যে ল্যাগ ইফেক্টটি অন্তর্ভুক্ত করে, মডেলটি ডেটাতে স্বতঃসম্পর্ক পুনরুদ্ধার করতে আরও ভাল সক্ষম হয়
সুতরাং সংক্ষেপে, নন-শূন্য লেগ প্যারামিটার এবং উত্তরোত্তর ভবিষ্যদ্বাণীমূলক চেকগুলি ল্যাগ মডেলটি আরও ভাল বলে প্রস্তাব দেয়; তবুও ডিভ্যান্স এবং ডিআইসির অর্থ হ'ল ল্যাগ মডেলটি আরও ভাল। এই ধাঁধা আমার।
আমার সাধারণ অভিজ্ঞতাটি হ'ল আপনি যদি কোনও দরকারী প্যারামিটার যুক্ত করেন তবে এটির কমপক্ষে গড় বিচ্যুতি হ্রাস করা উচিত (এমনকি জটিলতার জরিমানার পরেও ডিআইসিকে উন্নত করা হয়নি)। তদুপরি ল্যাগ প্যারামিটারের শূন্যের মানটি কোনও ল্যাগ মডেলের মতোই বিচ্যুতি অর্জন করবে।
প্রশ্ন
ল্যাগ প্যারামিটারটি শূন্য নয় এবং এটি উত্তরোত্তর ভবিষ্যদ্বাণীমূলক পরীক্ষাগুলি উন্নত করেও কেন বায়েশিয়ান হায়ারার্কিকাল মডেলটিতে লেগ এফেক্ট বাড়ানোর অর্থ হ্রাস হতে পারে?
প্রাথমিক চিন্তা
- আমি প্রচুর কনভার্জেন্সি চেক করেছি (যেমন ট্র্যাসপ্লটস দেখে; শৃঙ্খলা জুড়ে বিচ্যুতির ফলাফলের বিভিন্নতা পরীক্ষা করে এবং রানগুলি জুড়ে) এবং উভয় মডেলই উত্তরোত্তর রূপান্তরিত হয়েছে বলে মনে হয়।
- আমি একটি কোড চেক করেছি যেখানে আমি ল্যাগের প্রভাবটি শূন্য হতে বাধ্য করেছি এবং এটি কোনও ল্যাগ মডেলের বিচ্যুতি পুনরুদ্ধার করেছিল।
- আমি প্রত্যাশিত মানগুলিতে বিচ্যুতি হওয়া উচিত এমন অর্থদণ্ডের বিয়োগ বিয়োগের দিকেও চেয়েছিলাম এবং এগুলি ল্যাগ মডেলটিকে আরও খারাপ দেখা দিয়েছে।
- প্রথম পর্যবেক্ষণের আগে আমি কীভাবে অন্তর্নিহিত টাইম পয়েন্টটি অনুমান করেছি তাতে কিছু সমস্যা রয়েছে।
- সম্ভবত পিছনে প্রভাব এই ডেটাতে কেবল দুর্বল
- আমি মডেলটির
lme
সাথে সর্বাধিক লাইকুনিটি ব্যবহার করে অনুমান করার চেষ্টা করেছিcorrelation=corAR1()
। ল্যাগ প্যারামিটারের অনুমানটি খুব একই রকম ছিল। এই ক্ষেত্রে ল্যাগ মডেলের ল্যাগ ছাড়াই বড় লগ হওয়ার সম্ভাবনা এবং একটি ছোট এআইসি (প্রায় 100 দ্বারা) ছিল (অর্থাত্, এটি লেগ মডেলটি আরও ভাল ছিল)। সুতরাং এই ধারণাকে আরও জোর দেওয়া হয়েছে যে ল্যাগ যুক্ত করার ফলে বায়েশিয়ান মডেলটির বিচ্যুতিও হ্রাস করা উচিত। - সম্ভবত বায়েশিয়ান অবশিষ্টাংশ সম্পর্কে বিশেষ কিছু আছে। পূর্ববর্তী সময়ের সময়ে যদি লেগ মডেল পূর্বাভাস এবং সত্য y এর পার্থক্য ব্যবহার করে তবে এই পরিমাণটি অনিশ্চিত হতে চলেছে। সুতরাং, ল্যাগ এফেক্টটি এই জাতীয় অবশিষ্টাংশগুলির একটি বিশ্বাসযোগ্য ব্যবধানের মধ্যে পরিচালিত হবে।