লেগ ইফেক্ট বাড়াতে কেন কোনও বায়েশিয়ার শ্রেণিবিন্যাসের মডেলটির বিচ্যুতি মানে?


14

পটভূমি: আমি বর্তমানে বিভিন্ন বায়েশিয়ান শ্রেণিবদ্ধ মডেলের তুলনা করে কিছু কাজ করছি। ডেটা অংশগ্রহনকারী i এবং সময় j এর জন্য মঙ্গলজনক সংখ্যার ব্যবস্থা । আমার প্রায় 1000 অংশগ্রহণকারী এবং প্রতি অংশগ্রহণকারী প্রতি 5 থেকে 10 টি পর্যবেক্ষণ রয়েছে।Yআমিআমি

বেশিরভাগ দ্রাঘিমাংশীয় ডেটাসেটের মতো, আমিও স্বতঃসম্পর্কতার এমন কিছু রূপ দেখতে প্রত্যাশা করছি যার দ্বারা সময়ের কাছাকাছি থাকা পর্যবেক্ষণগুলির আরও পৃথক পৃথকগুলির চেয়ে আরও বেশি পারস্পরিক সম্পর্ক রয়েছে। কয়েকটি জিনিস সরলকরণের জন্য, মৌলিক মডেলটি নিম্নরূপ:

Yআমি~এন(μআমি,σ2)

যেখানে আমি কোনও ল্যাগ মডেল তুলনা করছি:

μআমি=β0আমি

একটি ল্যাগ মডেল সহ:

μআমি=β0আমি+ +β1(Yআমি(-1)-β0আমি)

যেখানে একজন ব্যক্তি-স্তরের গড় এবং β 1 হ'ল ল্যাগ প্যারামিটার (অর্থাত্ ল্যাগ এফেক্টটি সেই সময়ের বিন্দুর পূর্বাভাসিত মান থেকে পূর্ববর্তী সময় বিন্দু থেকে পর্যবেক্ষণের বিচ্যুতির একাধিক যোগ করে)। Y i 0 (যেমন, প্রথম পর্যবেক্ষণের আগে পর্যবেক্ষণ) অনুমান করার জন্য আমাকে কয়েকটি জিনিসও করতে হয়েছিল ।β0আমিβ1Yআমি0

আমি যে ফলাফলগুলি পাচ্ছি তা ইঙ্গিত করে যে:

  • লেগ প্যারামিটার প্রায় .18, 95% সিআই [.14, .21] এর কাছাকাছি। অর্থাৎ এটি শূন্য নয়
  • ল্যাগটি মডেলটিতে অন্তর্ভুক্ত করা হলে গড় বিচ্যুতি এবং ডিআইসি উভয়ই কয়েক শতাধিক বৃদ্ধি পায়
  • উত্তরোত্তর ভবিষ্যদ্বাণীমূলক চেকগুলি দেখায় যে ল্যাগ ইফেক্টটি অন্তর্ভুক্ত করে, মডেলটি ডেটাতে স্বতঃসম্পর্ক পুনরুদ্ধার করতে আরও ভাল সক্ষম হয়

সুতরাং সংক্ষেপে, নন-শূন্য লেগ প্যারামিটার এবং উত্তরোত্তর ভবিষ্যদ্বাণীমূলক চেকগুলি ল্যাগ মডেলটি আরও ভাল বলে প্রস্তাব দেয়; তবুও ডিভ্যান্স এবং ডিআইসির অর্থ হ'ল ল্যাগ মডেলটি আরও ভাল। এই ধাঁধা আমার।

আমার সাধারণ অভিজ্ঞতাটি হ'ল আপনি যদি কোনও দরকারী প্যারামিটার যুক্ত করেন তবে এটির কমপক্ষে গড় বিচ্যুতি হ্রাস করা উচিত (এমনকি জটিলতার জরিমানার পরেও ডিআইসিকে উন্নত করা হয়নি)। তদুপরি ল্যাগ প্যারামিটারের শূন্যের মানটি কোনও ল্যাগ মডেলের মতোই বিচ্যুতি অর্জন করবে।

প্রশ্ন

ল্যাগ প্যারামিটারটি শূন্য নয় এবং এটি উত্তরোত্তর ভবিষ্যদ্বাণীমূলক পরীক্ষাগুলি উন্নত করেও কেন বায়েশিয়ান হায়ারার্কিকাল মডেলটিতে লেগ এফেক্ট বাড়ানোর অর্থ হ্রাস হতে পারে?

প্রাথমিক চিন্তা

  • আমি প্রচুর কনভার্জেন্সি চেক করেছি (যেমন ট্র্যাসপ্লটস দেখে; শৃঙ্খলা জুড়ে বিচ্যুতির ফলাফলের বিভিন্নতা পরীক্ষা করে এবং রানগুলি জুড়ে) এবং উভয় মডেলই উত্তরোত্তর রূপান্তরিত হয়েছে বলে মনে হয়।
  • আমি একটি কোড চেক করেছি যেখানে আমি ল্যাগের প্রভাবটি শূন্য হতে বাধ্য করেছি এবং এটি কোনও ল্যাগ মডেলের বিচ্যুতি পুনরুদ্ধার করেছিল।
  • আমি প্রত্যাশিত মানগুলিতে বিচ্যুতি হওয়া উচিত এমন অর্থদণ্ডের বিয়োগ বিয়োগের দিকেও চেয়েছিলাম এবং এগুলি ল্যাগ মডেলটিকে আরও খারাপ দেখা দিয়েছে।
  • β0আমি
  • প্রথম পর্যবেক্ষণের আগে আমি কীভাবে অন্তর্নিহিত টাইম পয়েন্টটি অনুমান করেছি তাতে কিছু সমস্যা রয়েছে।
  • সম্ভবত পিছনে প্রভাব এই ডেটাতে কেবল দুর্বল
  • আমি মডেলটির lmeসাথে সর্বাধিক লাইকুনিটি ব্যবহার করে অনুমান করার চেষ্টা করেছি correlation=corAR1()। ল্যাগ প্যারামিটারের অনুমানটি খুব একই রকম ছিল। এই ক্ষেত্রে ল্যাগ মডেলের ল্যাগ ছাড়াই বড় লগ হওয়ার সম্ভাবনা এবং একটি ছোট এআইসি (প্রায় 100 দ্বারা) ছিল (অর্থাত্, এটি লেগ মডেলটি আরও ভাল ছিল)। সুতরাং এই ধারণাকে আরও জোর দেওয়া হয়েছে যে ল্যাগ যুক্ত করার ফলে বায়েশিয়ান মডেলটির বিচ্যুতিও হ্রাস করা উচিত।
  • সম্ভবত বায়েশিয়ান অবশিষ্টাংশ সম্পর্কে বিশেষ কিছু আছে। পূর্ববর্তী সময়ের সময়ে যদি লেগ মডেল পূর্বাভাস এবং সত্য y এর পার্থক্য ব্যবহার করে তবে এই পরিমাণটি অনিশ্চিত হতে চলেছে। সুতরাং, ল্যাগ এফেক্টটি এই জাতীয় অবশিষ্টাংশগুলির একটি বিশ্বাসযোগ্য ব্যবধানের মধ্যে পরিচালিত হবে।

আপনি বলছেন যে ল্যাগ প্যারামিটারটি প্রায় .18। আপনি কি ল্যাগ-প্যারামিটার শিখলেন? যদি হ্যাঁ, আপনি কোন পূর্বে ব্যবহার করেছেন?
সামিট

এন(β0আমি,σ2)

উত্তর:


1

আমার মতামত এখানে:

  • ডিআইসি, বিআইসির, এআইসির পরিবর্তে আমি প্রান্তিক সম্ভাবনার ( প্রমাণ হিসাবেও পরিচিত ) আপনি যদি সামর্থ্য করতে পারেন তবে সরাসরি কাজ করার পরামর্শ দিই । প্রমাণ যত বড় হবে আপনার মডেল বর্গের সম্ভাবনা তত বেশি। এটি কোনও বৃহত পার্থক্য নাও পারে, তবে ডিআইসি, বিআইসিসি, এআইসি, কেবলমাত্র আনুমানিকই।
  • 0.18
  • আসুন আরও এক ধাপ এগিয়ে যান: এমন মডেল নিন যা ল্যাগ-ইফেক্ট (সি) বিবেচনা করে না এবং এর প্রান্তিক সম্ভাবনা গণনা করে । এরপরে, আপনার মডেল শ্রেণিটি গ্রহণ করুন (ডি) যা ল্যাগ-ইফেক্টটি অন্তর্ভুক্ত করে এবং ল্যাগ-প্যারামিটারের পূর্ববর্তী থাকে; (d) এর প্রান্তিক সম্ভাবনা গণনা করুন । আপনি আশা করতে পারেন যে (ডি) এর একটি বৃহত্তর প্রান্তিক সম্ভাবনা রয়েছে । সুতরাং, আপনি না কি ?:

    (1) প্রান্তিক সম্ভাবনা সামগ্রিকভাবে মডেল শ্রেণিকে বিবেচনা করে। এর মধ্যে ল্যাগ-এফেক্ট, প্যারামিটারের সংখ্যা, সম্ভাবনা, পূর্ব অন্তর্ভুক্ত রয়েছে।

    (২) অতিরিক্ত পরামিতিগুলির পূর্বে যথেষ্ট অনিশ্চয়তা থাকলে, মডেলগুলির তুলনামূলক আলাদা প্যারামিটারগুলির তুলনা করা সর্বদা সূক্ষ্ম is

    (3) আপনি যদি আপনার ল্যাগ-প্যারামিটারটি যথাযথভাবে বড় করার আগে অনিশ্চয়তা নির্দিষ্ট করে থাকেন তবে আপনি পুরো মডেল শ্রেণিকে শাস্তি দিন।

    (4) theণাত্মক ল্যাগগুলির জন্য এবং ধনাত্মক পিছিয়ে যাওয়ার জন্য সমান সম্ভাবনার পক্ষে সহায়তা করে এমন তথ্য কী? আমি বিশ্বাস করি যে এটি নেতিবাচক পিছনে পর্যবেক্ষণ করা খুব সম্ভব নয় এবং এটি পূর্বের মধ্যে অন্তর্ভুক্ত করা উচিত।

    (5) আপনি আপনার ল্যাগ-প্যারামিটারে যে পূর্ব পছন্দটি বেছে নিয়েছিলেন তা অভিন্ন। এটি সাধারণত কখনও ভাল পছন্দ হয় না: আপনি কি নিশ্চিত যে আপনার প্যারামিটারগুলি নির্দিষ্ট গণ্ডির ভিতরে থাকা উচিত? সীমানার ভিতরে প্রতিটি ল্যাগ-ভ্যালুতে কি সত্যিই সমান সম্ভাবনা থাকে? আমার পরামর্শ: একটি বিটা-বিতরণ নিয়ে যান (যদি আপনি নিশ্চিত হন যে ল্যাগটি আবদ্ধ হয়; অথবা লগ-সাধারণের সাথে যদি আপনি শূন্যের চেয়ে ছোট মানগুলি বাদ দিতে পারেন) ।

    ()) এটি একটি বিশেষ উদাহরণ, যেখানে অ-তথ্যমূলক প্রিরিয়ারগুলির ব্যবহার ভাল নয় ( প্রান্তিক সম্ভাবনার দিকে তাকিয়ে ): আপনি সর্বদা একটি মডেলের পক্ষে পছন্দ করবেন যেটির সংখ্যার অনিশ্চিত পরামিতি রয়েছে; আরও পরামিতিগুলির সাথে মডেলটি কতটা খারাপ বা খারাপ করতে পারে তা বিবেচ্য নয়।

আমি আশা করি আমার চিন্তাভাবনাগুলি আপনাকে কিছু নতুন ধারণা দেয়, ইঙ্গিত ?!


টিপস জন্য ধন্যবাদ। কেবল জিনিসগুলি বের করে দেওয়ার জন্য, আমি পশ্চাদগ্রহের গড়ের মান (অর্থাত্, ০.০৮) মান রাখার জন্য ল্যাগ প্যারামিটারকে সীমাবদ্ধ করার চেষ্টা করেছি। কোনও ল্যাগ মডেলটির এখনও ছোট গড় বিচ্যুতি ছিল।
জেরোমি অ্যাংলিম
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.