অফসেটের সাথে পয়েসন এলোমেলো প্রভাবের মডেলগুলিতে ওভারডিস্পেরেশন এবং মডেলিংয়ের বিকল্পগুলি


12

একটি বিষয়-পরীক্ষার অভ্যন্তরীণ পরীক্ষার মাধ্যমে পরীক্ষামূলক গবেষণা থেকে ডেটা মডেলিংয়ের সময় আমি বেশ কয়েকটি ব্যবহারিক প্রশ্নে অংশ নিয়েছি। আমি আমার প্রশ্নগুলি অনুসরণ করে পরীক্ষা, ডেটা এবং এ পর্যন্ত যা করেছি তা সংক্ষেপে বর্ণনা করছি।

ধারাবাহিকভাবে উত্তরদাতাদের একটি নমুনায় চারটি ভিন্ন সিনেমা দেখানো হয়েছিল। প্রতিটি সিনেমার পরে একটি সাক্ষাত্কার পরিচালিত হয়েছিল যার মধ্যে আমরা নির্দিষ্ট বিবৃতিগুলির সংখ্যার সংখ্যা গণনা করেছি যা আরকিউর জন্য আগ্রহী ছিল না (পূর্বাভাস গণনা ভেরিয়েবল)। আমরা সম্ভাব্য সংখ্যার সর্বাধিক সংখ্যক রেকর্ডও করেছি (কোডিং ইউনিট; অফসেট ভেরিয়েবল)। এছাড়াও, মুভিগুলির বেশ কয়েকটি বৈশিষ্ট্য একটি অবিচ্ছিন্ন স্কেলে পরিমাপ করা হয়েছিল, যার মধ্যে একটির কাছে আমাদের বিবৃতিগুলির গণনার উপর মুভি বৈশিষ্ট্যের প্রভাবের কার্যকারণ অনুমান রয়েছে যখন অন্যগুলি নিয়ন্ত্রণ (ভবিষ্যদ্বাণীকারী) থাকে।

এখন পর্যন্ত গৃহীত মডেলিং কৌশলটি নিম্নরূপ:

একটি এলোমেলো প্রভাবের পোইসন মডেলটি অনুমান করুন, যেখানে কার্যকার্য ভেরিয়েবলটি একটি covariate হিসাবে এবং অন্যান্য ভেরিয়েবলগুলি নিয়ন্ত্রণ covariates হিসাবে ব্যবহৃত হয়। এই মডেলটির 'লগ (ইউনিট)' (কোডিং ইউনিট) সমান অফসেট রয়েছে। এলোমেলো প্রভাবগুলি বিষয়গুলিতে নেওয়া হয় (মুভি-নির্দিষ্ট গণনাগুলি বিষয়গুলিতে নেস্ট করা হয়)। আমরা কার্যকারণ হাইপোথিসিসটি নিশ্চিত হয়েছি (কার্যকরী ভেরিয়েবলের সিগন সহগ)। অনুমান হিসাবে আমরা l মধ্যে lme4 প্যাকেজটি আরে ব্যবহার করেছি, বিশেষত ফাংশন গ্লোমার।

এখন আমি নিম্নলিখিত প্রশ্ন আছে। পোইসন রিগ্রেশনের একটি সাধারণ সমস্যা হ'ল অতিরিক্ত কাজ pers আমি জানি যে এটি একটি নেতিবাচক দ্বিপদী রিগ্রেশন ব্যবহার করে এবং এর ছড়িয়ে পড়া প্যারামিটারটি একটি সাধারণ পোইসন মডেলের মডেল ফিটকে উন্নত করে কিনা তা নির্ধারণ করে পরীক্ষা করা যেতে পারে। যাইহোক, আমি এলোমেলো প্রভাব প্রসঙ্গে কীভাবে তা করতে জানি না।

  • আমার পরিস্থিতিতে কীভাবে ওভারডিস্পের জন্য পরীক্ষা করা উচিত? আমি কীভাবে ফিট করতে জানি তা একটি সাধারণ পোইসন / নেতিবাচক দ্বিপদী রিগ্রেশন (এলোমেলো প্রভাব ছাড়াই) ওভারডিস্পেরেশন পরীক্ষা করেছি। পরীক্ষা ওভারডিস্পেরিয়নের উপস্থিতি নির্দেশ করে। তবে এই মডেলগুলি যেহেতু ক্লাস্টারিংটিকে অ্যাকাউন্টে নেয় না আমি মনে করি এই পরীক্ষাটি ভুল is এছাড়াও অতিরঞ্জিত পরীক্ষার জন্য অফসেটের ভূমিকা সম্পর্কে আমি নিশ্চিত নই।
  • নেতিবাচক দ্বিপদী র্যান্ডম এফেক্ট রিগ্রেশন মডেলের মতো কিছু আছে এবং কীভাবে আমি এটি আর এ ফিট করব?
  • বিকল্প মডেলগুলির জন্য আপনার কাছে কি পরামর্শ রয়েছে যা আমার উপাত্তে চেষ্টা করা উচিত, অর্থাত্ পুনরাবৃত্তি ব্যবস্থা কাঠামো গ্রহণ, ভেরিয়েবলগুলি গণনা এবং কোডিং ইউনিটগুলি অ্যাকাউন্টে নেওয়া?

1
প্রারম্ভিকদের জন্য, glmm.wikidot.com
বেন বলকার

1
ধন্যবাদ, খুব সহায়ক! হয়তো কেউ এই এবং অন্যান্য তথ্য থেকে একটি উত্তর সংকলন করতে চান।
টোমকা

উত্তর:


1

জিজ্ঞাসিত প্রশ্নের সংখ্যার সাথে সম্পর্কিত উত্তরের সর্বাধিক সম্ভাব্য সংখ্যা রয়েছে। যদিও এক হিসেবে এই মডেল পারেন পইসন প্রক্রিয়া কাউন্টিং ধরনের, অন্য ব্যাখ্যা এটিতে যার এমন কোন পইসন প্রক্রিয়া সংখ্যাত উত্তর নম্বর, যে জন্য কোন তাত্ত্বিক সীমা আছে, । আরেকটি বিতরণ, অর্থাত্, একটি বিযুক্ত একটি যার সসীম সমর্থন রয়েছে , যেমন, বিটা দ্বিপদী , এটি আরও উপযুক্ত হতে পারে কারণ এটির আরও পরিবর্তনীয় আকার রয়েছে। তবে এটি কেবল অনুমান, এবং বাস্তবে, আমি নিষ্ঠুর শক্তি ব্যবহার করে আরও সাধারণ প্রশ্নের উত্তর অনুসন্ধান করতে চাই ...[0,)

অতিরিক্ত বিতরণের জন্য যাচাইয়ের পরিবর্তে , যার কোনও কার্যকর উত্তর দেওয়ার নেতৃত্বের কোনও গ্যারান্টি নেই, এবং যদিও কেউ ছত্রভঙ্গকে প্রশমিত করতে প্রসারণের সূচকগুলি পরীক্ষা করতে পারে তবে আমি আরও কার্যকরভাবে ফিট মানসম্পন্ন অনুসন্ধানের একটি বিচ্ছিন্ন বিতরণ বিকল্পটি ব্যবহার করে সেরা বিতরণ অনুসন্ধানের পরামর্শ দেব প্রোগ্রাম, যেমন, গণিতের ফাইন্ডড্রিট্রিবিউশন রুটিন। এই ধরণের অনুসন্ধানটি কী কী বিতরণ (গুলি) কাজ (গুলি) কেবলমাত্র মাত্রাতিরিক্ত মাত্রা প্রশমিত করার জন্যই নয়, আরও অনেক উপাত্তের অন্যান্য বৈশিষ্ট্য যেমন, উদাহরণস্বরূপ, এক ডজনকে পরিমাপ করার মতো ফিটের উপকারের মডেল করে তোলে তা অনুমান করার মোটামুটি বিবর্ণ কাজ করে ভিন্ন পথ.

আমার প্রার্থী বিতরণগুলি আরও পরীক্ষা করার জন্য, আমি সমকামিতা, এবং / অথবা বিতরণের ধরণের পরীক্ষা করার জন্য এই পরীক্ষার অবশিষ্টগুলি পোস্ট করব এবং প্রার্থীর বিতরণগুলি ডেটার শারীরিক ব্যাখ্যার সাথে মিলিত হতে পারে কিনা তাও বিবেচনা করব। এই পদ্ধতির বিপদটি এমন একটি বিতরণ সনাক্ত করছে যা একটি প্রসারিত ডেটা সেটটির সেরা মডেলিংয়ের সাথে সঙ্গতিপূর্ণ নয়। এই পোস্ট পোস্ট প্রক্রিয়া না করার আশঙ্কা হ'ল একটি অগ্রাধিকার যথাযথ পরীক্ষা ছাড়াই নির্বিচারে নির্বাচিত বিতরণ বরাদ্দ করা (আবর্জনা-আবর্জনা বাইরে)। এই পোস্টের শ্রেষ্ঠত্বপন্থাটি হ'ল এটি ফিটিংয়ের ত্রুটিগুলিকে সীমাবদ্ধ করে এবং এটি তার দুর্বলতাও, অর্থাত্ এটি অনেকগুলি বিতরণের চেষ্টা করার কারণে খাঁটি সুযোগের মাধ্যমে মডেলিংয়ের ত্রুটিগুলি হ্রাস করতে পারে। তারপরে, অবশিষ্টাংশগুলি পরীক্ষা করার এবং শারীরিকতা বিবেচনা করার কারণ। উপরে নিচে বা অবরোহী পদ্ধতি অফার কোন ধরনের পোস্টে হক যুক্তিবাদিতা উপর চেক। অর্থাৎ বিভিন্ন বিতরণের সাথে মডেলিংয়ের শারীরিকতার তুলনা করার একমাত্র পদ্ধতি হ'ল তাদের তুলনা করার পোস্ট করা । এইভাবে শারীরিক তত্ত্বের প্রকৃতি উত্থিত হয়, আমরা ক্লান্তিকর বিকল্প ব্যাখ্যা হিসাবে গ্রহণের আগে আমরা অনেক পরীক্ষা-নিরীক্ষার সাথে ডেটার একটি অনুমানমূলক ব্যাখ্যা পরীক্ষা করি।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.