পোইসন বনাম কোয়াসি-পোইসন মডেল অনুসারে আইডিনিকাল কো-এফিসিয়েন্টগুলি


12

একটি বীমা পরিবেশে দাবি গণনা ডেটা মডেলিংয়ে, আমি পয়সন দিয়ে শুরু করেছিলাম তবে তারপরে ওভারডিস্পেরেশন লক্ষ্য করেছি। একটি কোয়াসি-পোইসন বেসিক পয়েসনের চেয়ে বৃহত্তর গড়-বৈচিত্র্য সম্পর্কের মডেলিং করেছিল, কিন্তু আমি লক্ষ্য করেছি যে সহগগুলি পয়সন এবং কোয়াসি-পোইসন উভয় মডেলগুলিতেই অভিন্ন ছিল।

যদি এটি ত্রুটি না হয় তবে কেন এমন হচ্ছে? কুইস-পায়সনকে পয়েসন ব্যবহার করে কী লাভ?

বিষয়গুলি নোট করুন:

  • অন্তর্নিহিত লোকসানগুলি অতিরিক্ত ভিত্তিতে হয়, যা (আমি বিশ্বাস করি) টুইটেটিকে কাজ করা থেকে বিরত রেখেছিল - তবে এটিই আমি চেষ্টা করেছি প্রথম বিতরণ। আমি এনবি, জিপ, জেডআইএনবি এবং বাধা মডেলগুলিও পরীক্ষা করে দেখেছি, তবে এখনও খুঁজে পেয়েছি কোয়াসি-পোইসন সেরা ফিট সরবরাহ করেছে।
  • আমি এইআর প্যাকেজে ছড়িয়ে ছিটিয়ে যাওয়ার মাধ্যমে ওভারডিস্পেরিশনের জন্য পরীক্ষা করেছি। আমার বিচ্ছুরণের প্যারামিটারটি 8 was ছিল, 10 ^ -16 প্রস্থের পি-মান সহ।
  • আমি ফ্যামিলি = পোইসন বা কাসিপোইসন এবং কোডের জন্য একটি লগ লিঙ্ক ব্যবহার করছি m
  • পোইসন কোড চালানোর সময়, আমি "ইন ডিপোইস (y, মিউ, লগ = সত্য): অ-পূর্ণসংখ্যার x = ..." এর সতর্কতা নিয়ে এসেছি।

বেনের নির্দেশনা অনুযায়ী সহায়ক এস থ্রেডস:

  1. পোইসন রিগ্রেশন-এ অফসেটের বেসিক ম্যাথ
  2. সহগের উপর অফসেটের প্রভাব
  3. কোভারিয়ট বনাম অফসেট হিসাবে এক্সপোজার ব্যবহার করার মধ্যে পার্থক্য

একটি টুইডি বিতরণ একটি ভাল ধারণা হবে না?
duffymo

যেতে-যেতে টুইডির চেষ্টা করা হয়েছে কিন্তু আমাদের ক্ষতির ডেটা গ্রাউন্ড-আপ নয়, বরং অতিরিক্ত ভিত্তিতে। Countণাত্মক দ্বিপদী, জিপ এবং বাধা মডেলগুলিও গণনা ছড়িয়ে দেওয়ার বিষয়টি চেষ্টা করে দেখুন।
ফ্রাঙ্ক এইচ।

1
আপনার ডেটাতে অ-পূর্ণসংখ্যা মানগুলি কোথা থেকে এসেছে সে সম্পর্কে আপনি আরও কিছুটা ব্যাখ্যা করতে পারেন ??
বেন বলকার

6
আপনার অনুপাত / হারগুলি এর অনুপাতের গণনা করে মডেল করা উচিত নয়counts/exposure । বরং, offset(log(exposure))আপনার মডেলগুলিতে আপনার অফসেট ( ) পদ যুক্ত করা উচিত ।
বেন বলকার

1
এটি ব্যবহারিক, যদিও পইসন (কোয়েসি-পইসন নয়) মডেলিং করার সময় সর্বাধিক গুরুত্বপূর্ণ। আমি একটি ভাল রেফারেন্স অফহ্যান্ড জানি না; যদি আপনি এখানে ক্রসভিলেটেডে কোনও প্রাসঙ্গিক উত্তর খুঁজে না পান তবে এটি একটি সূক্ষ্ম ফলো-আপ প্রশ্ন করে।
বেন বলকার

উত্তর:


25

এটি প্রায় একটি সদৃশ ; লিঙ্কযুক্ত প্রশ্নটি ব্যাখ্যা করে যে আপনার সহগের অনুমান, অবশিষ্টাংশের বিচ্যুতি বা পরিবর্তনের স্বাধীনতার ডিগ্রি আশা করা উচিত নয়। পোইসন থেকে কোয়াসি-পায়সনে যাওয়ার সময় যে একমাত্র জিনিসটি পরিবর্তিত হয় তা হ'ল যে স্কেল প্যারামিটারটি আগে 1 তে স্থির করা হয়েছিল তা অবশিষ্টাংশের পরিবর্তন / খারাপতা-থেকে-ফিটের কিছু প্রাক্কলন থেকে গণনা করা হয় (সাধারণত পিয়ারসনের অবশিষ্টাংশগুলির বর্গাকার যোগফলের মাধ্যমে অনুমান করা হয়) ( ) অবশিষ্ট ডিএফ দ্বারা বিভক্ত, যদিও অ্যাসেম্পোটোটিকভাবে অবশিষ্ট অবলম্বন ব্যবহার একই ফল দেয়)। ফলাফলটি হ'ল মান ত্রুটিগুলি এই স্কেল প্যারামিটারের বর্গমূল দ্বারা আস্থা করা হয়, আত্মবিশ্বাসের ব্যবস্থাগুলি এবং মূল্যগুলিতে একযোগে পরিবর্তনের সাথে ।χ2p

আধা-সম্ভাবনার সুবিধাটি হ'ল এটি অনুমানের মূল ত্রুটিটি সংশোধন করে যে ডেটাগুলি পয়েসন (= সমজাতীয়, স্বতন্ত্র গণনা); যাইহোক, এইভাবে সমস্যার সমাধান করা সম্ভাব্যভাবে ডেটা সহ অন্যান্য সমস্যাগুলি মাস্ক করে। (নীচে দেখুন।) আধিক্য-সম্ভাবনা ওভারডিস্পেরেশন পরিচালনা করার একটি উপায়; যদি আপনি কোনও উপায়ে অতিরিক্ত বিবেচনা না করে থাকেন তবে আপনার সহগগুলি যুক্তিসঙ্গত হবে তবে আপনার অনুমান (সিআই, মূল্য ইত্যাদি) আবর্জনা হবে।p

  • আপনি উপরে মন্তব্য হিসাবে, ওভারডিস্পেরিয়ান (ট্যাদি, বিভিন্ন নেতিবাচক দ্বিপদী প্যারামিটারাইজেশন, পরিমাণ-সম্ভাবনা, শূন্য-মুদ্রাস্ফীতি / পরিবর্তন) এর জন্য প্রচুর বিভিন্ন পন্থা রয়েছে।
  • > 5 (8.4) এর অত্যধিক সংবেদনশীল ফ্যাক্টরের সাথে, আমি এটি উদ্বিগ্ন কিছুটা মডেলের ভুল-ফিট (আউটলিয়ার্স, শূন্য-মুদ্রাস্ফীতি [যা আপনি ইতিমধ্যে চেষ্টা করেছেন], অরৈখিকতা) এর চেয়ে চালিত হচ্ছে কিনা তা নিয়ে আমি কিছুটা উদ্বেগ প্রকাশ করব rather বোর্ডের বৈচিত্র্যের প্রতিনিধিত্ব করার চেয়ে। এটি সম্পর্কে আমার সাধারণ পদ্ধতির কাঁচা ডেটা এবং রিগ্রেশন ডায়াগোনস্টিকগুলির গ্রাফিকাল এক্সপ্লোরেশন ...

খুব উপকারী. আমি এখন দেখতে পাচ্ছি যে পোয়েসনে ভেরিয়েবল এবং লেভেলের ভ্যারিয়েবলের জন্য p- মানগুলি কোয়াসি-পোইসনের তুলনায় পরিসংখ্যানগতভাবে তাত্পর্যপূর্ণ, আপনি উল্লিখিত স্কেলিংয়ের কারণে। আমি আউটলিয়ারদের জন্য পরীক্ষা করেছিলাম তবে এটি কোনও সমস্যা বলে মনে হয়নি। অতিরিক্ত কিছু নিয়ে মুখোশযুক্ত অন্যান্য কিছু সমস্যা বা এই সমস্যাগুলি খুঁজে পাওয়ার জন্য এই জাতীয় পদ্ধতির উদাহরণ কী হতে পারে?
ফ্রাঙ্ক এইচ।

লিঙ্ক (লগ) স্কেলে প্রতিক্রিয়াগুলির বেশিরভাগ ক্ষেত্রেই অ-রৈখিকতা; নিদর্শন আছে কিনা তা দেখতে বনাম-বনাম-ফিটেড প্লট এবং অবশিষ্টাংশ-বনাম-ভবিষ্যদ্বাণীকারী-ভেরিয়েবল প্লটগুলি পরীক্ষা করুন।
বেন বলকার

1
+1 সুন্দরভাবে ছড়িয়ে দেওয়া! আমি আপনার প্রথম অনুচ্ছেদের স্পষ্টতার প্রশংসা করি।
অ্যালেক্সিস 18
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.