নেতিবাচক বিনোমিয়াল / পোইসন রিগ্রেশন-এ ওভারডিস্পেরেশন এবং আন্ডার ডিস্পিসারেশন


11

আমি এসএএস-তে একটি পয়সন রিগ্রেশন করছিলাম এবং দেখতে পেলাম যে পিয়ারসন চি-স্কোয়ার্ড মানটি স্বাধীনতার ডিগ্রি দ্বারা বিভক্ত ছিল প্রায় 5 এর মধ্যে, যা উল্লেখযোগ্য পরিমাণে অবিচ্ছিন্নতার ইঙ্গিত দেয়। সুতরাং, আমি প্রোক জেনোমডের সাথে একটি নেতিবাচক দ্বিপদী মডেল ফিট করি এবং পাইয়ারসন চি-স্কোয়ার্ড মানটি স্বাধীনতার ডিগ্রি দ্বারা বিভক্ত হয়ে 0.80 হয়। এটাকে কি এখন অবহেলিত বলে বিবেচনা করা হয়? যদি তাই হয় তবে কীভাবে কেউ এটি পরিচালনা করছেন? আমি ওভারডিস্পেরিয়ান সম্পর্কে অনেক কিছু পড়েছি এবং আমি বিশ্বাস করি যে এটি কীভাবে পরিচালনা করতে হয় তবে আন্ডারডিস্পারশন রয়েছে কীভাবে পরিচালনা করতে হবে বা নির্ধারণ করতে হবে সে সম্পর্কে তথ্য খুব কম। কেউ সাহায্য করতে পারেন?

ধন্যবাদ।


উত্তর:


17

গড় সহ পইসন বিতরণের জন্য ভেরিয়েন্সটিও হ'ল । মডেল রৈখিক সাধারণ কাঠামোর মধ্যে এই যে বোঝা ভ্যারিয়েন্স ফাংশন হয় পইসন মডেল জন্য। এই মডেল অনুমানটি বিভিন্ন কারণে বিভিন্ন কারণে ভুল হতে পারে। পয়সন বিতরণ যে আদেশ দেয় তার চেয়ে বড় বৈকল্পিকের সাথে অতিরঞ্জিত গণনা ডেটা, উদাহরণস্বরূপ, প্রায়শই সম্মুখীন হয়। μμ

V(μ)=μ

বৈকল্পিক অনুমান থেকে বিচ্যুতি একটি রিগ্রেশন প্রসঙ্গে বিভিন্ন রূপ নিতে পারে। সবচেয়ে সহজ যে এক ভ্যারিয়েন্স ফাংশন সমান সঙ্গে একটি বিচ্ছুরণ প্যারামিটার । এটি কোয়েসি-পোইসন মডেল। এটি একই ফিটেড রিগ্রেশন মডেল দেবে, তবে পরিসংখ্যানগত অনুমিতি ( মূল্য এবং আত্মবিশ্বাসের অন্তর) একটি আনুমানিক ছড়িয়ে পড়া প্যারামিটার ব্যবহার করে অতিরিক্ত বা আন্ডার বিভাজনের জন্য সামঞ্জস্য করা হয়।

V(μ)=ψμ
ψ>0p

ভেরিয়েন্স ফাংশনের কার্যকরী ফর্মটিও ভুল হতে পারে। এটি একটি দ্বিতীয় ডিগ্রি বহুবর্ষীয় বলুন। উদাহরণগুলিতে দ্বিপদী, নেতিবাচক দ্বিপদী এবং গামা মডেল অন্তর্ভুক্ত। পোইসন মডেলটির বিকল্প হিসাবে এই মডেলগুলির যে কোনওটিকে চয়ন করা ফিটেড রিগ্রেশন মডেলটির পাশাপাশি পরবর্তী পরিসংখ্যানগত অনুক্রমকে প্রভাবিত করবে। শেপ প্যারামিটার সহ নেতিবাচক দ্বিপদী বিতরণের জন্য ভেরিয়েন্স ফাংশনটি হ'ল আমরা এ থেকে দেখতে পাচ্ছি যে যদি আমরা পয়েসন বিতরণের জন্য ভেরিয়েন্স ফাংশনটি পাই।

V(μ)=aμ2+bμ+c,
λ>0
V(μ)=μ(1+μλ).
λ

পোইসন মডেলের জন্য বৈকল্পিক ফাংশন ডেটার জন্য উপযুক্ত কিনা তা নির্ধারণ করতে, ওপি পরামর্শ অনুসারে আমরা ছড়িয়ে পড়া প্যারামিটারটি অনুমান করতে পারি এবং এটি আনুমানিক 1 (সম্ভবত একটি আনুষ্ঠানিক পরীক্ষা ব্যবহার করে) আছে কিনা তা পরীক্ষা করতে পারি। এই জাতীয় পরীক্ষাটি কোনও নির্দিষ্ট বিকল্পের পরামর্শ দেয় না, তবে এটি অর্ধ-পোইসন মডেলের মধ্যে সবচেয়ে স্পষ্টভাবে বোঝা যায়। ভেরিয়েন্স ফাংশনের কার্যকরী ফর্মটি যথাযথ কিনা তা পরীক্ষা করতে আমরা নেতিবাচক দ্বিপদী মডেল ( ) এর বিপরীতে মডেলের ( ) সম্ভাবনা অনুপাতের পরীক্ষাটি তৈরি করতে পারি । নোট অনুমানের অধীনে এটি একটি মানহীন বিতরণ আছে নোট করুন। বা অ-নেস্টেড মডেলগুলির তুলনা করার জন্য আমরা সাধারণভাবে এআইসি ভিত্তিক পদ্ধতিগুলি ব্যবহার করতে পারি। পয়সন মডেলটিতে ওভারডিস্পেরেশনের জন্য রিগ্রেশন-ভিত্তিক পরীক্ষাλ=λ< সাধারণ ভেরিয়েন্স ফাংশনগুলির জন্য পরীক্ষার একটি শ্রেণির অন্বেষণ করে।

যাইহোক, আমি প্রথমে সমস্ত অধ্যয়নের অবশিষ্ট অবধি, যেমন পিয়ারসনের প্লট বা ডিভ্যান্স রেসিডুয়ালগুলি (বা তাদের স্কোয়ারের মান) লাগানো মানগুলির বিপরীতে সুপারিশ করব। যদি বৈকল্পিকের কার্যকরী ফর্মটি ভুল হয় তবে আপনি এটিকে অবশিষ্টাংশের প্লটে একটি ফানেল আকার (বা স্কোয়ারের অবশিষ্টাংশের প্রবণতা) হিসাবে দেখতে পাবেন। যদি কার্যকরী ফর্মটি সঠিক হয়, অর্থাত্ কোনও ফানেল বা প্রবণতা নেই, তবুও অতিরিক্ত বা আন্ডার বিভাজন হতে পারে, তবে এটি ছড়িয়ে পড়া প্যারামিটার অনুমান করে গণনা করা যেতে পারে। অবশিষ্ট প্লটটির সুবিধা হ'ল এটি কোনও পরীক্ষার চেয়ে আরও পরিষ্কারভাবে পরামর্শ দেয় যে কোনও কিছু হলে ভেরিয়েন্স ফাংশনে কী ভুল wrong

ওপি'র কংক্রিটের ক্ষেত্রে প্রদত্ত তথ্য থেকে 0.8 আন্ডার বিভাজন নির্দেশ করে কিনা তা বলা যায় না। 5 এবং 0.8 অনুমানের দিকে মনোনিবেশ করার পরিবর্তে আমি প্রথমে পোইসন মডেলটির বৈচিত্র্য কার্যকারিতা এবং নেতিবাচক দ্বিপদী মডেলের তদন্ত করার পরামর্শ দিই। একবার ভেরিয়েন্স ফাংশনের সর্বাধিক উপযুক্ত ফাংশনাল ফর্ম নির্ধারিত হয়ে গেলে, কোনও অতিরিক্ত অতিরিক্ত বা আন্ডার বিভাজনের জন্য পরিসংখ্যানগত অনুক্রমকে সামঞ্জস্য করার জন্য কোনও প্রয়োজনে কোনও ছড়িয়ে পড়া প্যারামিটার অন্তর্ভুক্ত করা যেতে পারে needed এসএএস-এ কীভাবে এটি করা যায়, বলুন, দুর্ভাগ্যক্রমে এমন কিছু নয় যা আমি সাহায্য করতে পারি।


2
+1, এটি ভাল সাধারণ তথ্য। আপনি যদি ওপি'র স্পষ্ট প্রশ্নগুলিতে বিশেষভাবে সম্বোধন করেন তবে এটি অপের পক্ষে আরও সহায়ক হতে পারে: (1) .8 স্বল্প বিস্তৃত; & (২) যদি তাই হয়, তবে ডাব্লু / এটিকে কীভাবে মোকাবেলা করতে হবে।
গুং - মনিকা পুনরায়

@ গুং, আরও সুনির্দিষ্ট পরামর্শ দেওয়ার জন্য আমি উত্তরটি সম্পাদনা করেছি। উপলব্ধ তথ্যগুলি থেকে 0.8 উল্লেখযোগ্যভাবে 1 এর চেয়ে ছোট কিনা তা আপনি নির্ধারণ করতে পারবেন না, এবং ছড়িয়ে পড়া প্যারামিটার 1 হ'ল কিনা তা ফোকাস করে IMHO। আমার সম্পাদনাটি ব্যাখ্যা করে যে এর পরিবর্তে ওপিকে ফোকাস করা উচিত বলে আমি মনে করি।
এনআরএইচ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.