Gণাত্মক দ্বিপদী বিতরণের অভ্যন্তরের পরামিতিগুলি বোঝা


37

আমি বিভিন্ন মডেলের মধ্যে আমার ডেটা মাপসই করা হবে এবং মূর্ত আউট যে চেষ্টা ছিল fitdistrলাইব্রেরি থেকে ফাংশন MASSএর Rআমাকে দেয় Negative Binomialসেরা-ফিট হিসাবে। উইকির পৃষ্ঠা থেকে এখন সংজ্ঞাটি দেওয়া হল:

নেগবিন (আর, পি) বিতরণ শেষ পরীক্ষায় সাফল্যের সাথে কে + আর বের্নুলি (পি) ট্রায়ালগুলিতে কে ব্যর্থতা এবং আর সাফল্যের সম্ভাবনা বর্ণনা করে।

Rমডেল ফিটিং করতে ব্যবহার করে আমাকে দুটি পরামিতি দেয় meanএবং dispersion parameter। আমি কীভাবে এগুলি ব্যাখ্যা করব তা বুঝতে পারছি না কারণ আমি উইকি পৃষ্ঠায় এই পরামিতিগুলি দেখতে পাচ্ছি না। আমি দেখতে পাচ্ছি সমস্ত নীচের সূত্র:

নেতিবাচক দ্বিপদী বিতরণ সূত্র

kপর্যবেক্ষণ সংখ্যা এবং যেখানে r=0...n। এখন আমি প্রদত্ত পরামিতিগুলির সাথে এগুলি কীভাবে সম্পর্কিত করব R? সহায়তা ফাইলটি খুব বেশি তথ্য সরবরাহ করে না।

এছাড়াও, আমার পরীক্ষার বিষয়ে কেবল কয়েকটি কথা বলার জন্য: আমি যে সামাজিক পরীক্ষা চালিয়ে যাচ্ছিলাম, আমি 10 দিনের মধ্যে প্রতিটি ব্যবহারকারীর সাথে যোগাযোগ করা লোকের সংখ্যা গণনা করার চেষ্টা করছিলাম। পরীক্ষার জন্য জনসংখ্যার আকার 100 ছিল।

এখন, যদি মডেলটি নেতিবাচক দ্বিপদী ফিট করে তবে আমি অন্ধভাবে বলতে পারি যে এটি সেই বন্টনকে অনুসরণ করে তবে আমি এর পিছনে স্বজ্ঞাত অর্থ বুঝতে চাই। আমার পরীক্ষার বিষয়গুলির দ্বারা যোগাযোগ করা লোকের সংখ্যা একটি নেতিবাচক দ্বিপদী বিতরণ অনুসরণ করার অর্থ কী? কেউ দয়া করে এটি পরিষ্কার করতে সহায়তা করতে পারেন?

উত্তর:


42

আপনার এনবি সম্পর্কিত উইকিপিডিয়া নিবন্ধটি আরও নীচে দেখতে হবে, যেখানে এটি "গামা-পোইসন মিশ্রণ" বলেছে। আপনি যে সংজ্ঞাটি উদ্ধৃত করেছেন (এটি যাকে আমি "মুদ্রা-উল্টানো" সংজ্ঞা বলি কারণ আমি সাধারণত ক্লাসের জন্য এটি সংজ্ঞায়িত করি "ধরুন আপনি না পাওয়া পর্যন্ত আপনি একটি মুদ্রা উল্টাতে চানশিরোনাম ") প্রাপ্ত করা সহজ এবং একটি প্রারম্ভিক সম্ভাবনা বা গাণিতিক পরিসংখ্যান প্রসঙ্গে আরও জ্ঞান অর্জন করে, গামা-পোইসন মিশ্রণটি (আমার অভিজ্ঞতায়) প্রয়োগিত প্রসঙ্গে বিতরণ সম্পর্কে চিন্তাভাবনা করার অনেক বেশি কার্যকর উপায় particular (বিশেষত, এই সংজ্ঞাটি ছড়িয়ে / আকারের প্যারামিটারের অ-পূর্ণসংখ্যার মানগুলিকে মঞ্জুরি দেয় this) এই প্রসঙ্গে আপনার ছড়িয়ে দেওয়া প্যারামিটারটি একটি অনুমানী গামা বিতরণের বিতরণকে বর্ণনা করে যা আপনার তথ্যকে অন্তর্নিহিত করে এবং তাদের যোগাযোগের অভ্যন্তরীণ স্তরের ব্যক্তিদের মধ্যে অরক্ষিত বৈচিত্রকে বর্ণনা করে particular বিশেষত, এটা গামা আকৃতি প্যারামিটার, এবং এটি এই সম্পর্কে চিন্তা জানেন যে সহায়ক হতে পারে যে আকৃতি সঙ্গে একটি গামা বিতরণের প্রকরণের সহগ প্যারামিটার হয় ; যেমনθ1/θθ বৃহত্তর হয়ে ওঠে সুপ্ত পরিবর্তনশীলতা অদৃশ্য হয়ে যায় এবং বিতরণটি পয়েসনের কাছে যায়।


7
হুম। ভাবি কেন ডাউনটা?
বেন বলকার

এনবি (গড়, ছড়িয়ে পড়া) সূত্রটিও এখন সেই উইকি পৃষ্ঠায় বিকল্প সূত্রগুলির ( en.wikedia.org/wiki/… ) বিভাগে বর্ণিত হয়েছে ।
mt1022

10

আমি আপনাকে আমার আগের পোস্টে উল্লিখিত হিসাবে, আমি ডেটা গণনা করার জন্য একটি বিতরণ ফিট করার জন্য আমার মাথা পেতে কাজ করছি। আমি যা শিখেছি তার মধ্যে এখানে রয়েছে:

যখন ভিন্নতার গড়ের চেয়ে বেশি হয়, অতিরিক্ত পরিমাণে স্পষ্ট হয় এবং এইভাবে নেতিবাচক দ্বিপদী বিতরণ সম্ভবত উপযুক্ত is যদি বৈকল্পিক এবং গড় একই থাকে তবে পোইসন বিতরণ প্রস্তাবিত হয়, এবং যখন ভিন্নতাটি গড়ের চেয়ে কম হয় তবে এটি দ্বিপদী বিতরণ যা প্রস্তাবিত।

আপনি যে গণনাটির উপরে কাজ করছেন তার সাথে আপনি নীচের অবাধে উপলব্ধ বইয়ের 4.5.৪.১.৩ (পৃষ্ঠা 165) এর নেগেটিভ দ্বিপদী ফাংশনের "পরিবেশগত" পরামিতি ব্যবহার করছেন (প্রসঙ্গে আর এর, কম নয়!) এবং, আমি আশা করি, আপনার কয়েকটি প্রশ্নের সমাধান করতে পারে:

http://www.math.mcmaster.ca/~bolker/emdbook/book.pdf

যদি আপনি এই সিদ্ধান্তে পৌঁছে যান যে আপনার ডেটা শূন্য-সঙ্কুচিত (যেমন, 0 টি পর্যবেক্ষণের সম্ভাবনা 0), তবে আপনি আর ভিজিএএম প্যাকেজে থাকা এনবিডি-র শূন্য-কাটা স্বাদ পরীক্ষা করতে চাইতে পারেন ।

এটির প্রয়োগের উদাহরণ এখানে:

library(VGAM)

someCounts = data.frame(n = c(1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16),
                     freq = c(182479,76986,44859,24315,16487,15308,5736,
                              2843,1370,1115,1127,49,100,490,106,2))

fit = vglm(n ~ 1, posnegbinomial, control = vglm.control(maxit = 1000), weights=freq,
           data=someCounts)

Coef(fit)

pdf2 = dposnegbin(x=with(someCounts, n), munb=0.8344248, size=0.4086801)

print( with(someCounts, cbind(n, freq, fitted=pdf2*sum(freq))), dig=9)

আমি আশা করি এই সহায়ক।


বইয়ের পৃষ্ঠা 165।
স্মলচেস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.