একটি নেতিবাচক দ্বিপদী বিতরণ ব্যবহার করার জন্য একটি পয়েসন বিতরণ ব্যবহার করে একটি প্রক্রিয়া মডেলিং থেকে স্যুইচ করবেন?


24

আমাদের একটি এলোমেলো প্রক্রিয়া রয়েছে যা এর একটি নির্দিষ্ট সময়কালে একাধিকবার ঘটে-বা-না-হতে পারে । আমাদের এই প্রক্রিয়াটির পূর্ব-বিদ্যমান মডেল থেকে একটি ডেটা ফিড রয়েছে, যা 0 \ লেক টি <টি পিরিয়ডে সংঘটিত কয়েকটি সংখ্যক ঘটনার সম্ভাবনা সরবরাহ করে । এই বিদ্যমান মডেলটি পুরানো এবং অনুমানের ত্রুটির জন্য আমাদের ফিড-ডেটাতে লাইভ চেকগুলি চালানো দরকার। পুরাতন ডেটা-ফিড (যা সম্ভাব্যতা প্রদান করা হয় উত্পাদক মডেল এন ঘটনা সময় অবশিষ্ট ঘটমান টি ) প্রায় পইসন বিতরণ করা হয়।T0t<Tnt

সুতরাং ব্যতিক্রমসমূহ / ত্রুটি রয়েছে কিনা পরীক্ষা করার জন্য, আমরা দিন t অবশিষ্ট সময় হতে হবে এবং Xt ঘটনা মোট সংখ্যা অবশিষ্ট সময় ঘটতে হতে t । পুরাতন মডেলটি অনুমানগুলি বোঝায় P(Xtc) । সুতরাং আমাদের অনুমানের অধীনে XtPoisson(λt) রয়েছে: \ পি (এক্স_টি \ লেক সি) = ই ^ {- \ ল্যাম্বদা} \ যোগ_ {কে = 0} ^ সি \ ফ্রোক { \ lambda_t ^ ট} {ট!} \ ,. পুরানো মডেলের আউটপুট (পর্যবেক্ষণ y_ {t} )

P(Xtc)=eλk=0cλtkk!.
থেকে আমাদের ইভেন্টের রেট \ ল্যাম্বদা_টি অর্জনের জন্য , আমরা একটি রাজ্য স্পেস পদ্ধতির ব্যবহার করি এবং রাষ্ট্রের সম্পর্কটিকে মডেল করি: y_t = mb ল্যাম্বদা_টি + are ওয়ার্পসিলন_টি \ কোয়াড (\ ওয়ারেপসিলন_টি \ সিম এন ( 0, এইচ_টি)) \, λtyt
yt=λt+εt(εtN(0,Ht)).
λt স্টেট ই (\ ল্যাম্বদা_টি | ওয়াই_টি) পাওয়ার জন্য \ ল্যাম্বদা_টি বিবর্তনের জন্য একটি রাষ্ট্র স্পেস [ধ্রুবক গতির ক্ষয়] মডেল ব্যবহার করে আমরা পুরানো মডেল থেকে পর্যবেক্ষণগুলি ফিল্টার করি এবং থেকে E(λt|Yt)আনুমানিক ইভেন্টের ফ্রিকোয়েন্সিটিতে একটি অবিচ্ছিন্ন / ত্রুটি পতাকাঙ্কিত করি ফিড-ডেটা যদি E(λt|Yt)<yt

এই পদ্ধতিরটি পুরো সময়ের পিরিয়ড টির তুলনায় অনুমানিত ইভেন্টের ত্রুটিগুলি বাছাই করতে চমত্কারভাবে কাজ করে T, তবে আমরা যদি অন্য সময়ের জন্য 0t<σ যেখানে \ সিগমা <\ frac { করতে চান তেমন ভাল হয় না not 2} {3} টিσ<23T । এটি পেতে, আমরা সিদ্ধান্ত নিয়েছি আমরা এখন gণাত্মক দ্বিপদী বিতরণটি ব্যবহার করতে চাই যাতে আমরা এখন ধরে নিই X_t \ সিম এনবি (আর, পি)XtNB(r,p) এবং আমাদের আছে:

P(Xtc)=prk=0c(1p)k(k+r1r1),
যেখানে প্যারামিটার λ এখন r এবং পি দ্বারা প্রতিস্থাপিত হয়েছেp। এটি বাস্তবায়নের জন্য সোজা হওয়া উচিত, তবে ব্যাখ্যার সাথে আমার কিছুটা সমস্যা হচ্ছে এবং এইভাবে আমার কিছু প্রশ্ন রয়েছে যার সাথে আপনি সহায়তা করতে চান:

1. আমরা কি কেবল নেতিবাচক দ্বিপদী বিতরণে p = \ লাম্বদা সেট করতে পারি p=λ? তা না হলে কেন?

২) ধরে নিই আমরা p = f (\ ল্যাম্বদা) সেট করতে পারি p=f(λ)যেখানে f কিছু ফাংশন, আমরা কীভাবে সঠিকভাবে r সেট করতে পারি r(আমাদের কী অতীতের ডেটা সেট ব্যবহার করে আর ফিট করতে হবে r)?

3. হল r ঘটনা আমরা একাধিক একটি প্রদত্ত প্রক্রিয়ার সময় ঘটতে আশা ওপর নির্ভরশীল?


r (এবং p ) এর জন্য অনুমানগুলি আনতে সংযোজন :

আমি সচেতন যে যদি আমাদের বাস্তবে এই সমস্যাটি বিপরীত হয় এবং প্রতিটি প্রক্রিয়াটির জন্য আমাদের ইভেন্টের গণনা থাকে তবে আমরা এবং সর্বাধিক সম্ভাবনা অনুমানকারী গ্রহণ করতে পারি । অবশ্যই সর্বাধিক সম্ভাবনা অনুমানকারী কেবলমাত্র সেই নমুনাগুলির জন্যই বিদ্যমান যার জন্য নমুনার পরিবর্তনের চেয়ে নমুনাটি তার চেয়ে বড়, তবে যদি আমরা এই ক্ষেত্রে তবে আমরা জন্য স্বতন্ত্রভাবে বিতরণ করা পর্যবেক্ষণের জন্য সম্ভাব্যতা ফাংশন সেট করতে পারতাম হিসাবে: যা থেকে আমরা লগ-সম্ভাবনা ফাংশনটি লিখতে পারি: পি এন কে 1 , কে 2 , , কে এন এল ( আর , পি ) = এন i = 1 পি ( কে আই ; আর , পি ) , ( আর , পি ) = এন i = 1 এলএন ( Γ ( কে আই + আর ) ) - এন irpNk1,k2,,kN

L(r,p)=i=1NP(ki;r,p),
l(r,p)=i=1Nln(Γ(ki+r))i=1Nln(ki!)Nln(Γ(r))+i=1Nkiln(p)+Nrln(1p).
সর্বাধিক সন্ধান করতে আমরা এবং সাথে আংশিক ডেরিভেটিভ নিয়ে থাকি এবং সেগুলি শূন্যের সমান সেট করি: সেটিং এবং সেটিং আমরা পাই: rp
rl(r,p)=i=1Nψ(ki+r)Nψ(r)+Nln(1p),pl(r,p)=i=1Nki1pNr11p.
rl(r,p)=pl(r,p)=0p=i=1Nki(Nr+i=1Nki),
rl(r,p)=i=1Nψ(ki+r)Nψ(r)+Nln(rr+i=1NkiN)=0.
এই সমীকরণটি নিউটন বা এমনকি ইএম ব্যবহার করে বন্ধ আকারে আর সমাধান করা যাবে না। তবে, এই পরিস্থিতিতে এটি হয় না। যদিও আমরা স্থিতিশীল এবং অর্জনের জন্য পূর্ববর্তী ডেটাগুলি ব্যবহার করতে পারি এটি আমাদের প্রক্রিয়া হিসাবে আসলেই কোনও ব্যবহার নয়, আমাদের সময় মতো এই পরামিতিগুলি খাপ খাইয়ে নেওয়া দরকার যেমন আমরা পোইসন ব্যবহার করেছিলাম। rp

1
আপনার ডেটা কেবল পইসন বা নেতিবাচক বাইনোমিয়াল রিগ্রেশন মডেলটিতে কেন প্লাগ করবেন না?
স্ট্যাটাস স্টুডেন্ট

1
আমি এটি ব্যবহার করা উচিত মনে করি না । মনে রাখবেন যে পয়েসন নেতিবাচক বাইনোমিয়ালের সীমাবদ্ধ কেস, পোইসনের ক্ষেত্রে আমি যেমন করেছি তেমনভাবে এই সমস্যাটিকে পরামিতি করার কিছু উপায় থাকা উচিত। এছাড়াও, হাজার হাজার পার্থক্য প্রক্রিয়াগুলির জন্য এই প্রক্রিয়াটি একই সাথে ঘটে এবং কারওরই একই "ইভেন্টের হার" হয় না, অর্থাত এই লাইক প্যারামিটারগুলির জন্য রিগ্রেশন বিশ্লেষণ সমস্ত লাইভ প্রক্রিয়াগুলির জন্য প্রতিটি নতুন পর্যবেক্ষণে করতে হবে। এটি সম্ভবপর নয়। আমার প্রশ্ন এবং মন্তব্য পড়তে সময় দেওয়ার জন্য অনেক ধন্যবাদ, এটি সবচেয়ে প্রশংসা করা হয়েছে ...
মুনকনাইট

1
এনবি-র সাথে সংযুক্ত করার ক্ষেত্রে, যদি আপনার কাছে লুকানো ওভার যাতে এবং । এটি একীকরণের উপর একটি প্রান্তিক NB বিতরণ । আপনি সাহায্য করতে এটি ব্যবহার করতে পারেন। ( g t | r t ) G a m m a ( r t , r t ) E ( g t ) = 1 v a r ( g t ) = r -(Xt|λt,rt,gt)Pois(λtgt)(gt|rt)Gamma(rt,rt)E(gt)=1 জিটিvar(gt)=rt1gt
সম্ভাব্যতাব্লোগিক

এটি একটি দুর্দান্ত সহায়তা, তবে আপনি কি আরও কিছুটা এনে দেবেন এবং কিছু স্পষ্ট বিবরণ সরবরাহ করতে পারবেন? আপনার সময়ের জন্য অনেক ধন্যবাদ ...
মুনকনাইট

1
Theণাত্মক দ্বিপদী পরিবর্তে দ্বিপদী ব্যবহার সম্পর্কে কী? এটি করা সহজ হতে পারে। আনসকম্ব এফজে। পোইসন, দ্বিপদী এবং নেতিবাচক-দ্বিপদী তথ্যের রূপান্তর। Biometrika। 1948; 35: 246-54।
কার্ল

উত্তর:


1

নেতিবাচক দ্বিপদী বিতরণ দ্বিপদী সম্ভাব্যতা মডেলের সাথে অনেক মিল। এটি কার্যকর হয় যখন নিম্নলিখিত অনুমানগুলি (শর্তাবলী) ভাল রাখে 1) নির্দিষ্ট পরিস্থিতিতে সাফল্যের একটি সংখ্যা অবধি একই শর্তের অধীনে কোনও পরীক্ষা-নিরীক্ষা করা হয়, সি বলা হয় 2) প্রতিটি পরীক্ষার ফলাফলকে দুটি বিভাগের মধ্যে একটিতে শ্রেণিবদ্ধ করা যেতে পারে , সাফল্য বা ব্যর্থতা 3) সাফল্যের সম্ভাবনা পি প্রতিটি পরীক্ষার জন্য সমান 40 প্রতি পরীক্ষার অন্যান্য সমস্তর থেকে পৃথক। প্রথম শর্তটি দ্বিপদী এবং নেতিবাচক বাইনোমিয়ালের মধ্যে একমাত্র কী পার্থক্যমূলক ফ্যাক্টর


0

পিসন বন্টন দ্বিপদীটির একটি যুক্তিসঙ্গত অনুমান হতে পারে যেমন 1) নির্দিষ্ট শর্তে 1) প্রতিটি পরীক্ষার সাফল্যের সম্ভাবনা খুব কম। পি -> 0 2) এনপি = মি (বলুন) ভাল হয়েছে নিয়মটি প্রায়শই পরিসংখ্যানবিদরা ব্যবহার করেন যে পোসন দ্বিপদী একটি ভাল অনুমান হয় যখন এন 20 এর সমান বা তার বেশি হয় এবং পি সমান বা 5 এর চেয়ে কম হয় %

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.