নির্ভরশীল ডেটার জন্য বার্নোল্লি র্যান্ডম ভেরিয়েবলের যোগফলকে কীভাবে মডেল করবেন?


9

আমার প্রায় একই ধরণের প্রশ্ন রয়েছে: আমি কীভাবে দক্ষতার সাথে বেরনুলি র্যান্ডম ভেরিয়েবলগুলির যোগফলকে মডেল করতে পারি?

তবে সেটিংটি সম্পূর্ণ আলাদা:

  1. S=i=1,NXi, P(Xi=1)=pi, N~ 20, pi~ 0.1

  2. বার্নোল্লি র্যান্ডম ভেরিয়েবলের ফলাফলের জন্য আমাদের কাছে ডেটা রয়েছে: Xi,j , Sj=i=1,NXi,j

  3. আমরা যদি অনুমান করি pi সর্বোচ্চ সম্ভাবনা অনুমান সহ (এবং পেতে) p^iMLE), এটা দেখা যাচ্ছে যে P^{S=3}(p^iMLE) অন্যান্য মাপদণ্ড দ্বারা প্রত্যাশিত তখন অনেক বড়: P^{S=3}(p^iMLE)P^expected{S=3}0.05

  4. সুতরাং, Xi এবং Xj (j>k) স্বতন্ত্র হিসাবে চিকিত্সা করা যায় না (তাদের স্বল্প নির্ভরতা রয়েছে)।

  5. এর মতো কিছু প্রতিবন্ধকতা রয়েছে: pi+1pi এবং s2P^{S=s}=A (পরিচিত), যা অনুমানের সাথে সহায়তা করবে P{S}

এই ক্ষেত্রে আমরা কীভাবে বার্নোল্লি র্যান্ডম ভেরিয়েবলগুলির যোগফলকে মডেল করার চেষ্টা করতে পারি?

টাস্কটি সমাধান করার জন্য কোন সাহিত্যটি কার্যকর হতে পারে?

আপডেট

আরও কিছু ধারণা রয়েছে:

(1) এটি অনুমান করা সম্ভব যে এর মধ্যে অজানা নির্ভরতা Xiসিরিজে 1 বা তত বেশি সাফল্যের পরে শুরু হয়। তো কখনi=1,KXi>0, pK+1pK+1 এবং pK+1<pK+1

(২) এমএলই ব্যবহার করতে আমাদের কমপক্ষে প্রশ্নবিদ্ধ মডেল প্রয়োজন। এখানে একটি বৈকল্পিক:

P{X1,...,Xk}=(1p1)...(1pk) যদি i=1,kXi=0 যে কোনও কে P{X1,...,Xk,Xk+1,...,XN}=(1p1)...pkP{Xk+1,...,XN} যদি i=1,k1Xi=0 এবং Xk=1, এবং P{Xk+1=1,Xk+2=1,...,XN=1}pk+1pk+2...pN যে কোনও কে।

(3) যেহেতু আমরা কেবল আগ্রহী P{S} আমরা সেট করতে পারি P{Xk+1,...,XN}P{i=1,kXi=s;N(k+1)+1=l} (সম্ভাবনা i=k+1,NXiN- (k + 1) +1 লেজ থেকে 1 সমানডের জন্য সাফল্য। এবং প্যারামিট্রাইজেশন ব্যবহার করুনP{i=k,NXi=s;Nk+1=l}=ps,l

(4) পরামিতিগুলির ভিত্তিতে মডেলের জন্য এমএলই ব্যবহার করুন p1,...,pN এবং p0,1,p1,1;p0,2,p1,2,p2,2;... সঙ্গে ps,l=0 জন্য s6 (এবং যে কোনও l) এবং অন্যান্য কিছু দেশীয় বাধা।

এই পরিকল্পনা কি সবকিছু ঠিক আছে?

আপডেট 2

অভিজ্ঞতামূলক বিতরণের কয়েকটি উদাহরণ P{S} (লাল) পোইসন বিতরণ (নীল) এর সাথে তুলনা করুন (পোয়েসন অর্থ 2.22 এবং 2.45, নমুনার আকারগুলি 332 এবং 259):

sample1 sample2

পোয়েসন সহ নমুনাগুলির জন্য (এ 1, এ 2) অর্থ 2.28 এবং 2.51 (নমুনার আকার 303 এবং 249):

sample3 sample4

যোগদানের জন্য সাম্পে এ 1 + এ 2 (নমুনার আকার 552):

নমুনা 3 + নমুনা 4

দেখে মনে হচ্ছে পোয়েসনের কিছু সংশোধনই সেরা মডেল হওয়া উচিত :)।


2
কি Xi,j?
chl

1
@ আন্ড্রে (২) এর সূত্রগুলি এবং (4) এর দ্বিতীয় সীমাবদ্ধতার কোনও অর্থ নেই: টুপি (4) এর অর্থ কী? কিS? (আপনি কেবল সংজ্ঞা দিয়েছেনSj, না S।) (4) তিনটি পণ্যের যোগফল বা অন্য কিছুর মধ্যে?
শুক্র

Xi,j বার্নোল্লি এলোমেলো ফলাফল (জে-থ্রি সিরিজের i-th ফলাফল), Sj যোগফলের জে-তম ফলাফল (সিরিজের উপর যোগফল)। Sযোগফলের এলোমেলো পরিবর্তনশীল; টুপি ইন (4) অর্থ অনুমান। সুতরাং সর্বনিম্ন মানগুলির যোগফল সম্পর্কে কিছু অতিরিক্ত তথ্য রয়েছেS। বিভ্রান্তির জন্য দুঃখিত.
অ্যান্ড্রে

উত্তর:


3

একটি পদ্ধতির মডেল হতে হবে Xজেনারাইজড লিনিয়ার মডেল (জিএলএম) এর সাথে। এখানে, আপনি প্রণয়ন করা হবেpi, সাফল্যের সম্ভাবনা iসাম্প্রতিক পর্যবেক্ষণের ইতিহাসের (লজিস্টিক লিনিয়ার) ফাংশন হিসাবে এটির পরীক্ষা। সুতরাং আপনি মূলত একটি অটোরেগ্রেসিভ জিএলএম ফিট করছেন যেখানে শব্দটি বার্নোল্লি এবং লিঙ্ক ফাংশনটি লজিট। সেটআপটি হ'ল:

pi=f(b+a1Xi1+a2Xi2+akXik), কোথায়

f(x)=11+exp(x), এবং

XiBernoulli(pi)

মডেলের পরামিতিগুলি হ'ল {b,a1,ak}, যা লজিস্টিক রিগ্রেশন দ্বারা অনুমান করা যায়। (আপনাকে যা যা করতে হবে তা প্রতিটি পরীক্ষার পর্যবেক্ষণের ইতিহাসের প্রাসঙ্গিক অংশটি ব্যবহার করে আপনার নকশা ম্যাট্রিক্স সেট আপ করতে হবে এবং এটি একটি লজিস্টিক রিগ্রেশন অনুমানের ফাংশনে পাস করুন; লগ-সম্ভাবনাটি অবতল; সুতরাং প্যারামিটারগুলির জন্য একটি অনন্য বৈশ্বিক সর্বোচ্চ রয়েছে)। ফলাফল যদি সত্যই স্বাধীন হয় তবেaiএর শূন্যতে সেট করা হবে; ধনাত্মকaiএর অর্থ পরবর্তীকালে piযখনই সাফল্য লক্ষ্য করা যায় এর বৃদ্ধি।

মডেল নেই ওভার সম্ভাব্যতা জন্য একটি সহজ অভিব্যক্তি প্রদান সমষ্টি এরXiএর, তবে সিমুলেশন (পার্টিকাল ফিল্টারিং বা এমসিএমসি) দ্বারা এটি গণনা করা সহজ কারণ মডেলটির সহজ মার্কোভিয়ান কাঠামো রয়েছে।

মস্তিষ্কের নিউরনের "স্পাইক" এর মধ্যে টেম্পোরাল নির্ভরতা মডেল করতে এ জাতীয় মডেল দুর্দান্ত সাফল্যের সাথে ব্যবহৃত হয়েছে এবং অটোরিগ্রেসিভ পয়েন্ট প্রক্রিয়া মডেলগুলির উপর একটি বিস্তৃত সাহিত্য রয়েছে। দেখুন, উদাহরণস্বরূপ, ট্রুক্কোলো এট আল 2005 (যদিও এই কাগজটি বার্নোলির সম্ভাবনার পরিবর্তে পোইসন ব্যবহার করে তবে একের থেকে অন্যটিতে ম্যাপিংটি সোজা))


1

নির্ভরতা যদি ক্লাম্পিংয়ের কারণে হয় তবে একটি যৌগিক পইসন মডেল এর মডেল হিসাবে সমাধান হতে পারে এস। কিছুটা এলোমেলো রেফারেন্স হ'ল এটি বার্বুর এবং ক্রিসাফিনো।

সম্পূর্ণ ভিন্ন দিকে, যেহেতু আপনি এটি ইঙ্গিত করেছেন এন 20, এবং এইভাবে তুলনামূলকভাবে ছোট, এর একটি গ্রাফিকাল মডেল তৈরি করতে পারে এক্সআমিএর, তবে আপনার সেটআপ এবং ডেটা এটি সম্ভব করে কিনা তা আমি জানি না। @ সিএল মন্তব্য হিসাবে, আপনি কী কী তা বর্ণনা করলে তা কার্যকর হবেএক্সআমি,এর হয়।

যদি এক্সআমি,এর ধারাবাহিক পরিমাপের প্রতিনিধিত্ব করা, যেমন সময়ের সাথে সাথে, এবং নির্ভরতা এটির সাথে সম্পর্কিত, একটি তৃতীয় সম্ভাবনা - এবং কিছু উপরে উপরোক্ত দুটি পরামর্শের মধ্যে একটি সমঝোতা প্রসারিত - এর একটি লুকানো মার্কভ মডেল ব্যবহার করা হয় এক্সআমি,'S।


এক্সআমি,Bernoulli এলোমেলো ফলাফল। অসম্পূর্ণতার জন্য দুঃখিত। সুতরাং,এক্সআমিসময়ের ক্রম সমমানের বিরতিতে ক্রীড়া দলগুলির জন্য স্কোরগুলির যোগফল। দেখা যাচ্ছে যে প্রথম গোল করার পরে ব্যবধানে পরবর্তী গোলের সম্ভাবনাগুলি আলাদা হবে।
অ্যান্ড্রে
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.