দ্বিপদী এবং বিটা বিতরণের মধ্যে সম্পর্ক


27

আমি পরিসংখ্যানবিদদের চেয়ে প্রোগ্রামার বেশি, তাই আমি আশা করি এই প্রশ্নটি খুব নিষ্প্রভ নয়।

এটি এলোমেলো সময়ে নমুনা প্রোগ্রামের মৃত্যুদন্ড কার্যকর হয়। যদি আমি প্রোগ্রামটির রাজ্যের N = 10 এলোমেলো সময়ের নমুনাগুলি গ্রহণ করি তবে আমি দেখতে পাচ্ছি ফু ফাংশনটি কার্যকর করা হচ্ছে, উদাহরণস্বরূপ, আমি সেই নমুনাগুলির মধ্যে = 3। আমি ফু আগ্রহী যে সময় F এর বাস্তব ভগ্নাংশ সম্পর্কে আমাকে বলে সে সম্পর্কে আমি আগ্রহী।

আমি বুঝতে পারছি যে আমি দ্বি দ্বিভিত্তিক গড় F * N দিয়ে বিতরণ করেছি। আমি এবং এন, প্রদত্ত এফটি একটি বিটা বিতরণ অনুসরণ করে তাও জানি। আসলে আমি প্রোগ্রামটি যাচাই করেছি those দুটি বিতরণের মধ্যে সম্পর্কটি যা

cdfBeta(I, N-I+1, F) + cdfBinomial(N, F, I-1) = 1

সমস্যাটি হ'ল সম্পর্কের জন্য আমার কোনও স্বজ্ঞাত অনুভূতি নেই। এটি কেন কাজ করে আমি "ছবি" করতে পারি না।

সম্পাদনা: সমস্ত উত্তর চ্যালেঞ্জিং ছিল, বিশেষত @ হুইলারের, যা আমার এখনও খাঁটি করা দরকার, তবে ক্রমের পরিসংখ্যান আনতে খুব সহায়ক হয়েছিল। তবুও আমি বুঝতে পেরেছিলাম আমার আরও একটি বেসিক প্রশ্ন জিজ্ঞাসা করা উচিত ছিল: আমি এবং এন দেওয়া, এফ এর বিতরণ কী? সবাই চিহ্নিত করেছে যে এটি বেটা, যা আমি জানতাম। অবশেষে আমি উইকিপিডিয়া ( কনজুগেট পূর্বে ) থেকে দেখেছি যে এটি উপস্থিত রয়েছে Beta(I+1, N-I+1)। একটি প্রোগ্রামের সাথে এটি অন্বেষণের পরে, এটি সঠিক উত্তর বলে মনে হয়। সুতরাং, আমি জানতে চাই যে আমি ভুল কিনা। এবং, আমি এখনও উপরোক্ত দুটি সিডিএফ-এর সম্পর্কের বিষয়ে বিভ্রান্ত হয়েছি কেন তারা 1 এর সমষ্টি, এবং আমি এমনকি জানতে চাইলে তার সাথে যদি তাদের কিছু করারও থাকে তবে।


যদি "আপনি যা জানতে চেয়েছিলেন" তা হ'ল ফু এর কার্যকর সময়টির প্রকৃত ভগ্নাংশ, "তবে আপনি দ্বিপদী আত্মবিশ্বাসের অন্তর্বর্তী বা একটি (বয়েসিয়ান) দ্বিপদী বিশ্বাসযোগ্য ব্যবধান সম্পর্কে জিজ্ঞাসা করছেন।
হোয়বার

@ হুইবার: আচ্ছা আমি প্রায় তিন দশকেরও বেশি সময় ধরে পারফরম্যান্স টিউনিংয়ের এলোমেলো বিরতি পদ্ধতিটি ব্যবহার করেছি এবং অন্য কিছু লোক এটি আবিষ্কার করেছে। আমি লোকদের বলেছি যে যদি 2 বা ততোধিক র্যান্ডম-সময় নমুনায় কিছু শর্ত সত্য হয়, তবে এটি সরিয়ে ফেলা সময়ের একটি ভাল ভগ্নাংশ বাঁচাতে পারে। ভেবেছিলাম আমরা কোনও বয়েশিয়ানকে এর আগে জানি না বলে ধরে নিয়ে আমি কীভাবে ভগ্নাংশের বিষয়ে স্পষ্ট করে বলার চেষ্টা করেছি। এখানে সাধারণ শিখা: স্ট্যাকওভারফ্লো / সিকিউশনস
মাইক ডুনলাভে

1
ভাল যুক্তি. পরিসংখ্যানগত ধারণাটি হ'ল বাধা কার্যকরকরণ রাষ্ট্রের থেকে পৃথক, যা একটি যুক্তিসঙ্গত অনুমান। একজন দ্বিপদ আস্থা ব্যবধান অনিশ্চয়তা প্রতিনিধিত্ব করতে ব্যবহার করার জন্য একটি ভাল হাতিয়ার। (এটি চোখের ওপেনারও হতে পারে: আপনার ৩/১০ পরিস্থিতিতে সত্যিকারের সম্ভাবনার জন্য একটি প্রতিসম দ্বিমুখী 95% সিআই হয় [[.7%, 65৫.২%]। ২/১০ অবস্থায় ব্যবধানটি [২. 2.5] ।%, 55.6%] এই ওয়াইড রেঞ্জ করা থাকলেও সেগুলিকে 2/3 সঙ্গে, নিম্ন সীমা এখনও কম 10% পাঠ এখানে কিছু মোটামুটি বিরল দুইবার ঘটতে
whuber

@ শুভ: ধন্যবাদ তুমি ঠিক বলছো. আরও কার্যকর কিছু হ'ল প্রত্যাশিত মান। প্রিরিয়াররা যতদূর যেতে চাই, আমি উল্লেখ করেছি যে আপনি যদি একবার মাত্র কিছু দেখেন তবে আপনি যদি প্রোগ্রামটি অসীম (বা অত্যধিক দীর্ঘ) লুপতে না জেনে থাকেন তবে তা আপনাকে বেশি কিছু বলবে না ।
মাইক ডুনলাভে

আমি মনে করি যে সমস্ত উত্তর এবং মন্তব্যগুলি অবশ্যই আলোকিত এবং সঠিক হয়েছে, তবে @ মাইকডুনলাভে তার মূল পোস্টে যে আকর্ষণীয় সমতা রেখেছিলেন তা সত্যিই কেউ স্পর্শ করেনি। এই সমতাটি বিটা উইকিপিডিয়া en.wikedia.org/wiki/Beta_function#Incomplete_beta_function- এ পাওয়া যাবে তবে কেন মামলাটি তা সম্পর্কে কোনও বিবরণ দেওয়া হয়নি, এটি সম্পত্তি হিসাবে ঠিক বর্ণনা করা হয়েছে।
বিডিওনোভিক

উত্তর:


27

ক্রমের পরিসংখ্যান বিবেচনা করুন এর স্বতন্ত্র বন্টন থেকে অঙ্কিত। কারণ অর্ডার পরিসংখ্যান বিটা ডিস্ট্রিবিউশন আছে , সুযোগ যে না অতিক্রম বিটা অবিচ্ছেদ্য দেওয়া হয় এন + 1 এক্স [ কে ] পিx[0]x[1]x[n]n+1x[k]p

Pr[x[k]p]=1B(k+1,nk+1)0pxk(1x)nkdx.

(কেন? এই হল এখানে একটি অ কঠোর কিন্তু স্মরণীয় বিক্ষোভ। সুযোগ যে মধ্যে মিথ্যা এবং সুযোগ যে বাইরে অভিন্ন মূল্যবোধ, তাদের মধ্যে থাকা এবং , তাদের মধ্যে কমপক্ষে একটি এবং মধ্যে রয়েছে এবং বাকী অংশ এবং মধ্যে রয়েছে। অনন্ত প্রথম অর্ডার করতে আমাদের কেবল সেই ক্ষেত্রেটি বিবেচনা করতে হবে যেখানে ঠিক একটি মান (যেমন, নিজেই এবং এবং তাইx[k]pp+dpn+1k0ppp+dpp+dp1dpx[k]pp+dpnk মানগুলি ছাড়িয়ে যায় । কারণ সব মান স্বাধীন ও অভিন্ন, এই সম্ভাবনা সমানুপাতিক । প্রথমে অর্ডার দেওয়ার জন্য এটি সমান , বিটা বিতরণের যথাযথভাবে একীকরণ। এই শব্দটি থেকে বহুগুণীয় সহগ হিসাবে argument বা পরোক্ষভাবে প্রাপ্ত হিসাবে বেছে নেওয়া যেতে পারে অবিচ্ছেদের স্বাভাবিককরণের ধ্রুবক।)p+dppk(dp)(1pdp)nkdppk(1p)nkdp1B(k+1,nk+1)(n+1k,1,nk)

সংজ্ঞা অনুসারে, ইভেন্ট হচ্ছে মান বেশি হবে না । সমানভাবে, কমপক্ষে এর মানগুলি ছাড়িয়ে যায় না : এই সরল (এবং আমি প্রত্যাশা করি প্রত্যাশা) দৃ int়তা আপনার সন্ধানের অন্তর্দৃষ্টি সরবরাহ করে। সমতুল্য বিবৃতিটির সম্ভাব্যতা দ্বিপদী বিতরণ দ্বারা দেওয়া হয়েছে,x[k]pk+1stp k+1p

Pr[at least k+1 of the xip]=j=k+1n+1(n+1j)pj(1p)n+1j.

সংক্ষেপে , বিটা ইন্টিগ্রালটি একটি ইভেন্টের গণনাটিকে একটি ধারাবাহিকতায় বিভক্ত করে: পরিসরে কমপক্ষে মান খুঁজে পাওয়া , যার সম্ভাবনাটি আমরা সাধারণত বাইনোমিয়াল সিডিএফ দিয়ে গণনা করি, পারস্পরিকভাবে বিভক্ত হয়ে যায় একচেটিয়া ক্ষেত্রে যেখানে ঠিক মানগুলি ব্যাপ্তিতে থাকে এবং 1 মানটি সমস্ত সম্ভাব্য , , এবং এর একটি সীমাহীন দৈর্ঘ্যের জন্য । এই জাতীয় সমস্ত "উইন্ডোজ" এর উপরে সংমিশ্রণ এটি হল, সংহত হচ্ছে - বাইনোমিয়াল সিডিএফ হিসাবে একই সম্ভাবনা দিতে হবে।k+1[0,p] k[0,x][x,x+dx]x0x<pdx[x,x+dx]

বিকল্প পাঠ


আমি প্রচেষ্টা প্রশংসা করি। আমি সত্যিই এটি অধ্যয়ন করতে যাচ্ছি কারণ এটি আমার "মাতৃভাষা" নয়। এছাড়াও, আমি প্রচুর ডলারের চিহ্ন এবং ফর্ম্যাটিং স্টাফ দেখছি। এমন কিছু কি আছে যা সম্পর্কে আমি জানি না যা এটিকে বাস্তব গণিতের মতো দেখায়?
মাইক ডুনলাভে

কি হলো? হঠাৎ করেই গণিতটি দেখা গেল এবং এখানে টাইপ করা সত্যই ধীর হয়ে গেল।
মাইক ডুনলাভে

@ মাইক দেখুন meta.stats.stackexchange.com/q/218/919
whuber

আমি প্রশ্নটি সংশোধন করেছি, আপনি যদি একবার খেয়াল রাখেন। ধন্যবাদ।
মাইক ডুনলাভে

1
কিছুটা দেরি হয়ে গেছে, তবে অবশেষে আমি বসে আপনার যুক্তিটি পুনরায় তৈরি করার জন্য সময় পেয়েছি। চাবিটি ছিল "বহুজাতিক গুণফল"। আমি সরল পুরানো দ্বিপদী সহগগুলি ব্যবহার করে এটি নির্ধারণের চেষ্টা করেছি এবং আমি সমস্ত বেলড হয়ে যাচ্ছি। একটি সুন্দর উত্তরের জন্য আবার ধন্যবাদ।
মাইক ডুনলাভে

12

: কে : এবং বিটার পিডিএফ ফাংশন হিসাবে পিডিএফ দেখুন : আপনি সম্ভবত দেখতে পারেন যে জন্য একটি যথাযথ (পূর্ণসংখ্যা) পছন্দ সঙ্গে এবং এই একই। আমি যতদূর বলতে পারি, এই সম্পর্কের মধ্যে এটিই রয়েছে : দ্বিপদী পিডিএফ-তে প্রবেশ করার পথে কেবল বিটা বিতরণ বলে।x

f(x)=(nx)px(1p)nx
p
g(p)=Γ(a+b)Γ(a)Γ(b)pa1(1p)b1
abp

আমি সেগুলি প্রায় একই রকম দেখতে জানি, তবে আমি যদি এনএক্সের জন্য y প্রতিস্থাপন করি এবং আমি যদি বিটা পিডিএফ এবং এক্স -1 এবং এ -1 এর জন্য এক্স-এর জন্য এবং বি -1 এর জন্য প্রতিস্থাপন করি তবে আমি (x + y + 1) এর একটি অতিরিক্ত গুণক পেয়েছি, বা এন + 1। অর্থাত (x + y + 1)! / x! / y! * p ^ x * q ^ y। আমাকে ফেলে দেওয়ার পক্ষে তা যথেষ্ট বলে মনে হচ্ছে।
মাইক ডুনলাভে

1
হতে পারে যে কোনও ব্যক্তি সম্পূর্ণ প্রতিক্রিয়া সহকারে চিমে যাবে, তবে একটি "স্বজ্ঞাত" ব্যাখ্যায় আমরা সর্বদা হাতের তরঙ্গকে দূরে সরিয়ে রাখতে পারি ( ) যা সুদের পরিবর্তনশীলগুলির উপর নির্ভর করে না ( এবং ), তবে প্রয়োজনীয় "সমতা" চিহ্নগুলিকে "সমানুপাতিক" চিহ্নগুলির সাথে প্রতিস্থাপন করতে নির্দ্বিধায় পিডিএফ তৈরি করুন integ n+1xp
অনিক

ভাল যুক্তি. আমি মনে করি আমি একটি বোঝার কাছাকাছি চলেছি আমি এখনও x কীভাবে পি ডিস্ট্রিবিউশন সম্পর্কে আপনাকে বলার চেষ্টা করতে সক্ষম হচ্ছি এবং কেন এই দুটি সিডিএফ যোগফল 1
মাইক ডুনলাভে

1
আমি "স্বজ্ঞাত" ব্যাখ্যাগুলির একটি ভিন্ন দৃষ্টিভঙ্গি গ্রহণ করি। কিছু ক্ষেত্রে আমরা ধ্রুবকগুলির সম্পর্কে খুব বেশি যত্ন নিই না, তবে এক্ষেত্রে বিষয়টির ক্রুসটি একটি এন + 1 কেন উপস্থিত হয় এবং এন এন নয় তা দেখতে হবে। যদি আপনি বুঝতে না পারেন তবে আপনার "স্বজ্ঞাত "টি ভুল।
whuber

আমি প্রশ্নটি সংশোধন করেছি, আপনি যদি একবার খেয়াল রাখেন। ধন্যবাদ।
মাইক ডুনলাভে

5

যেমন আপনি উল্লেখ করেছেন, বিটা বিতরণ পরীক্ষার সম্ভাব্যতা পরামিতি বিতরণকে বর্ণনা করে, যখন দ্বি-দ্বি বিতরণ ফলাফল প্যারামিটার এর বিতরণকে বর্ণনা করে । আপনার প্রশ্নের পুনর্লিখন, আপনি যা সম্পর্কে জিজ্ঞাসা করেছিলেন তা হ'ল কেন অর্থাৎ, পর্যবেক্ষণের প্রত্যাশার চেয়ে পর্যবেক্ষণ প্লাস একের সম্ভাবনা বেশি হওয়ার সম্ভাবনা একই পর্যবেক্ষণ প্লাস ওয়ান পর্যবেক্ষণের প্রত্যাশার চেয়ে বেশি।FI

P(Fi+1n)+P(Ifn1)=1
P(Fni+1)+P(I+1fn)=1
P(Fni+1)=P(fn<I+1)

আমি স্বীকার করি যে এটি সমস্যার মূল সূচনাটি অন্তর্নিহিত করতে সহায়তা করতে পারে না, তবে সম্ভবত এটি কমপক্ষে এটি দেখতে পারা যায় যে দুটি বিতরণ পুনরায় বার্নোল্লি ট্রায়ালের একই অন্তর্নিহিত মডেলটি বিভিন্ন পরামিতিগুলির আচরণ বর্ণনা করার জন্য কীভাবে ব্যবহার করে।


আমি আপনার এটি গ্রহণ প্রশংসা করি। সমস্ত উত্তর আমাকে প্রশ্নটি সম্পর্কে ভাবতে এবং আমি কী জিজ্ঞাসা করছি তা সম্ভবত আরও ভালভাবে বুঝতে সহায়তা করছে।
মাইক ডুনলাভে

আমি প্রশ্নটি সংশোধন করেছি, আপনি যদি একবার খেয়াল রাখেন। ধন্যবাদ।
মাইক ডুনলাভে

1
আপনার পুনর্বিবেচনা সম্পর্কিত: হ্যাঁ, , আপনার নমুনা ব্যবধানগুলি যতক্ষণ না প্রতিটি পর্যবেক্ষণটি স্বতন্ত্র এবং অভিন্নভাবে বিতরণযোগ্য। মনে রাখবেন যে আপনি যদি এটি সম্পর্কে বায়েশিয়ান হতে চান এবং প্রকৃত অনুপাতের যা প্রত্যাশা করেন তার জন্য একটি অযৌক্তিক পূর্ব বিতরণ নির্দিষ্ট করে রাখলে আপনি উভয় পরামিতিতে অন্য কিছু যুক্ত করতে পারেন। FBeta(I+1,NI+1)
sesqu

@ প্রশ্ন, আপনার উত্তরটি আমার প্রশ্নের সাথে এখানে কোনওভাবে সম্পর্কিত হতে পারে: stats.stackexchange.com/questions/147978/… ? আমি এটি সম্পর্কে আপনার চিন্তা প্রশংসা করব।
ভিসেন্ট

1

বায়সিয়ান জমিতে, বিটা বিতরণ বিনোমিয়াল বিতরণের প্যারামিটারের পূর্বে সম্মিলিত।


2
হ্যাঁ, তবে কেন এই ঘটনা?
ভনজড

1

অন্যান্য উত্তরের বিষয়ে মন্তব্য করতে পারে না, তাই আমাকে নিজের উত্তর তৈরি করতে হবে।

পূর্ববর্তী = সি * সম্ভাবনা * পূর্বে (সি একটি ধ্রুবক যা পোস্টেরিয়র 1 এ সংহত করে)

এমন একটি মডেল দেওয়া হয়েছে যা সম্ভাবনার জন্য দ্বিপদী বিতরণ এবং পূর্বের জন্য বিটা বিতরণ ব্যবহার করে। দুটি পোস্টারিয়র উত্পন্ন করে এর পণ্যটিও একটি বিটা বিতরণ। যেহেতু পূর্ব এবং পূর্ববর্তী উভয়ই বিটা, এবং সুতরাং এগুলি কনজিগেট বিতরণ । প্রিয়ার (একটি বিটা) সম্ভাবনা (দ্বিপদী) জন্য সংঘবদ্ধ আগে বলা হয় । উদাহরণস্বরূপ, আপনি যদি একটি সাধারণ দিয়ে বিটা গুণ করেন তবে পোস্টেরিয়র আর বিটা হয় না। সংক্ষেপে, বিটা এবং বিনোমিয়াল দুটি বিতরণ যা ঘন ঘন ব্যায়েশিয়ার অনুমান হিসাবে ব্যবহৃত হয়। বিটা বিনোমিয়ালের কনজুগেট প্রাইমার, তবে দুটি বিতরণ অন্যটির উপসেট বা সুপারসেট নয়।

বায়সিয়ান অনুমানের মূল ধারণাটি হ'ল আমরা প্যারামিটার পিটিকে একটি র্যান্ডম ভেরিয়েবল হিসাবে চিকিত্সা করছি যা [0,1] থেকে শুরু করে যা ঘন ঘনবাদী অনুমান পদ্ধতির বিপরীত যেখানে আমরা প্যারামিটার পিটিকে স্থির হিসাবে চিকিত্সা করছি। আপনি যদি বিটা বিতরণের বৈশিষ্ট্যগুলি ঘনিষ্ঠভাবে লক্ষ্য করেন, আপনি দেখতে পাবেন এর গড় এবং মোডটি সম্পূর্ণরূপে me এবং প্যারামিটার পি থেকে অপ্রাসঙ্গিক দ্বারা নির্ধারিতαβ । এটি এর নমনীয়তার সাথে মিলিত হয়, এজন্যই বিটা সাধারণত অগ্রাধিকার হিসাবে ব্যবহৃত হয়।


1

সংক্ষিপ্তসার: প্রায়শই বলা হয় যে বিটা বিতরণ বিতরণে বিতরণ! কিন্তু মানে কি?

এটির মূলত অর্থ হল যে আপনি এবং of কে ক্রিয়া হিসাবে । নীচের গণনাটি যা বলেছে তা হল থেকে থেকে বৃদ্ধি পায় যখন আপনি থেকে থেকে । প্রতিটি বৃদ্ধি হার ঠিক যে ।n,kP[Bin(n,p)k]pP[Bin(n,p)k]01p01pβ(k,nk+1)p

এখানে চিত্র বর্ণনা লিখুন


যাক সঙ্গে একটি বাইনমিয়াল দৈব চলক বোঝাতে নমুনা এবং সাফল্যের সম্ভাবনা । আমাদের কাছে বুনিয়াদি বীজগণিত ব্যবহার করেBin(n,p)np

ddpP[Bin(n,p)=i]=n(P[Bin(n1,p)=i1]P[Bin(n1,p)=i]).

এটিরও কিছু চমৎকার সমন্বয়মূলক প্রমাণ রয়েছে, এটিকে অনুশীলন হিসাবে ভাবেন!

তাহলে আমাদের আছে:

ddpP[Bin(n,p)k]=ddpi=knP[Bin(n,p)=i]=n(i=knP[Bin(n1,p)=i1]P[Bin(n1,p)=i])
যা একটি দূরবীণমূলক সিরিজ এবং এটিকে সরলীকৃত করা যেতে পারে

ddpP[Bin(n,p)k]=nP[Bin(n1,p)=k1]=n!(k1)!(nk)!pk1(1p)nk=β(k,nk+1).


মন্তব্য এ চক্রান্ত বর্ণন একটি ইন্টারেক্টিভ সংস্করণ দেখার জন্য এই । আপনি নোটবুকটি ডাউনলোড করতে পারেন বা কেবল বাইন্ডার লিঙ্কটি ব্যবহার করতে পারেন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.