গামা র্যান্ডম ভেরিয়েবলের জেনেরিক যোগফল


35

আমি পড়েছি যে একই স্কেল প্যারামিটার সহ গামা র্যান্ডম ভেরিয়েবলগুলির যোগফল হ'ল অন্য গামা র্যান্ডম ভেরিয়েবল। আমি মোছোপৌলসের কাগজটিও গামা র্যান্ডম ভেরিয়েবলগুলির একটি সাধারণ সেটের সংমিশ্রনের জন্য একটি পদ্ধতি বর্ণনা করে দেখেছি । আমি মোছোপ্লোস পদ্ধতিটি বাস্তবায়নের চেষ্টা করেছি তবে এখনও সাফল্য পাইনি ।

গামা র্যান্ডম ভেরিয়েবলগুলির একটি সাধারণ সেটের সংমিশ্রণটি দেখতে কেমন লাগে? এই প্রশ্নটি কংক্রিট করার জন্য, এটি দেখতে কেমন লাগে:

Gamma(3,1)+Gamma(4,2)+Gamma(5,1)

যদি উপরের প্যারামিটারগুলি বিশেষভাবে প্রকাশ না করে তবে দয়া করে অন্যদের পরামর্শ দিন।


4
যে কোনও দুটি গামা বিতরণের যোগফলের একটি স্পষ্ট সমাধান stats.stackexchange.com/a/252192 এ পোস্ট করা হয়েছে ।
হোবার

এর একটি বিশেষ উদাহরণ, যেখানে সমস্ত গামা বিতরণকে আকৃতি প্যারামিটার 1 রয়েছে (যা তারা ক্ষতিকারক হয়) বলা হয় হাইপো এক্সপেনশিয়াল ডিস্ট্রিবিউশন (পরিবার) । মাত্র দুটি সূচকীয় বিতরণের ক্ষেত্রে স্ট্যাটাস.স্ট্যাকেক্সেঞ্জাওয়েজ / সেকশনস / ৪১৪৪৮৯ এ একটি সুস্পষ্ট সূত্র দেওয়া আছে ।
হুড়াহুড়ো করে

উত্তর:


37

প্রথমে একই স্কেল ফ্যাক্টরযুক্ত যে কোনও যোগফল একত্রিত করুন : a Γ(n,β) প্লাস a Γ(m,β) ভ্যারিয়েটটি একটি Γ(n+m,β) ভ্যারিয়েট গঠন করে।

এর পরে, মান্য যে চরিত্রগত ফাংশনের গড় (CF) Γ(n,β) হয় (1iβt)n , কোথা এই ডিস্ট্রিবিউশন একটি সমষ্টি এর CF পণ্য

j1(1iβjt)nj.

যখন সব অবিচ্ছেদ্য, এই পণ্যের একটি আংশিক ভগ্নাংশ হিসাবে বিস্তৃতি একটি মধ্যে রৈখিক সমন্বয় এর ( 1 - আমি β টি ) - ν যেখানে ν মধ্যে পূর্ণসংখ্যা 1 এবং এন । উদাহরণে β 1 = 1 , n 1 = 8 ( Γ ( 3 , 1 ) এবং Γ ( 5 , 1 এর যোগফল থেকে )nj (1iβjt)νν1njβ1=1,n1=8Γ(3,1) ) এবং β 2 = 2 , n 2 = 4 আমরা খুঁজে পাইΓ(5,1)β2=2,এন2=4

1(1আমিটি)81(1-2আমিটি)4=1(এক্স+ +আমি)8-8আমি(এক্স+ +আমি)7-40(এক্স+ +আমি)6+ +160আমি(এক্স+ +আমি)5+ +560(এক্স+ +আমি)4-1792আমি(এক্স+ +আমি)3-5376(এক্স+ +আমি)2+ +15360আমিএক্স+ +আমি+ +256(2এক্স+ +আমি)4+ +2048আমি(2এক্স+ +আমি)3-9216(2এক্স+ +আমি)2-30720আমি2এক্স+ +আমি

সিএফ গ্রহণের বিপরীতমুখীটি হ'ল ইনভার্স ফুরিয়ার ট্রান্সফর্ম, যা লিনিয়ার : এর অর্থ আমরা এটি শব্দ দ্বারা পদ প্রয়োগ করতে পারি। প্রতিটি শব্দটি গামা বিতরণের সিএফের একাধিক হিসাবে স্বীকৃত এবং তাই পিডিএফ উত্সাহিত করার জন্য সহজেই উল্টে যায় । উদাহরণ হিসাবে আমরা প্রাপ্ত

ett75040+190ett6+13ett5+203ett4+83et2t3+2803ett3128et2t2+896ett2+2304et2t+5376ett15360et2+15360et

যোগফল পিডিএফ জন্য।

এটি গামা বিতরণগুলির একটি সীমাবদ্ধ মিশ্রণ যা সমষ্টিগুলির মধ্যে সমান পরিমাণগুলির সাথে সমান এবং আকৃতির উপাদানগুলির যোগফলগুলির চেয়ে কম বা সমান আকারের হয়। বিশেষ ক্ষেত্রে বাদে (যেখানে কিছু বাতিল হতে পারে), পদগুলির সংখ্যাটি মোট শেপ প্যারামিটার (সমস্ত এন জে আলাদা বলে ধরে নিচ্ছে )।n1+n2+nj


একটি পরীক্ষা হিসাবে, এখানে একটি হিস্টোগ্রাম হল স্বাধীন যোগ করে প্রাপ্ত ফলাফল থেকে স্বপক্ষে Γ ( 8 , 1 ) এবং Γ ( 4 , 2 ) ডিস্ট্রিবিউশন। এটিতে পূর্ববর্তী ফাংশনটির 10 গুণ 4 বারের গ্রাফ সুপারমোজ করা হয়। ফিট খুব ভাল।104Γ(8,1)Γ(4,2)104

ব্যক্তিত্ব


মোছোপৌলস এই ধারণাটিকে আরও এক ধাপ এগিয়ে নিয়ে যায় যখনই যোগফলের সিএফকে গামা চরিত্রগত ফাংশনগুলির সীমাহীন সিরিজের মধ্যে প্রসারিত করে যখনই আমি এক বা একাধিক অবিচ্ছেদ্য হয় এবং তারপরে অসীম ধারাবাহিকটি এমন এক পর্যায়ে বন্ধ করে দেয় যেখানে এটি যুক্তিসঙ্গতভাবে প্রায় নিকৃষ্ট হয় ।ni


2
গৌণ মন্তব্য: সাধারণত, একটি সীমাবদ্ধ মিশ্রণের অর্থ হল ফর্মের একটি পিডিএফ যেখানে একটি i > 0 এবং i a i = 1 , যে, আমি একটি সম্ভাব্যতা রয়েছে এবং পিডিএফকে (সম্পূর্ণ সম্ভাবনার আইন) শর্তসাপেক্ষ পিডিএফ-এর যোগফল হিসাবে ব্যাখ্যা করা যেতে পারে বিভিন্ন সম্ভাব্যতাগুলির সাথে ঘটে যা একটি শর্ত সাপেক্ষে i
f(x)=i=1naifi(x)
ai>0iai=1aiai। যাইহোক, উপরের যোগফলে, সহগগুলির মধ্যে কিছু নেতিবাচক এবং এইভাবে মিশ্রণের মানক ব্যাখ্যা প্রয়োগ হয় না।
দিলিপ সরোতে

@ দিলিপ এটি একটি ভাল পয়েন্ট। এই কেসটি আকর্ষণীয় করে তোলে তা হ'ল যদিও কিছু সহগগুলি নেতিবাচক হতে পারে তবে তবুও এই সংমিশ্রণটি এখনও একটি বৈধ বন্টন (এটির নির্মাণ দ্বারা)।
হোয়বার

এই পদ্ধতির নির্ভরশীল ভেরিয়েবল যোগ করার জন্য অ্যাকাউন্টে বাড়ানো যেতে পারে? বিশেষত আমি প্রত্যেকটির সাথে অন্যের সাথে কিছুটা সংযোগ স্থাপনের সাথে corre টি বিতরণ যুক্ত করতে চাই।
মাসের

11

আমি আরেকটি সম্ভাব্য সমাধান দেখাব, এটি বেশ ব্যাপকভাবে প্রযোজ্য এবং আজকের আর সফ্টওয়্যার সহ কার্যকর করা খুব সহজ। এটি স্যাডলিপয়েন্টের ঘনত্বের আনুমানিক, যা আরও বিস্তৃত জানা উচিত!

গামা বিতরণ সম্পর্কে পরিভাষার জন্য, আমি https://en.wikedia.org/wiki/Gamma_distribration কে আকার / স্কেল প্যারামিটারাইজেশন সহ অনুসরণ করব , আকারের প্যারামিটার এবং θ স্কেল। স্যাডলিপয়েন্টের প্রায় অনুমানের জন্য আমি রোনাল্ড ডাব্লু বাটলার অনুসরণ করব: "অ্যাপ্লিকেশনগুলির সাথে স্যাডলিপয়েন্টের আনুমানিকতা" (কেমব্রিজ ইউপি)। স্যাডলিপয়েন্টের সান্নিধ্যটি এখানে ব্যাখ্যা করা হয়েছে: স্যাডলিপয়েন্টের আনুমানিক কাজ কীভাবে হয়? এই অ্যাপ্লিকেশনটিতে এটি কীভাবে ব্যবহৃত হবে তা আমি এখানে দেখাব।kθ

যাক বিদ্যমান momentgenerating ফাংশন সঙ্গে একটি দৈব চলক হতে এম ( গুলি ) = গুলি এক্স , যার জন্য থাকা আবশ্যক গুলি কিছু খোলা বিরতি যে শূন্য থাকে। তারপরে কে ( গুলি ) = লগ এম ( গুলি ) দ্বারা কুল্যান্ট জেনারেটিং ফাংশনটি সংজ্ঞায়িত করুন এটি জানা যায় যে এক্স = কে ( 0 ) , ভার ( এক্স ) = কে ( 0 )X

M(s)=EesX
s
K(s)=logM(s)
EX=K(0),Var(X)=K(0)। Saddlepoint সমীকরণ হয় যা implicitely সংজ্ঞায়িত গুলি এর কার্যকারিতা হিসেবে এক্স (যা সীমার মধ্যে থাকতে হবে এক্স )। আমরা যত এই implicitely সংজ্ঞায়িত ফাংশন লিখতে গুলি ( এক্স ) । নোট করুন যে স্যাডলিপয়েন্ট সমীকরণের সর্বদা ঠিক একটি সমাধান থাকে কারণ কুমুল্যান্ট ফাংশন উত্তল।
K(s^)=x
sxXs^(x)

তারপর ঘনত্বের saddlepoint পড়তা এর এক্স দেওয়া হয় ( এক্স ) = 1fX এই আনুমানিক ঘনত্ব ফাংশন 1 সংহত করতে নিশ্চিত করা হয় না, তাই unnormalized saddlepoint পড়তা হয়। আমরা এটি সংখ্যার সাথে সংহত করতে পারি এবং আরও ভাল অনুমানের জন্য পুনর্নবীকরণ করতে পারি। তবে এই অনুমানটি অ-নেতিবাচক হওয়ার গ্যারান্টিযুক্ত।

f^(x)=12πK(s^)exp(K(s^)s^x)

এক্স1,এক্স2,...,এক্সএনএক্সআমি(আমি,θআমি)

কে(গুলি)=-Σআমি=1এনআমিLn(1-θআমিগুলি)
গুলি<1/সর্বোচ্চ(θ1,θ2,...,θএন)
কে'(গুলি)=Σআমি=1এনআমিθআমি1-θআমিগুলি
কে"(গুলি)=Σআমি=1এনআমিθআমি2(1-θআমিগুলি)2
Rএন=3=(1,2,3)θ=(1,2,3)R
shape <- 1:3 #ki
scale <- 1:3 # thetai
# For this case,  we get expectation=14,  variance=36
make_cumgenfun  <-  function(shape, scale) {
      # we return list(shape, scale, K, K', K'')
      n  <-  length(shape)
      m <-   length(scale)
      stopifnot( n == m, shape > 0, scale > 0 )
      return( list( shape=shape,  scale=scale, 
                    Vectorize(function(s) {-sum(shape * log(1-scale * s) ) }),
                    Vectorize(function(s) {sum((shape*scale)/(1-s*scale))}) ,
                    Vectorize(function(s) { sum(shape*scale*scale/(1-s*scale)) }))    )
}

solve_speq  <-  function(x, cumgenfun) {
          # Returns saddle point!
          shape <- cumgenfun[[1]]
          scale <- cumgenfun[[2]]
          Kd  <-   cumgenfun[[4]]
          uniroot(function(s) Kd(s)-x,lower=-100,
                  upper = 0.3333, 
                  extendInt = "upX")$root
}

make_fhat <-  function(shape,  scale) {
    cgf1  <-  make_cumgenfun(shape, scale)
    K  <-  cgf1[[3]]
    Kd <-  cgf1[[4]]
    Kdd <- cgf1[[5]]
    # Function finding fhat for one specific x:
    fhat0  <- function(x) {
        # Solve saddlepoint equation:
        s  <-  solve_speq(x, cgf1)
        # Calculating saddlepoint density value:
        (1/sqrt(2*pi*Kdd(s)))*exp(K(s)-s*x)
    }
    # Returning a vectorized version:
    return(Vectorize(fhat0))
} #end make_fhat

 fhat  <-  make_fhat(shape, scale)
plot(fhat, from=0.01,  to=40, col="red", main="unnormalized saddlepoint approximation\nto sum of three gamma variables")

নিম্নলিখিত চক্রান্ত ফলাফল: এখানে চিত্র বর্ণনা লিখুন

আমি অনুশীলন হিসাবে সাধারনত স্যাডলিপয়েন্টের কাছাকাছি চলে যাব।


1
এটি আকর্ষণীয়, তবে আমি আপনার Rকোডটিকে সঠিক উত্তরের সাথে তুলনা করার জন্য কাজ করতে পারি না । যেকোন প্রয়াস fhatত্রুটি উত্পন্ন করে, স্পষ্টতই এর ব্যবহারে uniroot
whuber

3
আপনার আর সংস্করণটি কী? কোডগুলি আনইরুট, এক্সটেনডইন্টে নতুন যুক্তি ব্যবহার করে, যা আরআর ৩.১ সংস্করণে প্রবর্তিত হয়েছিল যদি আপনার আর বয়স বেশি হয় তবে আপনি এটি সরিয়ে দেওয়ার চেষ্টা করতে পারেন, (এবং অবিরতকে দেওয়া ব্যবধানটি প্রসারিত করতে পারেন)। কিন্তু কোডটি কম শক্ত করবে!
কেজেটিল বি হালওয়ারসেন

10

ওয়েলশ-Satterthwaite সমীকরণ একটি দিতে ব্যবহার করা যেতে পারে আনুমানিক একটি গামা বন্টন আকারে উত্তর। এটি গ্যামার বিতরণকে অতিরিক্ত হিসাবে বন্ধ হিসাবে প্রায় (প্রায়) বন্ধ হিসাবে বিবেচনা করার আমাদের দুর্দান্ত সম্পত্তি রয়েছে। এটি সাধারণত ব্যবহৃত ওয়েলচের টি-টেস্টের প্রায় অনুমান।

(গামা বিতরণকে একটি ছোট আকারের স্কো-বর্গ বিতরণ হিসাবে দেখা যায় এবং অ-পূর্ণসংখ্যার আকারের প্যারামিটারকে মঞ্জুরি দেওয়া হয়))

আমি আনুমানিকটি এর সাথে মানিয়ে নিয়েছি ,θ গামা বিভ্রান্তির প্যারামিট্রাইজেশন:

গুলিতোমার দর্শন লগ করামি=(Σআমিθআমিআমি)2Σআমিθআমি2আমি

θগুলিতোমার দর্শন লগ করামি=Σθআমিআমিগুলিতোমার দর্শন লগ করামি

দিন =(3,4,5), θ=(1,2,1)

সুতরাং আমরা আনুমানিক গামা (10.666 ..., 1.5) পেয়েছি

আমরা আকারের প্যারামিটারটি দেখি কম বা বেশি মোট হয়েছে, তবে সামান্য কম কারণ ইনপুট স্কেল পরামিতি θআমি পৃথক। θ সমষ্টিটির সঠিক গড় মান রয়েছে এমনটি।


6

একটি সঠিক সমাধান সংবর্তন (অর্থাত, সমষ্টি) এরএনগামা বিতরণ একা হিসাবে দেওয়া হয়। (1) ডিসালভোর লিঙ্কযুক্ত পিডিএফ-এ । যেহেতু এটি কিছুটা দীর্ঘ, তাই এখানে এটি অনুলিপি করতে কিছু সময় লাগবে। কেবলমাত্র দুটি গামা বিতরণের জন্য, বন্ধ হয়ে যাওয়া আকারে তাদের সঠিক যোগফল একা দ্বারা নির্দিষ্ট করা হয়েছে। (২) ডিসালভোর এবং একা এর ওজন ছাড়াই। (5) ওয়েসলোভস্কি এট অ্যাল। যা সিভি সাইটে সেই প্রশ্নের উত্তর হিসাবে উপস্থিত হয় । এটাই,

জিডিসি(একটি,,α,β;τ)={একটিβαΓ(একটি+ +α)-ττএকটি+ +α-11এফ1[α,একটি+ +α,(-β)τ],τ>00,τ0,
যেখানে উপরের প্রশ্নগুলিতে স্বরলিপি; জিএকটিমিমিএকটি(একটি,)Γ(একটি,1/), এখানে. এটাই, এবং β এখানে রেট ধ্রুবক এবং সময় স্কেলার নয়।
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.