এটা কি সঠিক ? (একটি ছাঁটাই-আদর্শ-মাল্টিভারিয়েট-গাউসিয়ান তৈরি করা)


10

যদি XRn, XN(0_,σ2I) অর্থাত্,

fX(x)=1(2πσ2)n/2exp(||x||22σ2)

আমি একটি মাল্টিভারিয়েট ক্ষেত্রে কেটে যাওয়া-সাধারণ-বিতরণের একটি অ্যালবাম সংস্করণ চাই ।

আরো সঠিকভাবে, আমি জেনারেট করতে চান একটি আদর্শ-সীমাবদ্ধ (ক মান a বহুচলকীয় গসিয়ান) Y St

fY(y)={c.fX(y), if ||y||a0, otherwise .
যেখানে c=1Prob{||X||a}

এখন আমি নিম্নলিখিত পর্যবেক্ষণ:

যদি x=(x1,x2,,xn) , ||x||a

|xn|Tmax(0,(a21n1xi2))

সুতরাং গাউসিয়ানদের নমুনা হিসাবে বেছে নেওয়ার মাধ্যমে যাওয়া -সাধারণ-বিতরণ ( -লেজ following ) বিতরণ বাইরে নমুনা হিসাবে কে সীমাবদ্ধ করতে পারে , সম্ভাব্যতা সাথে এলোমেলোভাবে নির্বাচিত এর চিহ্নটি বাদে । এক্স এনটি এন টি ( 0 , σ 2 ) 1 / 2x1,,xn1xnTNT(0,σ2)1/2

এখন আমার প্রশ্ন এটি,

যদি আমি এর প্রতিটি ভেক্টর নমুনা( এক্স 1 , , এক্স এন )(x1,,xn)(X1,,Xn) উত্পন্ন করি তবে ,

x1,,xn1N(0,σ2)

এবং

Z 1{ ± 1 w.p. 1 / 2 } জেড 2 ~ এন টি ( 0 , σ 2 ) টি ( এক্স 1 , ... , x এর এন - 1 ) xn=Z1Z2  যেখানে, , , (অর্থাত্ এ ছেঁটে ফেলা-স্কালে-স্বাভাবিক সঙ্গে আরভি Z1{±1 w.p. 1/2}Z2NT(0,σ2)T(x1,,xn1)max(0,(a21n1xi2))

হবে হতে একটি আদর্শ-সীমাবদ্ধ ( ) বহুচলকীয় গসিয়ান? (যেমন উপরে সংজ্ঞায়িত সমান )। আমি কীভাবে যাচাই করব? অন্য কোনও পরামর্শ যদি এভাবে না হয়?একটি ওয়াই(X1,X2,,Xn)aY

সম্পাদনা করুন:

2D ক্ষেত্রে পয়েন্টগুলির একটি বিচ্ছুরিত প্লট এখানে "1" এর উপরে মানগুলিতে কাটা হয়েছে সাধারণ-কাটা মাল্টিভারিয়েট গাউসিয়ান

দ্রষ্টব্য: নীচে কয়েকটি দুর্দান্ত উত্তর রয়েছে, তবে কেন এই প্রস্তাবটি ভুল, এর যৌক্তিকতা অনুপস্থিত। আসলে, এই প্রশ্নের প্রধান পয়েন্ট।


1
@ শিয়ান আপনার জিজ্ঞাসা এবং আগ্রহের জন্য ধন্যবাদ। আপনার বক্তব্যটির জন্য আমার যুক্তি এখানে দেওয়া হয়েছে: প্রশ্নের মধ্যে থাকা অ্যালগোরিদমের জন্য আরভিএস , যেগুলি গাউসিয়ান এবং একটি নমুনা অনুসারে দেখা যায় যখন তারা ছাঁটাই-গাউসিয়ান হয় ; আরও সুনির্দিষ্টভাবে, বিতরণগুলির মধ্যে একটিতে প্রতিটি নমুনা পরিবর্তিত হয়। এইগুলি হল না নিজ নিজ marginals। কারণ, প্রতিটি দুটি পদে প্রদর্শিত হবে: এবং ; এবং স্পষ্টভাবে সময় পরিবর্তিত হয় কারণ প্রতিটি নমুনার জন্য কাটা থ্রেশহোল্ড পরিবর্তিত হয়। আপনি যে পচন প্রমাণটি সরবরাহ করেছেন তাতে ঠিক একই অর্থে সমস্যা রয়েছে। প্রান্তিকগুলি কেবল উপলভ্য নয়। এন - 1 এক্স আই , আই = 1 , , এন - 1 এক্স আই এক্স এন এক্স এনX1Xnn1xi,i=1,,n1xixnxn
সম্ভাবনা পছন্দ করে

আপনার (ভুল) অ্যালগরিদমটি এবং তারপরে দেওয়া । সুতরাং, প্রথম প্রজন্ম প্রান্তিক থেকে এবং দ্বিতীয় প্রজন্মটি শর্তাধীন। আমার প্রমাণটি দেখায় যে প্রান্তিকটি (n-1) মাত্রিক গাউসীয় বিতরণ নয়। এক্স এনএন টি ( 0 , σ 2 ) এক্স 1 , , এক্স এন - 1
X1,,Xn1N(0,σ2)
XnNT(0,σ2)
X1,,Xn1
শি'য়ান

@ শি'র শর্তসাপেক্ষ গাউসিয়ান মানে প্রান্তিক গাউসিয়ান নয় !!
সম্ভাব্যতা

@ শি'আন ঠিক আছে, আমার বক্তব্য এটি। যখন Gaussians যেমন তৈরি হয়, এবং পরে পদ এই মান উপর নির্ভর করে, এর marginals করা হবে না Gaussians হও। আপনি যা বলেছেন তা হুবহু। তারা "শর্তসাপেক্ষে গউসিয়ান" হতে পারে তবে অবশ্যই "প্রান্তিক গাউসিয়ান" নয়। আমার আগের মন্তব্যটির অর্থ। এক্স 1 , , এক্স এন - 1X1,,Xn1X1,,Xn1
সম্ভাব্যতা

1
@ শিয়ান আপনার রোগীর উত্তরের জন্য অনেক ধন্যবাদ। আপনার উদ্দীপনা দিয়ে আমি আমার ভুলটি অবশেষে বুঝতে পেরেছি এবং আমি এর নিজস্ব ব্যাখ্যাও একই সাথে ব্যাখ্যা করেছি। তবে দুঃখিত, আশা করি আপনি আপত্তি করবেন না, তাঁর সম্ভবত বিশদ ব্যাখ্যার জন্য আমি সম্ভবত whuber এর উত্তর গ্রহণ করব যা আসলে সমস্যা সমাধানে সহায়তা করে।
সম্ভাব্যতা

উত্তর:


11

মাল্টিভিয়ারেট স্বাভাবিক বিতরণটি গোলাকারভাবে প্রতিসম হয়। বন্টন আপনি ব্যাসার্ধ কাটছাঁট করে নেওয়া এ নিচের । এই মাপদণ্ডটি কেবলমাত্র দৈর্ঘ্যের উপর নির্ভর করে , ছাঁটাই হওয়া বিতরণটি গোলাকারভাবে প্রতিসাম্য রইল। যেহেতু গোলাকার কোণ থেকেএবং একটি বিতরণ রয়েছে , সুতরাং আপনি কেবল কয়েকটি সাধারণ পদক্ষেপে ছাঁটাই করা বিতরণ থেকে মানগুলি তৈরি করতে পারেন:Xρ=||X||2aXρX/||X||ρσχ(n)

  1. জেনারেট করুন ।XN(0,In)

  2. এ কাটা একটি বিতরণের বর্গমূল হিসাবে উত্পন্ন করুন ।Pχ2(d)(a/σ)2

  3. যাক।Y=σPX/||X||

ধাপ 1 এ, একটি ক্রম হিসাবে প্রাপ্ত হয় একটি প্রমিত স্বাভাবিক পরিবর্তনশীল স্বাধীন উপলব্ধির।Xd

ধাপ 2 সালে নির্দ্ধিধায় সমাংশক ফাংশন ইনভার্টারিং দ্বারা উৎপন্ন হয় একটি এর বন্টন: একটি অভিন্ন পরিবর্তনশীল উৎপন্ন সীমার মধ্যে সমর্থিত (quantiles এর) মধ্যে এবং এবং সেট ।PF1χ2(d)UF((a/σ)2)1P=F(U)

নীচে at কেটে কাটা এর জন্য এর জন্য এর স্বতন্ত্র উপলব্ধি এর একটি হিস্টগ্রাম এখানে । তৈরি করতে প্রায় এক সেকেন্ড সময় লেগেছিল, অ্যালগরিদমের দক্ষতার প্রমাণ দিয়ে।105σPσ=3n=11a=7

ব্যক্তিত্ব

লাল বক্ররেখা tr দ্বারা মাপা একটি কাটা বিতরণের ঘনত্ব । হিস্টগ্রামের সাথে এর ঘনিষ্ঠ মিল এই কৌশলটির বৈধতার প্রমাণ isχ(11)σ=3

ছাঁটাই জন্য একটি অনুভূতি পেতে, যদি বিবেচনা , মধ্যে মাত্রা। বিপরীতে স্ক্র্যাপপ্লট এখানে রয়েছে ( স্বতন্ত্র উপলব্ধির জন্য)। এটি স্পষ্টভাবে ব্যাসার্ধের গর্তটি দেখায় :a=3σ=1n=2Y2Y1104a

চিত্র ২

পরিশেষে, দ্রষ্টব্য: (1) উপাদানগুলির অবশ্যই অভিন্ন বিতরণ থাকতে হবে (গোলাকার প্রতিসাম্যের কারণে) এবং (2) যখন ব্যতীত , সাধারণ বিতরণটি স্বাভাবিক নয়। বস্তুত, যেমন বৃহৎ বৃদ্ধি পাচ্ছে (univariate) সাধারন বন্টন দ্রুত হ্রাস বহুচলকীয় স্বাভাবিক spherically ছেঁটে ফেলা সম্ভাবনা অধিকাংশ পৃষ্ঠের কাছাকাছি ক্লাস্টারে ঘটায় -sphere (ব্যাসার্ধ্যের )। প্রান্তিক বিতরণ অবশ্যই ব্যবহূত বিতরণ আনুমানিক একটি আকারযুক্ত প্রতিসৃত বিটা আনুমানিক । এটি পূর্ববর্তী স্ক্রেটারপ্লোটে স্পষ্ট, যেখানেXia=0an1a((n1)/2,(n1)/2)(a,a)a=3σইতিমধ্যে দুটি মাত্রায় বড়: পয়েন্টগুলি ব্যাসার্ধ একটি রিং (একটি স্পিয়ার) লম্বা করে ।213σ

এখানে আকারের একটি সিমুলেশন থেকে প্রান্তিক ডিস্ট্রিবিউশন এর histograms হয় মধ্যে সঙ্গে মাত্রা , (যার জন্য approximating বিটা বন্টন অভিন্ন হয়):1053a=10σ=1(1,1)

চিত্র 3

যেহেতু প্রশ্নটিতে বর্ণিত পদ্ধতির প্রথম মার্জিনালগুলি স্বাভাবিক (নির্মাণের মাধ্যমে), তাই সেই পদ্ধতিটি সঠিক হতে পারে না।n1


নিম্নলিখিত Rকোডটি প্রথম চিত্র তৈরি করেছে। এটি উত্পাদনের জন্য সমান্তরাল পদক্ষেপের জন্য 1-3 । এটা তোলে পরিবর্তন ভেরিয়েবল দ্বিতীয়টি চিত্রে জেনারেট করতে পরিবর্তন হয়েছিল , , , এবং এবং তারপর চক্রান্ত কমান্ডের পর তৈরি করেছিল।Yadnsigmaplot(y[1,], y[2,], pch=16, cex=1/2, col="#00000010")y

উচ্চতর সংখ্যাসূচক রেজোলিউশনের জন্য কোডটিতে এর প্রজন্মটি সংশোধিত হয়: কোডটি আসলে উত্পন্ন করে এবং এটি গণনা করতে ব্যবহার করে ।U1UP

একটি অনুমিত অ্যালগরিদম অনুযায়ী ডেটা সিমুলেট করার একই কৌশল, একটি হিস্টোগ্রামের সাথে সংক্ষিপ্ত করে এবং হিস্টোগ্রামকে সুপারমোসিং করা প্রশ্নটিতে বর্ণিত পদ্ধতিটি পরীক্ষা করতে ব্যবহার করা যেতে পারে। এটি নিশ্চিত করবে যে পদ্ধতিটি প্রত্যাশার মতো কাজ করে না।

a <- 7      # Lower threshold
d <- 11     # Dimensions
n <- 1e5    # Sample size
sigma <- 3  # Original SD
#
# The algorithm.
#
set.seed(17)
u.max <- pchisq((a/sigma)^2, d, lower.tail=FALSE)
if (u.max == 0) stop("The threshold is too large.")
u <- runif(n, 0, u.max)
rho <- sigma * sqrt(qchisq(u, d, lower.tail=FALSE)) 
x <- matrix(rnorm(n*d, 0, 1), ncol=d)
y <- t(x * rho / apply(x, 1, function(y) sqrt(sum(y*y))))
#
# Draw histograms of the marginal distributions.
#
h <- function(z) {
  s <- sd(z)
  hist(z, freq=FALSE, ylim=c(0, 1/sqrt(2*pi*s^2)),
       main="Marginal Histogram",
       sub="Best Normal Fit Superimposed")
  curve(dnorm(x, mean(z), s), add=TRUE, lwd=2, col="Red")
}
par(mfrow=c(1, min(d, 4)))
invisible(apply(y, 1, h))
#
# Draw a nice histogram of the distances.
#
#plot(y[1,], y[2,], pch=16, cex=1/2, col="#00000010") # For figure 2
rho.max <- min(qchisq(1 - 0.001*pchisq(a/sigma, d, lower.tail=FALSE), d)*sigma, 
               max(rho), na.rm=TRUE)
k <- ceiling(rho.max/a)
hist(rho, freq=FALSE, xlim=c(0, rho.max),  
     breaks=seq(0, max(rho)+a, by=a/ceiling(50/k)))
#
# Superimpose the theoretical distribution.
#
dchi <- function(x, d) {
  exp((d-1)*log(x) + (1-d/2)*log(2) - x^2/2 - lgamma(d/2))
}
curve((x >= a)*dchi(x/sigma, d) / (1-pchisq((a/sigma)^2, d))/sigma, add=TRUE, 
      lwd=2, col="Red", n=257)

1
একটি দুর্দান্ত উত্তর! তবে, আপনি কী দয়া করে প্রশ্ন-ইন-প্রশ্নটি ব্যর্থ হন সে সম্পর্কে দয়া করে কিছুটা আলোকপাত করতে পারেন? (শি'র উত্তর যথেষ্ট সন্তোষজনক নয়, আমি তার যুক্তি নিয়ে কিছু সমস্যা দেখতে পেয়েছি যেমন তিনি যখন সংহত হন)
ভালোবাসা সম্ভাবনা

1
আপনাকে অনেক ধন্যবাদ. তবে, আমি কি আপনাকে উপরের আমার প্রথম মন্তব্যে উত্তর দেওয়ার জন্য অনুরোধ করতে পারি? দেখে মনে হচ্ছে, আমার প্রস্তাবও যথেষ্ট ভাল একটি হিস্টোগ্রাম দেয়। আমি দ্বিধান্বিত!! ভুল কোথায়? দ্রষ্টব্য, এটি প্রশ্নের মূল বিষয় এবং যদি সঠিক হয় তবে পদ্ধতিটির জন্য কেবল একটি "ছাঁটাই-গাউসিয়ান" নমুনা দরকার প্লাস বর্তমানে বিদ্যমান দ্রুতগতির অ্যালগরিদমের প্রাপ্যতার সাথে এটি একটি বিশাল সঞ্চয় বাড়ে (বিভাজন এবং গুণগুলি এড়ায়, এ ছাড়াও) তুলনামূলকভাবে আরও জটিল কাটা-চি-স্কয়ারের প্রয়োজনীয়তা এড়ানো)
সম্ভাব্যতা

2
আমি যতটুকু বলতে পারি, আপনি একটি সাধারণ বিতরণ থেকে এবং দুই পক্ষের কাটা নরমাল থেকে অঙ্কনের প্রস্তাব করেছেন । এটি এতটা স্পষ্টতই কেটে যাওয়া এমভিএন বিতরণ নয়, কারণ জন্য একটি স্ক্র্যাটারপ্লট সহজেই প্রকাশ পাবে, আমি বিশ্বাস করি যে আমি আপনার প্রশ্নটি সেই অংশটি বুঝতে সক্ষম হয়েছি। আরও সাধারণভাবে, প্রশ্নগুলির বোঝা বোঝায় যে কিছু কেন কাজ করে না তা জিজ্ঞাসাবাদীর উপর নির্ভর করে যে এটি কাজ করে তার প্রমাণ প্রদান করে । সম্ভবত আপনি যদি এই জাতীয় প্রমাণ সরবরাহ করেন তবে আপনার প্রশ্নের প্রকৃতি পরিষ্কার হয়ে যাবে। X1,,Xn1Xnn=2
হোবার

1
বিশদ জন্য ধন্যবাদ। আপনি যেমন বলেছিলেন তেমন আমি একটি 2-ডি স্ক্যাটার প্লট যুক্ত করেছি এবং কয়েকটি বাক্য স্থির করেছি। যাইহোক, দুঃখিত, আমি আসলে আপনার কাছে প্রমাণের মোট বোঝা স্থানান্তরিত করতে চাইনি। আমার প্রস্তাবনাটি সমস্ত সাধারণ চেকগুলির সাথে ঠিকঠাকভাবে কাজ করছে বলে মনে হচ্ছে, অতএব আমি কেন এটি ভুল তা জানতে আগ্রহী, এটিও এই প্রশ্নের মূল উদ্দেশ্য।
সম্ভাব্যতা পছন্দ

1
প্রান্তিক বিতরণগুলির দিকে তাকানো হ'ল পদ্ধতিগুলির মধ্যে পার্থক্য বর্ণনা করার জন্য আমি সবচেয়ে সোজা উপায়। আমি এই মার্জিনালগুলি দেখানোর জন্য একটি চিত্র এবং কিছু কোড যুক্ত করেছি।
হোবার

7

আমি এই ধরে ধরেই লিখেছি যে আপনি কোন ইস্যু রাখতে চান না || y || > ক, যা সাধারণ এক মাত্রিক কাটনের অ্যানালগ। তবে, আপনি লিখেছেন যে আপনি পয়েন্টগুলি রাখতে চান | y || > = ক এবং অন্যকে ফেলে দিন। তবুও, আপনি যদি সত্যিই পয়েন্ট রাখতে চান তবে আমার সমাধানের সুস্পষ্ট সামঞ্জস্য করা যেতে পারে | y || > = ক।

সবচেয়ে সাধারণ উপায়, যা খুব সাধারণ কৌশল হিসাবে দেখা যায় তা হ'ল গ্রহণ-প্রত্যাখ্যান https://en.wikedia.org/wiki/Reject_sampling ব্যবহার করা । যতক্ষণ না প্রোব (|| এক্স ||> এ) মোটামুটি কম হবে এটি মোটামুটি দ্রুত হবে, কারণ তখন অনেকগুলি প্রত্যাখ্যান হবে না।

অসংযত মাল্টভিয়ারিয়েট নরমাল থেকে একটি নমুনা মান x উত্পন্ন করুন (যদিও আপনার সমস্যাটি বলছে যে মাল্টিভারিয়েট নরমালটি গোলাকার, তবুও কৌশলটি তা না হলেও প্রয়োগ করা যেতে পারে)। যদি || এক্স || <= এ, গ্রহণ করুন, অর্থাত্, এক্স ব্যবহার করুন, অন্যথায় এটি প্রত্যাখ্যান করুন এবং একটি নতুন নমুনা তৈরি করুন। আপনার প্রয়োজন অনুসারে যতগুলি গ্রহণযোগ্য নমুনা না পাওয়া পর্যন্ত এই প্রক্রিয়াটি পুনরাবৃত্তি করুন। এই পদ্ধতির প্রয়োগের প্রভাবটি হ'ল উত্পন্ন করে যেমন এর ঘনত্বটি c * f_X (y), যদি || y || <= a, এবং 0 যদি || y || > ক, আপনার প্রশ্নের উদ্বোধনী অংশে আমার সংশোধন প্রতি। আপনাকে কখনই সি গণনা করতে হবে না; এটি কার্যকরভাবে অ্যালগরিদম দ্বারা স্বয়ংক্রিয়ভাবে নির্ধারিত হয় যে ফ্রিকোয়েন্সি ভিত্তিতে নমুনাগুলি প্রত্যাখ্যান করা হয়।


3
+1 আমি চাই যে আপনার প্রস্তাবটি অ-গোলাকার সমান্তরাল এমভিএনগুলির সাথে কাজ করে, আপনি যে পরিস্থিতিতে এটি কার্যকর হবে সে সম্পর্কে আপনি স্পষ্টভাবে বর্ণনা করেছেন এবং প্রত্যাখ্যানের নমুনা ব্যবহার করবেন কিনা তা সিদ্ধান্ত নেওয়ার সময় আপনি প্রত্যাখ্যান হারকে মূল্যায়ন করার প্রয়োজনীয়তার উপর জোর দিয়েছিলেন।
হোবল

2
হ্যাঁ, এবং এটিও নোট করুন যে এটি ইচ্ছামত আকারের গ্রহণযোগ্যতা অঞ্চলের জন্য কাজ করতে পারে, কেবলমাত্র 2-আদর্শ এখানে যেমন একটি প্রান্তিকের উপরে নয় তার নীচে।
মার্ক এল স্টোন

5

এটি একটি দুর্দান্ত চেষ্টা কিন্তু এটি "নরমালাইজেশন ধ্রুবক" এর কারণে কাজ করে না: আপনি যদি যৌথ ঘনত্ব পচন

fX(x)1(2πσ2)n/2exp(||x||22σ2)I||x||>a=1(2πσ2)n/2exp(x12++xn22σ2)I||x||>a
fX(x)1(2πσ2)(n1)/2exp(||xn||22σ2)1(2πσ2)1/2exp(xn22σ2)I||x||>a
=1(2πσ2)(n1)/2exp(||xn||22σ2)1(2πσ2)1/2exp(xn22σ2)I||xn||2+xn2>a2
=P(Xn2>a2||xn||2)(2πσ2)(n1)/2exp(||xn||22σ2)
×P(Xn2>a2||xn||2)1(2πσ2)1/2exp(xn22σ2)Ixn2>a||xn||2
যা মধ্যে , শো যে
fXn(xn)P(Xn2>a2||xn||2)(2πσ2)(n1)/2exp(||xn||22σ2)
xn
  1. এর শর্তসাপেক্ষ বিতরণ অন্যান্য উপাদানগুলিকে প্রদত্ত, , কেটে নেওয়া সাধারণ বিতরণ;XnXn
  2. অতিরিক্ত উপাদান এর কারণে অন্যান্য উপাদানগুলির প্রান্তিক বিতরণ, , কোনও সাধারণ বিতরণ নয় ;XnP(Xn2>a2||xn||2)

এই সম্পত্তির সুযোগ নেওয়ার ক্ষেত্রে আমি দেখতে পাচ্ছি একমাত্র কাটানো সাধারণ শর্তাধীন বিতরণ ব্যবহার করে একটি সময়ে একটি উপাদান গিবস স্যাম্পলার চালানো।


1
বিস্তারিত উত্তরের জন্য অনেক ধন্যবাদ। কেবল একটি ব্যাখ্যা, আপনার ঘনত্বের (দ্বিতীয় eq) এর আওতাধীন অঞ্চল 1 এর সমষ্টি হয় না! --- আমি মনে করি, একবার এটি সংশোধন হয়ে গেলে, এটি আপনি যে "নরমালাইজেশন ফ্যাক্টর" এর কথা বলছেন তা বাতিল হয়ে যাবে। কোন চিন্তা? fX(x)
সম্ভাব্যতা পছন্দ

3

ভেক্টর নমুনাগুলি আঁকার জন্য - যৌথ বিতরণের মৌলিক শর্তাধীন-পচন - ব্যবহারের ধারণা থেকে প্রশ্নটির উত্স।

আইডি উপাদানগুলির সাথে একটি মাল্টিভারিয়েট গাউসিয়ান হতে দিন ।X

যাক এবং Prob(||X||>a)TYX.I||X||>a

প্রশ্নের মধ্যে থাকা অ্যালগরিদমটি নিম্নলিখিত (সমস্ত সঠিক তবে প্রতারণামূলক-ব্যাখ্যা) শর্তাধীন-কারণের ভিত্তিতে প্রস্তাবিত:

fY(y)=1T1(2πσ2)n/2exp(||y||22σ2)I||y||>a=1T1(2πσ2)n/2exp(y12++yn22σ2)I||y||>a=(i=1n112πσ2exp(yi22σ2))(1T12πσ2exp(yn22σ2)I||y||>a)=(i=1n112πσ2exp(yi22σ2))Gaussians(1T12πσ2exp(yn22σ2)Iyn2>(a2y12yn12))Truncated Gaussian??

সংক্ষিপ্ত উত্তরটি হ'ল পরেরটি কারণটি একটি কাটা গাউসিয়ান নয়, (আরও গুরুত্বপূর্ণভাবে) এমনকি বিতরণও নয়।


এখানে উপরোক্ত কারণকরণের কেন কিছু মৌলিক ত্রুটি রয়েছে তার বিশদ বিবরণ এখানে দেওয়া হল। একক বাক্যে: প্রদত্ত যৌথ বন্টনের যে কোনও শর্তসাপেক্ষ-নির্ধারণের জন্য কিছু খুব মৌলিক বৈশিষ্ট্য সন্তুষ্ট করতে হবে, এবং উপরোক্ত কারণগুলি তাদের সন্তুষ্ট করে না (নীচে দেখুন)।

সাধারণভাবে, যদি আমরা কখনও তবে এবং প্রান্তিক এর শর্তাধীন বিতরণ হয় । যার অর্থ:fXY(x,y)=fX(x)fY|X(y|x)fX(x)XfY|X(y|x)Y

  1. এর ফ্যাক্টর "হিসাবে অধিকৃত" একটি বিতরণ হওয়া আবশ্যক। এবং,f(x,y)fX(x)
  2. দ্বিতীয় ফ্যাক্টর "হিসেবে অধিকৃত" জন্য একটি বিতরণ হওয়া আবশ্যক প্রতিটি পছন্দfY|X(y|x)x

উপরের উদাহরণে, আমরা হিসাবে শর্ত দেওয়ার চেষ্টা করছি । এর অর্থ সম্পত্তি -১ এর গৌসিয়ানদের ফ্যাক্টরের জন্য থাকা উচিত এবং সম্পত্তি -২ এর উত্তর অংশের জন্য ভাল হওয়া উচিত।Yn|(Y1Yn1)

এটা স্পষ্ট যে সম্পত্তি -1 প্রথম ফ্যাক্টরটি ভাল রাখে। তবে সমস্যাটি সম্পত্তি -২ নিয়ে। উপরের শেষ ফ্যাক্টরটি দুর্ভাগ্যক্রমে (বিতর্কিত গাউসিয়ান সম্পর্কে ভুলে যান) মোটামুটি কোনও মূল্যের জন্য বিতরণ নয় !!(Y1Yn1)


অ্যালগরিদমের এ জাতীয় প্রস্তাব সম্ভবত নিম্নলিখিত ভুল ধারণার ফলস্বরূপ: একবার বিতরণ প্রাকৃতিকভাবে একটি যৌথ বন্টন (যেমন উপরের গাউসিয়ানস) এর কারণ হয়ে দাঁড়ায়, এটি শর্তসাপেক্ষ কারণের দিকে পরিচালিত করে। ---- না! ---- অন্য (দ্বিতীয়) ফ্যাক্টরটিও অবশ্যই ভাল হতে হবে।


দ্রষ্টব্য: এর আগে @ শুভর একটি দুর্দান্ত উত্তর রয়েছে, এটি আসলে একটি আদর্শ কাটা মাল্টিভারিয়েট গাউসিয়ান তৈরির সমস্যা সমাধান করে। আমি তার উত্তর গ্রহণ করছি। এই উত্তরটি কেবল আমার নিজের উপলব্ধি এবং প্রশ্নের উত্সকে স্পষ্ট করে জানাতে এবং ভাগ করে নেওয়া।


2
+1 আপনার চিন্তা ভাগ করে নেওয়ার জন্য আপনাকে ধন্যবাদ: তারা এই থ্রেডে মূল্যবান অন্তর্দৃষ্টি যুক্ত করে।
হোয়বার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.