অভিন্ন বিতরণের প্যারামিটার অনুমান করা: অনুপযুক্ত আগে?


10

আমরা এন নমুনা, have একটি অভিন্ন বিতরণ থেকে যেখানে হয় অজানা। আনুমানিক তথ্য থেকে।Xi[0,θ]θθ

সুতরাং, বয়েসের নিয়ম ...

f(θ|Xi)=f(Xi|θ)f(θ)f(Xi)

এবং সম্ভাবনা হ'ল:

f(Xi|θ)=i=1N1θ (সম্পাদনা: যখন সবার জন্য , এবং 0 অন্যথায় - ধন্যবাদ whuber)0Xiθi

তবে অন্য কোনও তথ্য না থাকলে মনে হয় (যেমন ইউনিফর্ম) এর সাথে সমানুপাতিক হওয়া উচিত বা তে (জেফরি পূর্বে?) এর সাথে তবে আমার অবিচ্ছেদ্য ডন একত্রিত হবেন না, এবং কীভাবে এগিয়ে যাবেন তা সম্পর্কে আমি নিশ্চিত নই। কোন ধারনা?θ11L[0,]


2
তোমার সম্ভাবনা ভুল: এটা শূন্য হবে যখনই বৃহত্তম চেয়ে কম হয় । θXi
whuber

আপনি কি ইন্টিগ্রাল নিচ্ছেন তা দেখাতে পারেন?

হ্যাঁ, সুতরাং, আমি অনুমান করি যে আমি অনুচিতদের সাথে কীভাবে আচরণ করতে পারি তা ঠিক জানি না। উদাহরণস্বরূপ, আমি লিখতে চাইf[Xi]=Θf(Xi|θ)f(θ)dθ
হবে

1
অপ্রকৃত পূর্বে জন্য = = এবং পূর্ববর্তী আপনি একইভাবেকারণ প্রায় নিশ্চয়, এটা নিশ্চিত ইন্টেগ্রাল বিন্দুতে মিলিত হবে। f[Xi]=Θf(Xi|θ)f(θ)dθmax(Xi)θNdθmax(Xi)1N/(N1)f(θ)1/θmax(Xi)N/N.maxXi>0
হোবার

1
বার্নার্ডো রেফারেন্সের পোস্টারটি হ'ল পেরেটো - ননফর্মেশনাল প্রিয়ারগুলির ক্যাটালগ দেখুন ।
স্টাফেন লরেন্ট

উত্তর:


4

এটি কিছু আকর্ষণীয় বিতর্ক তৈরি করেছে, তবে মনে রাখবেন যে এটি সত্যই আগ্রহের প্রশ্নে খুব বেশি পার্থক্য করে না। ব্যক্তিগতভাবে আমি মনে করি যেহেতু একটি স্কেল প্যারামিটার, রূপান্তর গ্রুপ যুক্তি যথাযথ, যার ফলে পূর্বেরθ

p(θ|I)=θ1log(UL)θ1L<θ<U

সমস্যাটি পুনরুদ্ধারের অধীনে এই বিতরণটির একই ফর্ম রয়েছে (পুনরুদ্ধারের অধীনে সম্ভাবনাও "আক্রমণকারী" থাকে)। এই পূর্বের, কার্নেলটি the কার্যকরী সমীকরণ সমাধান করে উদ্ভব করা যেতে পারে । মানগুলি সমস্যার উপর নির্ভর করে এবং নমুনার আকার খুব ছোট (1 বা 2 এর মতো) খুব কমই সত্য matter পূর্ববর্তীটি একটি কাটা প্যারেটো যা দ্বারা প্রদত্ত:f(y)=y1af(ay)=f(y)L,U

p(θ|DI)=NθN1(L)NUNL<θ<UwhereL=max(L,X(N))
যেখানে the ম অর্ডার পরিসংখ্যান, বা নমুনার সর্বাধিক মান। আমরা আমরা যদি সেট এবং আমরা সহজ exression পেতে ।X(N)
E(θ|DI)=N((L)1NU1N)(N1)((L)NUN)=NN1L(1[LU]N11[LU]N)
UL0E(θ|DI)=NN1X(N)

তবে এখন ধরুন আমরা by দ্বারা প্রদত্ত আরও সাধারণ ব্যবহার করি (নোট করুন যে আমরা সবকিছু যথাযথভাবে নিশ্চিত করতে সীমাবদ্ধ - তখন কোনও একক গণিত নেই) )। অবর তারপর উপরের মতো একই, কিন্তু সঙ্গে দ্বারা প্রতিস্থাপিত - প্রদান করা । উপরের গণনাগুলি পুনরাবৃত্তি করা হচ্ছে, আমরা এর মধ্যবর্তী পোস্টটির সহজ সরলকরণ করেছিp(θ|cI)θc1L,UNc+Nc+N0

E(θ|DI)=N+cN+c1X(N)

সুতরাং ইউনিফর্ম পূর্ব ( ) of এর অনুমান দেবে যে (এর অর্থ জন্য অসীম )। এটি দেখায় যে এখানে বিতর্কটি ভিন্নতা অনুমানের ক্ষেত্রে বিভাজক হিসাবে বা ব্যবহার করবেন কিনা তা কিছুটা bitc=1N1N2X(N)N2N=2NN1

অপ্রকৃত অভিন্ন এই ক্ষেত্রে পূর্বে ব্যবহার করার বিরুদ্ধে এক যুক্তি হল যে অবর অনুপযুক্ত যখন হয় , এটা যেমন সমানুপাতিক করতে । তবে এটি শুধুমাত্র বা খুব ছোট হলে গুরুত্বপূর্ণ।N=1θ1N=1


1

যেহেতু এখানে উদ্দেশ্যটি সম্ভবত কিছু বৈধ এবং দরকারী অনুমান পাওয়ার জন্য , তাই পূর্ববর্তী বন্টনটি যেখান থেকে নমুনা আসে সেই জনসংখ্যার বিতরণের নির্দিষ্টকরণের সাথে সামঞ্জস্য করা উচিত । এর অর্থ কোনওভাবেই নয় যে আমরা নমুনাটি ব্যবহারের আগে "গণনা" করি - এটি পুরো পদ্ধতির বৈধতা বাতিল করে দেবে। আমরা জানি যে নমুনাটি যে জনসংখ্যা থেকে আসে তা হ'ল আইড ইউনিফর্ম র্যান্ডম ভেরিয়েবলের প্রতিটি । এটি একটি বজায় রাখা অনুমান এবং এটি আমাদের পূর্ববর্তী তথ্যের একটি অংশ (এবং এর নমুনার সাথে আমাদের কোনও সম্পর্ক নেই , অর্থাত্ এলোমেলো ভেরিয়েবলগুলির একটি সাবসেটের নির্দিষ্ট উপলব্ধির সাথে)।θ[0,θ]

এখন ধরে নিন যে এই জনসংখ্যাটি এলোমেলো ভেরিয়েবলগুলি নিয়ে গঠিত (যখন আমাদের নমুনাতে র্যান্ডম ভেরিয়েবলের রিরিজেশন থাকে )। বজায় রাখা অনুমান আমাদের বলে যে mn<mn

maxi=1,...,n{Xi}maxj=1,...,m{Xj}θ

কমপ্যাক্টনেস । তারপরে আমাদের কাছে যা be লেখা যেতে পারে maxi=1,...,n{Xi}XθX

θ=cXc1

এর ঘনত্ব ফাংশন এর ইউনিফর্ম আরভি এর ছোটো IID মধ্যে হয় maxN[0,θ]

fX(x)=N(x)N1θN

সমর্থনের জন্য , এবং অন্য কোথাও শূন্য। তারপর ব্যবহার করে এবং পরিবর্তন অফ পরিবর্তনশীল সূত্র প্রয়োগের আমরা জন্য একটি পূর্বে বন্টন প্রাপ্ত : যে বজায় ধৃষ্টতা সঙ্গে সামঞ্জস্যপূর্ণ [0,θ]θ=cXθ

fp(θ)=N(θc)N1θN1c=NcNθ1θ[x,]

যা আমরা যদি ধ্রুবক নির্দিষ্ট না অনুপযুক্ত হতে পারে উপযুক্ত। তবে আমাদের আগ্রহ জন্য যথাযথ পোস্টারিয়র থাকার মধ্যে রয়েছে এবং আমরা সম্ভাব্য বজায় রাখতে চাই না (বজায় রাখা অনুমিতির দ্বারা নিষেধাজ্ঞার বাইরে)। সুতরাং আমরা নির্ধারিত ছেড়ে । তারপরে writing উত্তরcθθc
X={x1,..,xn}

f(θX)θNNcNθ1f(θX)=ANcNθ(N+1)

কিছু সাধারণ স্থির করার জন্য A. আমরা

Sθf(θX)dθ=1xANcNθ(N+1)dθ=1

ANcN1NθN|x=1A=(cx)N

পোস্টেরিয়রে

f(θX)=(cx)NNcNθ(N+1)=N(x)Nθ(N+1)

দ্রষ্টব্য যে পূর্ব বিতরণের নির্ধারিত ধ্রুবক সহজেই বাতিল হয়ে গেছে।c

উত্তরোত্তর সমস্ত তথ্য সংক্ষিপ্তসার করে যা নির্দিষ্ট নমুনা মান সম্পর্কে আমাদের দিতে পারে । যদি আমরা জন্য একটি নির্দিষ্ট মান পেতে চাই তবে আমরা সহজেই প্রত্যাশিত মান গণনা করতে পারি, θθ

E(θX)=xθN(x)Nθ(N+1)dθ=NN1(x)NθN+1|x=NN1x

এই ফলাফলের কোন অন্তর্দৃষ্টি আছে? ওয়েল, সংখ্যা হিসাবে এর বৃদ্ধি, তত বেশি তাদের মধ্যে সর্বাধিক উপলব্ধি কাছাকাছি এবং কাছাকাছি তাদের উপরের আবদ্ধ, এর হবে যা ঠিক কি অবর গড় মান - যদি লোক বলে, প্রতিফলিত , , তবে । এটি দেখায় যে পূর্বের নির্বাচন সম্পর্কিত আমাদের কৌশলটি সমস্যাটির সাথে যুক্তিসঙ্গত এবং সামঞ্জস্যপূর্ণ ছিল , তবে প্রয়োজনীয়ভাবে কিছুটা অর্থে "অনুকূল" ছিল না।XθθN=2E(θX)=2xN=10E(θX)=109x


1
ডেটাতে পূর্ববর্তী উত্তোলন আমার কাছে মজাদার মনে হয়। আপনি এই পদ্ধতির ন্যায্যতা কি?
whuber

2
আপনার পূর্বেরটি "সেরা" নয় এর বিপরীতে আমার কিছুই নেই। আমি এরকম কিছু বললাম কোথায়? আমি শুধু আপনার পদ্ধতির বোঝার চেষ্টা করছি। আমি এখনও এই সমতা বুঝতে পারি না। যদি সমতা থাকে তবে এর অর্থ কি এবং উভয়ই ? যাইহোক আপনি যে সত্যটি ব্যবহার করেন না যে পূর্বের মধ্যে, আপনি কি? (সিসি @ হুইবার)cθ=cXXθc1
স্টাফেন লরেন্ট

1
এবং আপনার পূর্বের সমর্থন ডেটা উপর নির্ভর করে? ( )θ[x,[
স্টাফেন লরেন্ট

3
পূর্বের উপর নির্ভর করে (এটি কেবলমাত্র সহায়তার মাধ্যমে হলেও) ডেটাতে ভুল শোনাচ্ছে: নমুনাটি তৈরি হওয়ার আগে আপনি স্যাম্পলটির সর্বাধিক জানতে পারবেন না । তদুপরি, আপনি দাবী করেছেন যে একটি প্রায় নিশ্চিত সাম্যতা, উভয়ই এবং এলোমেলো (এইভাবে পারস্পরিক সম্পর্ক )। তবে এর দ্বারা বোঝা যায় যে উত্তরোত্তর বিতরণ (যা নমুনা প্রদত্ত শর্তযুক্ত বিতরণ ) ভর । এবং এটি আপনার উত্তরোত্তর বিতরণের দ্বন্দ্বের বিরোধিতা করে। ... (কোনও অক্ষর বাকী নেই ...)θ=cXθX1θθcx
স্টাফেন লরেন্ট

1
এর অবর বন্টন এ ডিরাক হয় মানে যে হয় । বয়েস উপপাদ্য কারণ নয়। আপনি ধরে ধরে সমস্ত কিছু ধ্বংস করেছেন । এটি বোঝায় , সুতরাং প্রদত্ত শর্তসাপেক্ষ বন্টন হ'ল তে ডাইরাাক ভর , অন্যদিকে মূল ধারণাটি হ'ল এই বিতরণটি অভিন্ন বিতরণ) । θcxθ cxθ=cXX=θ/cXθθ/c(0,θ)
স্টাফেন লরেন্ট

0

ইউনিফর্ম পূর্বে বিতরণ উপপাদ্য (বিরতি কেস):

"যদি সম্পর্কে আপনার তথ্য সম্পূর্ণতা ডেটাতে বহিরাগত একক প্রস্তাব ক্যাপচার করা হয় তারপরে আপনার একমাত্র সম্ভাব্য যৌক্তিক-অভ্যন্তরীণ-সামঞ্জস্যপূর্ণ পূর্বের স্পেসিফিকেশন হ'ল θD

B={{Possible values for θ}={the interval (a,b)},a<b}
f(θ)=Uniform(a,b)

সুতরাং, আপনি পূর্বের স্পেসিফিকেশন জেফরির পূর্বের সাথে সামঞ্জস্য করা উচিত যদি আপনি উপরের উপপাদ্যে সত্যই বিশ্বাস করেন। "

ইউনিফর্ম পূর্বে বিতরণ উপপাদ্যের অংশ নয়:

বিকল্প হিসাবে আপনি আপনার পূর্ববর্তী বিতরণ পেরেটো বন্টন হিসাবে নির্দিষ্ট করতে পারেন যা ইউনিফর্মের জন্য কনজিগেট বিতরণ, জেনেও যে আপনার উত্তরোত্তর বিতরণটি যৌক্তিকতার সাথে অন্য একটি অভিন্ন বিতরণ হতে হবে। তবে, আপনি যদি পেরেটো বিতরণ ব্যবহার করেন, তবে আপনাকে কিছু উপায়ে পেরিটো বিতরণের পরামিতিগুলি নির্দিষ্ট করতে হবে।f(θ)


4
প্রথমে আপনি বলছেন "কেবলমাত্র যৌক্তিকভাবে অভ্যন্তরীণভাবে সামঞ্জস্যপূর্ণ" উত্তরটি একটি অভিন্ন বন্টন এবং তারপরে আপনি বিকল্প প্রস্তাব করার জন্য এগিয়ে যান। এটি আমার কাছে অযৌক্তিক এবং বেমানান মনে হচ্ছে :-)।
হোবার

2
আমি একমত হতে পারি না উদাহরণস্বরূপ, সেটযখন পিডিএফ হয় জন্য । তবে "উপপাদ্য অনুসারে," যার পিডিএফ সেই ব্যবধানে । সংক্ষেপে, যদিও প্রস্তাবটি সমস্যাটি প্যারামিটারাইজড হয় তার উপর নির্ভর করে না, তবে "উপপাদ্য" এর উপসংহারটি প্যারামিটারাইজেশনের উপর নির্ভর করে, সেখান থেকে এটি অস্পষ্ট। B{θ|θ3(a3,b3)}.ΘUniform(a,b),Ψ=Θ31/(3ψ2/3(ba))a3<ψ<b3ΨUniform(a3,b3)1/(b3a3)
হোবার

2
বাবাকপি: কীভাবে কেউ বলতে পারেন এটি একটি উপপাদ্য ? একটি উপপাদ্য একটি গাণিতিক প্রমাণ সহ একটি গাণিতিক দাবি। এই "উপপাদ্য "টিকে আরও সঠিকভাবে একটি" নীতি "হিসাবে অভিহিত করা হবে, তবে এটি বোধগম্য নয় কারণ এটি পরস্পরবিরোধী, @ হোবার দ্বারা দেখানো হিসাবে।
স্টাফেন লরেন্ট

2
বাবাকপি রেফারেন্সের জন্য ধন্যবাদ। আমি উল্লেখ করতে চাই যে "প্রুফ স্কেচ" বোগাস। ড্রপার ব্যবধানকে সমান সংখ্যক সমান ব্যবধানের মানগুলিতে ভাগ করে এবং "সীমাতে চলে যায়"। যে কেউ পছন্দ করতে পারে এমন ঘনত্বের আনুমানিক মানগুলিতে এবং একইভাবে সীমাতে চলে যাওয়ার জন্য ব্যবধানকে ব্যবধানে বিভক্ত করতে পারে, পুরোপুরি স্বেচ্ছাসেবী তৈরি করে "কেবলমাত্র যৌক্তিকভাবে-অভ্যন্তরীণভাবে-সামঞ্জস্যপূর্ব স্পেসিফিকেশন।" এই ধরণের জিনিস - যথা, অ-বায়েশিয়ানরা অযৌক্তিক তা দেখানোর প্রচেষ্টায় খারাপ গণিত ব্যবহার করে - বায়েশিয়ান বিশ্লেষণকে একটি (অনির্ধারিত) খারাপ নাম দেয়। (সিসি @ স্টাফেন।)
হোয়াট

1
@ Stéphane আমার insensitivity (ক্ষমা insensibilité ) - আমি একটি দ্বিতীয় ভাষা এখানে আলাপচারিতার আপনার দক্ষতা তারিফ এবং জ্ঞাতসারে অস্পষ্ট পদ ব্যবহার করবেন না! বোগাস এমন একটি বিশেষণ যা 200 বছরের পুরানো মার্কিন অপবাদ শর্ত থেকে আসে যাতে নগদ অর্থের জন্য কোনও মেশিনকে বোঝায়। এক্ষেত্রে এটি ছদ্মবেশী উপপাদ্যগুলি :-) নকল করার জন্য একটি গাণিতিক মেশিন।
হোবল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.