একটি অভিজ্ঞতামূলক সিডিএফ একীকরণ


13

আমার একটি অভিজ্ঞতা অভিজ্ঞতা । আমি নিম্নলিখিত হিসাবে এটি গণনাG(x)

    x <- seq(0, 1000, 0.1)
    g <- ecdf(var1)
    G <- g(x)

আমি , অর্থ হল , পিডিএফ, যখন সিডিএফ।h Gh(x)=dG/dxhG

আমি এখন একীকরণের উপরের সীমা (যেমন, ) এর জন্য একটি সমীকরণ সমাধান করতে চাই , যেমন প্রত্যাশিত মানটি কিছু ।এক্স কেaxk

এটি হল, থেকে পর্যন্ত সংহত করার জন্য আমার I । আমি জন্য সমাধান করতে চাই ।বি এক্স এইচ ( এক্স ) ডি এক্স = কে বি0bxh(x)dx=kb

অংশ দ্বারা সংহত, আমি সমীকরণ হিসাবে আবার লিখতে পারেন

bG(b)0bG(x)dx=k , যেখানে অখণ্ড 0 থেকে b ------- (1)

আমি মনে করি আমি নিম্নলিখিত হিসাবে অবিচ্ছেদ্য গণনা করতে পারি

    intgrl <- function(b) {
        z <- seq(0, b, 0.01)
        G <- g(z)
        return(mean(G))
     }

তবে যখন আমি এই ফাংশনটি সাথে ব্যবহার করার চেষ্টা করি

    library(rootSolve)
    root <- uniroot.All(fun, c(0, 1000))

যেখানে মজা এক (1), আমি নিম্নলিখিত ত্রুটি পেয়েছি

    Error in seq.default(0, b, by = 0.01) : 'to' must be of length 1  

আমি মনে করি সমস্যাটি হ'ল আমার ফাংশনটি intgrlএকটি সংখ্যাসমূহের সাথে মূল্যায়ন করা হয়, যখন uniroot.Allঅন্তরটি পেরিয়ে যায়c(0,1000)

আমি কিভাবে জন্য সমাধান করা উচিত b আর এই অবস্থায়?

উত্তর:


13

বাছাই করা ডেটাটি । গবেষণামূলক সিডিএফ বোঝার জন্য , এর মান এক বিবেচনা --let কল এটা --and যে অনুমান করা কিছু সংখ্যা এর কম এবং এর সমান । একটি বিরতি বাছুন যার মধ্যে, সমস্ত সম্ভাব্য ডেটা মানগুলির মধ্যে কেবল প্রদর্শিত হয়। তারপরে, সংজ্ঞা অনুসারে, এই ব্যবধানের মধ্যে এর চেয়ে কম সংখ্যার জন্য ধ্রুবক মান জি এক্স i γ γx1x2xnGxiγএক্স আই γ t 1 এক্স আই γ [ α , β ] γ জি কে / এন γ ( কে + টি ) / এন γkxiγt1xiγ[α,β]γGk/nγএবং চেয়ে বেশি সংখ্যার জন্য ধ্রুবক মান ঝাঁপ দেয় ।(k+t)/nγ

ECDF

ব্যবধান থেকে এর অবদান বিবেচনা করুন । যদিও একটি ফাংশন নয় - এটা আকারের একটি বিন্দু পরিমাপ এ --দী অবিচ্ছেদ্য হয় সংজ্ঞায়িত অংশ দ্বারা ইন্টিগ্রেশন মাধ্যমে এটি একটি সৎ টু ধার্মিকতা অবিচ্ছেদ্য মধ্যে রূপান্তর করবে। আসুন এটি ব্যবধানে :[ α , β ] এইচ টি / এন γ [ α , β ]0bxh(x)dx[α,β]ht/nγ[α,β]

αβxh(x)dx=(xG(x))|αβαβG(x)dx=(βG(β)αG(α))αβG(x)dx.

নতুন সংহত, যদিও এটি গামায় বিযুক্ত নয়, সংহতযোগ্য। এর মান পূর্ববর্তী অংশগুলিতে একীকরণের ডোমেনটি ভেঙে এবং র জাম্প অনুসরণ করে সহজেই পাওয়া যায় :জিγG

αβG(x)dx=αγG(α)dx+γβG(β)dx=(γα)G(α)+(βγ)G(β).

এটি পূর্বোক্তগুলিতে প্রতিস্থাপন করা এবং ফলন প্রত্যাহার করা হচ্ছেG(α)=k/n,G(β)=(k+t)/n

αβxh(x)dx=(βG(β)αG(α))((γα)G(α)+(βγ)G(β))=γtn.

অন্য কথায়, এই অবিচ্ছেদ্য প্রতিটি জাম্পের অবস্থান ( অক্ষ বরাবর) সেই লাফের আকার দিয়ে বহুগুণ করে । জাম্পের আকারX

tn=1n++1n

values সমতুল্য প্রতিটি ডাটা মানগুলির জন্য একটি শব্দ সহ । এমন সব জাম্প থেকে অবদান যোগ করার পদ্ধতি অনুষ্ঠানγG

0bxh(x)dx=i:0xib(xi1n)=1nxibxi.

আমরা এটি একটি "আংশিক গড়" বলতে পারি, এটি দেখলে এটি আংশিক যোগফলের সমান হয় । (দয়া করে মনে রাখবেন যে এটি কোনও প্রত্যাশা নয় It এটি অন্তর্নিহিত বিতরণের কোনও সংস্করণের প্রত্যাশার সাথে সম্পর্কিত হতে পারে যা অন্তর কেটে গেছে : আপনাকে ফ্যাক্টরটি দ্বারা প্রতিস্থাপন করতে হবে যেখানে হ'ল মধ্যে ডেটা মানগুলির সংখ্যা )1/n[0,b]1/n1/mm[0,b]

প্রদত্ত , আপনি খুঁজে পেতে চান যার জন্যকারণ আংশিক অঙ্কগুলি মানগুলির একটি সীমাবদ্ধ সেট, সাধারণত কোনও সমাধান হয় না: আপনাকে সর্বোত্তম অনুমানের জন্য নিষ্পত্তি করতে হবে, যা সম্ভব হলে দুটি আংশিক উপায়ে বন্ধনী দ্বারা পাওয়া যাবে can যে যেমন খুঁজে পেয়েkbকেজে1nxibxi=k.kj

1ni=1j1xik<1ni=1jxi,

আপনি narrowed হবে থেকে ব্যবধান । আপনি ইসিডিএফ ব্যবহার করে এর চেয়ে ভাল আর কিছু করতে পারবেন না। (ইসিডিএফ-তে কিছু ধারাবাহিক বিতরণ ফিটিংয়ের মাধ্যমে আপনি সঠিক মান সন্ধান করতে পারেন) তবে এর যথার্থতা ফিটের যথার্থতার উপর নির্ভর করবে)[ এক্স জে - 1 , এক্স ) b[xj1,xj)b


Rএর সাথে আংশিক যোগ গণনা সম্পাদন করে cumsumএবং whichঅনুসন্ধানগুলির পরিবার ব্যবহার করে এটি কোনও নির্দিষ্ট মানকে কোথায় অতিক্রম করে তা খুঁজে বের করে :

set.seed(17)
k <- 0.1
var1 <- round(rgamma(10, 1), 2)
x <- sort(var1)
x.partial <- cumsum(x) / length(x)
i <- which.max(x.partial > k)
cat("Upper limit lies between", x[i-1], "and", x[i])

কোনও তাত্ক্ষণিক বিতরণ থেকে আইড টানা এই উদাহরণের আউটপুট

উচ্চতর সীমা 0.39 এবং 0.57 এর মধ্যে রয়েছে

প্রকৃত মূল্য, সমাধানে হয় । রিপোর্ট করা ফলাফলগুলির সাথে এর ঘনিষ্ঠতা এই কোডটি সঠিক এবং সঠিক বলে প্রস্তাব করে। (অনেক বড় ডেটাসেট সহ সিমুলেশনগুলি এই উপসংহারে সমর্থন অব্যাহত রাখে)।0.5318120.1=0bxexp(x)dx,0.531812

উল্লিখিত ড্যাশযুক্ত ধূসর রেখাগুলি হিসাবে দেখানো উপরের সীমাটির আনুমানিক মানগুলি সহ এই ডেটাগুলির জন্য অনুমিত সিডিএফ এর একটি প্লট এখানে রয়েছে :G

ইসিডিএফ এর চিত্র


এটি একটি খুব পরিষ্কার এবং সহায়ক উত্তর, তাই আপনাকে ধন্যবাদ!
ব্যবহারকারী46768
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.