বাছাই করা ডেটাটি । গবেষণামূলক সিডিএফ বোঝার জন্য , এর মান এক বিবেচনা --let কল এটা --and যে অনুমান করা কিছু সংখ্যা এর কম এবং এর সমান । একটি বিরতি বাছুন যার মধ্যে, সমস্ত সম্ভাব্য ডেটা মানগুলির মধ্যে কেবল প্রদর্শিত হয়। তারপরে, সংজ্ঞা অনুসারে, এই ব্যবধানের মধ্যে এর চেয়ে কম সংখ্যার জন্য ধ্রুবক মান জি এক্স i γ γএক্স1। X2≤ ⋯ ≤ এক্সএনজিএক্সআমিγএক্স আই γ t ≥ 1 এক্স আই γ [ α , β ] γ জি কে / এন γ ( কে + টি ) / এন γটএক্সআমিγt ≥ 1এক্সআমিγ[ α , β]γজিকে / এনγএবং চেয়ে বেশি সংখ্যার জন্য ধ্রুবক মান ঝাঁপ দেয় ।( কে + টি ) / এনγ
ব্যবধান থেকে এর অবদান বিবেচনা করুন । যদিও একটি ফাংশন নয় - এটা আকারের একটি বিন্দু পরিমাপ এ --দী অবিচ্ছেদ্য হয় সংজ্ঞায়িত অংশ দ্বারা ইন্টিগ্রেশন মাধ্যমে এটি একটি সৎ টু ধার্মিকতা অবিচ্ছেদ্য মধ্যে রূপান্তর করবে। আসুন এটি ব্যবধানে :[ α , β ] এইচ টি / এন γ [ α , β ]∫খ0x h ( x ) dএক্স[ α , β]ht/nγ[α,β]
∫βαxh(x)dx=(xG(x))|βα−∫βαG(x)dx=(βG(β)−αG(α))−∫βαG(x)dx.
নতুন সংহত, যদিও এটি গামায় বিযুক্ত নয়, সংহতযোগ্য। এর মান পূর্ববর্তী অংশগুলিতে একীকরণের ডোমেনটি ভেঙে এবং র জাম্প অনুসরণ করে সহজেই পাওয়া যায় :জিγG
∫βαG(x)dx=∫γαG(α)dx+∫βγG(β)dx=(γ−α)G(α)+(β−γ)G(β).
এটি পূর্বোক্তগুলিতে প্রতিস্থাপন করা এবং ফলন প্রত্যাহার করা হচ্ছেG(α)=k/n,G(β)=(k+t)/n
∫βαxh(x)dx=(βG(β)−αG(α))−((γ−α)G(α)+(β−γ)G(β))=γtn.
অন্য কথায়, এই অবিচ্ছেদ্য প্রতিটি জাম্পের অবস্থান ( অক্ষ বরাবর) সেই লাফের আকার দিয়ে বহুগুণ করে । জাম্পের আকারX
tn=1n+⋯+1n
values সমতুল্য প্রতিটি ডাটা মানগুলির জন্য একটি শব্দ সহ । এমন সব জাম্প থেকে অবদান যোগ করার পদ্ধতি অনুষ্ঠানγG
∫b0xh(x)dx=∑i:0≤xi≤b(xi1n)=1n∑xi≤bxi.
আমরা এটি একটি "আংশিক গড়" বলতে পারি, এটি দেখলে এটি আংশিক যোগফলের সমান হয় । (দয়া করে মনে রাখবেন যে এটি কোনও প্রত্যাশা নয় It এটি অন্তর্নিহিত বিতরণের কোনও সংস্করণের প্রত্যাশার সাথে সম্পর্কিত হতে পারে যা অন্তর কেটে গেছে : আপনাকে ফ্যাক্টরটি দ্বারা প্রতিস্থাপন করতে হবে যেখানে হ'ল মধ্যে ডেটা মানগুলির সংখ্যা )1/n[0,b]1/n1/mm[0,b]
প্রদত্ত , আপনি খুঁজে পেতে চান যার জন্যকারণ আংশিক অঙ্কগুলি মানগুলির একটি সীমাবদ্ধ সেট, সাধারণত কোনও সমাধান হয় না: আপনাকে সর্বোত্তম অনুমানের জন্য নিষ্পত্তি করতে হবে, যা সম্ভব হলে দুটি আংশিক উপায়ে বন্ধনী দ্বারা পাওয়া যাবে can যে যেমন খুঁজে পেয়েkbকেজে1n∑xi≤bxi=k.kj
1n∑i=1j−1xi≤k<1n∑i=1jxi,
আপনি narrowed হবে থেকে ব্যবধান । আপনি ইসিডিএফ ব্যবহার করে এর চেয়ে ভাল আর কিছু করতে পারবেন না। (ইসিডিএফ-তে কিছু ধারাবাহিক বিতরণ ফিটিংয়ের মাধ্যমে আপনি সঠিক মান সন্ধান করতে পারেন) তবে এর যথার্থতা ফিটের যথার্থতার উপর নির্ভর করবে)[ এক্স জে - 1 , এক্স জ ) খb[xj−1,xj)b
R
এর সাথে আংশিক যোগ গণনা সম্পাদন করে cumsum
এবং which
অনুসন্ধানগুলির পরিবার ব্যবহার করে এটি কোনও নির্দিষ্ট মানকে কোথায় অতিক্রম করে তা খুঁজে বের করে :
set.seed(17)
k <- 0.1
var1 <- round(rgamma(10, 1), 2)
x <- sort(var1)
x.partial <- cumsum(x) / length(x)
i <- which.max(x.partial > k)
cat("Upper limit lies between", x[i-1], "and", x[i])
কোনও তাত্ক্ষণিক বিতরণ থেকে আইড টানা এই উদাহরণের আউটপুট
উচ্চতর সীমা 0.39 এবং 0.57 এর মধ্যে রয়েছে
প্রকৃত মূল্য, সমাধানে হয় । রিপোর্ট করা ফলাফলগুলির সাথে এর ঘনিষ্ঠতা এই কোডটি সঠিক এবং সঠিক বলে প্রস্তাব করে। (অনেক বড় ডেটাসেট সহ সিমুলেশনগুলি এই উপসংহারে সমর্থন অব্যাহত রাখে)।0.5318120.1=∫b0xexp(−x)dx,0.531812
উল্লিখিত ড্যাশযুক্ত ধূসর রেখাগুলি হিসাবে দেখানো উপরের সীমাটির আনুমানিক মানগুলি সহ এই ডেটাগুলির জন্য অনুমিত সিডিএফ এর একটি প্লট এখানে রয়েছে :G