একটি নিবন্ধে আমি একটি নমুনা আকার এন এর স্ট্যান্ডার্ড বিচ্যুতির সূত্রটি পেয়েছি
যেখানে হ'ল মূল নমুনা থেকে সাবমেলের (আকার ) গড় পরিসীমা । কীভাবে নম্বর গণনা করা হয়? এই সঠিক নম্বর?
একটি নিবন্ধে আমি একটি নমুনা আকার এন এর স্ট্যান্ডার্ড বিচ্যুতির সূত্রটি পেয়েছি
যেখানে হ'ল মূল নমুনা থেকে সাবমেলের (আকার ) গড় পরিসীমা । কীভাবে নম্বর গণনা করা হয়? এই সঠিক নম্বর?
উত্তর:
ইন একটি একটি নমুনা এর এন একটি বিতরণ থেকে স্বাধীন মান এফ পিডিএফ সঙ্গে চ , চরম যুগ্ম ডিস্ট্রিবিউশনের পিডিএফ মিনিট ( এক্স ) = এক্স [ 1 ] এবং সর্বোচ্চ ( এক্স ) = এক্স [ এন ] সমানুপাতিক হয়
(আনুপাতিকতার ধ্রুবকটি বহু বহুবৃত্তের গুণফল এর পারস্পরিক কাজ । স্বতঃস্ফূর্তভাবে, এই যৌথ পিডিএফটি পরিসরে ক্ষুদ্রতম মান খুঁজে পাওয়ার সম্ভাবনা প্রকাশ করে , ব্যাপ্তিটির বৃহত্তম মান এবং মধ্যে মধ্যবর্তী মানগুলি । যখন অবিচ্ছিন্ন থাকে, আমরা সেই মাঝারি পরিসরটি দ্বারা প্রতিস্থাপন করতে পারি , যার ফলে কেবলমাত্র একটি "অসীম" পরিমাণটিকে অবহেলা করা যায় associated সম্পর্কিত সম্ভাব্যতাগুলি, প্রথমত ডিফারেনশিয়ালে অর্ডার করতে, হয়[এক্স[1],এক্স[1]+ডিএক্স[1])[এক্স[এন],এক্স[এন]+ডিএক্স[এন])এন-2[এক্স[1]+ডিএক্স[এফ( এক্স [ 1 ] , এক্স [ এন ] ]চ( এক্স [ 1 ] )ঘ এক্স [ 1 ] ,চ( এক্স [ এন ] )ঘ এক্স [ এন ] , এবং যথাক্রমে এখন সূত্রটি কোথা থেকে এসেছে তা সুস্পষ্ট করে তুলেছে))
range রেঞ্জের প্রত্যাশা নেওয়া স্ট্যান্ডার্ড বিচ্যুতি এবং সহ কোনও সাধারণ বিতরণের জন্য দেয় । এর গুণিতক হিসাবে প্রত্যাশিত সীমার নমুনা আকারের উপর নির্ভর করে : 2,53441 σ σ এন = 6 σ এন
এই মানগুলিকে সংখ্যাগতভাবে করে হয়েছিল , সঙ্গে আদর্শ স্বাভাবিক সিডিএফ সেট করতে চান, এবং স্ট্যান্ডার্ড ডেভিয়েশন দ্বারা বিভাজক (যা ঠিক হয় )।{(এক্স,Y)∈আর2| x≤y}Fএফ1
প্রত্যাশিত পরিসীমা এবং স্ট্যান্ডার্ড বিচ্যুতির মধ্যে একই ধরণের গুণগত সম্পর্ক বিতরণের যে কোনও অবস্থান-স্কেল পরিবারের জন্য ধারণ করবে, কারণ এটি কেবলমাত্র বিতরণের আকারের সম্পত্তি । উদাহরণস্বরূপ, এখানে অভিন্ন বিতরণের জন্য তুলনামূলক প্লট রয়েছে:
এবং সূচকীয় বিতরণ:
পূর্ববর্তী দুটি প্লটের মানগুলি সংখ্যাসূচক নয় - একীকরণের মাধ্যমে নির্ভুলভাবে প্রাপ্ত হয়েছিল, যা প্রতিটি ক্ষেত্রে এবং এর তুলনামূলকভাবে সহজ বীজগণিত ফর্মগুলির কারণে সম্ভব । অভিন্ন বিতরণের জন্য তারা সমান এবং সূচকীয় বিতরণগুলির জন্য তারা যেখানে হ'ল ইউলারের ধ্রুবক এবং হ'ল "বহুগাম" ফাংশন, ইউলারের গামা ফাংশনের লোগারিথমিক ডেরাইভেটিভ।F n - 1
যদিও তারা পৃথক হয় (কারণ এই বিতরণগুলি আকারগুলির বিস্তৃত আকার প্রদর্শন করে), তিনটি মোটামুটি একমত হয় যে দেখায় যে গুণকটি আকারের উপর খুব বেশি নির্ভর করে না এবং তাই এটি সর্বকোষ হিসাবে প্রমাণিত করতে পারে, স্ট্যান্ডার্ড বিচ্যুতিটির শক্ত মূল্যায়ন যখন ছোট সাবমেলের ব্যাপ্তি জানা যায়। (বস্তুত, খুব ভারী-টেইলড শিক্ষার্থীর স্বাধীনতার তিন মাত্রার বন্টন এখনো কাছাকাছি একটি গুণক হয়েছে জন্য , বহু দূর থেকে এ সব না ।)
এই অনুমানটি সত্য নমুনা স্ট্যান্ডার্ড বিচ্যুতির খুব কাছাকাছি। আমি তা বোঝাতে একটি দ্রুত আর স্ক্রিপ্ট লিখেছি:
x = sample(1:10000,6000,replace=TRUE)
B = 100000
R = rep(NA,B)
for(i in 1:B){
samp = sample(x,6)
R[i] = max(samp)-min(samp)
}
mean(R)/2.534
sd(x)
যা ফলন:
> mean(R)/2.534
[1] 2819.238
>
> sd(x)
[1] 2880.924
এখন আমি নিশ্চিত (এখনও) এটি কেন কাজ করে তা নিশ্চিত নয় তবে এটি কমপক্ষে (মুখের মূল্যে) মতো দেখায় যে অনুমানটি একটি শালীন।
সম্পাদনা: এটি কেন কাজ করে তা সম্পর্কে @ হুইবারের ব্যতিক্রমী মন্তব্য (উপরে) দেখুন