পরিসীমা এবং মান বিচক্ষণতার মধ্যে সম্পর্ক


14

একটি নিবন্ধে আমি একটি নমুনা আকার এন এর স্ট্যান্ডার্ড বিচ্যুতির সূত্রটি পেয়েছিN

σ=R¯2.534

যেখানে হ'ল মূল নমুনা থেকে সাবমেলের (আকার ) গড় পরিসীমা । কীভাবে নম্বর গণনা করা হয়? এই সঠিক নম্বর?R¯62.534


6
রেফারেন্স দয়া করে। আরও গুরুত্বপূর্ণ: 1. আপনি যে ধরণের বিতরণটি আঁকছেন তা স্বাধীনভাবে এখানে কোনও "সঠিক নম্বর" থাকতে পারে না। ২. এই বিধিগুলি সাধারণত পরিসীমা থেকে এসডি অনুমান করার শর্ট-কাট পদ্ধতিগুলিতে আগ্রহ নিয়ে আসে। এখন আমাদের কম্পিউটার আছে .... আপনি কি করতে চান এবং কেন? শুধু ডাটা ব্যবহার করবেন না কেন?
নিক কক্স

3
@ নিক দুঃখিত: আপনি সঠিক ছিলেন। যখন নমুনার আকার থেকে কাছাকাছি হয় তখন প্রায় মান স্ট্যান্ডার্ড বিচ্যুতির জন্য কাজ করে ; প্রায় নমুনার আকারের জন্য কাজ করে I 15 50 3 1041550310
whuber

1
@ নিককক্স এটি প্রাচীন রাশিয়ান উত্স এবং আমি সূত্রটি আগে দেখিনি।
অ্যান্ডি

3
রেফারেন্স দেওয়া খুব কমই খারাপ ধারণা। পাঠকরা সেগুলি আকর্ষণীয় বা অ্যাক্সেসযোগ্য কিনা তা নিজেরাই সিদ্ধান্ত নিতে দিন। (এখানে প্রচুর লোক রয়েছে যারা উদাহরণস্বরূপ রাশিয়ান ভাষা পড়তে পারেন
নিক কক্স

উত্তর:


17

ইন একটি একটি নমুনা এর এন একটি বিতরণ থেকে স্বাধীন মান এফ পিডিএফ সঙ্গে , চরম যুগ্ম ডিস্ট্রিবিউশনের পিডিএফ মিনিট ( এক্স ) = এক্স [ 1 ] এবং সর্বোচ্চ ( এক্স ) = এক্স [ এন ] সমানুপাতিক হয়xnFfmin(x)=x[1]max(x)=x[n]

f(x[1])(F(x[n])F(x[1]))n2f(x[n])dx[1]dx[n]=HF(x[1],x[n])dx[1]dx[n].

(আনুপাতিকতার ধ্রুবকটি বহু বহুবৃত্তের গুণফল এর পারস্পরিক কাজ । স্বতঃস্ফূর্তভাবে, এই যৌথ পিডিএফটি পরিসরে ক্ষুদ্রতম মান খুঁজে পাওয়ার সম্ভাবনা প্রকাশ করে , ব্যাপ্তিটির বৃহত্তম মান এবং মধ্যে মধ্যবর্তী মানগুলি । যখন অবিচ্ছিন্ন থাকে, আমরা সেই মাঝারি পরিসরটি দ্বারা প্রতিস্থাপন করতে পারি , যার ফলে কেবলমাত্র একটি "অসীম" পরিমাণটিকে অবহেলা করা যায় associated সম্পর্কিত সম্ভাব্যতাগুলি, প্রথমত ডিফারেনশিয়ালে অর্ডার করতে, হয়[এক্স[1],এক্স[1]+ডিএক্স[1])[এক্স[এন],এক্স[এন]+ডিএক্স[এন])এন-2[এক্স[1]+ডিএক্স[(n1,n2,1)=n(n1)[x[1],x[1]+dx[1])[x[n],x[n]+dx[n])n2এফ( এক্স [ 1 ] , এক্স [ এন ] ]( এক্স [ 1 ] ) এক্স [ 1 ] ,( এক্স [ এন ] ) এক্স [ এন ] ,[x[1]+dx[1],x[n])F(x[1],x[n]]f(x[1])dx[1], f(x[n])dx[n],এবং যথাক্রমে এখন সূত্রটি কোথা থেকে এসেছে তা সুস্পষ্ট করে তুলেছে))F(x[n])F(x[1]),

range রেঞ্জের প্রত্যাশা নেওয়া স্ট্যান্ডার্ড বিচ্যুতি এবং সহ কোনও সাধারণ বিতরণের জন্য দেয় । এর গুণিতক হিসাবে প্রত্যাশিত সীমার নমুনা আকারের উপর নির্ভর করে : 2,53441 σ σ এন = 6 σ এনx[n]x[1]2.53441 σσn=6σn

সাধারণ

এই মানগুলিকে সংখ্যাগতভাবে করে হয়েছিল , সঙ্গে আদর্শ স্বাভাবিক সিডিএফ সেট করতে চান, এবং স্ট্যান্ডার্ড ডেভিয়েশন দ্বারা বিভাজক (যা ঠিক হয় )।{(এক্স,Y)আর2| xy}Fএফ1(n1,n2,1)(yx)HF(x,y)dxdy{(x,y)R2|xy}FF1

প্রত্যাশিত পরিসীমা এবং স্ট্যান্ডার্ড বিচ্যুতির মধ্যে একই ধরণের গুণগত সম্পর্ক বিতরণের যে কোনও অবস্থান-স্কেল পরিবারের জন্য ধারণ করবে, কারণ এটি কেবলমাত্র বিতরণের আকারের সম্পত্তি । উদাহরণস্বরূপ, এখানে অভিন্ন বিতরণের জন্য তুলনামূলক প্লট রয়েছে:

অভিন্ন

এবং সূচকীয় বিতরণ:

ব্যাখ্যামূলক

পূর্ববর্তী দুটি প্লটের মানগুলি সংখ্যাসূচক নয় - একীকরণের মাধ্যমে নির্ভুলভাবে প্রাপ্ত হয়েছিল, যা প্রতিটি ক্ষেত্রে এবং এর তুলনামূলকভাবে সহজ বীজগণিত ফর্মগুলির কারণে সম্ভব । অভিন্ন বিতরণের জন্য তারা সমান এবং সূচকীয় বিতরণগুলির জন্য তারা যেখানে হ'ল ইউলারের ধ্রুবক এবং হ'ল "বহুগাম" ফাংশন, ইউলারের গামা ফাংশনের লোগারিথমিক ডেরাইভেটিভ।F n - 1fFn1(n+1)12γ+ψ(n)=γ+Γ(n)Γ(n)γψ

যদিও তারা পৃথক হয় (কারণ এই বিতরণগুলি আকারগুলির বিস্তৃত আকার প্রদর্শন করে), তিনটি মোটামুটি একমত হয় যে দেখায় যে গুণকটি আকারের উপর খুব বেশি নির্ভর করে না এবং তাই এটি সর্বকোষ হিসাবে প্রমাণিত করতে পারে, স্ট্যান্ডার্ড বিচ্যুতিটির শক্ত মূল্যায়ন যখন ছোট সাবমেলের ব্যাপ্তি জানা যায়। (বস্তুত, খুব ভারী-টেইলড শিক্ষার্থীর স্বাধীনতার তিন মাত্রার বন্টন এখনো কাছাকাছি একটি গুণক হয়েছে জন্য , বহু দূর থেকে এ সব না ।)n=62.5t2.3n=62.5


6
অপূর্ব প্রকাশ! আপনি জানতে আগ্রহী হতে পারেন যে এটি 1920 এর দশকে ফিরে তদন্ত করা হয়েছিল বলে মনে হয়। টিপপেট 1925 দেখুন । টিপপেটের টেবিলগুলিতে (টেবিল এক্স) size আকারের একটি নমুনা দেওয়া পরিসরের জন্য প্রত্যাশিত মান হ'ল । তিনি সাধারণ বন্টনের জন্য পরিসীমাটির সম্পূর্ণ বিতরণের ডাইরিভিশন দেখান। এটি ডেভিড ইত্যাদি ব্যবহার করেছিলেন। (1954) স্বাভাবিকতার জন্য পরীক্ষার জন্য পরিসর বিতরণের সম্ভাব্যতা পয়েন্ট গণনা করতে (ডি'গোস্টিনো এবং স্টিফেনস 9.3.3.4.2 দেখুন)। 2.53441σ
অব্রাহাম

@ অভ্রাহাম আলোকিত মন্তব্যের জন্য আপনাকে ধন্যবাদ। আমি যখন গ্রাফিকগুলি যুক্ত করলাম তখন আমাকে কী আঘাত করেছিল তা হ'ল এই পুরো পদ্ধতির সত্যই চতুর অংশটি হ'ল আকারের ছয়টির নমুনা ব্যবহার করা কারণ সেখানে যেখানে গুণকরা বিতরণীয় আকার নির্বিশেষে একই রকম হয়ে থাকে।
whuber

ধন্যবাদ! টিপপেটের টেবিলগুলি আসলে 2 থেকে 1000 এর মধ্যে সমস্ত সংখ্যার জন্য উপযুক্ত গুণক দেয় He অবশ্যই, এটি এনআইএএসি এর 20 বছর পূর্বে ভাল ছিল 1925 সালে।
অভ্রাহাম

@ আপনি কীভাবে সংখ্যাটি (2.534) গণনা করাতে পারেন?
অ্যান্ডি

আমি গণনাগুলির ব্যাখ্যা অন্তর্ভুক্ত করার জন্য সম্পাদনা করেছি।
হোবার

4

এই অনুমানটি সত্য নমুনা স্ট্যান্ডার্ড বিচ্যুতির খুব কাছাকাছি। আমি তা বোঝাতে একটি দ্রুত আর স্ক্রিপ্ট লিখেছি:

x = sample(1:10000,6000,replace=TRUE)

B = 100000
R = rep(NA,B)
for(i in 1:B){
    samp = sample(x,6)
    R[i] = max(samp)-min(samp)
}

mean(R)/2.534

sd(x)

যা ফলন:

> mean(R)/2.534
[1] 2819.238
> 
> sd(x)
[1] 2880.924

এখন আমি নিশ্চিত (এখনও) এটি কেন কাজ করে তা নিশ্চিত নয় তবে এটি কমপক্ষে (মুখের মূল্যে) মতো দেখায় যে অনুমানটি একটি শালীন।

সম্পাদনা: এটি কেন কাজ করে তা সম্পর্কে @ হুইবারের ব্যতিক্রমী মন্তব্য (উপরে) দেখুন


1
6103/72.474mean(R)/2.4742887.6sd(x)

খুবই সত্য! > mean(R)/2.474 [1] 2887.611
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.