সাধারণ বিতরণের সংমিশ্রণ থেকে কোয়ান্টাইলগুলি


13

আমার কাছে বিভিন্ন বয়সের বাচ্চাদের জন্য অ্যানথ্রোপোমেট্রিক মাত্রা (কাঁধের স্প্যানের মতো) বিতরণের তথ্য রয়েছে। প্রতিটি বয়স এবং মাত্রার জন্য, আমার অর্থ, আদর্শ বিচ্যুতি। (আমার কাছে আটটি কোয়ান্টাইল রয়েছে, তবে আমি মনে করি না যে আমি তাদের কাছ থেকে যা চাই তা পেতে সক্ষম হব।)

প্রতিটি মাত্রার জন্য, আমি দৈর্ঘ্য বিতরণের নির্দিষ্ট কোয়ান্টাইলগুলি অনুমান করতে চাই। যদি আমি ধরে নিই যে প্রতিটি মাত্রাটি সাধারণত বিতরণ করা হয় তবে আমি উপায় এবং মানক বিচ্যুতি দিয়ে এটি করতে পারি। বিতরণের একটি নির্দিষ্ট পরিমাণের সাথে সম্পর্কিত মানটি পেতে আমি কি কোনও সুন্দর সূত্র ব্যবহার করতে পারি?

বিপরীতটি বেশ সহজ: একটি নির্দিষ্ট মানের জন্য, প্রতিটি সাধারণ বিতরণ (বয়স) এর জন্য মানটির ডানদিকে অঞ্চলটি পান। ফলাফলগুলি যোগ করুন এবং বিতরণের সংখ্যা দ্বারা ভাগ করুন।

আপডেট : এখানে গ্রাফিকাল আকারে একই প্রশ্ন। ধরে নিন যে রঙিন প্রতিটি বিতরণ সাধারণত বিতরণ করা হয়। গ্রাফিকাল আকারে একই প্রশ্ন

এছাড়াও, আমি স্পষ্টতই কেবল বিভিন্ন দৈর্ঘ্যের একগুচ্ছ চেষ্টা করতে পারি এবং আমার নির্ভুলতার জন্য কাঙ্ক্ষিত কোয়ান্টাইলের কাছে যথেষ্ট পরিমাণে কাছে না পৌঁছানো পর্যন্ত এগুলি পরিবর্তন করতে পারি। আমি ভাবছি যে এর চেয়ে ভাল উপায় আর আছে কিনা? এবং যদি এটি সঠিক পদ্ধতির হয় তবে এর কোনও নাম আছে?


3
আপনি কি জিজ্ঞাসা করছেন যে সাধারণ বিতরণের মিশ্রণের কোয়ান্টাইলগুলি গণনা করার জন্য একটি সাধারণ সূত্র আছে ? এই অ্যাপ্লিকেশনটিতে, আপনি বয়স-নির্দিষ্ট পরামিতিগুলির ভিত্তিতে বয়স নির্বিশেষে কাঁধের স্প্যানের কোয়ান্টাইলগুলি (বলুন) জিজ্ঞাসা করবেন । এটি কি সঠিক ব্যাখ্যা?
whuber

উত্তর:


16

দুর্ভাগ্যক্রমে, স্ট্যান্ডার্ড স্বাভাবিক (যা থেকে অন্যান্য সমস্ত নির্ধারণ করা যেতে পারে, যেহেতু সাধারণটি একটি লোকেশন-স্কেল পরিবার) কোয়ান্টাইল ফাংশন একটি বদ্ধ ফর্ম (যেমন একটি 'সুন্দর সূত্র') স্বীকার করে না। একটি বদ্ধ ফর্মের নিকটতম জিনিসটি হ'ল স্ট্যান্ডার্ড স্বাভাবিক কোয়ান্টাইল ফাংশন হ'ল ফাংশন, , যা ডিফারেনশিয়াল সমীকরণকে সন্তুষ্ট করেw

d2wdp2=w(dwdp)2

প্রাথমিক অবস্থার এবং । বেশিরভাগ কম্পিউটিং পরিবেশে এমন একটি ফাংশন রয়েছে যা সংখ্যাগতভাবে স্বাভাবিক কোয়ান্টাইল ফাংশন গণনা করে। আর তে, আপনি টাইপ করবেনw(1/2)=0w(1/2)=2π

qnorm(p, mean=mu, sd=sigma)

ডিস্ট্রিবিউশনের 'ম কোয়ান্টাইল পেতে ।pN(μ,σ2)


সম্পাদনা: সমস্যার একটি সংশোধিত বোঝার সাথে, তথ্যটি নরমালদের মিশ্রণ থেকে উত্পন্ন হয়, যাতে পর্যবেক্ষণ করা ডেটার ঘনত্ব হয়:

p(x)=iwipi(x)

যেখানে এবং প্রতিটি গড় সঙ্গে কিছু স্বাভাবিক ঘনত্ব এবং মানক চ্যুতির । এটি পর্যবেক্ষণ করা ডেটার সিডিএফ অনুসরণ করেiwi=1pi(x)μiσi

F(y)=yiwipi(x)dx=iwiypi(x)=iwiFi(y)

যেখানে স্বাভাবিক সিডিএফ সঙ্গে গড় এবং মানক চ্যুতির । সংহতকরণ এবং সংমিশ্রণকে আন্তঃসংযোগ করা যেতে পারে কারণ এই সংহতগুলি সীমাবদ্ধ। এই সিডিএফ একটি কম্পিউটারে গণনা করার জন্য অবিচ্ছিন্ন এবং যথেষ্ট সহজ, সুতরাং বিপরীত সিডিএফ, , যা কোয়ান্টাইল ফাংশন নামেও পরিচিত, একটি লাইন অনুসন্ধান করে গণনা করা যায়। আমি এই বিকল্পটিতে ডিফল্ট হয়েছি কারণ উপাদানগুলির বিতরণের কোয়ান্টাইলগুলির একটি ক্রিয়াকলাপ হিসাবে নরমালদের মিশ্রণের কোয়ান্টাইল ফাংশনের কোনও সাধারণ সূত্র মাথায় আসে না।μ i σ i F - 1Fi(x)μiσiF1

নিম্নলিখিত আর কোডটি সংখ্যার সাথে লাইন অনুসন্ধানের জন্য বাইসেকশন ব্যবহার করে calc গণনা করে। F_inv () ফাংশনটি কোয়ান্টাইল ফাংশন, আপনাকে প্রতিটি কোয়ান্টিলের সমাধান করতে হবে, । ডাব্লু i , μ i , σ i পিF1wi,μi,σip

# evaluate the function at the point x, where the components 
# of the mixture have weights w, means stored in u, and std deviations
# stored in s - all must have the same length.
F = function(x,w,u,s) sum( w*pnorm(x,mean=u,sd=s) )

# provide an initial bracket for the quantile. default is c(-1000,1000). 
F_inv = function(p,w,u,s,br=c(-1000,1000))
{
   G = function(x) F(x,w,u,s) - p
   return( uniroot(G,br)$root ) 
}

#test 
# data is 50% N(0,1), 25% N(2,1), 20% N(5,1), 5% N(10,1)
X = c(rnorm(5000), rnorm(2500,mean=2,sd=1),rnorm(2000,mean=5,sd=1),rnorm(500,mean=10,sd=1))
quantile(X,.95)
    95% 
7.69205 
F_inv(.95,c(.5,.25,.2,.05),c(0,2,5,10),c(1,1,1,1))
[1] 7.745526

# data is 20% N(-5,1), 45% N(5,1), 30% N(10,1), 5% N(15,1)
X = c(rnorm(5000,mean=-5,sd=1), rnorm(2500,mean=5,sd=1),
      rnorm(2000,mean=10,sd=1), rnorm(500, mean=15,sd=1))
quantile(X,.95)
     95% 
12.69563 
F_inv(.95,c(.2,.45,.3,.05),c(-5,5,10,15),c(1,1,1,1))
[1] 12.81730

2
প্রশ্নের শেষ অনুচ্ছেদটি ইঙ্গিত দেয় যে অন্য কিছু চাওয়া হচ্ছে। আমি স্পষ্টতা চেয়েছি।
whuber

whuber এর লাঞ্চ সঠিক প্রশ্নটি কম বিভ্রান্ত করার জন্য আমি একটি ছবি যুক্ত করেছি।
টমাস লেভাইন

1
এই সমস্যাটি মোকাবেলা করার জন্য এখন একটি আর প্যাকেজ রয়েছে, দেখুন stats.stackexchange.com/questions/390931/…
ক্রিস্টোফ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.