কীভাবে পরীক্ষা করতে হবে যে কোনও নমুনা গামা বিতরণের পরিবারকে ফিট করে?


13

আমার কাছে উপাত্তের একটি নমুনা রয়েছে যা অবিচ্ছিন্ন র্যান্ডম ভেরিয়েবল এক্স থেকে উত্পন্ন হয়েছিল And তবে আমি এই গামা বিতরণের সঠিক পরামিতিগুলি জানি না।

আমার প্রশ্নটি হল কিভাবে এক্স বিতরণ গামা বিতরণের কোনও পরিবারের অন্তর্ভুক্ত কিনা তা পরীক্ষা করবেন? কোলমোগোরভ-স্মারনভ পরীক্ষা, অ্যান্ডারসন-ডার্লিং পরীক্ষা ইত্যাদির মতো ফিটের টেস্টগুলির কিছু সদ্ব্যবহার রয়েছে, তবে এই পরীক্ষাগুলি ব্যবহার করার সময় একটি বিধিনিষেধটি হ'ল তাত্ত্বিক বিতরণের পরামিতিগুলি আগে থেকেই জানা উচিত। কেউ দয়া করে আমাকে বলবেন কীভাবে এই সমস্যাটি সমাধান করবেন?


সম্ভবত আমি কিছু মিস করছি, তবে যদি আপনি বিতরণের ফিটের পরীক্ষার জন্য ইতিমধ্যে কোনও পরীক্ষার কথা জানেন এবং তাত্ত্বিক বিতরণের মানগুলি আপনার যা জানা দরকার তা হল, তবে আপনি কেবল গামার পরামিতিগুলির সর্বাধিক সম্ভাবনা অনুমানকারী ব্যবহার করতে পারেন পরামিতিগুলির অনুমান পেতে আপনার ডেটাতে বিতরণ। তারপরে আপনি এই পরীক্ষাগুলিতে তাত্ত্বিক বিতরণ সংজ্ঞায়িত করতে এই অনুমানগুলি ব্যবহার করতে পারেন।
ডেভিড

ডেভিড, আপনার উত্তরের জন্য আপনাকে ধন্যবাদ। উত্তরটি আমি যা নিয়ে ভাবছিলাম তাও কিন্তু আমি নিশ্চিত নই যে এই ধারণাটিকে সমর্থন করতে পারে এমন কিছু তত্ত্ব রয়েছে কিনা, আপনি কি আমার পক্ষে উত্তর দিতে পারবেন?
ব্যবহারকারীর 6363

আপনি যদি আর ব্যবহার করেন তবে আপনি ফিটডিসট্রপ্লাস প্যাকেজটি দেখে নিতে আগ্রহী হতে পারেন , এতে এই ধরণের কাজ করার সুবিধা রয়েছে।
গুং - মনিকা পুনরায়

উত্তর:


8

আমি মনে করি যে প্রশ্নটি কোনও হিস্টোগ্রাম তুলনার জন্য নয়, একটি সুনির্দিষ্ট পরিসংখ্যান পরীক্ষা করার জন্য বলেছে। কোলমোগোরভ-স্মিমনভ পরীক্ষাটি অনুমানক পরামিতিগুলির সাথে ব্যবহার করার সময় শূন্যের অধীনে পরীক্ষার পরিসংখ্যানগুলির বন্টন পরীক্ষিত বিতরণের উপর নির্ভর করে, কোনও অনুমানযুক্ত প্যারামিটার না করে মামলার বিপরীতে। উদাহরণস্বরূপ, (আরে) ব্যবহার করে

x <- rnorm(100)
ks.test(x, "pnorm", mean=mean(x), sd=sd(x))

দিকে

        One-sample Kolmogorov-Smirnov test

data:  x 
D = 0.0701, p-value = 0.7096
alternative hypothesis: two-sided

যখন আমরা পেয়েছি

> ks.test(x, "pnorm")

        One-sample Kolmogorov-Smirnov test

data:  x 
D = 0.1294, p-value = 0.07022
alternative hypothesis: two-sided 

একই নমুনা এক্স এর জন্য। তাত্পর্য স্তরের বা পি-মানটি মন্টে কার্লো সিমুলেশন দ্বারা শূন্যের অধীনে নির্ধারণ করতে হবে, অনুমিত বন্টনের অধীনে নমুনাগুলি থেকে কোলমোগোরভ-স্মারনভ পরিসংখ্যান বিতরণ করা হবে (পর্যবেক্ষণের নমুনা প্রদত্ত ফলাফলের মধ্যে সামান্য আনুমানিক সাথে) অন্য বিতরণ থেকে আসে, এমনকি শূন্যের নীচে)।


1
(+1) আনুমানিক বিতরণের অধীনে নমুনাগুলি অনুকরণ করা কেন সঠিক তা আমি ভাল করি না। আমি ভাবতে পারি যে পরামিতিগুলির জন্য আমাদের পূর্বের প্রয়োজন ছিল এবং সমস্ত সম্ভাব্য বিতরণ থেকে নমুনা ... আপনি আরও কিছুটা ব্যাখ্যা করতে পারেন?
এলভিস

1
শিয়ান, আপনার উত্তর হ'ল আমি যা উদ্বিগ্ন। আপনার অর্থ হ'ল "আনুমানিক পরামিতিগুলির সাথে কলমোগোরভ-স্মারনভ পরীক্ষাটি ব্যবহার করার সময় শূন্যের অধীনে পরীক্ষার পরিসংখ্যানগুলির বন্টন পরীক্ষিত বিতরণের উপর নির্ভর করে"। যাইহোক, আমরা এক্স এর বিতরণ জানি না, আরও স্পষ্টভাবে, আমরা নাল অনুমানের অধীনে এক্স এর বিতরণের পরামিতি জানি না, সুতরাং পরীক্ষার পরিসংখ্যানগুলির বিতরণ, অতএব, আমরা মন্টি কার্লো ব্যবহার করি। পি মান পেতে আপনি মন্টি কার্লো ব্যবহার না করে এটি সমাধানের আরও কিছু উপায় থাকতে পারেন? আপনাকে ধন্যবাদ
ব্যবহারকারী 83৩63৩

"পর্যবেক্ষিত নমুনা নালীর নীচে এমনকি অন্য বিতরণ থেকে আসে" এই বিষয়টি বিবেচনায় নেওয়ার জন্য, প্রতিটি প্রতিলিপিটিতে প্যারামিটারগুলির পুনরায় অনুমান করে, নমুনাটি বুটস্ট্র্যাপ করা কি উপযুক্ত হবে না?
এলভিস

1
@ এলভিস (1): এটি ক্লাসিক্যাল পরিসংখ্যান, ফিট সমস্যার সদ্ব্যবহারের কোনও বায়েশীয় রেজোলিউশন নয়। লোকেশন-স্কেল প্যারামিটারগুলির সাথে বিতরণের জন্য, সিমুলেটেড নমুনাগুলি অনুকরণ করতে ব্যবহৃত প্যারামিটারগুলির পছন্দ কোনও বিষয় নয়।
শি'য়ান

1
@ এলভিস (২): আবার কিছু আমি নিজের শিক্ষার্থীদের সাথে কেবল আলোচনা করেছি! বুটস্ট্র্যাপ কোলমোগোরভ-স্মারনভের দূরত্বের আচরণের মূল্য নির্ধারণে সহায়তা করবে উপাত্তের সত্যিকারের বিতরণে, শূন্যতার নীচে নয়! ফিশার-নেইমন-পিয়ারসন নীতিটি হ'ল নলটির নীচে কোলমোগোরভ-স্মারনভের দূরত্বের আচরণের বিষয়টি গুরুত্বপূর্ণ, যাতে পর্যবেক্ষণ করা দূরত্বটি নালার নীচে এই বিতরণকে খুব চূড়ান্তভাবে আঁকিয়ে তুললে তা প্রত্যাখাত হয়।
শি'য়ান

4

আপনার ডেটার জন্য গামা বিতরণ ধরে ধরে প্যারামিটারগুলির এমএলইগুলি গণনা করুন এবং তাত্ত্বিক ঘনত্বটিকে আপনার ডেটা হিস্টোগ্রামের সাথে তুলনা করুন। যদি দুটি খুব আলাদা হয় তবে গামা ডিস্ট্রিবিউশন হ'ল আপনার ডেটার দুর্বলতা। একটি আনুষ্ঠানিক পরীক্ষার জন্য আপনি গণনা করতে পারেন, উদাহরণস্বরূপ, কোলমোগোরভ-স্মারনফ পরীক্ষার পরিসংখ্যানটি যথাযথরূপে অভিজ্ঞতা অভিজ্ঞতা এবং পরীক্ষার সাথে সেরা ফিটিং গামা বিতরণের তুলনা করে।


3
+1, এটি একটি শক্ত উত্তর। তবে, আমি হিস্টোগ্রামের চেয়ে তাত্ত্বিক গামার বিরুদ্ধে কিউকিউ প্লট পরীক্ষা করার পরামর্শ দেব - বিচ্যুতির জন্য মূল্যায়ন করা আরও সহজ হবে।
গুং - মনিকা পুনরায়

1
সমস্যাটি হ'ল কেএস পরীক্ষাটি তাত্ত্বিক বিতরণটি আগে থেকেই দেওয়া হবে বলে তথ্য থেকে অনুমান করা যায় না। শি'আন (আংশিকভাবে) সেদিক দিয়ে উত্তর দিয়েছিল ...
এলভিস

আপনার অর্থ এই যে আমরা প্রথমে এমএলএস অনুমানের জন্য ডেটাগুলির এই নমুনাটি ব্যবহার করি এবং গামা বিতরণে এমএলএস অনুমানের মান ব্যবহার করতে পারি, এবং তারপরে কেএস পরীক্ষার সাহায্যে গামা বিতরণ (আনুমানিক প্যারামিটার সহ) ডেটার তুলনা করব?
ব্যবহারকারীর 6363

এলভিস, আপনি দয়া করে কীভাবে সমস্যাটি সমাধান করবেন তা আমাকে বলবেন যে যখন তাত্ত্বিক বিতরণের প্যারামিটারটি অজানা এবং অনুমান করা দরকার। এই ক্যাসে, অনুমানের তুলনামূলকভাবে সঠিক রায় পেতে কেউ কীভাবে পরীক্ষা ব্যবহার করতে পারে, আপনাকে ধন্যবাদ!
ব্যবহারকারী 63৩63৩

1
@ এলভিস: আমি মনে করি না যে গামা বিতরণের ক্ষেত্রে সঠিক উত্কৃষ্টতা সম্ভব। সিডিএফ নিজেই বদ্ধ আকারে উপলভ্য নয়। আরও, আকৃতির প্যারামিটারটি স্কেল বা অবস্থান নয় এর অর্থ হ'ল আকারের প্যারামিটারের প্রতিটি মানের জন্য আলাদা বিতরণ আছে ...
শি'ান
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.