পৃথক ডিস্ট্রিবিউশন ফিটিং পদ্ধতি
পৃথক পৃথক বিতরণে ফিট করার জন্য প্যারামিটারগুলির প্রাক্কলন করতে তিনটি প্রধান পদ্ধতি ব্যবহৃত হয়।
এটি প্যারামিটারের মানগুলি খুঁজে পায় যা আপনার নমুনা সরবরাহের সর্বোত্তম সুযোগ দেয় (অন্যান্য অনুমান যেমন প্রদত্ত স্বাধীনতা, ধ্রুবক প্যারামিটার ইত্যাদি)
এটি প্যারামিটার মানগুলি খুঁজে পায় যা প্রথম কয়েকটি জনসংখ্যার মুহুর্তগুলিকে আপনার নমুনার মুহুর্তগুলির সাথে মেলে। এটি প্রায়শই করা মোটামুটি সহজ এবং অনেক ক্ষেত্রে মোটামুটি যুক্তিসঙ্গত অনুমানক পাওয়া যায়। এটি কখনও কখনও এমএল রুটিনগুলিতে শুরুর মান সরবরাহ করতে ব্যবহৃত হয়।
এটি পৃথক বিতরণের তুলনায় ফিটের পরিসংখ্যানের চি-বর্গক্ষেত্রের সদল্যকে হ্রাস করে, যদিও কখনও কখনও বড় ডেটা সেট সহ, শেষ-বিভাগগুলি সুবিধার জন্য সংযুক্ত করা যেতে পারে। এটি প্রায়শই বেশ ভালভাবে কাজ করে এবং নির্দিষ্ট পরিস্থিতিতে এমএল এর থেকে এটির পক্ষে যুক্তিযুক্ত কিছু সুবিধাও রয়েছে তবে সাধারণত এটি রূপান্তরিত হতে হবে, সেক্ষেত্রে বেশিরভাগ লোক এমএলকেই পছন্দ করেন।
প্রথম দুটি পদ্ধতি অবিচ্ছিন্ন বিতরণের জন্যও ব্যবহৃত হয়; তৃতীয়টি সাধারণত সেই ক্ষেত্রে ব্যবহার হয় না।
এগুলি কোনও উপায়ে একটি বিস্তৃত তালিকার অন্তর্ভুক্ত নয় এবং উদাহরণস্বরূপ কেএস-পরিসংখ্যানকে হ্রাস করে প্যারামিটারগুলি অনুমান করা সম্ভব হবে - এবং এমনকি (যদি আপনি বিচক্ষণতার জন্য সামঞ্জস্য করেন), এটি থেকে একটি যৌথ ব্যঞ্জনাঞ্চল পেতে , যদি আপনি থাকতেন এত ঝোঁক যেহেতু আপনি আর-তে কাজ করছেন, এমএল অনুমানটি নেতিবাচক দ্বিপদী জন্য অর্জন করা বেশ সহজ। যদি আপনার নমুনাটি থাকে তবে x
এটি যতটা সহজlibrary(MASS);fitdistr (x,"negative binomial")
:
> library(MASS)
> x <- rnegbin(100,7,3)
> fitdistr (x,"negative binomial")
size mu
3.6200839 6.3701156
(0.8033929) (0.4192836)
সেগুলি হ'ল প্যারামিটারের অনুমান এবং তাদের (অ্যাসিপটোটিক) স্ট্যান্ডার্ড ত্রুটি।
পোইসন বিতরণের ক্ষেত্রে, এমএলই এবং মো এম এম উভয়ই নমুনা গড়ের ভিত্তিতে পোইসন প্যারামিটার অনুমান করে।
যদি আপনি উদাহরণ দেখতে চান তবে আপনার কিছু প্রকৃত সংখ্যা পোস্ট করা উচিত। মনে রাখবেন যে আপনার হিস্টগ্রামটি নির্বাচিত বিনগুলি দিয়ে সম্পন্ন হয়েছে যাতে 0 এবং 1 বিভাগগুলি একত্রিত হয় এবং আমাদের কাছে কাঁচা গণনা না থাকে।
আমি যতটা অনুমান করতে পারি তার কাছাকাছি, আপনার ডেটা মোটামুটি নীচে রয়েছে:
Count: 0&1 2 3 4 5 6 >6
Frequency: 311 197 74 15 3 1 0
তবে বড় সংখ্যাগুলি অনিশ্চিত হয়ে পড়বে (এটি নিম্ন-সংখ্যাগুলি কতগুলি যথাযথভাবে তাদের বার-উচ্চতাগুলির পিক্সেল-গণনা দ্বারা উপস্থাপন করা হয় তার উপর নির্ভর করে) এবং এটি সংখ্যার কিছুটা হতে পারে যেমন এই সংখ্যার দ্বিগুণ (কাঁচা গণনাগুলি প্রভাবিত করে) স্ট্যান্ডার্ড ত্রুটিগুলি, সুতরাং তারা সেই মানগুলি সম্পর্কে বা দ্বিগুণ হিসাবে বড় কিনা তা বিবেচনা করে)
প্রথম দুটি গোষ্ঠীর সংমিশ্রণটি কিছুটা বিশ্রী করে তোলে (এটি করা সম্ভব, তবে আপনি কিছু বিভাগ সংযুক্ত করলে সোজা সোজা A প্রচুর তথ্য সেই প্রথম দুটি গ্রুপে রয়েছে তাই কেবলমাত্র ডিফল্ট হিস্টোগ্রামগুলি লম্পট না করা ভাল best )।
* পৃথক পৃথক বিতরণ ফিটিংয়ের অন্যান্য পদ্ধতি অবশ্যই সম্ভব (উদাহরণস্বরূপ, ফিটের পরিসংখ্যানগুলির মধ্যে কোয়ান্টাইলগুলি মেলা বা অন্য ন্যূনতমতা কমিয়ে আনতে পারে)। আমি যেগুলির উল্লেখ করেছি সেগুলি সবচেয়ে সাধারণ বলে মনে হয়।