আমি আর এর সাথে সিমুলেশনগুলি সম্পর্কে আপনার পয়েন্টটি উত্তর দেব কারণ এটিই আমার পরিচিত। আর এর অনেকগুলি বিল্টিন বিতরণ রয়েছে যা আপনি অনুকরণ করতে পারেন। নামকরণের লজিকগুলি হ'ল disনামটি বন্টন অনুকরণ করতে হবে rdis।
নীচে আমি প্রায়শই ব্যবহার করি
# Some continuous distributions.
?rnorm
?runif
?rgamma
?rlnorm
?rweibull
?rexp
?rt
# Some discrete distributions.
?rpoiss
?rbinom
?rnbinom
?rgeom
?rhyper
আর এর সাথে ফিটিং বিতরণে কিছু পরিপূরণ পেতে পারেন ।
সংযোজন: বিতরণ এবং তাদের অন্তর্ভুক্ত প্যাকেজগুলির একটি বিস্তৃত তালিকা সহ একটি লিঙ্ক সরবরাহ করার জন্য @ jthetzel কে ধন্যবাদ ।
তবে অপেক্ষা করুন, আরও রয়েছে: ঠিক আছে, @ হুশিয়ারের মন্তব্য অনুসরণ করে আমি অন্য বিষয়গুলিকে সম্বোধন করার চেষ্টা করব। পয়েন্ট 1 সম্পর্কিত, আমি কখনও কখনও সদ্ব্যবহারে ফিট হই না। পরিবর্তে আমি সর্বদা সিগন্যালটির উত্স সম্পর্কে চিন্তা করি, যেমন ঘটনার কারণ হয়, সেখানে কী প্রাকৃতিক প্রতিসাম্য তৈরি হয় যা এটি তৈরি করে ইত্যাদি etc. েকে দেওয়ার জন্য আপনার বেশ কয়েকটি বইয়ের অধ্যায় প্রয়োজন তাই আমি কেবল দুটি উদাহরণ দেব give
যদি ডেটা গণনা করা হয় এবং কোনও উচ্চতর সীমা না থাকে তবে আমি একটি পইসন চেষ্টা করি। পাইসন ভেরিয়েবলগুলি একটি টাইম উইন্ডোর সময় ক্রমান্বয়ে স্বতন্ত্র গণনা হিসাবে ব্যাখ্যা করা যেতে পারে যা একটি খুব সাধারণ কাঠামো। আমি বিতরণ ফিট করে এবং দেখতে (প্রায়শই দৃষ্টিভঙ্গি) হয় যে প্রকরণটি ভালভাবে বর্ণিত হয়েছে। বেশিরভাগ ক্ষেত্রে, নমুনার বৈকল্পিকতা অনেক বেশি, এক্ষেত্রে আমি নেতিবাচক দ্বিপদী ব্যবহার করি। নেগেটিভ বাইনোমিয়ালকে বিভিন্ন ভেরিয়েবলের সাথে পায়সনের মিশ্রণ হিসাবে ব্যাখ্যা করা যেতে পারে যা আরও সাধারণ, তাই এটি সাধারণত নমুনার সাথে খুব ভাল ফিট করে।
যদি আমি মনে করি যে ডেটাগুলি গড়ের চারপাশে প্রতিসাম্যযুক্ত, অর্থাৎ বিচ্যুতিগুলি ইতিবাচক বা নেতিবাচক হওয়ার সম্ভাবনা রয়েছে তবে আমি কোনও গাউসিয়ানকে ফিট করার চেষ্টা করি। আমি তখন পরীক্ষা করে দেখি (আবার দৃষ্টি দিয়ে) অনেক বিদেশী আছে কিনা, অর্থাত্ ডেটা পয়েন্টগুলি গড় থেকে খুব দূরে। যদি সেখানে থাকে তবে আমি পরিবর্তে একটি শিক্ষার্থীর টি ব্যবহার করি। শিক্ষার্থীর টি বিতরণকে বিভিন্ন রূপের গাউসের মিশ্রণ হিসাবে ব্যাখ্যা করা যেতে পারে, যা আবার খুব সাধারণ।
এই উদাহরণগুলিতে, আমি যখন দৃষ্টিভঙ্গি বলি, তার অর্থ আমি একটি কিউকিউ প্লট ব্যবহার করি
পয়েন্ট 3, বেশ কয়েকটি বইয়ের অধ্যায়গুলিরও প্রাপ্য। অন্যের পরিবর্তে বিতরণ ব্যবহারের প্রভাব সীমাহীন। সুতরাং এটি সব কিছু না করে পরিবর্তে, আমি উপরের দুটি উদাহরণ চালিয়ে যাব।
আমার প্রথম দিনগুলিতে, আমি জানতাম না যে নেতিবাচক দ্বিপদী একটি অর্থপূর্ণ ব্যাখ্যা করতে পারে তাই আমি পয়সনকে সর্বদা ব্যবহার করি (কারণ আমি মানবিক পদগুলিতে প্যারামিটারগুলি ব্যাখ্যা করতে সক্ষম হতে চাই)। খুব প্রায়শই, আপনি যখন পইসন ব্যবহার করেন, আপনি গড়টি সুন্দরভাবে ফিট করেন তবে আপনি বৈকল্পিকাকে অবমূল্যায়ন করেন। এর অর্থ হল যে আপনি আপনার নমুনার চূড়ান্ত মানগুলি পুনরুত্পাদন করতে অক্ষম এবং আপনি প্রকৃতপক্ষে না হওয়া অবস্থায় আপনি বহিরাগতদের (ডেটা পয়েন্টগুলির অন্যান্য পয়েন্টগুলির মতো একই বিতরণ নেই) হিসাবে মূল্যবোধ বিবেচনা করবেন।
আবার আমার প্রথম দিনগুলিতে, আমি জানতাম না যে স্টুডেন্টের টি এরও একটি অর্থপূর্ণ ব্যাখ্যা রয়েছে এবং আমি গাউসিকে সব সময় ব্যবহার করব। একই ঘটনা ঘটেছে। আমি গড় এবং তারতম্যটি ভালভাবে ফিট করব, তবে আমি এখনও বহিরাগতদের ক্যাপচার করব না কারণ প্রায় সমস্ত ডেটা পয়েন্টগুলি গড়ের 3 টি স্ট্যান্ডার্ড বিচ্যুতির মধ্যে বলে মনে করা হচ্ছে। একই জিনিসটি ঘটেছিল, আমি উপসংহারে পৌঁছেছি যে কিছু পয়েন্টগুলি "অসাধারণ" ছিল, যদিও বাস্তবে তা ছিল না।