নেতিবাচক দ্বিপদী বিতরণ বনাম দ্বিপদী বিতরণ


22

নেতিবাচক দ্বিপদী বিতরণ এবং দ্বিপদী বিতরণের মধ্যে পার্থক্য কী?

আমি অনলাইনে পড়ার চেষ্টা করেছি, এবং আমি দেখতে পেয়েছি যে ডেটা পয়েন্টগুলি পৃথক হলে নেতিবাচক দ্বিপদী বিতরণ ব্যবহৃত হয়, তবে আমি মনে করি এমনকি দ্বিপদী বিতরণও পৃথক ডেটা পয়েন্টের জন্য ব্যবহার করা যেতে পারে।


5
তারা দুজনেই আলাদা' re
গ্লেন_বি -রিনস্টেট মনিকা

5
সাধারণ উদাহরণ: আপনি ঘরে ঘরে ক্যান্ডি বিক্রি করছেন। আপনি যে দরজায় কড়া নাড়েন, আপনার কাছে 1 ক্যান্ডি বার এবং সম্ভাব্যতা 3/4 বিক্রয় বা 0 ক্যান্ডি বার বিক্রি করার সম্ভাবনা রয়েছে। যদি আপনি 50 টি দরজায় নক করেন তবে এন বারগুলি বিক্রয় করার সম্ভাবনা হ'ল এনটিতে দ্বি-দ্বি বিতরণ। 30 বার বিক্রি করার জন্য এম দরজাতে কড়া নাড়তে আপনার সম্ভাবনা এম এর মধ্যে একটি নেতিবাচক দ্বিপদী বিতরণ। নোট করুন যে প্রাক্তনটি 50 এ কাটবে কারণ আপনি 50 টিরও বেশি বার বিক্রি করতে পারবেন না, যদিও পরেরটির অনন্ত সময়ে একটি লেজ রয়েছে কারণ আপনি কেবল সেদিন ভয়ানক ভাগ্য পেতে পারেন এবং 30 তম বারটি কখনই বিক্রি করতে পারবেন না।
জেরি গর্ন

উত্তর:


30

পার্থক্য কি আমরা আগ্রহী নয়। উভয় ডিস্ট্রিবিউশন সাফল্যের সংশোধন সম্ভাবনা, সঙ্গে স্বাধীন বের্নুলির বিচারের থেকে নির্মিত হয় পি

দ্বিপদী বিতরণের সাথে, এলোমেলো পরিবর্তনশীল এক্স হল এন ট্রায়ালগুলিতে সাফল্যের সংখ্যা । কারণ এখানে নির্দিষ্ট সংখ্যক বিচার রয়েছে, এক্স এর সম্ভাব্য মানগুলি 0, 1, ..., এন

Gণাত্মক দ্বিপদী বিতরণের সাথে, র্যান্ডম ভেরিয়েবল ওয়াই হল পরীক্ষার সংখ্যা যতক্ষণ না পর্যালোচনা করা হয় r ত সাফল্যটি পর্যবেক্ষণ করা হয়। এই ক্ষেত্রে, আমরা r সাফল্যে না পৌঁছা পর্যন্ত আমরা পরীক্ষার সংখ্যা বাড়িয়ে রাখি । Y এর সম্ভাব্য মানগুলি হ'ল r , r + 1 , r + 2 , ... উপরের সীমা ছাড়াই। Gণাত্মক দ্বিপদীটি আর - সাফল্য না হওয়া পর্যন্ত ব্যর্থতার সংখ্যার পরিবর্তে, আর-এর সাফল্য পর্যন্ত পরীক্ষার সংখ্যার পরিবর্তে সংজ্ঞায়িত করা যেতে পারে । উইকিপিডিয়া এইভাবে নেতিবাচক দ্বিপদী বিতরণকে সংজ্ঞায়িত করে।

সুতরাং সংক্ষেপে:

দ্বিপদী :

  • পরীক্ষার স্থির সংখ্যা ( এন )
  • সাফল্যের স্থির সম্ভাবনা ( পি )
  • এলোমেলো পরিবর্তনশীল হ'ল এক্স = সাফল্যের সংখ্যা।
  • সম্ভাব্য মানগুলি 0 ≤ Xn হয়

নেতিবাচক দ্বিপদী :

  • সাফল্যের স্থির সংখ্যা ( আর )
  • সাফল্যের স্থির সম্ভাবনা ( পি )
  • র্যান্ডম ভেরিয়েবলটি হল r = সাফল্য হওয়া পর্যন্ত পরীক্ষার সংখ্যা ।
  • সম্ভাব্য মানগুলি হ'ল rY

দু'টি বিতরণের সমর্থন উল্লেখ করার জন্য আমাকে স্মরণ করিয়ে দেওয়ার জন্য বেন বলকারকে ধন্যবাদ। তিনি এখানে একটি সম্পর্কিত প্রশ্নের উত্তর দিয়েছেন ।


4
এনবির আরও আলোচনার জন্য এখানে: stats.stackexchange.com/questions/6728/… । লক্ষ্য করার মতো বিষয় যে দ্বিপাক্ষিক প্রতিক্রিয়াগুলি সীমিত [[0, এন]], এনবি প্রতিক্রিয়াগুলি সীমাহীন [0, ...]
বেন বলকার

ভাল কথা, আমি এটিকে অন্তর্ভুক্ত করার জন্য আমার উত্তর আপডেট করেছি।
জেলসিমা

জেলসিমার বিস্তারিত উত্তরের জন্য ধন্যবাদ, আমি এখন এটি আরও ভালভাবে বুঝতে পারলাম
অ্যালি

19

বাইনোমিয়ালের সাথে আপাতদৃষ্টিতে সুস্পষ্ট সম্পর্ক থাকা সত্ত্বেও নেতিবাচক দ্বিপদী বিতরণটি পয়সন বিতরণের তুলনায় আসলে ভাল। তিনটিই বিচ্ছিন্ন, বিটিডাব্লু।

ব্যবহারিক প্রয়োগগুলিতে, আপনি পোইসন দ্বারা প্রত্যাশার চেয়ে বেশি ছড়িয়ে পড়া (বৈকল্পিক) পর্যবেক্ষণ করার সময় এনবি পয়সের বিকল্প হয়। পোইসন হ'ল প্রথম পছন্দ বিবেচনা করার সময় আপনি গণনা সম্পর্কিত ডেটাগুলি নিয়ে কাজ করেন, যেমন একটি ছোট শহরে বার্ষিক সংখ্যক গাড়ি দুর্ঘটনাজনিত প্রাণহানির ঘটনা। পয়সন বিতরণের উভয় গড় এবং বৈচিত্রগুলি একটি পরামিতি দ্বারা সংজ্ঞায়িত করা হয় - সংঘটন হার, সাধারণত হিসাবে চিহ্নিত করা হয় । যতক্ষণ আপনি অনুমান করেছেন , আপনার গড় এবং বৈকল্পিকতা অনুসরণ করবে। আসলে, গড়টি অবশ্যই বৈকল্পিকের সমান হতে হবে।λλλ

যদি আপনার ডেটা থেকে বোঝা যায় যে বৈকল্পিক গড়ের চেয়ে বেশি (ওভারডিস্পেরিয়ান), এটি পয়েসনকে বাতিল করে দেয়, তবে নেতিবাচক দ্বিপদীটি দেখার জন্য পরবর্তী বিতরণ হবে। এটির একাধিক প্যারামিটার রয়েছে, সুতরাং এর বৈকল্পিক গড়ের চেয়ে বেশি হতে পারে।

দ্বিপদী সাথে NB এর সম্পর্ক অন্তর্নিহিত প্রক্রিয়া থেকেই আসে, কারণ এটি @ জেলসিমার উত্তরে বর্ণিত হয়েছিল। প্রক্রিয়াটি সম্পর্কিত, সুতরাং বিতরণগুলিও খুব বেশি, তবে আমি এখানে যেমন ব্যাখ্যা করেছি পয়সন বিতরণের লিঙ্কটি ব্যবহারিক প্রয়োগগুলির মধ্যে আরও কাছাকাছি।

আপডেট: আরেকটি বিষয় হ'ল প্যারামিটারাইজেশন। দ্বিপদী বিতরণের দুটি প্যারামিটার রয়েছে: পি এবং এন। এর উদ্ভট ডোমেন 0 থেকে n হয়। এটি কেবল বিচ্ছিন্নই নয়, সংখ্যার একটি সীমাবদ্ধ সংখ্যায়ও সংজ্ঞায়িত।

বিপরীতে পোইসন এবং এনবি উভয়ই অ-নেতিবাচক পূর্ণসংখ্যার সেটগুলিতে সংজ্ঞায়িত। পোইসনের একটি প্যারামিটার রয়েছে mb , আর এনবিতে দুটি রয়েছে: পি এবং আর। দ্রষ্টব্য, এই দুটি পরামিতি । সুতরাং এনবি এবং পোইসন কীভাবে সংযুক্ত রয়েছে তা দেখার এটি আরও একটি উপায়।nλn


3
"পইসন বিতরণের তুলনায় আরও ভাল তুলনা করে" আপনি কী বোঝাতে চেয়েছেন তা আমি বুঝতে পারি না। মূল প্রশ্নটি কোন ধরণের মডেলিং পছন্দসই তা বলে না। এমনকি এটি বোঝানোও হয় না যে একজন আদৌ মডেলিংয়ে আগ্রহী।
heropup

@ হেরোপআপ, ওপি অ্যাপ্লিকেশনগুলিতে স্পষ্টভাবে আগ্রহী এবং সরাসরি এনবিয়ের সাথে বিনোমিয়ালের সাথে তুলনা করে। সুতরাং, আমার উত্তরটি সেই তুলনা সম্পর্কে এবং পয়সনের সাথে সেই তুলনাটি সাধারণত অ্যাপ্লিকেশনগুলিতে আরও প্রাসঙ্গিক।
আকসকল

7

আপনি নমুনা দেওয়ার সময় এগুলি উভয়ই স্বতন্ত্র এবং গণনা উপস্থাপন করে।

দ্বিপদী বিতরণ একটি পরীক্ষায় সাফল্যের সংখ্যা প্রতিনিধিত্ব করে যা এর অঙ্কনের সংখ্যা আগেই নির্ধারিত হয়, উদাহরণস্বরূপ ধরুন যে তিনটি আইটেম একটি উত্পাদন প্রক্রিয়া থেকে এলোমেলোভাবে নির্বাচিত হয় এবং প্রতিটি আইটেমটি পরিদর্শন করা হয় এবং ত্রুটিযুক্ত , , বা অকেজো, , আমরা দেখতে পাই যে এই ক্ষেত্রে নমুনা স্থানটি ।এন এস = ( ডি ডি ডি , ডি ডি এন , ডি এন ডি , ডি এন এন , এন ডি ডি , এন ডি এন , এন এন ডি , এন এন এন )DNS=(DDD,DDN,DND,DNN,NDD,NDN,NND,NNN)

যেহেতু আপনি নির্দিষ্ট সংখ্যা সাফল্যগুলি আঁকেন না untilণাত্মক দ্বিপদী ব্যর্থতার সংখ্যার প্রতিনিধিত্ব করে। একই উদাহরণটি বিবেচনা করুন এবং ধরুন পরীক্ষাটি কোনও ত্রুটিযুক্ত আইটেম পর্যবেক্ষণ না করা অবধি এলোমেলোভাবে আইটেমগুলির নমুনা দেওয়া। তারপরে এই মামলার নমুনা স্থান হ'ল ।S=(D,ND,NND,NNND,...)

সুতরাং বিনোমিয়াল একটি নির্দিষ্ট সংখ্যক পরীক্ষায় সাফল্য গণনা করে থাকে, তবে একটি নির্দিষ্ট সংখ্যক সফল হওয়া অবধি নেতিবাচক দ্বিপদী ব্যর্থতা গণনা করে, তবে উভয়ের ক্ষেত্রে আমরা প্রতিস্থাপনের সাথে আঁকছি যার অর্থ প্রতিটি পরীক্ষার সাফল্যের একটি নির্দিষ্ট সম্ভাবনা রয়েছে।p

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.