শূন্য-স্ফীত এবং বাধা মডেলগুলির মধ্যে পার্থক্য কী?


81

আমি অবাক হয়েছি যদি তথাকথিত শূন্য-স্ফীত ডিস্ট্রিবিউশন (মডেল) এবং তথাকথিত বাধা-শূন্য-শূন্য বিতরণ (মডেল) এর মধ্যে কোনও স্পষ্ট-কাট পার্থক্য রয়েছে? সাহিত্যে শর্তাবলী প্রায়শই দেখা যায় এবং আমার সন্দেহ হয় যে সেগুলি এক নয়, তবে আপনি কি দয়া করে আমাকে সহজ শর্তে পার্থক্যটি ব্যাখ্যা করবেন?

উত্তর:


80

আকর্ষণীয় প্রশ্নের জন্য আপনাকে ধন্যবাদ!

পার্থক্য: স্ট্যান্ডার্ড গণনা মডেলের একটি সীমাবদ্ধতা হ'ল শূন্য এবং ননজারোস (ধনাত্মক) একই ডেটা উত্পন্নকরণ প্রক্রিয়া থেকে আসা বলে মনে করা হয়। বাধা মডেল সহ , এই দুটি প্রক্রিয়া একই হতে সীমাবদ্ধ নয়। মূল ধারণাটি হ'ল একটি বার্নোল্লি সম্ভাব্যতা একটি গণনা বৈকল্পিকের শূন্য বা ধনাত্মক উপলব্ধি আছে কিনা এর দ্বৈত ফলাফলকে পরিচালনা করে। যদি উপলব্ধিটি ইতিবাচক হয় তবে প্রতিবন্ধকতা অতিক্রম করা হবে, এবং ধনাত্মকগুলির শর্তসাপেক্ষ বিতরণ একটি কাটা-শূন্য-শূন্য গণনা ডেটা মডেল দ্বারা পরিচালিত হয়। শূন্য-স্ফীত মডেলগুলির সাথে, প্রতিক্রিয়া ভেরিয়েবলটি বের্নোল্লি বিতরণের মিশ্রণ হিসাবে মডেল করা হয় (বা এটি শূন্যের পয়েন্ট গণ) এবং পোইসন বিতরণ (বা অন্য কোনও নেতিবাচক ইন্টিজারে সমর্থনযোগ্য গণনা বিতরণ)। আরও বিশদ এবং সূত্রের জন্য দেখুন উদাহরণস্বরূপ, গুরমু এবং ত্রিবেদী (২০১১) এবং ডালারিম্পল, হাডসন এবং ফোর্ড (২০০৩)।

উদাহরণ: বাধা মডেলগুলি ব্যক্তির দ্বারা মোকাবেলা করা ক্রমগত সিদ্ধান্ত গ্রহণের প্রক্রিয়া দ্বারা অনুপ্রাণিত হতে পারে। আপনার প্রথমে সিদ্ধান্ত নেওয়া দরকার আপনার কিছু কিনতে হবে কিনা এবং তারপরে আপনি সেই কিছুর পরিমাণ সম্পর্কে সিদ্ধান্ত নেবেন (যা অবশ্যই ইতিবাচক হতে হবে)। যখন আপনার কিছু কেনার সিদ্ধান্ত নেওয়ার পরে আপনাকে কিছু না কিনে (বা সম্ভাব্য করতে পারে) অনুমতি দেওয়া হয় তখন শূন্য-স্ফীত মডেলটি উপযুক্ত এমন পরিস্থিতির উদাহরণ। জেরোস দুটি উত্স থেকে আসতে পারে: ক) কেনার সিদ্ধান্ত নেই; খ) কিনতে চেয়েছিল তবে কিছুই কিনে শেষ হয়নি (যেমন স্টক আউট)।

বিটা: বাধা মডেল হ'ল ফ্রি (২০১১) এর অধ্যায় 16 এ বর্ণিত দুটি অংশের মডেলের একটি বিশেষ কেস। সেখানে, আমরা দেখতে পাব যে দুটি অংশের মডেলগুলির জন্য, স্বাস্থ্যসেবা ব্যবহারের পরিমাণটি একটি অবিচ্ছিন্ন পাশাপাশি একটি গণনা পরিবর্তনশীলও হতে পারে। সুতরাং সাহিত্যে যা কিছুটা বিভ্রান্তিকরভাবে "শূন্য-স্ফীত বিটা বিতরণ" হিসাবে অভিহিত করা হয়েছে তা আসলে দ্বি-অংশ বিতরণ এবং মডেলগুলির (শ্রেণির বিজ্ঞানের ক্ষেত্রে সাধারণ) শ্রেণীর অন্তর্ভুক্ত, যা কোনও বাধা মডেলের উপরের সংজ্ঞার সাথে সামঞ্জস্যপূর্ণ। । এই দুর্দান্ত বইটি বিভাগ 12.4.1-এ শূন্য-স্ফীত মডেলগুলি এবং বিভাগ 12.4.2-এ বিঘ্নিত মডেলগুলির বিষয়ে আলোচনা করেছে, বাস্তব সংক্রান্ত প্রয়োগগুলির সূত্র এবং উদাহরণ সহ।

ইতিহাস: কোভেরিয়েট ছাড়াই শূন্য-স্ফীত পোইসন (জিপ) মডেলগুলির দীর্ঘ ইতিহাস রয়েছে (উদাহরণস্বরূপ, জনসন এবং কোটজ, 1969)। কোভারিয়েটগুলি অন্তর্ভুক্ত করে জিপ রিগ্রেশন মডেলগুলির সাধারণ ফর্ম ল্যামবার্টের কারণে (1992)। বাধা মডেলগুলি প্রথমে কানাডার পরিসংখ্যানবিদ ক্রেগ (১৯ 1971১) দ্বারা প্রস্তাবিত হয়েছিল এবং পরে মোলয়ির দ্বারা আরও বিকাশ ঘটে (1986)। আপনি ক্রস্টন (1972) কেও বিবেচনা করতে পারেন, যেখানে জেরো দ্বারা প্রভাবিত একটি পূর্ণসংখ্যা-মূল্যবান প্রক্রিয়া বর্ণনা করতে বার্নোল্লি প্রক্রিয়াটির সাথে ইতিবাচক জ্যামিতিক গণনাগুলি ব্যবহার করা হয়।

আর: অবশেষে, আপনি যদি আর ব্যবহার করেন, সিমোন জ্যাকম্যান দ্বারা রচিত "পলিটিকাল সায়েন্স কম্পিউটেশনাল ল্যাবরেটরির জন্য ক্লাস এবং মেথডস ফর আর্টের জন্য প্যাকেজ পিসিএসএল রয়েছে, এতে আছিম জেইলিসের বাধা () এবং জিরোইনফেল () ফাংশন রয়েছে।

উপরোক্ত উত্পাদনগুলির জন্য নিম্নলিখিত রেফারেন্সগুলির সাথে পরামর্শ করা হয়েছে:

  • গুরুমু, এস এবং ত্রিবেদী, ব্যবসায় ও অর্থনৈতিক পরিসংখ্যানের বিনোদনমূলক ট্রিপস জার্নালের জন্য গণনা মডেলগুলিতে পিকে অতিরিক্ত জিরো, 1996, 14, 469-477
  • জনসন, এন।, কোটজ, এস।, পরিসংখ্যানগুলিতে বিতরণ: পৃথক বিতরণ। 1969, হাউটন মিজিন, বোস্টন
  • ল্যামবার্ট, ডি।, জিরো-স্ফীত পোইসন রিগ্রেশন ম্যানুফ্যাকচারিংয়ের ত্রুটিগুলির একটি অ্যাপ্লিকেশন সহ। টেকনোমেট্রিক্স, 1992, 34 (1), 1–14।
  • ক্রেগ, জেজি টেকসই জিনিসগুলির একনোমেট্রিকিয়া, ১৯ ,১, ৩৯, ৮৯৯-৮৪৪ এর চাহিদা সীমাবদ্ধ নির্ভরশীল ভেরিয়েবলগুলির জন্য কয়েকটি পরিসংখ্যানের মডেল
  • মোলয়, জে। কিছু সংশোধিত গণনা ডেটা মডেলগুলির স্পেসিফিকেশন এবং পরীক্ষার জেনারেল অফ ইকোনোমেট্রিক্স, 1986, 33, 341-365
  • ফ্রিস, অ্যাকুয়ারিয়াল এবং ফিনান্সিয়াল অ্যাপ্লিকেশনস ক্যামব্রিজ ইউনিভার্সিটি প্রেস, ২০১১ সহ ইডাব্লু রেগ্রেশন মডেলিং
  • ডাল্রিম্পল, এমএল; হাডসন, আইএল এবং ফোর্ড, আরপিকে ফিনাইট মিশ্রণ, জিরো-স্ফীত পোইসন এবং বাধা মডেলগুলি এসআইডিএস গণনার পরিসংখ্যান ও ডেটা বিশ্লেষণ, 2003, 41, 491-504 এ আবেদনের সাথে
  • ক্রস্টন, জেডি পূর্বাভাস এবং স্টেম কন্ট্রোল ইন্টারমিটেন্ট অপারেশনাল রিসার্চ ত্রৈমাসিক, 1972, 23, 289-303 দাবি

2
কোনও প্রতিবন্ধকতা মডেল কি আসলেই "মডেল", তাই না? বা এটি দুটি ক্রমিক, এবং পৃথক-অনুমিত মডেলগুলি চালাচ্ছে? প্রতিযোগিতার স্কোরগুলি (1 - বিজয়ের ব্যবধান) দেখে নির্বাচনী দৌড়ের মডেলিংয়ের প্রতিযোগিতাটির কল্পনা করুন। এটি আবদ্ধ [0, 1), কারণ কোনও বন্ধন নেই (যেমন, 1)। সুতরাং আমরা প্রথমে 0 বনাম (0, 1) বিশ্লেষণ করতে একটি লজিস্টিক রিগ্রেশন করি। তারপরে আমরা (0, 1) কেস বিশ্লেষণ করতে বিটা রিগ্রেশন করি। দেখে মনে হচ্ছে এগুলি দুটি স্বতঃস্ফূর্ত আলাদা মডেল, তাদের নিজস্ব গুণফল এবং পৃথক অনুমান সহ? নাকি আমি কিছু মিস করছি?
মার্ক হোয়াইট

উদাহরণস্বরূপ, আপনি আপনার উত্তরে উল্লেখ করেছেন যে শূন্যগুলি (ক) গাড়ি না কেনার সিদ্ধান্ত নেওয়ার কারণে হতে পারে, বা (খ) চাইছিল, তবে এটি অকার্যকর ছিল। দেখে মনে হচ্ছে কোনও বাধা মডেল দু'জনের মধ্যে পার্থক্য করতে সক্ষম হবে না, যেহেতু তারা ধারাবাহিকভাবে সম্পন্ন হয়েছে ...?
মার্ক হোয়াইট

অন্য একটি উদাহরণ বিবেচনা করুন: প্রতিক্রিয়াগুলি [১,]] aতিহ্যবাহী লিকার্ট স্কেলের মতো a. এর বিশাল সিলিং প্রভাবের সাথে দেখা যায় যে কেউ একটি প্রতিবন্ধকতা মডেল করতে পারে যা [1, 7) বনাম 7 এর লজিস্টিক রিগ্রেশন এবং তারপরে একটি টবিট রিগ্রেশন সমস্ত ক্ষেত্রে যেখানে পর্যবেক্ষিত প্রতিক্রিয়াগুলি <Again. আবার, আমরা দুটি সংযোজন সহগের সেট পাই এবং সেগুলি পৃথকভাবে অনুমান করা হয়। দেখে মনে হচ্ছে আমরা এই প্রক্রিয়াগুলি যৌথভাবে মডেলিং করছি না, তবে দুটি সম্পূর্ণ ভিন্ন মডেলে? সুতরাং, বাধা আসলে কি কোনও মডেল, বা কেবল দুটি বিভিন্ন ধরণের জেনারেলাইজড লিনিয়ার মডেলগুলি এককভাবে করার প্রক্রিয়া?
মার্ক হোয়াইট

আমি এখানে আমার নিজের পোস্টে এই প্রশ্নটি প্রসারিত করেছি: stats.stackexchange.com/questions/320924/…
মার্ক হোয়াইট

47

বাধা মডেল ধরে নেয় যে কেবল একটি প্রক্রিয়া যার দ্বারা শূন্য উত্পাদিত হতে পারে, অন্যদিকে শূন্য-স্ফীত মডেলগুলি ধরে নেয় যে দুটি পৃথক প্রক্রিয়া রয়েছে যা শূন্য উত্পাদন করতে পারে।

বাধা মডেলগুলি 2 ধরণের বিষয় অনুমান করে: (1) যাঁরা কখনই ফলাফলটি অনুভব করেন না এবং (2) যারা সর্বদা ফলাফলটি সর্বদা অন্তত একবার উপভোগ করেন। শূন্য-স্ফীত মডেলগুলি বিষয়গুলিকে রূপান্তরিত করে (1) যারা ফলাফল কখনই অনুভব করে না এবং (2) যারা ফলাফলটি দেখতে পারে তবে সর্বদা তা হয় না।

সহজ কথায়: উভয় শূন্য-স্ফীত এবং বাধা মডেল দুটি অংশে বর্ণিত।

প্রথমটি অন-অফ অংশ, যা একটি বাইনারি প্রক্রিয়া। সম্ভাব্যতা সহ সিস্টেমটি "অফ" এবং সম্ভাব্যতা সহ "চালু" । (এখানে, মুদ্রাস্ফীতি সম্ভাবনা হিসাবে পরিচিত)) সিস্টেমটি "অফ" থাকলে কেবল শূন্যের সংখ্যা সম্ভব। এই অংশটি শূন্য-স্ফীত এবং বাধা মডেলগুলির জন্য একই।π1ππ

দ্বিতীয় অংশটি গণনা অংশ, যা সিস্টেম "চালু" থাকে তখন ঘটে। এখানেই শূন্য-স্ফীত এবং বাধা মডেলগুলির মধ্যে পার্থক্য রয়েছে। শূন্য-স্ফীত মডেলগুলিতে, গণনাগুলি এখনও শূন্য হতে পারে। বাধা মডেলগুলিতে তারা অবশ্যই ননজারো হতে হবে। এই অংশের জন্য, শূন্য-স্ফীত মডেলগুলি একটি "স্বাভাবিক" বিচ্ছিন্ন সম্ভাবনা বিতরণ ব্যবহার করে যখন বাধা মডেলগুলি শূন্য-কাটা বিচ্ছিন্ন সম্ভাব্যতা বিতরণ ফাংশন ব্যবহার করে।

একটি বাধা মডেলের উদাহরণ: একটি মোটর প্রস্তুতকারক তার মোটরগাড়িগুলির জন্য দুটি মানের নিয়ন্ত্রণ প্রোগ্রামের তুলনা করতে চায়। এটি দায়েরকৃত ওয়ারেন্টি দাবির ভিত্তিতে তাদের তুলনা করবে। প্রতিটি প্রোগ্রামের জন্য, এলোমেলোভাবে নির্বাচিত গ্রাহকদের একটি সেট 1 বছরের জন্য অনুসরণ করা হয় এবং তারা যে ওয়্যারেন্টি দাবি দাবি করে তা গণনা করা হয়। দুটি প্রোগ্রামের প্রতিটি জন্য মুদ্রাস্ফীতি সম্ভাবনা তারপর তুলনা করা হয়। "অফ" রাষ্ট্রটি "শূন্য দাবি দায়ের করা হয়" এবং "অন" রাষ্ট্রটি "কমপক্ষে একটি দাবি দায়ের করা হয়"।

শূন্য-স্ফীত মডেলের উদাহরণ: উপরের একই গবেষণায় গবেষকরা আবিষ্কার করেছেন যে অটোমোবাইলগুলির কিছু মেরামতের কোনও ওয়ারেন্টি দাবি দায়ের না করেই স্থির করা হয়েছিল। এইভাবে, শূন্যগুলি মান নিয়ন্ত্রণের সমস্যাগুলির অভাবের পাশাপাশি মান নিয়ন্ত্রণের সমস্যাগুলির উপস্থিতির একটি মিশ্রণ যা কোনও ওয়ারেন্টি দাবি জড়িত না। "অফ" রাষ্ট্রের অর্থ "দায়ের করা শূন্য দাবি" এবং "অন" রাষ্ট্রের অর্থ "কমপক্ষে একটি দাবি দায়ের করা বা দাবি দায়ের না করে মেরামত ঠিক করা হয়েছিল।"

অধ্যয়নের জন্য এখানে দেখুন যেখানে উভয় ধরণের মডেল একই ডেটা সেটটিতে প্রয়োগ করা হয়েছিল।


বিস্তারিত উত্তর দেওয়ার জন্য ধন্যবাদ। যুক্ত জিরোগুলির সাথে স্ট্যান্ডার্ড বিটা বিতরণের জন্য উপযুক্ত পরিভাষা কী তা সম্পর্কে আপনার মতামত আছে? শূন্য-স্ফীত মডেলের আপনার সংজ্ঞাটি ব্যবহার করে, স্পষ্টতই শূন্যের একটি উত্স রয়েছে তাই এটি শূন্য-স্ফীত বলা যেতে পারে না ... এই আলোচনা দেখুন stats.stackexchange.com/questions/81343/…
skulker

2
@ হাইবারনেটিংয়ের পরামর্শ অনুসারে আমি "শূন্য-সংযুক্ত বিটা বিতরণ" পছন্দ করি
ড্যারেন জেমস

10

জিপ মডেলটিতে ~ 0 সম্ভাব্যতার সাথে এবং ~ পোইসন ( ) সম্ভাব্যতা সহ বিতরণ , এইভাবে জিপ মডেলটি 2 টি মিশ্রণ মডেল এবং: yiπyiλ1π

Pr(yj=0)=π+(1π)eλ
Pr(yj=xi)=(1π)λxieλxi!,xi1

এবং বাধা মডেলটিতে ~ 0 সম্ভাব্যতা সহ এবং ~ ছাঁটাই পোইসন ( ) বন্টন সম্ভাবনার সাথে , এবং: yiπyiλ1π

Pr(yj=0)=π
Pr(yj=xi)=(1π)1eλ(λxieλxi!),xi1

4

বাধা মডেল সম্পর্কে, এখানে গাণিতিক এবং পরিসংখ্যান মডেলিংয়ের অ্যাডভান্সেসের একটি উদ্ধৃতি (আর্নল্ড, বালাকৃষ্ণান, সরবিয়া, এবং ম্যাঙ্গুয়েজ, ২০০)):

বাধা মডেল বাধা নীচে এবং উপরের এক প্রক্রিয়া দ্বারা চিহ্নিত করা হয়। স্পষ্টতই, সর্বাধিক ব্যবহৃত বাধা মডেল হ'ল বাধাটি শূন্যে সেট করে। আনুষ্ঠানিকভাবে, আগল-অ্যাট-শূন্য মডেল হিসেবে প্রকাশ করা হয়: জন্য জন্যP(Ni=ni)=f1(0)ni=0 P(Ni=ni)=1f1(0)1f2(0)f2(ni)=ϕf2(ni)ni=1,2,...

পরিবর্তনশীল বাধা অতিক্রম করার সম্ভাবনা হিসাবে ব্যাখ্যা করা যেতে পারে, বা আরও সুনির্দিষ্টভাবে বীমা ক্ষেত্রে, কমপক্ষে একটি দাবি রিপোর্ট করার সম্ভাবনা।ϕ

শূন্য-স্ফীত মডেলের ক্ষেত্রে উইকিপিডিয়া বলে :

শূন্য-স্ফীত মডেল হ'ল শূন্য-স্ফীত সম্ভাবনা বিতরণের উপর ভিত্তি করে একটি পরিসংখ্যান মডেল, অর্থাত্ এমন একটি বিতরণ যা ঘন ঘন শূন্য-মূল্যবান পর্যবেক্ষণের অনুমতি দেয়।

শূন্য-স্ফীত পোইসন মডেলটি একক সময়ে অতিরিক্ত শূন্য-গণনা ডেটাযুক্ত এলোমেলো ঘটনা নিয়ে উদ্বেগ প্রকাশ করে। উদাহরণস্বরূপ, কোনও প্রদত্ত আচ্ছাদিত ব্যক্তির দ্বারা বীমা সংস্থাকে দাবির সংখ্যা প্রায় সর্বদা শূন্য হয়, অন্যথায় যথেষ্ট ক্ষতির কারণে বীমা সংস্থা দেউলিয়া হয়ে যায়। শূন্য-স্ফীত পোইসন (জিপ) মডেলটিতে দুটি উপাদান নিয়োগ করা হয় যা দুটি শূন্য উত্পাদক প্রক্রিয়ার সাথে মিলে যায়। প্রথম প্রক্রিয়াটি বাইনারি বিতরণ দ্বারা পরিচালিত হয় যা কাঠামোগত জিরো উত্পন্ন করে। দ্বিতীয় প্রক্রিয়াটি একটি পয়সন বিতরণ দ্বারা পরিচালিত হয় যা গণনাগুলি উত্পন্ন করে, যার কয়েকটি শূন্য হতে পারে। দুটি মডেলের উপাদানগুলি নিম্নরূপ বর্ণিত হয়েছে:[1]

Pr(yj=0)=π+(1π)eλ
Pr(yj=hi)=(1π)λhieλhi!,hi1
যেখানে ফলাফল পরিবর্তনশীল কোনো অ-নেগেটিভ পূর্ণসংখ্যা মান আছে, প্রত্যাশিত পইসন জন্য গণনা হয় তম পৃথক; অতিরিক্ত শূন্যের সম্ভাবনা।yjλiiπ

আর্নল্ড এবং সহকর্মীদের কাছ থেকে (২০০৮), আমি দেখতে পেয়েছি যে একটি বাধা-শূন্য মডেল হ'ল বাধা মডেলগুলির আরও সাধারণ শ্রেণির একটি বিশেষ ঘটনা, তবে উইকিপিডিয়ায় একটি রেফারেন্স থেকে ( হল, ২০০৪ ) আমি আরও দেখতে পেলাম যে কিছু শূন্য- স্ফীত মডেলগুলি উপরের সীমাবদ্ধ হতে পারে। আমি সূত্রগুলির পার্থক্যটি পুরোপুরি বুঝতে পারি না তবে এগুলি বেশ মিল বলে মনে হয় (উভয়ই খুব অনুরূপ উদাহরণ ব্যবহার করে, বীমা দাবী)। আমি আশা করি অন্যান্য উত্তরগুলি যে কোনও গুরুত্বপূর্ণ পার্থক্য (গুলি) ব্যাখ্যা করতে সহায়তা করতে পারে এবং এই উত্তরটি সেগুলির জন্য মঞ্চ নির্ধারণে সহায়তা করবে।

উইকিপিডিয়া রেফারেন্স:

  1. ল্যামবার্ট, ডি (1992)। শূন্য-স্ফীত পোইসন রিগ্রেশন, উত্পাদন ত্রুটিগুলির জন্য একটি অ্যাপ্লিকেশন সহ। টেকনোমেট্রিক্স, 34 (1), 1–14।
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.