অতিরিক্ত সংখ্যক গণনা ডেটার জন্য পয়সন রিগ্রেশনের বিকল্প নির্বাচন করা


12

আমি বর্তমানে ধারাবাহিক আচরণগত পরীক্ষাগুলির থেকে ডেটা বিশ্লেষণ করছি যা সকলেই নিম্নলিখিত পরিমাপটি ব্যবহার করে। এই পরীক্ষায় অংশগ্রহণকারীদের ক্লুগুলি নির্বাচন করতে বলা হয় যা (কল্পনাপ্রসূত) অন্যান্য ব্যক্তি 10 টি অ্যানাগ্রামের সিরিজ সমাধানে সহায়তা করতে পারে। অংশগ্রহনকারীদের বিশ্বাস করা হয় যে এই অন্যান্য ব্যক্তিরা হয় এনাগ্রামগুলি সমাধানের ক্ষেত্রে তাদের পারফরম্যান্সের উপর নির্ভর করে অর্থ উপার্জন বা হারাবেন। ক্লুগুলি তারা কতটা সহায়ক সে সম্পর্কে তারতম্য। উদাহরণস্বরূপ, রননিং-এর একটি এনজিগ্রাম নুনগ্রিনের জন্য, তিনটি সূত্র হতে পারে:

  1. দ্রুত চলমান (অসহায়)
  2. ম্যারাথন দৌড়ে আপনি যা করেন (সহায়ক)
  3. সবসময় স্বাস্থ্যকর শখ নয় (অপ্রয়োজনীয়)

পরিমাপটি গঠনের জন্য, আমি বারের সংখ্যা গণনা করি (10 এর মধ্যে) একজন অংশগ্রহণকারী অন্য ব্যক্তির জন্য একটি অপ্রয়োজনীয় ক্লু পছন্দ করে। পরীক্ষা-নিরীক্ষায়, লোকেদের নির্বাচন করা ক্লুগুলির সহায়কতাকে প্রভাবিত করতে আমি বিভিন্ন ধরণের হেরফের ব্যবহার করছি।

সহায়কতা / অপ্রয়োজনীয়তা পরিমাপ মোটামুটি দৃ positive়ভাবে ইতিবাচকভাবে আঁকানো হয়েছে (লোকেদের একটি বৃহত অনুপাত সবসময় 10 সবচেয়ে সহায়ক ক্লু বেছে নেয়), এবং পরিমাপটি একটি গণনা পরিবর্তনশীল হওয়ায় আমি এই ডেটাগুলি বিশ্লেষণ করার জন্য একটি পয়েসন জেনারালাইজড লিনিয়ার মডেল ব্যবহার করছি। যাইহোক, যখন আমি পায়সন রিগ্রেশন সম্পর্কে আরও কিছু পাঠ করেছি, আমি আবিষ্কার করেছি যে পয়সন রিগ্রেশন কোনও বিতরণের গড় এবং তারতম্যটি স্বতন্ত্রভাবে অনুমান করে না, এটি প্রায়শই ডেটা সংকেতের মধ্যে বৈকল্পিকাকে কম করে দেখায়। আমি কুইসিপোসন রিগ্রেশন বা নেগেটিভ বাইনোমিয়াল রিগ্রেশন পয়েসন রিগ্রেশন এর বিকল্পগুলি অনুসন্ধান করতে শুরু করেছি। যাইহোক, আমি স্বীকার করি যে আমি এই ধরণের মডেলগুলির চেয়ে বরং নতুন, তাই আমি এখানে পরামর্শের জন্য আসছি।

এই ধরণের ডেটা ব্যবহারের জন্য কোন মডেলটি ব্যবহার করতে হবে সে সম্পর্কে কারও কি কোনও সুপারিশ রয়েছে? অন্য কোন বিবেচ্য বিষয় যা সম্পর্কে আমার সচেতন হওয়া উচিত (উদাহরণস্বরূপ, একটি নির্দিষ্ট মডেল কি অন্যের চেয়ে বেশি শক্তিশালী?)? আমি নির্বাচিত মডেলটি সঠিকভাবে আমার ডেটা পরিচালনা করছে কিনা তা নির্ধারণের জন্য আমার কী ধরণের ডায়াগনস্টিকের দিকে নজর দেওয়া উচিত?


বৈকল্পিক গড়ের সমান? এই ধারণাটি শিথিল করার জন্য একটি শক্তিশালী বৈকল্পিক / কোভারিয়েন্স অনুমানকারী সম্পর্কে কী?
বোস্কোভিচ

2
যেহেতু এগুলি ডেটা এবং অ-নেতিবাচক হিসাবে গণনা করা হচ্ছে, তাই কাসি-পোইসন বা একটি নেতিবাচক দ্বিপদী রিগ্রেশন মডেল, যা বিচ্ছুরণের জন্য অ্যাকাউন্ট করে?
অরুণ

1
আমি একটি কোয়েসি-পোইসন বা নেতিবাচক দ্বিপদী মডেলটি ব্যবহার করার বিষয়ে চিন্তা করেছি, তবে আমি যা বুঝতে পারি না তা হ'ল আমি নিজের ডেটা সঠিকভাবে মডেলিং করছি এই বিষয়টি নিশ্চিত করার জন্য নিজেকে কী ধরণের ডায়াগোনস্টিক্স দেখতে হবে। যেহেতু বেশ কয়েকটি বিকল্প রয়েছে (কোয়াসি-পোইসন, নেতিবাচক দ্বিপদী এবং "শূন্য-বৃদ্ধিমূলক" মডেল), আমিও ভাবছি যে এই বিকল্পগুলির মধ্যে বেছে নেওয়ার কোনও ভাল উপায় আছে কিনা। উদাহরণস্বরূপ, একটি পদ্ধতি কি অন্যদের চেয়ে সাধারণত শক্তিশালী?
প্যাট্রিক এস ফোর্সার

1
এটি ডেটা উপর নির্ভর করে। আপনার ডেটাগুলিতে (পয়সন, নেতিবাচক দ্বিপদী, শূন্য-স্ফীত পোইসন এবং negativeণাত্মক দ্বিপদী, প্রশ্নযুক্তদের ক্ষেত্রে বাধা মডেল) কেন এই সমস্ত কিছু ফিট করে না এবং এআইসি বা বিআইসির মাধ্যমে তাদের তুলনা করুন? Cran.r-project.org/web/packages/pscl/vignettes/countreg.pdf দেখুন তারপরে আপনার ডেটার জন্য উপযুক্ত একটি চয়ন করুন। আপনি আধা-সম্ভাবনা মডেলগুলিও ব্যবহার করতে পারেন তবে এটি স্বাদের বিষয়, আমি তাদের এত পছন্দ করি না।
মোমো 4'12

1
আপনার প্রতিক্রিয়াটির জন্য কী বিতরণ ভাল মডেল হতে পারে তা পরীক্ষা করতে, আপনি ভিসিডি :: ডিসপ্লট ফাংশনটি ব্যবহার করতে পারেন।
মোমো

উত্তর:


12

আপনার ফলাফলটি 10 ​​এর মধ্যে সহায়ক ক্লুগুলির সংখ্যা, যা দ্বিপদী র্যান্ডম পরিবর্তনশীল। সুতরাং আপনার এটি একরকম দ্বিপদী রিগ্রেশন দিয়ে বিশ্লেষণ করা উচিত, সম্ভবত অতিরিক্ত পরিমাণে ছাড়ার জন্য আধা-দ্বিপদী। নোট করুন যে পইসন এবং বিভ্রান্তিকরভাবে নামকরণ করা নেতিবাচক দ্বিপদী বিতরণগুলি সীমাহীন গণনা ডেটার জন্য উপযুক্ত।


2
আমি নেতিবাচক দ্বিপদী উল্লেখ করেছি কারণ এটি পোইসনের একটি অতিমাত্রায় বিকল্প যা পোজার প্রথমে পরামর্শ করেছিলেন। যেহেতু প্রতিটি উত্তরদাতার এক্স / 10 ক্লু রয়েছে এটি দ্বিপদী হতে পারে তবে 10 টি ক্লুগুলির প্রত্যেকটির জন্যই আইথ উত্তরদাতার জন্য একটি নির্দিষ্ট সম্ভাবনা পাই রয়েছে এবং ঘটনাগুলি স্বতন্ত্র। এটাই হতে পারে।
মাইকেল আর। চেরনিক 5'12

2
বিটা-দ্বিপদীটি হ'ল আরেকটি সম্ভাবনা (বিটা-দ্বিপদীটি দ্বিপদী হিসাবে যেমন নেতিবাচক দ্বিপদীটি পয়সনের কাছে)। betabinমধ্যে aodপ্যাকেজ তা পূর্ণ করব।
বেন বলকার

5

আমিও যদি পয়সনের মতো সম্ভাব্য ফলাফলগুলি অসীম হয় তবে নেতিবাচক দ্বিপদীটি দেখার পরামর্শ দেব। আপনি জো হিল্বের একটি বইয়ের সাথে পরামর্শ করতে চাইতে পারেন। তাঁর একটি জিইইতে রয়েছে এবং একটি নেতিবাচক দ্বিপদী রিগ্রেশন যা তিনি পয়সন রিগ্রেশনের সাথে বিপরীত। আনিকোর নির্দেশ অনুসারে কেবলমাত্র 10 টি ক্লু রয়েছে যাতে প্রতিটি উত্তরদাতাকে কেবল 0, 1, 2, 3, ..., 10 থাকতে পারে এবং তাই পোইসন বা নেতিবাচক ঘাতক উভয়ই উপযুক্ত নয়।


4

@ অ্যানিকো দ্বারা ভাল পয়েন্ট। অন্য পছন্দটি হ'ল বিটা রিগ্রেশন। "এ বেটার লেমন স্কুইজার" শিরোনামযুক্ত একটি কাগজ ছিল যা এই পদ্ধতিতে প্রচুর তথ্য দিয়েছিল।


2
তবে বিটা সংখ্যার একটি সীমাবদ্ধ সমষ্টিতে কোনও গণনা পরিবর্তনশীল নয়, অনুপাতের মডেল হিসাবে ব্যবহার করা হবে।
মাইকেল আর চেরনিক

এর বিস্তৃত ব্যবহার রয়েছে, @ মিশেল চেরনিক, নিবন্ধটি দেখুন, যা বেশ ভাল।
পিটার ফ্লুম - মনিকা পুনরায়

@ পিটারফ্লম এটি অন্তর [0,1], কেবল (0,1) এর ডেটা পরিচালনা করতে পারে না।
কলিন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.