অনুন্নত গণনা ডেটার জন্য উপযুক্ত মডেল কী?


24

আমি আর এর মধ্যে গণনা ডেটা মডেল করার চেষ্টা করছি যা আপাতদৃষ্টিতে নিম্নচাপযুক্ত (বিচ্ছুরণ প্যারামিটার ~ .40)। এটি সম্ভবত কেন একটি হল glmসঙ্গে family = poissonবা নেতিবাচক দ্বিপদ ( glm.nb) মডেল উল্লেখযোগ্য নয়। আমি যখন আমার ডেটা বর্ণনার দিকে নজর দিই, তখন আমার কাছে গণনা তথ্যগুলির সাধারণ স্কিউ নেই এবং আমার দুটি পরীক্ষামূলক অবস্থার অবশিষ্টাংশগুলিও একজাতীয় ge

সুতরাং আমার প্রশ্নগুলি হ'ল:

  1. আমার গণনা ডেটা যদি সত্যিই গণনা ডেটার মতো আচরণ না করে তবে আমার গণনা ডেটার জন্যও কি বিশেষ প্রতিরোধ বিশ্লেষণগুলি ব্যবহার করতে হবে? আমি মাঝে মাঝে অ-স্বাভাবিকতার মুখোমুখি হই (সাধারণত কুর্তোসিসের কারণে), তবে আমি ছাঁটাইযুক্ত মাধ্যমের তুলনা করার জন্য পারসেন্টাইল বুটস্ট্র্যাপ পদ্ধতিটি ব্যবহার করেছি (উইলকক্স, ২০১২) অ-স্বাভাবিকতার জন্য অ্যাকাউন্টে। উইলকক্স দ্বারা প্রস্তাবিত কোনও শক্ত পদ্ধতি দ্বারা গণ্য ডেটার জন্য বিকল্পগুলি প্রতিস্থাপন করা যেতে পারে এবং ডাব্লুআরএস প্যাকেজে উপলব্ধি করা যেতে পারে?

  2. যদি আমার গণনা সম্পর্কিত ডেটার জন্য রিগ্রেশন বিশ্লেষণগুলি ব্যবহার করতে হয় তবে আমি কীভাবে আন্ডার-ডিসপ্রেসনের জন্য অ্যাকাউন্ট করব? পোইসন এবং নেতিবাচক দ্বিপদী বিতরণ একটি উচ্চতর বিচ্ছুরণ ধরেছে, সুতরাং এটি উপযুক্ত না হওয়া উচিত, তাই না? আমি কোয়েস-পয়েসন বিতরণ প্রয়োগ করার কথা ভাবছিলাম , তবে এটি সাধারণত অতিরিক্ত ছড়িয়ে দেওয়ার জন্য সুপারিশ করা হয়। আমি বিটা-বাইনোমিয়াল মডেলগুলি পড়েছি যা দেখে মনে হয় যে তারা অতিরিক্ত হিসাব করতে সক্ষম হবেন - পাশাপাশি আন্ডার ডিস্পারশনও VGAMআর এর প্যাকেজটিতে পাওয়া যাবে The লেখকরা অবশ্য একটি টিলড পোইসন বিতরণের প্রস্তাব দিচ্ছেন , তবে আমি প্যাকেজে এটি পাই না can't ।

কেউ কি সুবিশাল ডেটাগুলির জন্য কোনও পদ্ধতির প্রস্তাব দিতে পারে এবং এর জন্য কিছু উদাহরণের কোড দিতে পারে?


1
আপনি কীভাবে জানবেন যে আপনার ডেটা অনুন্নত হয়? আপনি কীভাবে ছড়িয়ে পড়া প্যারামিটার গণনা করছেন?
হংক ওই

1
আপনি কী আগ্রহী সে সম্পর্কে আমাদের আরও জানাতে সহায়তা করবে line লিনিয়ার প্রেডিক্টর পয়েন্টের অনুমান এবং মানগুলির পূর্বাভাসের জন্য, আন্ডার ডিস্পারেশন খুব কমই সমস্যা হয় তবে পরীক্ষা এবং বিরতিগুলি অযৌক্তিক রক্ষণশীল হতে পারে (আধা পরিবারগুলি এতে সহায়তা করবে)। এটি বলেছে যে, একটি "স্বাভাবিক" সম্ভাবনার পদ্ধতির জন্য সিওএম পোইসন এবং অন্যান্য জেনারেলাইজড পয়েসন মডেলগুলি পরীক্ষা করে দেখুন।
মোমো

@ হাং ওই: আমি ছত্রভঙ্গ (পয়সনমডেল, বিকল্প = সি ("কম")) দিয়ে ছড়িয়ে পড়েছি এবং পরীক্ষাটি তাৎপর্যপূর্ণ প্রমাণিত হয়েছে।
শিল

1
@ মোমো: আমি পরীক্ষা করতে চাই যদি দুটি পরীক্ষামূলক অবস্থায় ডায়াডের সাথে আলাপ আলোচনা করা হয় তবে তারা সঠিক প্রস্তাবগুলির চেয়ে আলাদা। সঠিক অফার মানে ডায়াডস আরও বেশি সমস্যা দাবি করে যা তাদের দলের স্বার্থের সাথে সামঞ্জস্য করে অন্য পক্ষের পক্ষে আরও মূল্যবান দাবি দাবি করার পরিবর্তে teams প্রথমত, আমি এমনকি অবগত ছিলাম না যে এটি গণনা ডেটা। আপনি কি সিওএম পোইসন দ্বারা কনওয়ে-ম্যাক্সওয়েল-পোইসন বিতরণ বোঝাতে চান? ইতিমধ্যে অনেক ধন্যবাদ!
শিল

3
অতিরিক্ত তথ্যের জন্য ধন্যবাদ। হ্যাঁ, আমি কনওয়ে-ম্যাক্সওয়েল পোয়েসনকে বোঝাতে চাইছিলাম। শমুয়েলি এন্ড কো এর জন্য কিন্ডফের জেনারালাইজড লিনিয়ার মডেল তৈরি করেছে, আপনি চেষ্টা করতে চাইলে একটি আর প্যাকেজও রয়েছে।
মোমো

উত্তর:


9

ছদ্মবেশী পোইসন ডেটা হ্যান্ডেল করার সর্বোত্তম --- এবং মানক উপায় হ'ল জেনারেলাইজড পয়েসন বা সম্ভবত কোনও বাধা মডেল ব্যবহার করে। তিনটি প্যারামিটার গণনা মডেলগুলি নিম্নচাপিত ডেটার জন্যও ব্যবহার করা যেতে পারে; যেমন ফ্যাডি-স্মিথ, ওয়ারিং, ফ্যামোয়ে, কনও-ম্যাক্সওয়েল এবং অন্যান্য জেনারেলাইজড কাউন্ট মডেল। এগুলির সাথে একমাত্র অপূর্ণতা হ'ল ব্যাখ্যাযোগ্যতা। তবে সাধারণ অনুন্নত ডেটার জন্য সাধারণ পয়েসন ব্যবহার করা উচিত। এটি অত্যধিক সংবেদনশীল ডেটার জন্য নেতিবাচক দ্বিপদী মত। কেমব্রিজ ইউনিভার্সিটি প্রেসের আমার দুটি বই, মডেলিং কাউন্ট ডেটা (২০১৪) এবং নেগেটিভ বোনমিয়াল রিগ্রেশন, ২ য় সংস্করণ, (২০১১) উভয় ক্ষেত্রে আমি এ সম্পর্কে কিছুটা বিশদ আলোচনা করব। আর-তে ভিজিএএম প্যাকেজটি সাধারণ পোয়েসন (জিপি) রিগ্রেশনকে অনুমতি দেয়। ছড়িয়ে পড়া প্যারামিটারের নেতিবাচক মানগুলি আন্ডার বিভাজনের জন্য সামঞ্জস্য নির্দেশ করে। আপনি অতিরিক্ত তথ্য সরবরাহের জন্য জিপি মডেলটিও ব্যবহার করতে পারেন, তবে সাধারণত এনবি মডেলটি আরও ভাল। এটি যখন নেমে আসে তখন আন্ডার ডিস্পারশিপনের কারণ নির্ধারণ এবং তার সাথে মোকাবিলা করার জন্য সবচেয়ে উপযুক্ত মডেলটি নির্বাচন করা সেরা।


ফিরে আসার জন্য স্বাগতম! দয়া করে নিবন্ধভুক্ত করুন এবং / অথবা আপনার অ্যাকাউন্টগুলি মার্জ করুন (আপনি কীভাবে আমাদের সহায়তা কেন্দ্রের আমার অ্যাকাউন্ট বিভাগে এটি করবেন সে সম্পর্কে তথ্য পেতে পারেন ), তাহলে আপনি নিজের প্রশ্নে সম্পাদনা করতে এবং মন্তব্য করতে সক্ষম হবেন। (আপনার আসল অ্যাকাউন্টটি এখানে ))
গং - মনিকা পুনরায়

আপনি কি এসপিএস-এ সাধারণীকরণ পোইসন বিশ্লেষণ করতে পারেন?
গ্রেস ক্যারল

3

আমি একবার ছড়িয়ে ছিটিয়ে থাকা পোইসনের মুখোমুখি হয়েছিলাম যে ফ্রিকোয়েন্সিটি যখন লোকেরা একটি সামাজিক গেম খেলবে তখন তার সাথে তার সম্পর্ক ছিল। দেখা গেল এটি চরম নিয়মিততার কারণে যা লোকেরা শুক্রবারে খেলত। শুক্রবারের ডেটা অপসারণ করায় আমাকে প্রত্যাশিত অতিরিক্ত ছাপিয়ে যায় পোয়েসন। সম্ভবত আপনার একইভাবে আপনার ডেটা সম্পাদনা করার বিকল্প রয়েছে।


1

এমন পরিস্থিতিতে রয়েছে যেখানে শূন্য-মুদ্রাস্ফীতি সহকারে আন্ডার ডিস্পারেশন একত্রিত হয় যা উভয় লিঙ্গের ব্যক্তির দ্বারা পছন্দের বাচ্চাদের গণনা করা সাধারণ। আমি আজ অবধি এটি ক্যাপচার করার কোনও উপায় পাইনি

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.