শূন্য-কাটা নেতিবাচক দ্বিপদী জিআইই এর জন্য আর / স্টাটা প্যাকেজ?


13

এটা আমার প্রথম পোস্ট. আমি এই সম্প্রদায়ের জন্য সত্যই কৃতজ্ঞ।

আমি দ্রাঘিমাংশীয় গণনা ডেটা বিশিষ্ট করার চেষ্টা করছি যা শূন্য-কাটা হয়েছে (সম্ভাব্যতা যে প্রতিক্রিয়া পরিবর্তনশীল = 0 হয় 0), এবং এর গড়! = বৈকল্পিক, সুতরাং একটি পিসনের উপরে নেতিবাচক দ্বিপদী বিতরণ বেছে নেওয়া হয়েছিল।

আমি যে কাজগুলি / আদেশগুলি বাতিল করে দিয়েছি:

আর

  • জি এর (জি) ফাংশন শূন্য-কাটা বা নেতিবাচক দ্বিপদী বিতরণের জন্য অ্যাকাউন্ট করে না (এমনকি ম্যাস প্যাকেজ লোড সহ নয়)
  • আর এ glm.nb () বিভিন্ন পারস্পরিক সম্পর্কের কাঠামোর জন্য অনুমতি দেয় না
  • ভিজিএএম প্যাকেজ থেকে ভিজিএলএম () পোসনেগবিনোমিয়াল পরিবার ব্যবহার করতে পারে তবে স্টাটার ztnb কমান্ডের মতো একই সমস্যা রয়েছে (নীচে দেখুন) যে আমি একটি স্বতঃস্ফূর্ত সম্পর্ক সম্পর্কিত কাঠামো ব্যবহার করে মডেলগুলিকে রিফিট করতে পারি না।

Stata

  • যদি তথ্য দ্রাঘিমাংশ না হয়, আমি কেবল বিশ্লেষণ চালাতে স্টাটা প্যাকেজগুলি ztnb ব্যবহার করতে পারতাম, তবে এই আদেশটি ধরে নেয় যে আমার পর্যবেক্ষণগুলি স্বাধীন।

আমি বিভিন্ন পদ্ধতিগত / দার্শনিক কারণে জিএলএমএমকেও বাতিল করে দিয়েছি।

আপাতত, আমি স্টাটার xtgee কমান্ডে স্থির হয়েছি (হ্যাঁ, আমি জানি যে xtnbreg একই কাজ করে) যা নিরপেক্ষ সম্পর্ক সম্পর্কিত কাঠামো এবং নেগ দ্বিপদী পরিবার উভয়ই বিবেচনা করে তবে শূন্য-কাটা না। Xtgee ব্যবহারের অতিরিক্ত সুবিধা হ'ল আমি আমার রেসপন্স ভেরিয়েবলের জন্য সেরা ফিটিং পারস্পরিক সম্পর্কের কাঠামো নির্ধারণ করতে কিউিক মানগুলি (কিউইকি কমান্ড ব্যবহার করে) গণনা করতে পারি।

আর বা স্টাটাতে যদি কোনও প্যাকেজ / কমান্ড থাকে যা ১) এনবিনোমিয়াল পরিবার নিতে পারে, ২) জিইই এবং ৩) শূন্য-সংক্ষিপ্তকরণকে অ্যাকাউন্টে রাখে, আমি জানার জন্য মরে যাব।

আপনার যে কোনও ধারণাগুলি থাকতে পারে আমি তার প্রশংসা করব। ধন্যবাদ.

-Casey

উত্তর:


12

আর দুটি বিকল্প মনে রাখে না, উভয়ই আমি কেবল অস্পষ্টভাবে সর্বোপরি পরিচিত।

প্রথমটি হ'ল psclপ্যাকেজ, যা খুব সুন্দর, নমনীয় উপায়ে শূন্য কাটা স্ফীত এবং বাধা মডেলগুলি ফিট করতে পারে। psclপ্যাকেজটি সেই প্যাকেজটির ব্যবহারের পরামর্শ দেয় sandwichযা "ক্রস-বিভাগীয়, সময় সিরিজ এবং অনুদৈর্ঘ্য তথ্যের জন্য মডেল-শক্তিশালী মান ত্রুটি অনুমানকারী" সরবরাহ করে। সুতরাং আপনি আপনার গণনা মডেলটিকে ফিট করতে পারেন এবং তারপরে sandwichপ্যাকেজটি ব্যবহার করে ডেটাগুলির অনুদৈর্ঘ্য প্রকৃতি বিবেচনা করে অবশিষ্টাংশগুলির জন্য উপযুক্ত কোভেরিয়েন্স ম্যাট্রিক্সটি অনুমান করতে পারেন ।

দ্বিতীয় বিকল্পটি geepackপ্যাকেজটি দেখার মতো হতে পারে যা দেখে মনে হচ্ছে এটি আপনি যা করতে পারেন তা কেবল পরিচিত থিতা সহ একটি নেতিবাচক দ্বিপদী মডেলের জন্য, কারণ এটি কোনও ধরণের জিএলএম ফিট করবে যা আর এর glm()ফাংশনটি পারে (তাই এমএএসএস থেকে পারিবারিক ফাংশনটি ব্যবহার করতে পারে) ।

তৃতীয় বিকল্পটি এর মাথা বাড়িয়ে তুলেছে: gamlssএবং এটি অ্যাড-অন প্যাকেজ gamlss.tr। পরবর্তীটিতে একটি ফাংশন অন্তর্ভুক্ত রয়েছে gen.trun()যা সমর্থিত যে কোনও gamlss()বিতরণকে নমনীয় উপায়ে ছাঁটাই করা বিতরণে পরিণত করতে পারে - উদাহরণস্বরূপ আপনি 0 টি নেতিবাচক দ্বিপদী বিতরণে বাম কাটা নির্দিষ্ট করতে পারেন। gamlss()নিজেই এলোমেলো প্রভাবগুলির জন্য সমর্থন অন্তর্ভুক্ত যা তথ্যের অনুদৈর্ঘ্য প্রকৃতির যত্ন নেওয়া উচিত। আপনার যদি মডেলটিতে কোনও কমোয়্যারেটের কমপক্ষে একটি মসৃণ ফাংশন ব্যবহার করতে হয় বা কেবল কোনও জিএলএম এর মতো লিনিয়ার ফাংশন হিসাবে সবকিছুকে মডেল করতে পারেন তবে তা অবিলম্বে পরিষ্কার হয় না।


আমার বিশ্বাস, pscl প্যাকেজটি কেবল শূন্য-স্ফীত এবং বাধা মডেলগুলিতে ফিট করে। বাধা মডেলগুলি একটি বাম-কাটা কাউন্ট গণনা উপাদান এবং একটি ডান-সেন্সরযুক্ত বাধা উপাদান উভয়কেই অন্তর্ভুক্ত করে। আমি বাধা উপাদান ছাড়াই বাধা মডেল চালাতে সক্ষম হলেও কীভাবে বা তাও করি না, তবে আমি স্যান্ডউইক প্যাকেজটি দেখব। জিপ্যাক প্যাকেজ হিসাবে, মনে হয় জি প্যাকেজের মতো একই সমস্যা রয়েছে; আমি যখন কোনও থেটা উল্লেখ না করে একটি "নেতিবাচক" দ্বিখণ্ডিত "পরিবার (এমএএসএস থেকে) নির্দিষ্ট করি, তখন এটি থেইটা চাইবে। যাইহোক, আমি যখন একটি থিটা মান নির্দিষ্ট করে দিই, এটি ত্রুটি ছুঁড়ে দেবে এটি বলে এটি একটি অচেনা পরিবার।
আইরিস সোই

@ ক্যাসি - দুঃখিত আমি আপনার প্রয়োজনীয়তা শূন্য শূন্য হয়ে গেছে re লজ্জাজনক যে জিপ্যাকটি সেই পরিবারের ফাংশনটির সাথে কাজ করে না। আমি যদি অন্য কিছু মনে করি তবে আমি এখানে আপডেট করব।
মনিকা পুনরায় ইনস্টল করুন - জি সিম্পসন

@ ক্যাসি আমি gamlssপ্যাকেজটি সম্পর্কে একটি নোট যুক্ত করেছি যা সম্ভবত বিটিতেও উপযুক্ত হতে পারে।
মনিকা পুনরায় ইনস্টল করুন - জি সিম্পসন

আমার বোঝার উন্নতি করেছে এমন সংস্থান এবং ফাংশনগুলির জন্য একাধিক পরামর্শের কারণে আপনার উত্তর গ্রহণ করা। দেখে মনে হচ্ছে 'গ্যামলস' আমার সমস্যা সমাধানের একটি সম্ভাব্য উপায় হতে পারে তবে আমি আসলে একটি অ-পরিসংখ্যানবিদ, কারণ বর্তমানে আমার কাছে গণিতে পটভূমি নেই এবং এখনই কীটপতঙ্গগুলি খোলার সময় নেই (তবে সম্ভবত শেষ পর্যন্ত আমি করব)। অন্য মন্তব্যে যেমন উল্লেখ করা হয়েছে, আমার ডেটা-র জন্য কমপক্ষে, মনে হচ্ছে শূন্য-কাটাকে উপেক্ষা করা আমার অনুমান এবং স্ট্যান্ডের ত্রুটিগুলিকে বেশি পরিবর্তন করবে না। আমার উদ্দেশ্যে দর্শকদের জন্য, আমি বিশ্বাস করি যে একটি উত্তর-জিআইই ঠিকঠাক করবে। ধন্যবাদ!
আইরিস সোই

9

হুম, ভাল প্রথম প্রশ্ন! আমি এমন প্যাকেজটি জানি না যা আপনার সুনির্দিষ্ট প্রয়োজনীয়তা পূরণ করে। আমি মনে করি আপনি যদি হুবার-হোয়াইট স্ট্যান্ডার্ড ত্রুটিগুলি দেওয়ার বিকল্পটিও নির্দিষ্ট করেন বা এটি ব্যবহারিক হয় তবে স্টাটার xtgee ভাল পছন্দ । এই বিকল্পগুলির মধ্যে যে কোনওটি শূন্য কাটাকে উপেক্ষা করে মডেলটির অপব্যবহারের পরেও স্ট্যান্ডার্ড ত্রুটিগুলি ধারাবাহিকভাবে অনুমান করা নিশ্চিত করবে।vce(robust)vce(bootstrap)

এটি আপনার আগ্রহের পয়েন্ট আনুমানিক (গুলি) -কে শূন্য কাটা উপেক্ষা করার ফলে কী প্রভাব ফেলবে তা প্রশ্ন থেকে যায়। এটি সম্পর্কে সাধারণভাবে প্রাসঙ্গিক সাহিত্য আছে কি না তা দেখার জন্য এটি দ্রুত অনুসন্ধানের প্রয়োজন, যেমনটি জিআইই প্রসঙ্গে নয় - আমি ভেবেছিলাম আপনি খুব নিরাপদে ধরে নিতে পারেন যে এ জাতীয় ফলাফল জিইই ক্ষেত্রেও প্রাসঙ্গিক হবে। যদি আপনি কিছু না খুঁজে পান তবে আপনি সর্বদা শূন্য-কাটা এবং পরিচিত প্রভাব অনুমানের সাথে ডেটা সিমুলেট করতে এবং অনুকরণের মাধ্যমে পক্ষপাত মূল্যায়ন করতে পারেন।


1
আমি দৃ standard় স্ট্যান্ডার্ড ত্রুটিগুলি অনুমান করা নিশ্চিত করেছিলাম। এছাড়াও, 261 পৃষ্ঠাতে জুউর, এট আল, 2009 এর "ইকোলজির সাথে মিশ্রিত প্রভাবগুলির মডেলস এবং ইকোলজিতে এক্সটেনশানস" বইয়ের 261 পৃষ্ঠায় তারা উল্লেখ করেছেন, "যদি প্রতিক্রিয়ার ভেরিয়েবলের গড় তুলনামূলকভাবে বড় হয়, কাটা সমস্যাটিকে অগ্রাহ্য করে, তবে প্রয়োগ করা হবে একটি পইসন বা নেতিবাচক দ্বিপদী (এনবি) সাধারণীনের রৈখিক মডেল (জিএলএম), সমস্যার কারণ হওয়ার সম্ভাবনা কম। " সৌভাগ্যক্রমে, আমার প্রতিক্রিয়ার পরিবর্তনশীলগুলির মাধ্যমগুলি বৃহত, তাই আমি আমার রিগ্রেশনগুলির জিইই এবং নেতিবাচক দিকগুলির তুলনায় শূন্য-কাটাকে বঞ্চিত করতে কিছুটা স্বাচ্ছন্দ্য বোধ করি।
আইরিস সোই

আপনার মতামত আমার চেয়ে এই বিষয়টি সম্পর্কে ইতিমধ্যে আরও জানে! বা এই সাইটের অন্য যে কেউ, অন্যান্য প্রতিক্রিয়াগুলির অভাব দ্বারা বিচার করে।
onestop

এটা একটু অবিশ্বাস্য; কে জানত যে অতিরঞ্জিত দ্রাঘিমাংশের গণনা তথ্য বিশ্লেষণ করা এত কঠিন হবে (একটি জিএলএমএম না করেই, যা আমি এখনও করতে দেখিনি)? যদি কেবল আমার ডেটা শূন্য-স্ফীত হয় তবে তা অন্য গল্প হবে।
আইরিস সোই

5

আমার গবেষণামূলক প্রবন্ধে আমারও একই সমস্যা ছিল। স্টাটাতে, আমি স্রেফ নিজেকে কাস্টম .আডো প্রোগ্রামটি তৈরি করেছিলাম xtgee- এর দুটি কল।

এর জন্য, আমি পার্থ দেব, উইলার্ড ম্যানিং, এবং এডওয়ার্ড নর্টনের "মডেলিং স্বাস্থ্যসেবা ব্যয় এবং গণনা" স্লাইড / প্রোগ্রামগুলি দরকারী বলে খুঁজে পেয়েছি । তারা দ্রাঘিমাংশীয় ডেটা সম্পর্কে কথা বলেন না, তবে এটি একটি কার্যকর প্রারম্ভিক বিন্দু।


1

আমি glmmADMB ব্যাখ্যায় উত্তর খুঁজছিলাম এবং আমি আপনার পোস্ট দেখেছি। আমি জানি এটি অনেক আগে ছিল তবে উত্তরটি আমার কাছে থাকতে পারে।

বাধা মডেল ব্যবহার করার সময় প্যাকেজ glmmADMB দেখুন। আপনাকে আপনার ডেটা বিশ্লেষণে দুটিতে বিভক্ত করতে হবে: তার মধ্যে একটিতে কেবল শূন্য নয় ats আপনি মিশ্র প্রভাব যুক্ত করতে পারেন এবং বিতরণটি বেছে নিতে পারেন। শর্তটি হ'ল ডেটা শূন্য-স্ফীত হতে হবে এবং আমি জানি না এটি আপনার প্রয়োজনীয়তার সাথে খাপ খায় কিনা! যাইহোক, আমি আশা করি আপনি অনেক আগে খুঁজে পেয়েছি!

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.