মডেলিং গণনা ডেটা যেখানে কিছু পর্যবেক্ষণের জন্য অফসেট ভেরিয়েবল 0 হয়


9

আমি সহকর্মী একটি ছাত্র সাহায্য করার চেষ্টা করছি। পরীক্ষামূলক পরীক্ষায় ছাত্র পাখির আচরণ পর্যবেক্ষণ করে এবং গণনা করে (কলগুলির সংখ্যা)। প্রতিটি পরীক্ষার সময় একটি নির্দিষ্ট পর্যবেক্ষণ করা পাখির সাথে সম্পর্কিত কলগুলির সংখ্যা নির্ধারণ করা যায়নি তবে রেকর্ডকৃত কলগুলির সংখ্যায় অবদান রেখেছিল এমন পাখির সংখ্যা গণনা সম্ভব ছিল। সুতরাং আমার প্রাথমিক পরামর্শটি ছিল পোয়েসন জিএলএম মডেলটিতে অফসেট শব্দ হিসাবে পাখির সংখ্যা অন্তর্ভুক্ত করা, সুতরাং আমরা পাখি প্রতি প্রত্যাশিত সংখ্যার কল ফিটিং করব ।

এটির সাথে সমস্যাটি হ'ল বহু পর্যবেক্ষণ অনুষ্ঠানে কোনও পাখি (এবং তাই কোনও কল) পর্যবেক্ষণ করা হয়নি। সফ্টওয়্যার (এই ক্ষেত্রে রাঃ) অভিযোগ কারণ (রাঃ সম্পর্কে অভিযোগ ধারণকারী ডেটা কিন্তু যে বিশুদ্ধরূপে ফল হচ্ছে )।log(0)=infy-Infoffset(log(nbirds))-Inf

আমি আসলে সন্দেহ করি যে আমাদের একটি প্রতিবন্ধকতা মডেল (বা অনুরূপ) প্রয়োজন যেখানে আমাদের "কল পরিলক্ষিত?" জন্য আলাদা দ্বিপদী মডেল রয়েছে? (বা না) এবং কলগুলি (প্রতিটি পাখি প্রতি) সংখ্যার জন্য ছাঁটাই কাউন্ট মডেল যেখানে পরিস্থিতিতে কল ছিল, যেখানে আমরা কেবলমাত্র মডেলের গণনা অংশে অফসেট শব্দটি অন্তর্ভুক্ত করি।

আর-তে pscl প্যাকেজটি ব্যবহার করে এটি চেষ্টা করেও আমি এখনও একই ত্রুটি পেয়ে যাচ্ছি:

mod1 <- hurdle(NumberCallsCOPO ~ Condition * MoonVis +
               offset(log(NumberCOPO)) | 1, data = Data,
               dist = "poisson")

কারণ একই আর কোড ( গণনা মডেল অংশটি ফিট করার জন্য glm.fitঅভ্যন্তরীণভাবে ব্যবহৃত হয় hurdle()) যাচাই করে দেখছে -Infযদিও আমি মনে করি না যে এটি পর্যবেক্ষণগুলির জন্য মডেল ফিটকে প্রভাবিত করবে। (এটি কি সঠিক অনুমান?)

আমি মডেলটিকে NumberCOPO( অল্প সংখ্যক 0.0001) সংখ্যক সংখ্যক সংখ্যার যোগ করে ফিট করতে পারি তবে এটি সর্বোত্তমভাবে একটি ফাজ।

এই ক্ষুদ্র ধারাবাহিকতা সংশোধন যুক্ত করা কি বাস্তবে ঠিক হবে? যদি তা না হয় তবে যেখানে পইসন মডেলটিতে অফসেট ভেরিয়েবল 0 মান নিতে পারে সেখানে ডেটা হ্যান্ডেল করার সময় আমাদের আর কোন পদ্ধতির বিবেচনা করা উচিত? আমি যে উদাহরণগুলি দেখতে পেয়েছি তার সবগুলিই সেই পরিস্থিতিতে রয়েছে যেখানে অফসেট ভেরিয়েবলের জন্য 0 টি সম্ভব না।


2
এই ক্ষেত্রে, আপনার মডেলটি টোটোলজির সাথে ফিট করার চেষ্টা করছে বলে মনে হচ্ছে: যদি 0 টি পাখি পর্যবেক্ষণ করা হয় তবে আপনি 0 টি পাখির ডাকও শুনতে পাবেন। আমি নিশ্চিত নই যে অফসেট 0 দিয়ে সারিগুলিতে একটি মডেল ফিট করা এই ক্ষেত্রে উপযুক্ত।
সাইকোরাক্স মনিকাকে

ধন্যবাদ, আমি যেমন নীচে উল্লেখ করেছি, এটি আমার অন্ত্রের প্রতিক্রিয়াও। আমি নীচে নীচে ব্যারি (স্পেসডম্যান) এর জবাবে আমার জবাবে কিছুটা প্রসারিত করেছি।
গ্যাভিন সিম্পসন

2
আমি এই মন্তব্যের সাথে একমত হব যে ইঙ্গিত দেয় যে পয়েসন রেট মডেল (যেটি অফসেট শব্দটি সহ) এই ক্ষেত্রেগুলির পক্ষে অনুপযুক্ত (এবং আপনি ঠিক বলেছেন যে সম্ভবত একটি পৃথক, যেমন দ্বিপদী, মডেল প্রয়োগ করা উচিত those কেসগুলি অন্তর্ভুক্ত করার জন্য) । হার শূন্য ডিনোমিনেটরের উপর ভিত্তি করে করা যাবে না।
ttnphns

উত্তর:


5

সুতরাং আপনি যে প্রতিক্রিয়াটি মডেল করতে চান তা হ'ল "পাখি প্রতি কল সংখ্যা" এবং ঝামেলা লাইনগুলি যেখানে আপনি কোনও পাখি পর্যবেক্ষণ করেন নি? কেবল সেই সারিগুলি ফেলে দিন। আপনি যে মডেলটির চেষ্টা করছেন সেগুলিতে তারা কোনও তথ্য জুড়ে না।


এটি আমার অন্ত্রের প্রতিক্রিয়াও; সম্ভবত এটি overthinking, তবে আমি এমন পরিস্থিতিটি অনুমান করতে পারি যেখানে পাখি পর্যবেক্ষণ করেছে তবে কোনও কল করা হয়নি। সুতরাং বাধা মডেল, তবে অভ্যন্তরীণভাবে এটি এখনও ব্যবহার করছে glm.fitযা সেই মানগুলিকে মডেলের গণনা অংশে গণনা না করা সত্ত্বেও একটি ডুবিয়ে দেয়। আমি মনে করি আমি বাধা মডেলটি হাতে হাতে করতে পারি তবে আমি এটি করতে চাই না, কেবল শিক্ষার্থীকে পরামর্শ দিন।
গ্যাভিন সিম্পসন

3
আপনার যদি শূন্য-না হওয়া পর্যবেক্ষণ করা পাখি থেকে প্রচুর শূন্য কল করা থাকে তবে আপনি শূন্য-স্ফীত পোয়েসন মডেল (বা অনুরূপ) করতে চাইতে পারেন তবে যখন আপনি পাখি প্রতি কলের সংখ্যায় আগ্রহী তখন শূন্য পর্যবেক্ষণ করা পাখির চেয়ে খুব আলাদা ।
স্পেসডম্যান

এক্ষেত্রে আমি ভাবি না যে আমাদের অনেকগুলি রয়েছে; 0 টি পর্যবেক্ষণ-পাখি ডেটা ফেলে দেওয়া এবং নেতিবাচক দ্বিপদী সঙ্গে ফিট করা একটি যুক্তিসঙ্গত প্রথম পদক্ষেপ বলে মনে হয়।
গ্যাভিন সিম্পসন 21

2

কোনও পয়সন জিএলএম-তে, অফসেটটি কেবল পোইসন হারের মডেলিংয়ের উপর একটি গুণগত স্কেলিং - এবং শূন্যের হারের সাথে একটি পইসন সহায়ক বা এমনকি অর্থবহ নয় ...

যে কারণে স্পেসডম্যান সঠিক!


0

এটি কেবল (হরডল) "হাত দিয়ে করার জন্য (" ডায়ডটিক / জিমন্যাস্টিক "পার্পোর্সের জন্য) চেষ্টা করুন: দ্বিখণ্ডিত অংশ এবং কাউট অংশে বিভক্ত করুন এবং মজাদার লগিট এবং কাউট রিগ্রেশন আলাদাভাবে উপভোগ করুন! বা স্ট্যান্ডার্ড হারডল মডেলগুলি (+ ভুং পরীক্ষা) পোয়েসন / নেগবিন ব্যবহার করুন / গামা ..., গ্যাম। আপনার এখানে "অফসেট" ভার দরকার নেই, আমার কাছে মনে হচ্ছে। ;-)

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.