আমার পয়সন জিএলএম এর জন্য আমার কোনও অফসেট ব্যবহার করা উচিত?


11

আমি যখন পানির নিচে ভিজ্যুয়াল শুমারীর দুটি পৃথক পদ্ধতি ব্যবহার করি তখন মাছের ঘনত্ব এবং মাছের প্রজাতির richশ্বর্যের পার্থক্যগুলি দেখতে গবেষণা চালিয়ে যাচ্ছি। আমার ডেটাটি প্রাথমিকভাবে ডেটা গণনা করা হয়েছিল তবে তারপরে সাধারণত এটি মাছের ঘনত্বে পরিবর্তিত হয় তবে আমি এখনও একটি পয়সন জিএলএম ব্যবহার করার সিদ্ধান্ত নিয়েছি, যা আমি আশা করি সঠিক।

model1 <- glm(g_den ~ method + site + depth, poisson)

আমার 3 প্রেডেক্টর ভেরিয়েবলগুলি হ'ল পদ্ধতি, সাইট এবং গভীরতা যা আমি যখন ইনপুট করি তখন ফ্যাক্টর হিসাবে আদেশ করি।

আমার প্রতিক্রিয়ার পরিবর্তনশীলগুলি হ'ল গ্রেপার প্রজাতির সমৃদ্ধি, গ্রোপার ঘনত্ব এবং অন্যান্য মাছের গোষ্ঠীর জন্য একই the আমি সচেতন যে ঘনত্ব কোনও পূর্ণসংখ্যা নয় এবং এটি সংখ্যার ডেটা যেমন 1.34349। আমি এখন এই ত্রুটিটি পাচ্ছি:

In dpois(y, mu, log = TRUE) : non-integer x = 0.037500

আমি পড়ছি এবং অনেক লোক একটি অফসেট ব্যবহার করার পরামর্শ দিচ্ছে, এটি কি সবচেয়ে পরামর্শ দেওয়া জিনিস?


1
এটি আর কে কীভাবে ব্যবহার করবেন সে সম্পর্কে এটি সত্য নয় This এটি একটি आर প্রশ্ন হিসাবে ছদ্মবেশিত একটি মৌলিক পরিসংখ্যানমূলক প্রশ্ন। এটি এখানে বিষয় হওয়া উচিত।
গুং - মনিকা পুনরায়

উত্তর:


11

এখানে বেশ কয়েকটি সমস্যা রয়েছে:

  1. আপনার প্রতিক্রিয়া পরিবর্তনশীল হিসাবে আপনাকে পর্যবেক্ষণ গণনাগুলি ব্যবহার করতে হবে। আপনার ঘনত্ব ( g_den) ব্যবহার করা উচিত নয় ।
  2. যদি পর্যবেক্ষিত গণনাগুলি পৃথক পৃথক অঞ্চল থেকে থাকে তবে আপনাকে সেই অঞ্চলগুলির লগকে নতুন পরিবর্তনশীল হিসাবে নেওয়া দরকার:

    larea = log(area)
  3. আপনি দুটি ভিন্ন উপায়ে পর্যবেক্ষণের জন্য পৃথক পৃথক অঞ্চলের জন্য নিয়ন্ত্রণ করতে পারেন:

    • lareaঅফসেট হিসাবে ব্যবহার করে । এটি আপনার প্রতিক্রিয়াটিকে আসলে একটি হার তৈরি করবে (যদিও আপনার মডেলের বাম দিকে তালিকাভুক্ত রয়েছে একটি গণনা )।
    • lareaএকটি covariate হিসাবে ব্যবহার করে । এটি ভিন্ন ভিন্ন অঞ্চলগুলির জন্য নিয়ন্ত্রণ করবে তবে আপনার প্রতিক্রিয়াটিকে হারের সমতুল্য করবে না। এটি একটি আরও নমনীয় পদ্ধতির সাহায্যে বাড়তে lareaবাড়তে বা বাড়তে বা না বাড়ার কারণে কাউন্টের উপর প্রভাব (যেমন, assess ালটি 1 এর চেয়ে কম বা বেশি) কিনা তা আপনাকে মূল্যায়ন করতে দেয়।

নিম্নলিখিত সিভি থ্রেডগুলিতে এই বিষয়গুলি সম্পর্কে আরও তথ্য রয়েছে:


6

দেখে মনে হচ্ছে আপনি জরিপের জলের পরিমাণ (বা সম্ভবত অঞ্চল) দিয়ে মাছের সংখ্যাগুলি ভাগ করেছেন। সেক্ষেত্রে একটি অফসেট সত্যই উপযুক্ত, আপনি যা ভাগ করেছেন তার লগটি ব্যবহার করা উচিত। সম্ভবত

model1 <- glm(g_den ~ method + site + depth + offset(log(area)), poisson)

(আগের ভুল সংস্করণ থেকে সম্পাদিত, লগ অনুপস্থিত)

ত্রুটি বার্তার কারণ হ'ল পয়েসন বিতরণটি সাধারণত পূর্ণসংখ্যার-মূল্যবান তবে প্রতিক্রিয়াটি পূর্ণসংখ্যার নয়। অফসেট উপস্থিত হওয়ার পরে এটি পরিবর্তন হয়; (প্রতিক্রিয়া / অফসেট) অবশ্যই একটি পূর্ণসংখ্যা হতে পারে (এটি অবশ্যই মুল গণনাটি পূর্ণসংখ্যা বলে মনে করে)।


2
আপনি উল্লেখ করেছেন যে আপনার উত্তরটিতে আপনার অঞ্চলের লগ রূপান্তর (যেমন পায়সন মডেল লগ লিঙ্কটি ব্যবহার করে) ব্যবহার করা উচিত তবে আপনার কোডটি রূপান্তরটি করে না। আমি মনে করি না যে offsetএটি রূপান্তরটি ডিফল্টরূপে প্রয়োগ করে তবে এটি ব্যবহার করার পরে অনেকক্ষণ হয়ে গেছে offset
iacobus

3
নোট করুন যে রূপান্তরটি ডিফল্টরূপে প্রয়োগ offset() করে না ; এটি কেবল সহগকে ১ হতে বাধ্য করে See দেখুন, উদাহরণস্বরূপ, এখানে
গুং - মনিকা পুনরায়

1
মন্তব্যের জন্য ধন্যবাদ। তাহলে আমার ঘনত্বের পরিবর্তে আমার ডেটাগুলি গণনাগুলিতে পরিবর্তন করা উচিত এবং পৃথক ভেরিয়েবল হিসাবে ক্ষেত্রটি অন্তর্ভুক্ত করা উচিত? আমাকে অন্য ফোরামে গামা বা বিপরীত গসিয়ান মডেল করার পরামর্শ দেওয়া হয়েছে এবং আমার শূন্য মানগুলি 0.00001 এ পরিবর্তন করতে হবে যদি আমি ডেটাটিকে ঘনত্ব হিসাবে রাখি, আপনি কি এটিও উপযুক্ত বলে মনে করেন?
ভিভিয়েন

4
@ জেডিএল অ-পূর্ণসংখ্যার ঘনত্ব রাখা ঠিক হবে না কারণ একবার প্রতিক্রিয়া লগ (অঞ্চল) অফসেট হিসাবে অন্তর্ভুক্ত করা হয়। লগ লিঙ্ক-ফাংশন এবং লগ (অঞ্চল) অফসেট পূর্বের যুক্তিসঙ্গত অনুমানের সমান যে th علائقي , অর্থাৎ মাছের প্রত্যাশিত সংখ্যা এবং প্রতিটি অঞ্চলের আকারের সরাসরি অনুপাত। এর থেকে বোঝা যায় যে প্রত্যাশিত ঘনত্ব লগ থেকে স্বতন্ত্র ( অঞ্চল)। E(count)=exp(βTx)area=exp(βTx+log(area))E(count/area)=E(count)/area=exp(βTx)
জারলে টুফ্টো

5
প্রতিক্রিয়া হিসাবে আপনি ঘনত্বগুলি ব্যবহার করতে পারবেন না। আপনার প্রতিক্রিয়া হিসাবে আপনাকে অবশ্যই মূল গণনাগুলি ব্যবহার করতে হবে। অফসেট সহ স্বয়ংক্রিয়ভাবে গণনা প্রতিক্রিয়াটিকে সঠিক উপায়ে ঘনত্বের সমতুল্য করে তুলবে ।
গুং - মনিকা পুনরায়

5

আপনি যদি পোইসন ব্যবহার করে মডেল করতে চলেছেন তবে আপনার প্রতিক্রিয়া পরিবর্তনের জন্য পূর্ণসংখ্যার মান থাকতে হবে। তারপরে আপনার কাছে দুটি বিকল্প রয়েছে

  • অফসেট হিসাবে অঞ্চল বা অন্য কোনও উপযুক্ত ডিনোমিনেটর ব্যবহার করুন। এটি সাধারণত প্রথমে লগ ইন করা প্রয়োজন
  • পূর্বাভাসক চলক হিসাবে অঞ্চল বা ইত্যাদি অন্তর্ভুক্ত করুন। আবার এটি সাধারণত একটি লগ হিসাবে অন্তর্ভুক্ত করা হবে কারণ আপনি লগের গণনাগুলিকে মডেলিং করছেন।

আপনি যদি অফসেট পদ্ধতির ব্যবহার করেন তবে আপনি বলছেন যে আমি যদি অঞ্চলটি দ্বিগুণ করি তবে আমি গণনা দ্বিগুণ হওয়ার আশা করব। আপনি যদি ভবিষ্যদ্বাণীকারী পদ্ধতির ব্যবহার করেন তবে আপনি বলছেন যে আপনি যদি জানেন যে আপনি যদি সেই অঞ্চলটি গুণন করেন যা আপনি গুণন করেন তবে অগত্যা একই কারণের দ্বারা নয়।

এটা আপনার কল।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.