একটি অনুপাত বা ভগ্নাংশ হিসাবে প্রতিক্রিয়ার ভেরিয়েবলের দ্বিপদী জিএলএমএম (গ্লোমার) ফিটিং করা


11

আমি প্রত্যাশা করছি যে আমার তুলনামূলক সহজ প্রশ্ন হিসাবে কেউ সাহায্য করতে পারে এবং আমি মনে করি আমি উত্তরটি জানি তবে নিশ্চিত হওয়া ছাড়া এটি এমন একটি বিষয় হয়ে দাঁড়িয়েছে যা আমি নিশ্চিত হতে পারি না।

প্রতিক্রিয়া ভেরিয়েবল হিসাবে আমার কিছু গণনা তথ্য রয়েছে এবং আমি পরিমাপ করতে চাই যে কীভাবে কোনও কিছুর আনুপাতিক উপস্থিতির সাথে পরিবর্তনশীল পরিবর্তন হয়।

আরও বিশদে, প্রতিক্রিয়া পরিবর্তনশীল হ'ল কয়েকটি সাইটে পোকা প্রজাতির উপস্থিতি গণনা করা হয়, সুতরাং উদাহরণস্বরূপ কোনও সাইটকে 10 বার নমুনা দেওয়া হয় এবং এই প্রজাতিটি 4 বার ঘটতে পারে।

আমি দেখতে চাই যে এটি এই সাইটগুলিতে গাছপালার সামগ্রিক সম্প্রদায়ের মধ্যে একদল উদ্ভিদ প্রজাতির আনুপাতিক উপস্থিতির সাথে সম্পর্কিত কিনা।

এর অর্থ হল যে আমার ডেটা নীচে দেখায় (এটি কেবল একটি উদাহরণ)

Site, insectCount, NumberOfInsectSamples, ProportionalPlantGroupPresence
1, 5, 10, 0.5
2, 3, 10, 0.3
3, 7, 9, 0.6
4, 0, 9, 0.1

ডেটা এছাড়াও অবস্থানের জন্য একটি এলোমেলো প্রভাব অন্তর্ভুক্ত।

আমি দুটি পদ্ধতির কথা ভেবেছিলাম, একটি হ'ল একটি লিনিয়ার মডেল ( lmer) পোকামাকড়ের সাথে অনুপাত হিসাবে রূপান্তরিত হবে

 lmer.model<-lmer(insectCount/NumberOfInsectSamples~
 ProportionalPlantGroupPresence+(1|Location),data=Data)

দ্বিতীয়টি দ্বিপদী জিএলএমএম ( glmer) যেমন

glmer.model <- glmer(cbind(insectCount,NumberOfInsectSamples-insectCount)~
 ProportionalPlantGroupPresence+(1|Location),
 data=Data,family="binomial")

আমি বিশ্বাস করি দ্বিপদী গ্ল্যামার সঠিক পদ্ধতি হতে পারে তবে তারা মোটামুটি ভিন্ন ফলাফল দেয়। আমি সামান্য অনিশ্চিত বোধ না করেই নেট থেকে একটি নির্দিষ্ট উত্তর খুঁজে পেতে পারি না এবং আমি নিশ্চিত হতে চাই যে আমি কোনও ভুল করছি না।

এ সম্পর্কিত বিকল্প পদ্ধতিগুলির জন্য কোনও সহায়তা বা অন্তর্দৃষ্টি প্রশংসিত হবে।


উত্তর:


19

দ্বিপদী জিএলএমএম সম্ভবত সঠিক উত্তর।

  • বিশেষত একটি ছোট থেকে মাঝারি সংখ্যার নমুনা (আপনার উদাহরণে 9 এবং 10) সহ, প্রতিক্রিয়া ভেরিয়েবলের বিতরণ সম্ভবত হেটেরোসেসটাস্টিক হবে (বৈকল্পিক স্থির থাকবে না এবং বিশেষত পদ্ধতিগত উপায়ে গড়ের উপর নির্ভর করবে) এবং দূরে স্বাভাবিকতা থেকে, এমন এক উপায়ে রূপান্তর করা শক্ত হবে - বিশেষ করে যদি অনুমানের পরিবর্তনশীলের কয়েকটি মানের জন্য অনুপাতগুলি 0 বা 1 এর কাছাকাছি থাকে। এটি জিএলএমএমকে একটি ভাল ধারণা করে তোলে।
  • অতিমাত্রায় যাওয়ার জন্য আপনার অ্যাকাউন্টের জন্য / অ্যাকাউন্ট পরীক্ষা করার জন্য আপনার যত্নবান হওয়া উচিত। যদি প্রতি স্থানের জন্য আপনার একক পর্যবেক্ষণ (যেমন আপনার ডেটা ফ্রেমে একক দ্বিপদী নমুনা / সারি) থাকে তবে আপনার (1|Site)এলোমেলো প্রভাবটি স্বয়ংক্রিয়ভাবে এটি পরিচালনা করবে (যদিও সাবধানী নোটের জন্য হ্যারিসন 2015 দেখুন)
  • পূর্ববর্তী ধারণাটি যদি সঠিক হয় (আপনার কাছে প্রতি স্থানের জন্য একক দ্বিপদী নমুনা রয়েছে), তবে আপনি এটি নিয়মিত দ্বিপদী মডেল হিসাবেও ফিট করতে পারেন ( glm(...,family=binomial)- সেক্ষেত্রে আপনি একটি ক্যাসিবিনোমিয়াল মডেল ( family=quasibinomial) একটি সহজ, বিকল্প উপায় হিসাবেও ব্যবহার করতে পারেন অতিরিক্ত বিনিয়োগের জন্য অ্যাকাউন্টে for
  • আপনি যদি পছন্দ করেন তবে প্রতিক্রিয়া হিসাবে অনুপাতের সাথে আপনার জিএলএমএম ফিট করতেও পারেন, যদি আপনি weightsনমুনার সংখ্যার সমান করার পক্ষে যুক্তিটি সেট করেন :

     glmer(insectCount/NumberOfInsectSamples~ProportionalPlantGroupPresence+
           (1|Location),
           weights=NumberofInsectSamples,
           data=Data,family="binomial")

    (এটি glmer()আপনার প্রশ্নের মধ্যে থাকা ফিটের জন্য অভিন্ন ফলাফল দেবে )।

হ্যারিসন, জাভিয়ার এ। " বাস্তুশাস্ত্র এবং বিবর্তনে দ্বিপদী ডেটাতে মডেলিং ওভারডিস্পের্পশন মডেলিংয়ের জন্য পর্যবেক্ষণ-স্তরের র্যান্ডম এফেক্ট এবং বিটা-বোনমিয়াল মডেলের একটি তুলনা ।" পিয়ারজে 3 (21 জুলাই, 2015): ই 1114। ডোই: 10,7717 / peerj.1114।


হাই বেন, আপনার পরিষ্কার এবং বিস্তৃত উত্তরের জন্য অনেক ধন্যবাদ!
ALS
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.