আমি কি সঠিকভাবে আমার মডেলটিকে লিটারে নির্দিষ্ট করে দিয়েছি?


26

আমি প্রচুর সহায়তা সাইটগুলি ছড়িয়েছি এবং একটি মিশ্র মডেলটিতে আরও জটিল নেস্টেড শর্তাদি কীভাবে নির্দিষ্ট করতে হবে তা নিয়ে এখনও বিভ্রান্ত হয়ে পড়েছি। আমিও ব্যবহার হিসাবে বিভ্রান্ত করছি :এবং /এবং |কথাবার্তাও উল্লেখ এবং ব্যবহার র্যান্ডম কারণের সঙ্গে পাখির মধ্যে lmer()lme4প্যাকেজ R

এই প্রশ্নের উদ্দেশ্যে, ধরে নেওয়া যাক যে আমি এই স্ট্যান্ডার্ডিকাল মডেলটির সাথে আমার ডেটা সঠিকভাবে চিত্রিত করেছি: fixed স্থির হয়েছে, এবং এলোমেলো হয়। ভিতরে (স্পষ্টভাবে) নেস্ট করা হয় ।

Yijk=u+stationi+towj(i)+dayk+(station×day)ik+(tow×day)j(i)k
stationtowdayTowstation

অন্য কথায়, আমি আশা করছি যে আমার মডেলটিতে স্টেশন (i, ফিক্সড), টো (জে, এলোমেলোভাবে স্পষ্টভাবে নেস্টেড স্টেশনের ভিতরে), দিন (কে, এলোমেলো), এবং টো এবং ডে এর মধ্যে মিথস্ক্রিয়া এবং দিনের মধ্যে ইন্টারঅ্যাকশন রয়েছে এবং স্টেশন। আমি আমার মডেল তৈরি করতে কোনও পরিসংখ্যানবিদদের সাথে পরামর্শ করেছি এবং এই মুহুর্তে এটি আমার ডেটার প্রতিনিধি বলে বিশ্বাস করি, তবে যারা আমার পোস্টের নীচে আগ্রহী তাদের জন্য আমার ডেটা বর্ননা যুক্ত করবেন যাতে যাতে বিশৃঙ্খলা না ঘটে।

এতক্ষণ আমি যা একসাথে টুকরো টুকরো করতে পেরেছি তা নীচে রয়েছে lmer:

lmer(y ~ station + (1|station:tow) + (1|Day) + (1|station:day) + (1|tow:day), 
     data=my.data)

এটি কি আমার পরিসংখ্যানের মডেলটিকে সঠিকভাবে চিত্রিত করে? আমার কোডটি সঠিকভাবে না পড়লে কীভাবে উন্নতি করা যায় তার জন্য কোনও পরামর্শ?

আমি আমার লিমার সূত্রে উল্লেখ করতে যে নির্দিষ্ট পদগুলিতে উল্লেখ করতে অসুবিধা হচ্ছে তা আমি সাহসী করেছি

# 1। তোয় এলোমেলোভাবে স্টেশন এবং স্টেশন স্থির হয়ে গেলে
আমি বিভ্রান্ত হয়ে যাই, তবে নেস্টেড এবং ইন্টারঅ্যাকশন শর্তাদির মধ্যে পার্থক্য সম্পর্কে যা এলোমেলোভাবে ব্যবহার করে :এবং /। আমার উপরের উদাহরণে, আমার কাছে (1|station:tow)রয়েছে যা আমি আশা করি স্টেশনগুলির মধ্যেই খুব ভালভাবে পড়তে পারি। আমি বিভিন্ন সাইটগুলিতে বিবাদী মন্তব্য পড়েছি আমার ব্যবহার :বা /এলোমেলো (1|...)বিন্যাসের মধ্যে থাকা উচিত কিনা lmer

# 2। স্টেশন স্থির এবং দিন নির্ধারণের সময় এবং দিনের মধ্যে ক্রিয়াকলাপটি
আমার কাছে তখন এলোমেলো তবে (1|station:day)আমি আশা করি এটি স্টেশন এবং দিনের মধ্যে ইন্টারঅ্যাকশনটি পড়বে। দেখে মনে হচ্ছে যে স্টেশন এবং দিনের পৃথক প্রভাবগুলির জন্য অ্যাকাউন্টের জন্য আমি স্টেশন * দিনটি ব্যবহার করতে পারছিলাম পাশাপাশি তাদের মিথস্ক্রিয়াটি (আমি উপরে বর্ণিত হিসাবে তিনটি শর্ত পৃথক পৃথকভাবে বাদ দিয়ে) তবে কীভাবে এটি নির্দিষ্ট করা যায় তা আমি দেখতে পাচ্ছি না যখন একটি স্থির হয় এবং অন্যটি এলোমেলো হয়। চান station*(1|day)যে কি?

# 3। কাতা ও দিন (উভয় র্যান্ডম) যখন কাতা স্টেশন (সংশোধন) এ নেস্টেড হয় মধ্যে পারস্পরিক কথোপকথন তারপর সর্বশেষে, আমি (1|tow:day)যা আমি আশা করছি মিথষ্ক্রিয়া সার্চ towএবং day, কিন্তু যদি আমি যে কাতা নেস্টেড আবার নির্দিষ্ট করতে হবে আমি ভাবছি করছি (স্পষ্টভাবে) স্টেশনে?

আমি Rএবং lmerএবং পরিসংখ্যানগত মডেলিং উভয়ের ক্ষেত্রেই নতুন এবং সম্ভব হলে আমার প্রশ্নের যে কোনও প্রতিক্রিয়াতে পুরো ব্যাখ্যাগুলি দেওয়ার সমস্যার প্রশংসা করি।

আমার ডেটা সম্পর্কে আরও বিশদ: আমি জিজ্ঞাসা করছি যে প্ল্যাঙ্কটনের ঘনত্বগুলি নূরশোর সমুদ্রের কোনও দৈহিক সম্মুখভাগে পরিবর্তিত হয়। আমার এই ফ্রন্টের তিনটি স্টেশন, ইনশোর, ভিতরে এবং অফশোর have স্টেশন এইভাবে স্থির করা হয়। প্রতিটি স্টেশনে, আমি তিনটি প্রতিলিপি প্লাঙ্কটন টো (যা থেকে আমি বাছাই, গণনা করি এবং প্রতি মিটার ঘন জলের প্রতি # বাগের শর্তে ঘনত্ব পাই) take টো এলোমেলো: তিনটি ট্যুতে আমি আশা করি সেই নির্দিষ্ট স্টেশনে প্লাঙ্কটনের সাধারণ পরিবর্তনশীলতার জন্য অ্যাকাউন্ট করব। প্রতিটি স্তরের স্বতন্ত্র আইডি না থাকায় প্রতিটি স্টোতে অভ্যন্তরীণভাবে নীচে নেমে আসে (প্রতিটি স্টেশনে টোয়ের জন্য আইডি হ'ল 123,123,123)। আমি তখন একাধিক, স্বাধীন দিনগুলিতে একটি নতুন ফ্রন্ট গঠন করে এটি করেছি। আমি মনে করি আমি দিবসকে একটি ব্লকিং ফ্যাক্টর হিসাবে ভাবতে পারি? দিবসটি এলোমেলো হিসাবে একাধিক স্বতন্ত্র সামনের দিনগুলিতে দিনে দিনে পরিবর্তনশীলতা ক্যাপচার করার চেষ্টা করা হয় এবং এই ফ্রন্টটি উপস্থিত রয়েছে এমন সমস্ত দিনের প্রতিনিধি হতে পারে। আমি কি ইন্টারঅ্যাকশন শর্তাদি সম্পর্কে জানতে চাই যে তাজগুলি দিন দিন পরিবর্তিত হয় এবং যদি স্টেশনগুলি সর্বদা একই রকম ডেটা দেয় বা এটি দিনের উপর নির্ভর করে?

আবার, আপনার সময় এবং সহায়তার জন্য আপনাকে ধন্যবাদ, আমি এটি প্রশংসা করি!


আমি বিশ্বাস করি যে আপনার মানক পরিসংখ্যানের মডেলটিতে আপনি কয়েকটি সাবস্ক্রিপ্ট মিস করছেন (আমি ভুল হয়ে থাকলে সেগুলিতে যুক্ত করতে চাইনি)।

1
এফডব্লিউআইডাব্লু, যে কেউ এই থ্রেড জুড়ে আসেন এবং Rসিনট্যাক্স, আইএমও- তে ফোকাস দেওয়ার কারণে এটি অন-টপিক কিনা তা নিয়ে অবাক হয়ে যান , এটি পর্যাপ্ত পরিসংখ্যানগত (মডেলটি কীভাবে বাসা বাঁধার এবং মিথস্ক্রিয়া ইত্যাদির সাথে সম্পর্কিত understanding সিভি জন্য।
গং - মনিকা পুনরায়

1
এটি আমার মতে বিষয়টিতে 100%।


2
আপনার lmer()সিনট্যাক্স অনুসারে আপনি এমন একটি মডেল নির্দিষ্ট করেছেন যেখানে সেখানে stationচারটি এলোমেলো ইন্টারসেপ্টের স্থির প্রভাব রয়েছে এবং একই সাথে (1) সংমিশ্রণ stationএবং tow(2) মান Day, (3) এর সংমিশ্রণ stationএবং dayএবং ( 4) towএবং dayযথাক্রমে সংমিশ্রণ । আপনি কি এই ইচ্ছা? আমি নিশ্চিত নই কারণ @BabekP দ্বারা নির্দেশিত, আপনি কীভাবে আপনার মডেল সূত্রটি লিখেছেন তা পরিষ্কার নয়। আপনি পরিবর্তনশীল নাম লিখেছেন, পরামিতিগুলি নয় not সাধারণত, এটির মতো কোনও মডেলটিতে, ভেরিয়েবল সংমিশ্রণগুলি সাবস্ক্রিপ্টগুলি ক্যাপচার করে।
ম্যাক্রো

উত্তর:


23

যখন টু এলোমেলো থাকে এবং স্টেশন স্থির হয় তখন স্টোরের মধ্যে টো নস্ট করা হয়

station+(1|station:tow)সঠিক. @ জন তার উত্তরে যেমনটি বলেছিল, তেড়ে (1|station/tow)যাবে (1|station)+(1|station:tow)(স্টেশন এবং টো এবং স্টেশনের মধ্যবর্তী মিথস্ক্রিয়াটির মূল প্রভাব) যা আপনি চান না কারণ আপনি ইতিমধ্যে স্টেশনটিকে একটি নির্দিষ্ট প্রভাব হিসাবে নির্দিষ্ট করেছেন।

স্টেশন স্থির এবং দিন এলোমেলো যখন স্টেশন এবং দিনের মধ্যে মিথস্ক্রিয়া।

একটি স্থির এবং একটি এলোমেলো প্রভাবের মধ্যে মিথস্ক্রিয়া সর্বদা এলোমেলো থাকে। আবার @ জন বলেছেন, আবার station*dayপ্রসারিত হয় station+day+station:day, যা আপনি (আবার) চান না কারণ আপনি ইতিমধ্যে dayআপনার মডেলটিতে উল্লেখ করেছেন। আপনি যা চান তা করার কোনও উপায় আছে বলে আমি মনে করি না day(র্যান্ডম) এবং station(স্থির) এর ক্রসড ইফেক্টগুলি ভেঙে ফেলতে পারে তবে আপনি লিখতে চাইলে station+(1|day/station)এমনটি করতে পারতেন , যা পূর্বের উত্তরে বর্ণিত হিসাবে প্রসারিত হবে station + (1|day) + (1|day:station)

টো এবং দিনের মধ্যে পারস্পরিক মিথস্ক্রিয়া যখন স্টেতে বাসা বেঁধে থাকে

কারণ আপনি অনন্য মান না থাকে towপরিবর্তনশীল (অর্থাত আপনি যা বললেন নিচে tows উল্লিখিত হিসাবে কারণ 1, 2, 3প্রত্যেক স্টেশনে, আপনি কি হিসাবে, পাখির নির্দিষ্ট করতে হবে (1|station:tow:day)। আপনি যদি tows স্বতন্ত্র নিদিষ্ট ছিল, হয় আপনি ব্যবহার করতে পারে (1|tow:day)বা (1|station:tow:day)(তাদের সমতুল্য উত্তর দেওয়া উচিত) you আপনি যদি এই ক্ষেত্রে নেস্টিং নির্দিষ্ট নাlme4 করেন তবে সমস্ত স্টেশনগুলিতে # 1 দ্বারা ভাগ করা একটি র্যান্ডম এফেক্টটি অনুমান করার চেষ্টা করবে ...

আপনি এলোমেলো প্রভাবগুলি সঠিকভাবে নির্দিষ্ট করেছেন কিনা তা নির্ণয়ের একটি উপায় হ'ল প্রতিটি গ্রুপিং ভেরিয়েবলের জন্য প্রতিবেদন করা পর্যবেক্ষণের সংখ্যা এবং এটি আপনার প্রত্যাশার সাথে একমত কিনা তা দেখুন (উদাহরণস্বরূপ, station:tow:dayগোষ্ঠীর সাথে সম্পর্কিত বিভিন্ন পর্যবেক্ষণ থাকা উচিত) দিনের সংমিশ্রণে স্টেশনগুলির সংখ্যা দুই : : আপনি যদি স্টেশনের সাথে বাসাটি ভুলে গিয়ে থাকেন তবে আপনার দেখতে হবে যে আপনার চেয়ে কম পর্যবেক্ষণ পেয়েছেন।××

হয় http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#model-specification এবং http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#nested-or-crossed আপনার জন্য উপযোগী?


সহায়ক জবাব এবং রেফারেন্সের জন্য আপনাকে অনেক ধন্যবাদ, তারা অনেক প্রশংসা করেছে। উপরের বর্ণনা হিসাবে আমি স্বরলিপিটি সম্পর্কে (1 | a: b) বিভ্রান্ত হয়েছি, যেখানে দেখা যাচ্ছে যে ':' এর অর্থ "নেস্টেড" পাশাপাশি একটি মিথস্ক্রিয়াও হতে পারে। কিভাবে এটি উভয় নির্দিষ্ট করতে পারেন? অন্য কথায়, লিমার কীভাবে জানতে পারে যে আপনি কোন সম্পর্কটি নির্দেশ করছেন? আমি অবশ্যই এখানে কিছু বেসিক মিস করছি, আমি ক্ষমা চাইছি।
wtree

4
এই প্রসঙ্গে, মিথস্ক্রিয়া এবং বাসা বাঁধার মধ্যে এতটা পার্থক্য নেই। কিনা Bমধ্যে নেস্টেড হয় Aবা শুধু মিথস্ক্রিয়া সঙ্গে এটি কিনা প্রধান প্রভাব উপর নির্ভর করে Aমডেল বা না অন্তর্ভুক্ত হয়। যদি প্রধান প্রভাব Bহয় এছাড়াও মডেল তারপর এটা ছাড়িয়েছে ...
বেন Bolker

হাই সব, আমি এখানে একটি সম্পর্কিত প্রশ্ন জিজ্ঞাসা করেছি: stats.stackexchange.com/questions/272377/… যদি কারও কাছে (বিশেষত @ বেনবোলকার) সন্ধান করার এবং উত্তর সরবরাহ করার সুযোগ থাকে।
জোশুয়া রোজেনবার্গ

11

সূত্রে কিছু জিনিস কিছু বিভ্রান্তিকর। :যখন দুটি শব্দের মধ্যে পারস্পরিক ক্রিয়ার জন্য *প্রধান প্রভাব এবং পারস্পরিক ক্রিয়ার জন্য। /পারস্পরিক ক্রিয়ার জন্য অন্য একটি কিন্তু এটি কী লব এবং পদ সব হর (যেমন একটা পারস্পরিক আদানপ্রদান উৎপন্ন হয় A/(B+C) = A:B + A:C)। |মত "দ্বারা গ্রুপকৃত" কিছু জন্য। সুতরাং, 1|stationস্টেশনে এবং বন্ধনীগুলিতে এটি এলোমেলোভাবে সংযুক্ত করা হবে (1|station)। এভাবেই আপনি বাসা বাঁধবেন।

আশা করি সেটাই সাহায্য। এটি একটি স্থির প্রভাবের মধ্যে এলোমেলোভাবে প্রভাবিত হওয়া কিছুটা অদ্ভুত এবং আপনি কীভাবে এটি উপস্থাপন করবেন তা আমি নিশ্চিত নই। আমি পরিস্থিতি কল্পনাও করতে পারি না। আপনার ভেরিয়েবলগুলি কী এবং আপনি কী সম্পাদন করতে চান তার ব্যাখ্যা দিলে আপনি আরও ভাল সাড়া পেতে পারেন। অনেক সময় লোকেরা প্রশ্ন জিজ্ঞাসা করে এবং পরিভাষাটি ভুল ব্যবহার করে এবং যোগাযোগ করা শক্ত। ভেরিয়েবলগুলি কী উপস্থাপন করে এবং সেগুলি সম্পর্কে আপনি কী জানতে চান তা ব্যাখ্যা করুন।

আপনার শেষ অনুচ্ছেদে আপনার বর্ণনাকে কেন্দ্র করে মনে হচ্ছে আপনার টোটি কেবল আপনার সংগ্রহ করা নমুনাগুলির একটি সূচক এবং এমন কোনও অর্থে আপনার অনুমানের প্রয়োজন নেই যে আপনি আশা করছেন যে টো 1 কোনওভাবে টো 2 থেকে ধারাবাহিকভাবে আলাদা হবে। টো কেবল একটি নমুনা নির্দেশ করছে। আপনি যদি সত্যই বিশ্বাস না করেন তবে পায়ের ক্রমটি গুরুত্বপূর্ণ যে আপনি সেই পরিবর্তনশীলটির সাথেও মাথা ঘামান না। এবং যদি তারা গুরুত্বপূর্ণ হয়ে থাকে তবে এটি একটি স্থির প্রভাব (এবং সম্ভবত এলোমেলো, তবে সম্পূর্ণ র্যান্ডম প্রভাব নয়)। আপনি বলেছিলেন যে দিনগুলি দিন দিন পরিবর্তনগুলি পরিবর্তিত হয় কিনা তা আপনি জানতে চান want উত্তরটি হ্যাঁ কেমন? এটি বাস্তবসম্মত সম্ভাবনার পরিমণ্ডলে নয় যে তারা দিনে দিনে আলাদা হয় না। এটি আপনার পদক্ষেপের বৈকল্পিক। আপনি' পুনরায় কোনও বৈকল্পিকতার জন্য অ্যাকাউন্ট করার চেষ্টা করার অনুমতি দেওয়া হয় না কারণ তারপরে ত্রুটির জন্য কোনও বৈকল্পিকতা না রেখে আপনি গতিবদ্ধ হন। আপনার একটি অতিরিক্ত নির্দিষ্ট মডেল আছে। আপনি প্রতিটি পরিমাপের রিপোর্টিংয়ের পর্যায়ে থাকবেন।

দিনের পর দিন স্টেশনটি পরিবর্তিত হয় কিনা তা অবাক করে দেওয়ার বিষয়ে আপনি অনুরূপ বক্তব্য দেন; অবশ্যই এটা করে। তবে আপনি নির্দিষ্ট দিন বলতে চান? দিনগুলি কোনওভাবে seasonতু, চন্দ্রচক্র ইত্যাদির দ্বারা ভাগ করা হয়েছিল? যদি আপনি কেবল এই দিন 1, 2, ইত্যাদি ব্যতীত অন্য কিছু না পেয়ে থাকেন তবে স্টেশনগুলি প্রতিদিন পরিবর্তিত হয় তা জেনে কীভাবে আপনাকে স্টেশনগুলি পরিবর্তিত করে অন্য কিছু বলা যায়? সুতরাং এই প্রশ্নের উত্তর হ'ল, অবশ্যই স্টেশনগুলি দিনে দিনে পরিবর্তিত হয়। এবং অবশ্যই দিন দিন এবং স্টেশন থেকে স্টেশনে পৃথক পৃথক্ পৃথক্ থাকে। আপনি একটি সাধারণ মডেল দিয়ে বামে শেষ করেছেন:

aov(y ~ station, data = dat)

এখানে আপনার এক স্থির প্রভাব, স্টেশন, সবেমাত্র একাধিক টো এবং একাধিক দিনের জন্য নমুনাযুক্ত। আমি নিশ্চিত নই যে আপনার এখানে সত্যিই মাল্টি-লেভেল মডেলিংয়ের দরকার আছে। দেখে মনে হচ্ছে আপনি নিজের মডেলটিকে অতিরিক্ত উল্লেখ করছেন।

আপনি যদি সত্যিই এলোমেলো দিন এবং তোয়াক্কা প্রভাব চান এবং এমন তথ্য রয়েছে যা আপনি এখানে নির্দিষ্ট করেন নি তবে আপনি এটি একটি বহু-স্তরের মডেলে প্রসারিত করতে পারেন। এটি হবে:

lmer(y ~ station + (two*day|station), data = dat)

যদিও এই মডেলটি ব্যবহার করতে আপনার প্রতিটি স্টেশন এবং দিনে একাধিক টো দরকার need


আপনারা যা বলেছেন তার সাথে আমি একমত তবে আমার কাছে মনে হয় এটি কোনও উত্তরের চেয়ে কমেন্টের চেয়ে বেশি।
ম্যাক্রো

@ জন আমি আপনার সাথে "এইভাবে বাসা বাঁধবে" until আমি মনে করি আপনি কীভাবে বাসা বাঁধেন এর আসল পয়েন্টটি আমি মিস করেছি। আপনি আরও বিস্তারিতভাবে ব্যাখ্যা করতে ইচ্ছুক হবে? আমি মনে করি আমি এখনও দ্বারা বিভ্রান্ত | এবং এটি আরও চেহারা হবে। তবে আপনার প্রতিক্রিয়া থেকে, আমি এখনও নিশ্চিত নই কীভাবে, উদাহরণস্বরূপ, কীভাবে টো (এলোমেলো) স্টেশনের অভ্যন্তরে (স্থির) থাকা উচিত?
wtree

@ জন ওহ এবং স্টেশনটি সমুদ্রের আগ্রহের জায়গাগুলি / অবস্থান হিসাবে নির্ধারণ করা হয়েছে এবং দুটি জায়গা এলোমেলো কারণ আমি এই সাইটগুলিতে প্ল্যাঙ্কটন টো নিচ্ছি যা এলোমেলোভাবে যে তারা প্রতিটি সাইটে প্ল্যাঙ্কটনে পরিবর্তনের জন্য অ্যাকাউন্ট নেওয়ার চেষ্টা করছে এবং তারপরে এক্সট্রাপোলটেড হবে I স্টেশনে প্লাঙ্কটন জনসংখ্যার প্রতিনিধিত্ব করা।
wtree

1
কোনও নমুনার প্রতিটি লেবেল এলোমেলো পরিবর্তনশীল নয়, সম্পাদনাগুলি দেখুন।
জন

1
আমি এখনও মনে করি যে বর্ণনাটি দেওয়া মোটেও মডেলটিতে থাকা উচিত নয়। দিন যদিও ভাল শোনাচ্ছে।
জন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.