স্থিত প্রভাব বনাম এলোমেলো প্রভাব যখন সমস্ত সম্ভাবনা মিশ্র প্রভাবগুলির মডেলটিতে অন্তর্ভুক্ত থাকে


15

একটি মিশ্র প্রভাবগুলির মডেলটিতে সমস্ত সম্ভাব্য স্তর অন্তর্ভুক্ত করা হয় (উদাহরণস্বরূপ, পুরুষ এবং মহিলা উভয়) প্যারামিটারটি অনুমান করার জন্য একটি নির্দিষ্ট প্রভাব ব্যবহার করার পরামর্শ দেওয়া হয়। যদি পরিবর্তিত স্তরগুলির একটি জনসংখ্যার কেবলমাত্র এলোমেলো নমুনা হয় (সম্ভাব্য রোগীদের মহাবিশ্বের তালিকাভুক্ত রোগীরা) এবং আপনি জনসংখ্যার গড় পরিবর্তনের এবং তারতম্যের পরিবর্তনের জন্য প্রাক্কলন করতে চান তবে পরিবর্তনের জন্য অ্যাকাউন্টে র্যান্ডম এফেক্ট ব্যবহার করার পরামর্শ দেওয়া হচ্ছে স্বতন্ত্র ফ্যাক্টর স্তর।

আমি ভাবছি যে আপনি এইভাবে সর্বদা একটি নির্দিষ্ট প্রভাব ব্যবহার করতে যুক্তিযুক্তভাবে বাধ্য। কীভাবে ফুট / জুতার আকার বিকাশের মাধ্যমে পরিবর্তন হয় এবং উচ্চতা, ওজন এবং বয়সের সাথে সম্পর্কিত হয় তা নিয়ে একটি গবেষণা বিবেচনা করুন। Sideবছরের পর বছর ধরে পরিমাপগুলি একটি নির্দিষ্ট পাদদেশে বাসা বেঁধে থাকে এবং স্বতন্ত্র হয় না তার জন্য অ্যাকাউন্টে অবশ্যই স্পষ্টভাবে মডেলটিতে অন্তর্ভুক্ত করতে হবে। তদুপরি, ডান এবং বাম সমস্ত সম্ভাবনা যা বিদ্যমান থাকতে পারে। তদতিরিক্ত, এটি খুব সত্য হতে পারে যে প্রদত্ত অংশগ্রহণকারীদের জন্য তাদের ডান পা তাদের বামের চেয়ে বড় (বা আরও ছোট)। তবে, পাদদেশের আকার সকল মানুষের পায়ের মধ্যে কিছুটা পৃথক হলেও, ডান পা গড়ে গড়ে বাম পায়ের চেয়েও বড় হবে বলে বিশ্বাস করার কোনও কারণ নেই। যদি তারা আপনার নমুনায় থাকে তবে এটি সম্ভবত আপনার নমুনায় থাকা মানুষের জিনেটিক্স সম্পর্কে কিছু ডান-পায়ের নীড়ের অভ্যন্তরীণ পরিবর্তে to পরিশেষে, side একটি উপদ্রব প্যারামিটারের মতো মনে হচ্ছে, এমন কিছু নয় যা আপনি সত্যই যত্নবান হন।

আমাকে লক্ষ্য করুন যে আমি এই উদাহরণটি তৈরি করেছি। এটি কোনও ভাল নাও হতে পারে; এটি শুধু ধারণা জুড়ে পেতে। আমি জানি সকলের জন্য, প্যালেওলিথিকটিতে বেঁচে থাকার জন্য ডান পা এবং একটি ছোট বাম পা রাখা দরকার ছিল।

এর মতো কোনও ক্ষেত্রে, মডেলটিতে এলোমেলোভাবে প্রভাব হিসাবে অন্তর্ভুক্ত করা (আরও / কম / যে কোনও) ধারণাটি তৈরি করবে ? এখানে একটি নির্দিষ্ট বনাম। এলোমেলো প্রভাব ব্যবহার করার পক্ষে কি কি হবে? side


আপনি কেন এলোমেলো ফ্যাক্টর হিসাবে পক্ষের সাথে চিকিত্সা করতে চান যে এই ফ্যাক্টরের দুটি এবং মাত্র দুটি স্তর রয়েছে? আপনার সমস্যা সেটিং এ এলোমেলোতা আসে কোথা থেকে?
অ্যারন জেং

@ অ্যারোনজেং, আমার উদাহরণের গুণগতমানকে আলাদা করে রেখেছেন, এটি আমার প্রশ্ন। যদি আপনার সমস্ত সম্ভাব্য স্তর থাকে তবে এলোমেলো প্রভাবগুলির সাথে স্তরগুলিকে উপস্থাপন করার কোনও কারণ আছে কি? যদি প্রশ্নের ফ্যাক্টরের> 2 স্তর থাকে তবে কী হবে?
গুং - মনিকা পুনরায়

1
@ গুং আমি এই থ্রেডে ফিরে এসেছি - উত্তরের কোনওটি কী সহায়তা করেছে? যদি না - আপনি আরও কি জানতে আগ্রহী? হয়তো আপনার নিজের উত্তর আছে (যদি হ্যাঁ, আমি এই সমস্যাটি সম্পর্কে আরও জানতে আগ্রহী হব!)?
টিম

2
@ টিম, আমি এখানে ফিরে আসার অনেক দিন হয়েছে। আমি উভয় জবাবের প্রশংসা করি (আমি তাদের উত্সাহিত করেছি), তবে তারা আমি যা খুঁজছিলাম তা পুরোপুরি নয় (সম্ভবত একটি অপ্রতুলতার সাথে পরিষ্কার প্রশ্ন বিবরণের কারণে)। বেন বলকার বিভিন্ন জায়গায় পোস্ট করেছেন এমন কিছু জিনিস থেকে একটি উত্তর সংকলন করার বিষয়ে আমি ভেবেছি, তবে এটি কিছুটা কাজ হবে এবং আমি আসলে এটি কখনও অর্জন করতে পারি নি। যদিও এটি এখনও আমার কিছু করা উচিত। ধাক্কা দেওয়ার জন্য ধন্যবাদ।
গুং - মনিকা পুনরায়

উত্তর:


13

"স্থির" এবং "এলোমেলো" প্রভাবগুলির সাথে সাধারণ সমস্যা হ'ল এগুলি একটি ধারাবাহিক উপায়ে সংজ্ঞায়িত করা হয় না। অ্যান্ড্রু গেলম্যান তাদের কয়েকটি উদ্ধৃতি দিয়েছেন:

(1) নির্দিষ্ট প্রভাবগুলি ব্যক্তিদের মধ্যে স্থির থাকে এবং এলোমেলো প্রভাবগুলি পৃথক হয়। উদাহরণস্বরূপ, একটি বৃদ্ধি গবেষণায়, র্যান্ডম বিবৃতি সঙ্গে একটি মডেল এবং স্থির ঢাল অনুরূপ বিভিন্ন ব্যক্তিদের জন্য লাইন সমান্তরাল আমি , অথবা মডেল Y আমি টন = একটি আমি + + টি । ক্রেফ্ট এবং ডি লিউউ (1998) এইভাবে স্থির এবং র্যান্ডম সহগগুলির মধ্যে পার্থক্য করে।একটিআমিআমিYআমিটি=একটিআমি+ +টি

(২) প্রভাবগুলি যদি তারা নিজের মধ্যে আকর্ষণীয় হয় বা এলোমেলো জনসংখ্যার আগ্রহী থাকে তবে এলোমেলোভাবে স্থির হয়। সেরেল, কেসেলা এবং ম্যাককুলাচ (1992, বিভাগ 1.4) গভীরতার সাথে এই পার্থক্যটি আবিষ্কার করুন।

(3) “যখন একটি নমুনা জনসংখ্যা ক্লান্ত করে, তখন সংশ্লিষ্ট ভেরিয়েবলটি স্থির হয়; যখন নমুনা জনসংখ্যার একটি ছোট (অর্থাত্ উপেক্ষিত নয়) আনুষঙ্গিক পরিবর্তনশীল এলোমেলো হয় Green

(৪) "যদি কোনও প্রভাবটি এলোমেলো পরিবর্তনশীলের উপলব্ধির মান হিসাবে ধরে নেওয়া হয়, তবে এটিকে এলোমেলো প্রভাব বলে।" (LaMotte, 1983)

(৫) স্থির প্রভাবগুলি কমপক্ষে স্কোয়ারগুলি ব্যবহার করে (বা আরও সাধারণভাবে সর্বাধিক সম্ভাবনা) ব্যবহার করা হয় এবং এলোমেলো প্রভাব সংকোচনের সাথে অনুমান করা হয় (রবিনসন, ১৯৯১ এর পরিভাষায় "লিনিয়ার নিরপেক্ষ ভবিষ্যদ্বাণী")। এই সংজ্ঞাটি বহুমুখী মডেলিং সাহিত্যে (উদাহরণস্বরূপ, স্নিজ্ডার্স এবং বস্কার, 1999, বিভাগ 4.2) এবং একনোমেট্রিক্সে আদর্শ।

এবং লক্ষ্য করুন যে তারা সামঞ্জস্যপূর্ণ নয়রিগ্রেশন এবং মাল্টিলেভেল / হায়ারারিকিকাল মডেলগুলি ব্যবহার করে তার বই ডেটা অ্যানালাইসিসে তিনি সাধারণত এই পদগুলি ব্যবহার করা এড়িয়ে যান এবং তাদের কাজকর্মে তিনি গ্রুপ ইন্টারসেপ্ট এবং betweenালুগুলির মধ্যে স্থির বা পৃথক হওয়ার দিকে মনোনিবেশ করেন কারণ

σα20

এটি সাধারণত বায়েশিয়ান কাঠামোর সাথে সত্য - সাধারণত মিশ্র মডেলগুলির জন্য ব্যবহৃত হয় - যেখানে সমস্ত প্রভাব প্রতি সেফ এলোমেলো। আপনি যদি বায়েসিয়ান ভাবছেন, আপনি সত্যই "স্থির" প্রভাব এবং পয়েন্ট আনুমানিক সাথে উদ্বিগ্ন নন এবং সমস্ত প্রভাবগুলি এলোমেলো হিসাবে গণ্য করার ক্ষেত্রে কোনও সমস্যা নেই।

আমি এই বিষয়ে যত বেশি পড়ি, তত বেশি আমি নিশ্চিত যে এটি বরং আমরা কী অনুমান করতে পারি (বা উচিত) এবং আমরা কেবল কী ভবিষ্যদ্বাণী করতে পারি (এটি এখানে আমি আপনার নিজের জবাবটিও উল্লেখ করতে পারি) সম্পর্কে আদর্শিক আলোচনা । আপনার যদি সম্ভাব্য ফলাফলগুলির একটি এলোমেলো নমুনা থাকে তবে আপনি এলোমেলো প্রভাবগুলি ব্যবহার করেন , সুতরাং আপনি পৃথক অনুমানের বিষয়ে উদ্বিগ্ন নন এবং আপনি জনসংখ্যার প্রভাবগুলি, তারপরে পৃথক ব্যক্তিদের প্রতি যত্নশীল হন। সুতরাং আপনার প্রশ্নের উত্তর নির্ভর করে আপনি কী চান বা আপনার ডেটা প্রদত্ত স্থির প্রভাবগুলি অনুমান করতে পারেন সে সম্পর্কে আপনি কী ভাবেন তার উপরও নির্ভর করে। সমস্ত সম্ভাব্য স্তর যদি আপনার ডেটাতে অন্তর্ভুক্ত থাকে তবে আপনি পারেনস্থির প্রভাবগুলি অনুমান করুন - এছাড়াও, আপনার উদাহরণের মতো, স্তরগুলির সংখ্যা কম হতে পারে এবং এলোমেলো প্রভাবগুলির অনুমানের জন্য এটি সাধারণত ভাল হবে না এবং এর জন্য কিছু ন্যূনতম প্রয়োজনীয়তাও রয়েছে

সেরা ক্ষেত্রে দৃশ্যের যুক্তি

বলুন আপনার সীমিত পরিমাণে ডেটা এবং সীমাহীন কম্পিউটিং শক্তি রয়েছে ut এক্ষেত্রে আপনি প্রতিটি প্রভাব স্থির হিসাবে হিসাবে অনুমান করতে পারবেন, যেহেতু স্থির প্রভাবগুলি আপনাকে আরও নমনীয়তা দেয় (স্বতন্ত্র প্রভাবগুলির তুলনা করতে আমাদের সক্ষম করুন)। যাইহোক, এমনকি এই ক্ষেত্রেও, আমাদের বেশিরভাগই প্রতিটি কিছুর জন্য নির্দিষ্ট প্রভাবগুলি ব্যবহার করতে নারাজ।

উদাহরণস্বরূপ, কল্পনা করুন যে আপনি কোনও কোনও অঞ্চলের স্কুলের পরীক্ষার ফলাফলের মডেল বানাতে চান এবং আপনার কাছে অঞ্চলের 100 টি বিদ্যালয়ের ডেটা রয়েছে। এক্ষেত্রে আপনি স্কুলগুলি স্থির হিসাবে হুমকি দিতে পারেন - যেহেতু আপনার সমস্ত স্তরের ডেটা রয়েছে - তবে বাস্তবে আপনি সম্ভবত এগুলি এলোমেলো হিসাবে ভাবেন । তা কেন?

  1. একটি কারণ হ'ল সাধারণত এই জাতীয় ক্ষেত্রে আপনি পৃথক বিদ্যালয়ের প্রভাবগুলিতে আগ্রহী নন (এবং এগুলির সবগুলির তুলনা করা শক্ত) তবে বরং বিদ্যালয়ের মধ্যে একটি সাধারণ পরিবর্তনশীলতা রয়েছে।

  2. এখানে আরেকটি যুক্তি হ'ল মডেল পার্সিমনি। সাধারণত আপনি "প্রতিটি সম্ভাব্য প্রভাব" মডেলটিতে আগ্রহী নন, তাই আপনার মডেলটিতে আপনি কয়েকটি স্থির প্রভাব অন্তর্ভুক্ত করেন যা আপনি পরিবর্তনশীলতার অন্যান্য সম্ভাব্য উত্সগুলির জন্য পরীক্ষা করতে এবং নিয়ন্ত্রণ করতে চান। এটি মিশ্র প্রভাবগুলির মডেলগুলিকে পরিসংখ্যানগত মডেলিং সম্পর্কে চিন্তা করার সাধারণ পদ্ধতিতে ফিট করে যেখানে আপনি কোনও কিছুর অনুমান করেন এবং অন্যান্য জিনিসের জন্য নিয়ন্ত্রণ রাখেন। জটিল (বহুস্তর বা স্তরক্রমিক) ডেটা সহ আপনার অনেকগুলি প্রভাব অন্তর্ভুক্ত রয়েছে যার ফলে আপনি কিছুকে "স্থির" হিসাবে এবং কিছুটিকে "এলোমেলো" হিসাবে হুমকি দিয়ে থাকেন যাতে তাদের নিয়ন্ত্রণ করতে পারেন।

  3. এই দৃশ্যে আপনি বিদ্যালয়ের ফলাফলগুলির প্রতিটিটির নিজস্ব, অনন্য, প্রভাব হিসাবে বিবেচনা করবেন না, বরং বিদ্যালয়গুলিতে সাধারণভাবে কিছুটা প্রভাব ফেলবে বলে মনে করবেন না। সুতরাং এই যুক্তিটি হ'ল আমরা বিশ্বাস করি যে পৃথক বিদ্যালয়ের অনন্য প্রভাবগুলি অনুমান করা সত্যিই সম্ভব নয় এবং তাই আমরা তাদের সম্ভাব্য বিদ্যালয়ের প্রভাবগুলির এলোমেলো নমুনা হিসাবে হুমকি দিই।

মিশ্র প্রভাবগুলির মডেলগুলি "সবকিছু স্থির" এবং "সমস্ত কিছু এলোমেলো" দৃশ্যের মধ্যে রয়েছে। আমরা যে ডেটা মুখোমুখি হয়েছি তা আমাদের স্থির প্রভাব হিসাবে সমস্ত কিছু অনুমানের বিষয়ে আমাদের প্রত্যাশা কমিয়ে আনতে সাহায্য করে, তাই আমরা সিদ্ধান্ত নিই যে আমরা কোন প্রভাবগুলি তুলনা করতে চাই এবং কোন প্রভাবগুলি নিয়ন্ত্রণ করতে চাই, বা তাদের প্রভাব সম্পর্কে সাধারণ অনুভূতি রয়েছে। এটি কেবল ডেটা কী তা নয়, আমরা কীভাবে ডেটাটিকে মডেলিংয়ের সময় চিন্তা করি তাও নয়।


এখানে অনেক ভাল পয়েন্ট, @ টিম। আমি ভাবছি যে আপনার গ্রহণটি ওপিতে গুংয়ের উদাহরণে কী রয়েছে; আমার উত্তরের অধীনে মন্তব্যে দীর্ঘ আলোচনা হয়েছিল তবে আমি মনে করি এখন অবধি এটি কমবেশি সমাধান হয়েছে। আপনি যদি আমার লেখার সাথে একমত হন বা সম্ভবত একমত না হন তবে তা জেনে রাখা ভাল।
অ্যামিবা বলেছেন মোনিকা

@ অ্যামিবা এটি একটি আকর্ষণীয় উত্তর (আমি ইতিমধ্যে +1 'করেছি) এবং আমি আপনার বক্তব্যের সাথে একমত। আমি মনে করি যে মূলত গাং সঠিক (গেলম্যানের সমান - যিনি সর্বদা সঠিক :)) যে কোনও উত্তর নেই। মিশ্র ইফেক্ট মডেলগুলিকে নিযুক্ত করার জন্য একটি বিশাল সাহিত্য এবং একাধিক উপায় রয়েছে এবং কোনও স্পষ্ট-কাট পার্থক্য নেই। তদুপরি, এমন কিছু লোক আছেন যারা ডিফল্টরূপে সবসময় স্থির প্রভাব ব্যবহার করেন এবং এমন কিছু ব্যক্তি রয়েছে যাঁরা যখনই এলোমেলো প্রভাব ব্যবহার করেন, এমনকি আমরা সাধারণত স্থির প্রতিক্রিয়া হিসাবে বিবেচনা করব ... এটি ঠিক কী করতে চান তার উপরও নির্ভর করে মডেল.
টিম

13

নির্বাহী সারসংক্ষেপ

এটি প্রায়শই বলা হয়ে থাকে যে যদি সম্ভাব্য সমস্ত ফ্যাক্টর স্তরগুলি একটি মিশ্র মডেলটিতে অন্তর্ভুক্ত করা হয়, তবে এই ফ্যাক্টরটিকে একটি নির্দিষ্ট প্রভাব হিসাবে বিবেচনা করা উচিত। এটি দুটি ডিসটিন্ট কারণের জন্য অগত্যা সত্য নয়:

(1) মাত্রা সংখ্যা বড় ফেলেন, তাহলে এটি করতে জানার জন্য র্যান্ডম যেমন [অতিক্রম] ফ্যাক্টর চিকিত্সা।

আমি এখানে @ টিম এবং @ রবার্টলং উভয়ের সাথেই একমত: যদি কোনও ফ্যাক্টরটির একটি বিশাল সংখ্যক স্তর থাকে যা সমস্ত মডেলের অন্তর্ভুক্ত থাকে (যেমন বিশ্বের সমস্ত দেশ; বা কোনও দেশের সমস্ত স্কুল; অথবা সম্ভবত পুরো জনসংখ্যার বিষয়গুলি সমীক্ষা করা হয় ইত্যাদি), তবে এটিকে এলোমেলো হিসাবে গণ্য করার ক্ষেত্রে কোনও ভুল নেই --- এটি আরও পার্সোনামিয়াস হতে পারে, কিছু সংকোচনের ব্যবস্থা করতে পারে ইত্যাদি

lmer(size ~ age + subjectID)                     # fixed effect
lmer(size ~ age + (1|subjectID))                 # random effect

(২) যদি ফ্যাক্টরটি অন্য এলোমেলো প্রভাবের মধ্যে বাসা বেধে থাকে তবে এটিকে স্তরের সংখ্যার চেয়ে স্বতন্ত্রভাবে এলোমেলো হিসাবে বিবেচনা করতে হবে।

এই থ্রেডে একটি বিশাল বিভ্রান্তি ছিল (মন্তব্যগুলি দেখুন) কারণ অন্যান্য উত্তরগুলি উপরের # 1 কেস সম্পর্কিত, তবে আপনি যে উদাহরণ দিয়েছেন তা একটি ভিন্ন পরিস্থিতির উদাহরণ , এই মামলা # 2। এখানে মাত্র দুটি স্তর রয়েছে (অর্থাত্ "বৃহত সংখ্যক" নয়!) এবং তারা সমস্ত সম্ভাবনা নিঃশেষ করে দেয় তবে এগুলি অন্য এলোমেলো প্রভাবের ভিতরে নেস্টেড থাকে , এতে নেস্টেড এলোমেলো প্রভাব পাওয়া যায়।

lmer(size ~ age + (1|subject) + (1|subject:side)  # side HAS to be random

আপনার উদাহরণ বিশদ আলোচনা

আপনার কাল্পনিক পরীক্ষার পক্ষ এবং বিষয়গুলি প্রমিত শ্রেণিবদ্ধ মডেল উদাহরণে ক্লাস এবং বিদ্যালয়ের মতো সম্পর্কিত। সম্ভবত প্রতিটি স্কুলে (# 1, # 2, # 3 ইত্যাদি) ক্লাস এ এবং ক্লাস বি রয়েছে এবং এই দুটি ক্লাস মোটামুটি একই বলে মনে করা হচ্ছে। আপনি দুটি স্তরের স্থির প্রভাব হিসাবে ক্লাস এ এবং বি মডেল করবেন না; এটি একটি ভুল হবে। তবে আপনি দুটি এবং দুটি স্তরের সাথে এন্ড এবং বি ক্লাসগুলিকে "পৃথক" (অর্থাত্ অতিক্রম করা) এলোমেলো প্রভাব হিসাবে মডেল করবেন না; এটিও একটি ভুল হবে। পরিবর্তে, আপনি স্কুলের অভ্যন্তরীণ এলোমেলো প্রভাব হিসাবে ক্লাসগুলি মডেল করবেন ।

এখানে দেখুন: ক্রসড বনাম নেস্টেড এলোমেলো প্রভাবগুলি: কীভাবে তাদের পার্থক্য রয়েছে এবং কীভাবে তারা lme4 এ সঠিকভাবে নির্দিষ্ট করা হয়?

আমি=1...এন=1,2

আয়তনআমি=μ+ +αউচ্চতাআমি+ +βওজনআমি+ +γবয়সআমি+ +εআমি+ +εআমি+ +εআমি
εআমি~এন(0,σগুলিতোমার দর্শন লগ করাটিগুলি2),প্রতিটি বিষয়ের জন্য র্যান্ডম ইন্টারসেপ্ট
εআমি~এন(0,σবিষয়-সাইড2),এলোমেলো ইনট পক্ষের জন্য বিষয় নেস্টেড
εআমি~এন(0,σগোলমাল2),ত্রুটি শব্দ

যেমন আপনি নিজের লিখেছেন, "বিশ্বাস করার কোনও কারণ নেই যে ডান পা গড়ে গড়ে বাম পায়ের চেয়ে বড় হবে"। সুতরাং ডান বা বাম পায়ের কোনও "গ্লোবাল" প্রভাব (কোনও স্থির বা এলোমেলোভাবে অতিক্রম করা) হওয়া উচিত নয়; পরিবর্তে, প্রতিটি বিষয় "একটি" পা এবং "অন্য" পা রাখার কথা ভাবা যেতে পারে, এবং এই পরিবর্তনশীলতাটি আমাদের মডেলটিতে অন্তর্ভুক্ত করা উচিত। এই "একটি" এবং "অন্য" ফুটগুলি বিষয়গুলির মধ্যে নেস্ট করা হয়, তাই এলোমেলো এলোমেলো প্রভাবগুলি।

মন্তব্যের জবাবে আরও বিশদ। [সেপ্টেম্বর 26]

আমার উপরের মডেলটিতে সাবজেক্টের মধ্যে নেস্টেড এলোমেলো প্রভাব হিসাবে সাইড অন্তর্ভুক্ত রয়েছে। এখানে একটি বিকল্প মডেল, @ রবার্ট দ্বারা প্রস্তাবিত, যেখানে সাইডটি একটি নির্দিষ্ট প্রভাব:

আয়তনআমি=μ+ +αউচ্চতাআমি+ +βওজনআমি+ +γবয়সআমি+ +δপাশ+ +εআমি+ +εআমি

আমি

এটা হতে পারে না.

ক্রস এলোমেলো প্রভাব হিসাবে সাইড সহ @ গং এর অনুমানমূলক মডেলটির ক্ষেত্রেও এটি একই:

আয়তনআমি=μ+ +αউচ্চতাআমি+ +βওজনআমি+ +γবয়সআমি+ +εআমি+ +ε+ +εআমি

এটি নির্ভরতাগুলির জন্য অ্যাকাউন্টে ব্যর্থ হয়।

একটি অনুকরণের মাধ্যমে বিক্ষোভ [২ অক্টোবর]

এখানে আরে সরাসরি প্রদর্শিত হয়

আমি টানা পাঁচ বছর ধরে উভয় পায়ে পরিমাপ করা পাঁচটি বিষয় নিয়ে একটি খেলনা ডেটাসেট তৈরি করি। বয়সের প্রভাব লিনিয়ার is প্রতিটি বিষয় একটি এলোমেলো ইন্টারসেপ্ট আছে। এবং প্রতিটি বিষয়ের একটির পায়ে একটি (বাম বা ডান হয়) অন্যটির চেয়ে বড়।

set.seed(17)

demo = data.frame(expand.grid(age = 1:5,
                              side=c("Left", "Right"),
                              subject=c("Subject A", "Subject B", "Subject C", "Subject D", "Subject E")))
demo$size = 10 + demo$age + rnorm(nrow(demo))/3

for (s in unique(demo$subject)){
  # adding a random intercept for each subject 
  demo[demo$subject==s,]$size = demo[demo$subject==s,]$size + rnorm(1)*10

  # making the two feet of each subject different     
  for (l in unique(demo$side)){
    demo[demo$subject==s & demo$side==l,]$size = demo[demo$subject==s & demo$side==l,]$size + rnorm(1)*7
  }
}

plot(1:50, demo$size)

আমার ভয়ঙ্কর আর দক্ষতার জন্য ক্ষমা চাই। এখানে ডেটা দেখতে কেমন দেখাচ্ছে (প্রতিটি একটানা পাঁচটি বিন্দু কয়েক বছরের মধ্যে পরিমাপ করা এক ব্যক্তির এক ফুট হয়; প্রতিটি টানা দশটি বিন্দু একই ব্যক্তির দুই ফুট হয়):

এখানে চিত্র বর্ণনা লিখুন

এখন আমরা একগুচ্ছ মডেল ফিট করতে পারি:

require(lme4)
summary(lmer(size ~ age + side + (1|subject), demo))
summary(lmer(size ~ age + (1|side) + (1|subject), demo))
summary(lmer(size ~ age + (1|subject/side), demo))

সমস্ত মডেলের একটি স্থির প্রভাব ageএবং এর এলোমেলো প্রভাব অন্তর্ভুক্ত থাকে subjectতবে sideআলাদাভাবে চিকিত্সা করে ।

  1. sideageটি=1.8

  2. sideageটি=1.4

  3. sideageটি=37

এটি পরিষ্কারভাবে দেখায় যে sideনেস্টেড এলোমেলো প্রভাব হিসাবে বিবেচনা করা উচিত।

পরিশেষে, মন্তব্যে @ রবার্ট বিশ্বব্যাপী প্রভাবকে sideনিয়ন্ত্রণ ভেরিয়েবল হিসাবে অন্তর্ভুক্ত করার পরামর্শ দিয়েছেন । নেস্টেড এলোমেলো প্রভাব রাখার সময় আমরা এটি করতে পারি:

summary(lmer(size ~ age + side + (1|subject/side), demo))
summary(lmer(size ~ age + (1|side) + (1|subject/side), demo))

sideটি=0.5side


2
আমি সত্যিই ভাবি না যে, এই উদাহরণস্বরূপ, sideকোনও ফ্যাক্টরটি কখন এলোমেলো বনাম হিসাবে বিবেচিত হওয়া উচিত তার কোনও সাধারণ সংজ্ঞা / নির্দেশিকাগুলি পূরণ করে meets বিশেষত, ফ্যাক্টরের নমুনা স্তরের বাইরে সূচনা করা অর্থহীন। তদ্ব্যতীত, মাত্র 2 মাত্রার ফ্যাক্টর সহ, এটি স্থির হিসাবে গণ্য করা মডেলিংয়ের কাছে যাওয়ার জন্য একটি দ্ব্যর্থহীন এবং সোজা উপায় বলে মনে হয়।
রবার্ট লং

রবার্ট, উত্তরের জন্য ধন্যবাদ। হয় আমি সম্পূর্ণ বিভ্রান্ত হয়ে পড়েছি বা আমি কী বোঝাতে চাইছি তা সঠিকভাবে ব্যাখ্যা করতে ব্যর্থ হয়েছি। sideএকটি নির্দিষ্ট প্রভাব হিসাবে চিকিত্সা করার অর্থ অনুমান করা হয় যে কোনও পক্ষের (যেমন ডান) একটি নির্দিষ্ট পরিমাণে সর্বদা অন্য (বাম) এর চেয়ে বড়। এই পরিমাণটি সমস্ত লোকের জন্য সমান। এটি ওপির মনে কী ছিল তা স্পষ্টভাবে নয়। তিনি লিখেছেন যে কিছু লোকের মধ্যে ডান বড় হতে পারে এবং কিছু লোকের বাম হতে পারে। তবে, sideসম্পর্কযুক্ত ত্রুটির কারণে আমাদের অ্যাকাউন্ট করতে হবে account কেন আমরা তখন নেস্টেড এলোমেলো প্রভাব হিসাবে আচরণ করতে পারি না? এটা ঠিক স্কুলের মধ্যে ক্লাস মত।
অ্যামিবা বলছেন মনিকাকে

আমি জানি না যে এটি অগত্যা তা বোঝায়। এটি যা বলবে তা হ'ল, এই নমুনায়, উভয় পক্ষের মধ্যে নিয়মতান্ত্রিক পার্থক্য থাকতে পারে (যা নমুনা পরিবর্তনের কারণে কোনও শিল্পকর্ম হতে পারে বা নাও হতে পারে)। আমি এটি অ-স্বাধীনতার জন্য "নিয়ন্ত্রণ" হিসাবে স্থির প্রভাব হিসাবে আরও কিছু হিসাবে অন্তর্ভুক্ত করার বিষয়ে ভাবতে পছন্দ করি - একইভাবে আমরা একটি মডেলের সাথে একটি বিভ্রান্তকারী যুক্ত করব এবং এটির সহগের ব্যাখ্যা দেওয়ার চেষ্টা করার স্বপ্নও দেখি না।
রবার্ট লং

2
আমি আরও উত্তর প্রতিবিম্ব পরে আপনার উত্তর upvoting করছি। আপনি কিছু সত্যই আকর্ষণীয় পয়েন্ট উত্থাপন। এর গাণিতিক বিষয়গুলি অনুসন্ধান করার মতো মুহূর্তে আমার কাছে সময় নেই। আমি যদি সম্ভব হয় তবে খেলতে খেলতে একটি ডেটাসেটের সন্ধান করতে চাই (যদি আপনি কোনও একটি সম্পর্কে জানেন তবে দয়া করে আমাকে জানান)
রবার্ট লং

2
+1, আরও প্রতিবিম্বের উপর, আপনি এই গবেষণার অদ্ভুততা সম্পর্কে সঠিক বলে মনে করছেন। বৃহত্তর বিষয়টি যে সমস্ত সম্ভাবনা অন্তর্ভুক্ত থাকা অবস্থায় স্থির বনাম এলোমেলো প্রভাবের কোনও উত্তর নেই, এবং প্রতিটি ক্ষেত্রে পৃথকভাবে মূল্যায়ন করা উচিত, আমি অবাক হই?
গুং - মনিকা পুনরায়

7

অন্যান্য উত্তর যুক্ত করতে:

আমি মনে করি না যে আপনি সবসময় ওপিতে বর্ণিত পদ্ধতিতে একটি স্থির প্রভাব ব্যবহার করতে যুক্তিযুক্তভাবে বাধ্য are এমনকি যখন কোনও ফ্যাক্টরটিকে এলোমেলো হিসাবে বিবেচনা করা হয় তার জন্য সাধারণ সংজ্ঞা / গাইডলাইনগুলি পূরণ না হয়, তখনও যখন আমি বিপুল সংখ্যক স্তরের উপস্থিতি পাই তখনও এটিকে এলোমেলো হিসাবে মডেল করতে প্রবণতা পোষণ করতে পারি, যাতে ফ্যাক্টরটিকে স্থির হিসাবে বিবেচনা করা অনেক ডিগ্রি গ্রাস করতে পারে স্বাধীনতা এবং ফলে একটি জটিল এবং কম পার্সামোনিয়াস মডেল।


এটি একটি যুক্তিসঙ্গত বিন্দুর মতো মনে হয় এবং আমি প্রশংসা করি যে আপনি আমার উদাহরণ দ্বারা অন্ধ হন নি। আমি এ থেকে সংগ্রহ করেছি এবং @ অ্যামিবার জবাবে আপনার মন্তব্যটি, যে "যখন সেখানে একটি বিশাল সংখ্যক স্তর থাকে" (বনাম "মাত্রার 2 মাত্রার মাত্রা থাকে") মনে হয় তা গুরুত্বপূর্ণ মনে হয়।
গুং - মনিকা পুনরায়

1
+1 টি কারণ আমি এই বিন্দু সাথে একমত, বিট এটা ড্রাইভ আমাকে বাদাম যে আমি আমার বিন্দু ব্যাখ্যা করতে ব্যর্থ হয়েছে এবং বা আপনি কেউই @gung দেখতে যে আমি কি বোঝানো। sideউভয় হিসাবে স্থির হিসাবে বা ক্রস এলোমেলো প্রভাব হিসাবে চিকিত্সা অর্থ অগত্যা ধরে নেওয়া যে সমস্ত পক্ষের (পক্ষের) (বাম) এর চেয়ে সর্বদা বড় is গাং তাঁর ওপিতে যা লিখেছেন তা স্পষ্টভাবে নয়, উল্লেখ করে যে "ডান পা গড়ে গড়ে বাম পায়ের চেয়েও বড় হবে" এমন বিশ্বাস করার কোনও কারণ নেই। আমি এখনও গুং এর উদাহরণটি স্কুলগুলির মধ্যে ক্লাসের সাথে সম্পূর্ণ সাদৃশ্যগুলিতে নেস্টেড এলোমেলো প্রভাবের একটি পরিষ্কার ক্ষেত্রে হিসাবে দেখতে পাচ্ছি।
অ্যামিবা বলছেন মনিকাকে

@ মোয়েবা আকর্ষণীয় বিষয় তবে আমি তাতে রাজি নই। আমি আপনার উত্তরে মন্তব্যগুলিতে মন্তব্য করব ...
রবার্ট লং

4

আপনি যদি এমন পরিস্থিতি সম্পর্কে কথা বলছেন যেখানে আপনি আগ্রহের একটি উপাদানগুলির সমস্ত সম্ভাব্য স্তরগুলি জানেন এবং এর প্রভাবগুলি অনুমান করার জন্য ডেটাও রেখেছেন, তবে অবশ্যই এলোমেলো প্রভাব সহ আপনার স্তরগুলি উপস্থাপন করার দরকার নেই।

যে কারণটি আপনি কোনও ফ্যাক্টরের সাথে এলোমেলোভাবে প্রভাব সেট করতে চান তা হ'ল কারণ আপনি যে ফ্যাক্টরের সমস্ত স্তরের প্রভাবগুলিতে অনন্য ধারণা তৈরি করতে চান যা সাধারণত অজানা। এই ধরণের অনুমান করতে, আপনি এই ধারণাটি চাপিয়ে দেন যে সমস্ত স্তরের প্রভাবগুলি সাধারণভাবে একটি সাধারণ বিতরণ করে। তবে আপনার সমস্যাটি সেট করার পরে আপনি সমস্ত স্তরের প্রভাব অনুমান করতে পারেন। তারপরে অবশ্যই এলোমেলো প্রভাব সেট করার এবং অতিরিক্ত অনুমান আরোপের দরকার নেই।

এটি এমন পরিস্থিতির মতো যে আপনি জনসংখ্যার সমস্ত মান পেতে সক্ষম হয়েছেন (সুতরাং আপনি প্রকৃত গড়টি জানেন) তবে আপনি জনসংখ্যার কাছ থেকে একটি বড় নমুনা নেওয়ার চেষ্টা করছেন এবং নমুনা বিতরণকে আনুমানিকভাবে কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি ব্যবহার করার চেষ্টা করছেন, এবং তারপরে সত্যিকার অর্থে অনুমান করা।


2
একটি মন্তব্য: কখনও কখনও আপনার কাছে সমস্ত স্তর থাকে তবে এখনও তাদের জন্য এলোমেলো প্রভাব ব্যবহার করে। উদাহরণস্বরূপ, আপনি শিক্ষার উপর দেশভিত্তিক অধ্যয়ন পরিচালনা করেন এবং সমস্ত বিদ্যালয়ের ডেটা রাখেন, তবুও আপনি বিদ্যালয়ের জন্য এলোমেলো প্রভাব ব্যবহার করুন বরং প্রতিটি বিদ্যালয়ের জন্য ডমি ব্যবহার করবেন।
টিম
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.