সাধারণ কথায়, আপনি কীভাবে ব্যাখ্যা করবেন (সম্ভবত সাধারণ উদাহরণ সহ) স্থির প্রভাব, এলোমেলো প্রভাব এবং মিশ্র প্রভাবের মডেলগুলির মধ্যে পার্থক্য?
সাধারণ কথায়, আপনি কীভাবে ব্যাখ্যা করবেন (সম্ভবত সাধারণ উদাহরণ সহ) স্থির প্রভাব, এলোমেলো প্রভাব এবং মিশ্র প্রভাবের মডেলগুলির মধ্যে পার্থক্য?
উত্তর:
পরিসংখ্যানবিদ অ্যান্ড্রু গেলম্যান বলেছেন যে 'ফিক্সড এফেক্ট' এবং 'র্যান্ডম এফেক্ট' পদগুলির ব্যবহারগুলি কে নির্ভর করে তার উপর নির্ভর করে পরিবর্তনশীল অর্থ রয়েছে । সম্ভবত আপনি বেছে নিতে পারেন যে 5 টির মধ্যে কোন একটি সংজ্ঞা আপনার ক্ষেত্রে প্রযোজ্য। সাধারণভাবে হয় সমীকরণগুলি অনুসন্ধান করা ভাল যা লেখকরা ব্যবহার করছেন (পড়ার সময়) যে সম্ভাব্যতা মডেলটি ব্যবহার করছেন (যখন পড়ছেন) বা আপনি ব্যবহার করতে চান এমন পূর্ণ সম্ভাবনার মডেলটি লেখার জন্য (লেখার সময়) লিখলে ভাল হয়।
এখানে আমরা পাঁচটি সংজ্ঞা রূপরেখা দিয়েছি যা আমরা দেখেছি:
স্থায়ী প্রভাবগুলি ব্যক্তিদের মধ্যে স্থির থাকে এবং এলোমেলো প্রভাবগুলি পৃথক হয়। উদাহরণস্বরূপ, বৃদ্ধি সমীক্ষায়, এবং স্থির দিয়ে র্যান্ডম ইন্টারসেপ্টের একটি মডেল বিভিন্ন ব্যক্তি , বা মডেলের সমান্তরাল রেখার সাথে । ক্রেফ্ট এবং ডি লিউউ (1998) এইভাবে স্থির এবং র্যান্ডম সহগগুলির মধ্যে পার্থক্য করে। b আমি Y আমি টন = একটি আমি + + খ টি
অন্তর্নিহিত জনসংখ্যার আগ্রহ থাকলে তারা নিজের মধ্যে আকর্ষণীয় বা এলোমেলোভাবে প্রভাবিত হলে প্রভাবগুলি স্থির হয়। সেরেল, কেসেলা এবং ম্যাককুলাচ (1992, বিভাগ 1.4) গভীরতার সাথে এই পার্থক্যটি আবিষ্কার করুন।
“যখন একটি নমুনা জনসংখ্যা ক্লান্ত করে, তখন সংশ্লিষ্ট ভেরিয়েবলটি স্থির হয়; যখন নমুনা জনসংখ্যার একটি ছোট (অর্থাত্ উপেক্ষিত নয়) আনুষঙ্গিক পরিবর্তনশীল এলোমেলো হয় ”" (গ্রিন অ্যান্ড টুকি, ১৯60০)
"যদি কোনও প্রভাবটি এলোমেলো পরিবর্তনশীলের উপলব্ধির মান হিসাবে ধরে নেওয়া হয়, তবে এটিকে এলোমেলো প্রভাব বলে” "(LaMotte, 1983)
স্থির প্রভাবগুলি সর্বনিম্ন স্কোয়ার (বা আরও সাধারণভাবে সর্বাধিক সম্ভাবনা) ব্যবহার করে অনুমান করা হয় এবং সংযোজন (রবিনসন, ১৯৯১ এর পরিভাষায় "লিনিয়ার নিরপেক্ষ ভবিষ্যদ্বাণী") দ্বারা এলোমেলো প্রভাব অনুমান করা হয়। এই সংজ্ঞাটি বহুমুখী মডেলিং সাহিত্যে (উদাহরণস্বরূপ, স্নিজ্ডার্স এবং বস্কার, 1999, বিভাগ 4.2) এবং একনোমেট্রিক্সে মান in
[ গেলম্যান, 2004, বৈকল্পিক বিশ্লেষণ — কেন এটি আগের চেয়ে বেশি গুরুত্বপূর্ণ। পরিসংখ্যানগুলির অ্যানালস। ]
(4) “If an effect is assumed to be a realized value of a random variable, it is called a random effect.” (LaMotte, 1983)
জেলম্যান এবং হিলের মতো এটিতে ভাল বই রয়েছে । যা অনুসরণ করে তা মূলত তাদের দৃষ্টিভঙ্গির সংক্ষিপ্তসার।
প্রথমত, আপনার পরিভাষাগুলিতে খুব বেশি ধরা পড়া উচিত নয়। পরিসংখ্যানগুলিতে, জারগনকে নিজেরাই মডেলগুলির গাণিতিক বোঝার বিকল্প হিসাবে ব্যবহার করা উচিত নয়। এটি এলোমেলো এবং মিশ্র প্রভাবগুলির মডেলগুলির জন্য বিশেষত সত্য। "মিশ্রিত" এর অর্থ হ'ল মডেলের স্থির এবং এলোমেলো উভয় প্রভাব রয়েছে, সুতরাং আসুন স্থির এবং এলোমেলো মধ্যে পার্থক্য উপর ফোকাস করা যাক।
ধরা যাক আপনার কাছে একটি শ্রেণিবদ্ধ ভবিষ্যদ্বাণীযুক্ত একটি মডেল রয়েছে, যা আপনার পর্যবেক্ষণগুলি বিভাগের মান অনুসারে গোষ্ঠীতে বিভক্ত করে * * ভবিষ্যদ্বাণীকারীর সাথে সম্পর্কিত মডেল সহগ বা "প্রভাবগুলি" হয় স্থির বা এলোমেলো হতে পারে। দুজনের মধ্যে সবচেয়ে গুরুত্বপূর্ণ ব্যবহারিক পার্থক্যটি হ'ল:
আংশিক পুলিংয়ের সাথে এলোমেলো প্রভাবগুলি অনুমান করা হয়, তবে স্থির প্রভাবগুলি হয় না।
আংশিক পুলিংয়ের অর্থ হ'ল, যদি আপনার একটি গোষ্ঠীতে কয়েকটি ডেটা পয়েন্ট থাকে তবে গোষ্ঠীর প্রভাব অনুমানটি আংশিকভাবে অন্যান্য গোষ্ঠীর আরও প্রচুর ডেটা ভিত্তিক হবে। এটি সমস্ত গ্রুপকে পুরোপুরি পুল করে কোনও প্রভাব অনুমানের মধ্যে সমঝোতা হতে পারে, যা গোষ্ঠী-স্তরীয় প্রকরণকে মাস্ক করে এবং সমস্ত গ্রুপের জন্য আলাদাভাবে কোনও প্রভাব অনুমান করে, যা নিম্ন-নমুনা গোষ্ঠীগুলির জন্য খারাপ অনুমান দিতে পারে।
এলোমেলো প্রভাবগুলি সাধারণ-উদ্দেশ্যে পরিসংখ্যানের মডেল হিসাবে আংশিক পুলিং কৌশলটির কেবল প্রসারিত extension এটি একাধিক ভবিষ্যদ্বাণীকারী, মিশ্রিত অবিচ্ছিন্ন এবং শ্রেণীবদ্ধ ভেরিয়েবল এবং জটিল পারস্পরিক কাঠামো সহ বিভিন্ন পরিস্থিতিতে ধারণার মূলত প্রয়োগকে সক্ষম করে। (তবে দুর্দান্ত শক্তির সাথে মহান দায়িত্ব আসে: মডেলিং এবং অনুমানের জটিলতা যথেষ্ট পরিমাণে বৃদ্ধি পেয়েছে, এবং সূক্ষ্ম পক্ষপাতিত্বগুলিকে জন্ম দিতে পারে যা এড়াতে যথেষ্ট প্রয়োজন।)
এলোমেলো প্রভাবগুলির মডেলকে প্রেরণা দেওয়ার জন্য, নিজেকে জিজ্ঞাসা করুন: আপনি কেন আংশিক পুল করবেন? সম্ভবত কারণ আপনি মনে করেন যে ছোট্ট উপগোষ্ঠগুলি একটি সাধারণ গড় প্রভাব সহ কিছু বড় গ্রুপের অংশ। সাবগ্রুপ মানে বড় গ্রুপ থেকে কিছুটা বিচ্যুত হতে পারে তবে কোনও স্বেচ্ছাসেবী পরিমাণে নয়। এই ধারণাটি আনুষ্ঠানিক করতে, আমরা পোষ্ট করি যে বিচ্যুতিগুলি একটি বিতরণ অনুসরণ করে, সাধারণত গাউসিয়ান। এদিকেই এলোমেলো প্রভাবগুলির মধ্যে "র্যান্ডম" আসে: আমরা পিতামাতার কাছ থেকে উপগোষ্ঠীর বিচ্যুতিগুলি এলোমেলো ভেরিয়েবলের বিতরণ অনুসরণ করে ধরে নিই। আপনার এই ধারণাটি একবার মাথায় রাখলে মিশ্র-প্রভাবগুলির মডেল সমীকরণগুলি প্রাকৃতিকভাবে অনুসরণ করে।
দুর্ভাগ্যক্রমে, মিশ্র ইফেক্টের মডেলগুলির ব্যবহারকারীরা প্রায়শই এলোমেলো প্রভাবগুলি কী কী এবং কীভাবে তারা স্থির প্রভাবগুলির থেকে পৃথক হন সে সম্পর্কে ভ্রান্ত ধারণা রয়েছে। লোকেরা "এলোমেলো" শুনতে পায় এবং মনে করে এর অর্থ সিস্টেমটি মডেল করা সম্পর্কে খুব বিশেষ কিছু, যেমন কিছু "স্থির" করার সময় স্থির প্রভাবগুলি ব্যবহার করতে হয় যখন কোনও কিছু "এলোমেলোভাবে নমুনা" দেওয়ার সময় এলোমেলো প্রভাবগুলি ব্যবহার করতে হয়। তবে মডেল সহগগুলি একটি বিতরণ থেকে আসে তা ধরে নিয়ে বিশেষভাবে এলোমেলো কিছু নেই; এটি কেবলমাত্র একটি নরম বাধা, রিজ রিগ্রেশন-এ মডেল সহগের জন্য পেনাল্টের । এমন অনেকগুলি পরিস্থিতি রয়েছে যখন আপনি র্যান্ডম এফেক্টগুলি ব্যবহার করতে পারেন বা নাও করতে পারেন এবং "ফিক্সড" এবং "এলোমেলো" এর মধ্যে পার্থক্যটির সাথে তাদের খুব বেশি কিছু করার দরকার নেই when
দুর্ভাগ্যক্রমে, এই শর্তগুলির ফলে ধারণার বিভ্রান্তি দ্বন্দ্ব সংজ্ঞাগুলির একটি মিশ্রণের দিকে পরিচালিত করে । এই লিঙ্কের পাঁচটি সংজ্ঞাগুলির মধ্যে, সাধারণ ক্ষেত্রে কেবল # 4 সম্পূর্ণ সঠিক, তবে এটি সম্পূর্ণরূপে তথ্যহীন। ব্যবহারিক কাজের ক্ষেত্রে সেই সংজ্ঞাটি কী বোঝায় তা বুঝতে আপনাকে পুরো কাগজপত্র এবং বইগুলি পড়তে হবে (বা এটি ব্যর্থ হয়ে এই পোস্টে)।
আসুন এমন একটি ক্ষেত্রে তাকান যেখানে র্যান্ডম এফেক্টস মডেলিং দরকারী হতে পারে। ধরুন আপনি জিপ কোড দ্বারা গড় মার্কিন পরিবারের আয়ের অনুমান করতে চান। আপনার বাড়ির আয়ের এবং জিপ কোডগুলির পর্যবেক্ষণ সম্বলিত একটি বড় ডেটাসেট রয়েছে। কিছু জিপ কোডগুলি ডেটাসেটে ভালভাবে উপস্থাপিত হয়, তবে অন্যদের মধ্যে কয়েকটি পরিবার রয়েছে।
আপনার প্রাথমিক মডেলের জন্য আপনি সম্ভবত প্রতিটি জিপতে গড় আয় পাবেন। আপনার কাছে একটি জিপের জন্য প্রচুর ডেটা থাকলে এটি ভালভাবে কাজ করবে তবে আপনার খারাপ নমুনাযুক্ত জিপগুলির জন্য অনুমানগুলি উচ্চ মাত্রায় ভুগবে। আপনি সঙ্কুচিত অনুমানকারী (ওরফে আংশিক পুলিং) ব্যবহার করে এটি প্রশমিত করতে পারেন, যা সমস্ত জিপ কোডগুলি জুড়ে গড় আয়ের দিকে চূড়ান্ত মানকে ঠেলে দেবে।
তবে একটি নির্দিষ্ট জিপের জন্য আপনার কতটা সঙ্কুচিত / পুলিং করা উচিত? স্বজ্ঞাতভাবে, এটি নিম্নলিখিত উপর নির্ভর করে:
আপনি যদি এলোমেলো প্রভাব হিসাবে জিপ কোডটি মডেল করেন তবে সমস্ত জিপ কোডগুলিতে গড় আয় অনুমান উপরের সমস্ত বিষয়গুলি বিবেচনা করে পরিসংখ্যানগতভাবে সু-প্রতিষ্ঠিত সঙ্কুচিত করা হবে।
সর্বোত্তম অংশটি হ'ল এলোমেলো এবং মিশ্র প্রভাবগুলির মডেলগুলি স্বয়ংক্রিয়ভাবে হ্যান্ডেল করে (4), তারতম্য অনুমান, মডেলের সমস্ত এলোমেলো প্রভাবগুলির জন্য। এটি প্রথম নজরে যেমন মনে হয় তার থেকে এটি শক্ত: এলোমেলো প্রভাবের মডেলটিতে, অনুমান প্রক্রিয়াটি নমুনা বৈকল্পিকের জন্য অ্যাকাউন্ট করে এবং সেই অনুসারে ভেরিয়েন্সের প্রাক্কলন সঙ্কুচিত করে।
(1) - (4) হিসাবে গণ্য হওয়া, একটি এলোমেলো / মিশ্র প্রভাবগুলির মডেল কম-নমুনা গোষ্ঠীগুলির জন্য উপযুক্ত সঙ্কুচিততা নির্ধারণ করতে সক্ষম। এটি বিভিন্ন বিভিন্ন ভবিষ্যদ্বাণীকের সাথে আরও জটিল মডেলগুলি পরিচালনা করতে পারে।
যদি এটি আপনার কাছে শ্রেনীর বায়েশিয়ান মডেলিংয়ের মতো মনে হয় তবে আপনি ঠিক বলেছেন - এটি একটি নিকটাত্মীয় তবে অভিন্ন নয়। মিশ্র প্রভাবগুলির মডেলগুলি শ্রেণিবদ্ধ যেগুলি তারা সুপ্ত, অরক্ষিত প্যারামিটারগুলির জন্য বিতরণ পোষন করে তবে এগুলি সাধারণত পুরোপুরি বেইসিয়ান হয় না কারণ শীর্ষ স্তরের হাইপারপ্যারামিটারগুলিকে যথাযথ প্রিয়ার দেওয়া হবে না। উদাহরণস্বরূপ, উপরের উদাহরণে আমরা সম্ভবত একটি সাধারণ বিতরণকৃত নমুনা হিসাবে প্রদত্ত জিপটিতে গড় উপার্জনকে মিশ্রিত-পারফরম্যান্স প্রক্রিয়া দ্বারা অনুমান করা অজানা গড় এবং সিগমা সহ বিবেচনা করব। তবে, একটি (নন-বেইশিয়ান) মিশ্র প্রভাবগুলির মডেলটির সাধারণত অজানা গড় এবং সিগমা সম্পর্কিত কোনও পূর্বসূচি থাকবে না, সুতরাং এটি পুরোপুরি বায়েশিয়ান নয়। এটি বলেছিল, একটি শালীন আকারের ডেটা সেট সহ, স্ট্যান্ডার্ড মিশ্রিত প্রভাবগুলির মডেল এবং সম্পূর্ণ বায়েশিয়ান বৈকল্পিক প্রায়শই খুব অনুরূপ ফলাফল দেয়।
* যদিও এই বিষয়টির অনেকগুলি চিকিত্সা "গোষ্ঠী" এর সংকীর্ণ সংজ্ঞায় ফোকাস করে, ধারণাটি আসলে খুব নমনীয়: এটি কেবলমাত্র একটি পর্যবেক্ষণের একটি সেট যা একটি সাধারণ সম্পত্তি ভাগ করে দেয়। একটি গোষ্ঠী একক ব্যক্তির একাধিক পর্যবেক্ষণ, বা একটি বিদ্যালয়ের একাধিক লোক, বা একটি জেলার একাধিক বিদ্যালয়, বা একাধিক জাতের একজাতীয় ফল, বা একই ফসল থেকে একাধিক ধরণের উদ্ভিদ বা একাধিক ফসল সংগ্রহের সমন্বয়ে গঠিত হতে পারে group একই ধরণের উদ্ভিজ্জ ইত্যাদি। যে কোনও শ্রেণিবদ্ধ ভেরিয়েবলকে গ্রুপিং ভেরিয়েবল হিসাবে ব্যবহার করা যেতে পারে।
আমি এটি সম্পর্কে মিশ্র মডেলগুলির একটি বইয়ের অধ্যায়ে লিখেছি ( ফক্স, নেগ্রেট-ইয়ানক্লেভিচ, এবং সোসা 2014 এর অধ্যায় ); সম্পর্কিত পৃষ্ঠাগুলি (পৃষ্ঠা 311-315) গুগল বুকগুলিতে উপলব্ধ । আমি মনে করি যে প্রশ্নটি "হ্রাস এবং স্থিরতর প্রভাবের সংজ্ঞাগুলি কী?" এ হ্রাস পেয়েছে? (একটি "মিশ্র মডেল" কেবলমাত্র এমন একটি মডেল যা উভয়ই ধারণ করে)। আমার আলোচনায় তাদের আনুষ্ঠানিক সংজ্ঞা (যার জন্য আমি @ জনসালভাটিয়ারের উত্তর দ্বারা লিঙ্কিত জেলম্যান পেপারটি স্থগিত করবো) এবং তাদের ব্যবহারিক বৈশিষ্ট্য এবং ইউটিলিটি সম্পর্কে আরও কিছুটা কম বলেছি। এখানে কিছু অংশ রয়েছে:
এলোমেলো প্রভাবগুলির traditionalতিহ্যগত দৃষ্টিভঙ্গি যখন কিছু পর্যবেক্ষণের সাথে সম্পর্কিত হয় তখন সঠিক পরিসংখ্যান পরীক্ষা করার উপায় as
আমরা একটি গ্রুপিং ভেরিয়েবলের মধ্যে বিভিন্ন স্তর থেকে তথ্য একত্র করার উপায় হিসাবে এলোমেলো প্রভাবগুলিও ভাবতে পারি।
এলোমেলো প্রভাবগুলি বিশেষত কার্যকর যখন আমাদের কাছে (1) প্রচুর মাত্রা থাকে (যেমন, অনেকগুলি প্রজাতি বা ব্লক), (২) প্রতিটি স্তরের তুলনামূলকভাবে কম তথ্য (যদিও আমাদের বেশিরভাগ স্তর থেকে একাধিক নমুনা প্রয়োজন) এবং (3) অসম স্তরগুলি জুড়ে নমুনা (বাক্স 13.1)।
ঘনঘন বিশেষজ্ঞ এবং বায়েশিয়ানরা এলোমেলো প্রভাবগুলি কিছুটা আলাদাভাবে সংজ্ঞায়িত করে, যা তাদের ব্যবহারের পদ্ধতিকে প্রভাবিত করে। ঘনঘন বিশেষজ্ঞরা এলোমেলো প্রভাবগুলি শ্রেণিবদ্ধ পরিবর্তনশীল হিসাবে সংজ্ঞায়িত করেন যার স্তরগুলি বৃহত জনসংখ্যার থেকে এলোমেলোভাবে বেছে নেওয়া হয়যেমন, স্থানীয় প্রজাতির একটি তালিকা থেকে এলোমেলোভাবে বেছে নেওয়া প্রজাতি। বায়েশিয়ানরা এলোমেলো প্রভাবগুলি ভেরিয়েবলের সেট হিসাবে সংজ্ঞায়িত করে যার প্যারামিটারগুলি [সমস্ত] [একই] বন্টন থেকে আঁকা। ঘনঘনবাদী সংজ্ঞাটি দার্শনিকভাবে সুসংগত এবং আপনি গবেষকদের (পর্যালোচক এবং তদারককারীগণ সহ) এর মুখোমুখি হবেন যারা এটির জন্য জোর দিয়েছিলেন তবে এটি ব্যবহারিকভাবে সমস্যাযুক্ত হতে পারে। উদাহরণস্বরূপ, এটি সূচিত করে যে আপনি যখন নিজের ক্ষেত্রের সাইটে সমস্ত প্রজাতি পর্যবেক্ষণ করেছেন তখন আপনি প্রজাতিগুলি এলোমেলো প্রভাব হিসাবে ব্যবহার করতে পারবেন না - যেহেতু প্রজাতির তালিকা বৃহত্তর জনগোষ্ঠীর নমুনা নয় — বা বছরটিকে এলোমেলো প্রভাব হিসাবে ব্যবহার করে, যেহেতু গবেষকরা এলোমেলোভাবে নমুনাযুক্ত বছরগুলিতে খুব কমই একটি পরীক্ষা চালান — তারা সাধারণত একটানা কয়েকটা ধারাবাহিকতা ব্যবহার করেন, অথবা তারা যখন মাঠে নামতে পারে তখন বছরের হাফসেট সেট ব্যবহার করেন।
এলোমেলো প্রভাবগুলি পূর্বাভাসকারী ভেরিয়েবল হিসাবেও বর্ণনা করা যেতে পারে যেখানে আপনি নির্দিষ্ট স্তরের মধ্যে মূল্যবোধের পার্থক্য পরীক্ষা করার পরিবর্তে মূল্যগুলির বিতরণ (অর্থাত্ বিভিন্ন স্তরের প্রতিক্রিয়ার মানগুলির মধ্যে ভিন্নতা) সম্পর্কে আগ্রহ তৈরি করতে আগ্রহী।
লোকেরা মাঝে মাঝে বলে যে এলোমেলো প্রভাবগুলি "এমন কারণগুলি যা আপনি আগ্রহী নন are" এটি সর্বদা সত্য নয়। যদিও এটি প্রায়শই বাস্তুসংস্থার পরীক্ষায় ঘটে থাকে (যেখানে সাইটের মধ্যে বিভিন্নতা সাধারণত একটি উপদ্রব হয়ে থাকে) এটি কখনও কখনও খুব আগ্রহী হয় যেমন উদাহরণস্বরূপ বিবর্তনীয় গবেষণায় যেখানে জিনোটাইপের মধ্যে প্রকরণটি প্রাকৃতিক নির্বাচনের জন্য কাঁচামাল বা জনসংখ্যার অধ্যয়নের ক্ষেত্রে যেখানে বছরের পরিবর্তনের মধ্যে দীর্ঘমেয়াদী বৃদ্ধির হার কম হয়। কিছু ক্ষেত্রে স্থির প্রতিক্রিয়াগুলি অনিচ্ছাকৃত প্রকরণের নিয়ন্ত্রণের জন্যও ব্যবহৃত হয়, উদাহরণস্বরূপ, শরীরের আকারের প্রভাবগুলি নিয়ন্ত্রণ করার জন্য ভরকে কোভারিয়েট হিসাবে ব্যবহার করে।
আপনি আরও শুনবেন যে "শর্তাধীন মোডের (পূর্বাভাস) মান সম্পর্কে আপনি কিছু বলতে পারবেন না।" এটিও সত্য নয় - আপনি আনুষ্ঠানিকভাবে নাল অনুমানটি পরীক্ষা করতে পারবেন না যে মানটি শূন্যের সমান, বা যে দুটি পৃথক স্তরের মান সমান, তবে এটি পূর্বাভাসিত মানটি দেখতে এবং এমনকি পূর্বাভাসিত মানটির একটি স্ট্যান্ডার্ড ত্রুটি গণনা করা পুরোপুরি বুদ্ধিমান (যেমন, 13.1 চিত্রের শর্তাধীন মোডের চারপাশে ত্রুটি বারগুলি দেখুন)।
বায়েশিয়ান কাঠামোর এলোমেলো প্রভাবগুলির একটি সহজ সংজ্ঞা রয়েছে। বায়েশিয়ান পদ্ধতির অধীনে একটি স্থির প্রভাব হ'ল যেখানে আমরা প্রতিটি প্যারামিটারটি অনুমান করি (উদাহরণস্বরূপ, একটি বংশের মধ্যে প্রতিটি প্রজাতির গড়) স্বাধীনভাবে (স্বতন্ত্রভাবে নির্দিষ্ট প্রিয়ার সহ), যখন এলোমেলো প্রভাবের জন্য প্রতিটি স্তরের পরামিতিগুলি আঁকানো হিসাবে মডেল করা হয় একটি বিতরণ থেকে (সাধারণত সাধারণ); মানক পরিসংখ্যান স্বরলিপিতে, ।
আমি উপরে বলেছি যে যখন গ্রুপিং ভেরিয়েবলের অনেক পরিমাপ স্তর থাকে তখন এলোমেলো প্রভাবগুলি সবচেয়ে বেশি কার্যকর। বিপরীতে, গোষ্ঠীকরণের ভেরিয়েবলের খুব কম মাত্রা থাকলে এলোমেলো প্রভাবগুলি সাধারণত অকার্যকর হয়। আপনি যখন গ্রুপিং ভেরিয়েবলের পাঁচটি স্তরের কম থাকে তখন আপনি সাধারণত এলোমেলো প্রভাব ব্যবহার করতে পারবেন না এবং এলোমেলো প্রভাবের ভেরিয়েন্সের অনুমানটি আটটিরও কম স্তরের সাথে অস্থির, কারণ আপনি খুব ছোট নমুনা থেকে কোনও বৈকল্পিক অনুমান করার চেষ্টা করছেন।
স্থির প্রভাব: পরীক্ষামূলক কিছু সরাসরি পরিচালনা করে এবং প্রায়শই পুনরাবৃত্তিযোগ্য, যেমন, ড্রাগ প্রশাসন - একটি গ্রুপ মাদক পায়, একটি গ্রুপ প্লেসবো পায়।
এলোমেলো প্রভাব: এলোমেলো পরিবর্তনের উত্স / পরীক্ষামূলক ইউনিট যেমন, ক্লিনিকাল পরীক্ষার জন্য জনসংখ্যা থেকে আঁকা ব্যক্তি (এলোমেলোভাবে)। এলোমেলো প্রভাবগুলি তারতম্যটি অনুমান করে
মিশ্র প্রভাব: উভয়কেই অন্তর্ভুক্ত করে, এই ক্ষেত্রে স্থির প্রভাব জনসংখ্যা স্তরের সহগের অনুমান করে থাকে, যখন এলোমেলো প্রভাবগুলি প্রভাবের প্রতিক্রিয়ায় পৃথক পার্থক্যের জন্য দায়বদ্ধ করতে পারে, উদাহরণস্বরূপ, প্রতিটি ব্যক্তি বিভিন্ন অনুষ্ঠানে ড্রাগ এবং প্লাসবো উভয়ই গ্রহণ করে, স্থির করে প্রভাব ওষুধের প্রভাব অনুমান করে, এলোমেলো প্রভাবের শর্তাদি প্রতিটি ব্যক্তিকে ড্রাগের জন্য আলাদাভাবে প্রতিক্রিয়া জানাতে দেয়।
মিশ্র প্রভাবগুলির সাধারণ বিভাগগুলি - পুনরাবৃত্তি ব্যবস্থা, দ্রাঘিমাংশ, শ্রেণিবদ্ধ, বিভাজন-প্লট।
আমি এখান থেকে এই প্রশ্নে এসেছি , একটি সম্ভাব্য সদৃশ।
ইতিমধ্যে বেশ কয়েকটি দুর্দান্ত উত্তর রয়েছে, তবে গ্রহণযোগ্য উত্তরে বলা হয়েছে, শব্দটির অনেকগুলি বিভিন্ন (তবে সম্পর্কিত) ব্যবহার রয়েছে, সুতরাং এটি ইকোনোমেট্রিক্সে নিযুক্ত হিসাবে দৃষ্টিভঙ্গি দেওয়া মূল্যবান হতে পারে, যা এখনও এখানে পুরোপুরি সম্বোধিত হয়নি বলে মনে হয় ।
একটি ত্রুটি সহকারী ম্যাট্রিক্সকে নেতৃত্ব দেয় যা "গোলাকৃতির" নয় (সুতরাং পরিচয়ের ম্যাট্রিক্সের একাধিক নয়), যাতে এলোমেলো প্রভাবগুলির মতো একটি জিএলএস-টাইপ পদ্ধতির ব্যবস্থা হবে ওএলএসের চেয়ে আরও দক্ষ হতে হবে)।
m
এখানে কোড তৈরি করা হয়েছে যা ডেটা উত্পন্ন করে এবং যা ইতিবাচক আরই অনুমান এবং একটি "সঠিক", নেতিবাচক এফ অনুমান উত্পাদন করে। (এটি বলেছিল, আরই অনুমানগুলি অন্যান্য বীজের জন্যও প্রায়শই নেতিবাচক হবে, উপরে দেখুন see)
library(Jmisc)
library(plm)
library(RColorBrewer)
# FE illustration
set.seed(324)
m = 8
n = 12
step = 5
alpha = runif(n,seq(0,step*n,by=step),seq(step,step*n+step,by=step))
beta = -1
y = X = matrix(NA,nrow=m,ncol=n)
for (i in 1:n) {
X[,i] = runif(m,i,i+1)
X[,i] = rnorm(m,i)
y[,i] = alpha[i] + X[,i]*beta + rnorm(m,sd=.75)
}
stackX = as.vector(X)
stackY = as.vector(y)
darkcols <- brewer.pal(12, "Paired")
plot(stackX,stackY,col=rep(darkcols,each=m),pch=19)
unit = rep(1:n,each=m)
# first two columns are for plm to understand the panel structure
paneldata = data.frame(unit,rep(1:m,n),stackY,stackX)
fe <- plm(stackY~stackX, data = paneldata, model = "within")
re <- plm(stackY~stackX, data = paneldata, model = "random")
আউটপুট:
> fe
Model Formula: stackY ~ stackX
Coefficients:
stackX
-1.0451
> re
Model Formula: stackY ~ stackX
Coefficients:
(Intercept) stackX
18.34586 0.77031
পার্থক্যটি কেবলমাত্র বেইসিয়ার পরিসংখ্যানের প্রসঙ্গেই অর্থবহ। বায়েশিয়ান পরিসংখ্যানগুলিতে, সমস্ত মডেলের পরামিতিগুলি "এলোমেলো"।
ইকোনোমেট্রিক্সে, শর্তাদি সাধারণত রৈখিক মডেলগুলিতে সাধারণত প্রয়োগ করা হয়, যেখানে মডেলটি ফর্মের
ইন রৈখিক মডেল , একটি র্যান্ডম প্রভাব উপস্থিতিতে OLS ঔজ্জ্বল্যের প্রেক্ষাপটে মূল্নির্ধারক এর অসঙ্গতি ফলে না। তবে, এলোমেলো প্রভাবের প্রাক্কলনকারী (সম্ভাব্য জেনারেলাইজড ন্যূনতম স্কোয়ারগুলির মতো) ব্যবহার করার ফলে আরও দক্ষ अनुमान ক তৈরি হবে ।
ইন অ রৈখিক মডেল যেমন probit, টবিট হিসাবে,, ..., একটি র্যান্ডম প্রভাব উপস্থিতি, সাধারণ, একটি অসঙ্গত মূল্নির্ধারক স্থাপিত হবে। একটি এলোমেলো প্রভাবের অনুমানকারী ব্যবহারের পরে ধারাবাহিকতা পুনরুদ্ধার হবে।
উভয় রৈখিক এবং অ-রৈখিক মডেলগুলির জন্য, স্থির প্রভাবগুলি পক্ষপাতদুষ্ট ফলাফল করে। যাইহোক, লিনিয়ার মডেলগুলিতে এমন রূপান্তর রয়েছে যা ব্যবহার করা যেতে পারে (যেমন প্রথম পার্থক্য বা কৃতজ্ঞতা), যেখানে রুপান্তরিত তথ্যের উপর ওএলএসের ধারাবাহিক অনুমানের ফলস্বরূপ। অ-লিনিয়ার মডেলগুলির জন্য, এখানে কয়েকটি ব্যতিক্রম রয়েছে যেখানে রূপান্তরগুলি বিদ্যমান, স্থির প্রভাবগুলির লগইট একটি উদাহরণ being
উদাহরণ: র্যান্ডম এফেক্টস প্রবিট। অনুমান করা
এবং পর্যবেক্ষণ ফলাফল হয়
পুঞ্জিকৃত সর্বাধিক সম্ভাবনা মূল্নির্ধারক নমুনা গড় ছোট
অবশ্যই, এখানে লগ এবং পণ্যটি সহজতর করা হয়েছে, তবে শিক্ষাগত কারণে, সমীকরণটি এলোমেলো প্রভাবগুলির প্রাক্কলকের সাথে তুলনীয় করে তোলে যা ফর্মটি রয়েছে
সত্যিকার অর্থে কোনও সংজ্ঞা নয়, তবে আমি নিম্নলিখিত স্লাইডগুলি পছন্দ করি: মিশ্র মডেল এবং সমাজবিজ্ঞানীদের কেন তাদের ( আয়না ) ব্যবহার করা উচিত , ড্যানিয়েল এজরা জনসনের কাছ থেকে। একটি সংক্ষিপ্ত পুনরুদ্ধার 4 স্লাইডে দেওয়া হয় যদিও এটি বেশিরভাগ মনস্তাত্ত্বিক স্টাডিজকে কেন্দ্র করে, এটি প্রথম পদক্ষেপ হিসাবে খুব কার্যকর।
প্যানেল ডেটাতে লিনিয়ার রিগ্রেশনগুলি করার সময় একনোমেট্রিক্স থেকে এলোমেলো এবং স্থির প্রভাবের মডেলগুলির জন্য আরও একটি বাস্তব ব্যবহারিক দৃষ্টিভঙ্গি আসে । যদি আপনি পৃথক / গোষ্ঠী অনুসারে একাধিক নমুনা সহ একটি ডেটাসেটে বর্ণনামূলক ভেরিয়েবল এবং ফলাফল ভেরিয়েবলের মধ্যে অ্যাসোসিয়েশন অনুমান করে থাকেন তবে এটি আপনার ব্যবহার করতে চান এমন কাঠামো।
প্যানেল ডেটার একটি ভাল উদাহরণ হ'ল ব্যক্তিদের একটি সেট থেকে বার্ষিক পরিমাপ:
যদি আমরা অনুশীলন এবং ওজন পরিবর্তনের মধ্যে সম্পর্কটি বোঝার চেষ্টা করি, তবে আমরা নিম্নলিখিত রেগ্রেশন সেট আপ করব:
সুতরাং, মূল প্রশ্নটি কোন মডেলটি উপযুক্ত তা নির্ধারণ করা। উত্তর হউসমান টেস্ট । এটি ব্যবহারের জন্য আমরা উভয় স্থির এবং এলোমেলো প্রভাবগুলি রিগ্রেশন করি এবং তারপরের গুণাগুণগুলি অনুমানযোগ্যভাবে উল্লেখযোগ্যভাবে বিভক্ত হয় কিনা তা দেখার জন্য হাউসমান টেস্ট প্রয়োগ করে। যদি তারা ডাইভারেজ করে তবে এন্ডোজেনিটি প্লে হয় এবং একটি ফিক্সড এফেক্টস মডেল সেরা পছন্দ। অন্যথায়, আমরা এলোমেলো প্রভাব সহ যাব।