ইন্ট্রাক্লাস পারস্পরিক সম্পর্ক সহগ বনাম এফ-পরীক্ষা (একমুখী আনোভা)?

আমি ইন্ট্রাক্লাস পারস্পরিক সম্পর্ক সহগ এবং একমুখী আনোভা সম্পর্কে কিছুটা বিভ্রান্ত। যেহেতু আমি এটি বুঝতে পারি, উভয়ই আপনাকে বলে যে কোনও গোষ্ঠীর মধ্যে একই ধরণের পর্যবেক্ষণগুলি কীভাবে হয়, অন্য দলের পর্যবেক্ষণের তুলনায়।

কেউ কি আরও কিছুটা আরও ভালভাবে ব্যাখ্যা করতে পারেন, এবং সম্ভবত সেই পরিস্থিতি (গুলি) ব্যাখ্যা করতে পারেন যেখানে প্রতিটি পদ্ধতি আরও সুবিধাজনক?

— blep
সূত্র

দয়া করে নির্ভরযোগ্যতা বা আন্তঃ-রাটার ট্যাগগুলি দেখার জন্য সময় দিন। আইসিসি একটি আনোভা টেবিলের উপর ভিত্তি করে তৈরি হয়েছে, তবে এফ-টেস্টের মতো বন্টনমূলক বৈশিষ্ট্যগুলি সহ একক পরীক্ষার পরিসংখ্যান তৈরি করার পরিবর্তে ধারণাটি কেবল বৈকল্পিক উপাদানগুলির বিশ্লেষণের জন্য। আপনার মনে কোন প্রয়োগ রয়েছে?

— chl

@ সিএইচএল আমি গোষ্ঠীযুক্ত ডেটার জন্য পৃথক স্কোর বিশ্লেষণ করতে চাইছি to আমি কিছু কাগজপত্র পিতামাতা ও শিশুদের প্রতিক্রিয়াগুলির মধ্যে কোনও উল্লেখযোগ্য পার্থক্য রয়েছে কিনা তা জানাতে আইসিসি ব্যবহার করে পিতামাতার এবং বাচ্চার স্কোরের মধ্যে পার্থক্য পরীক্ষা করে দেখেছি। আমি মনে করি আইসিসি এখানে আমি যা চাই তা চাই, তবে আমি যেমন উল্লেখ করেছি, দুজনের মধ্যে পার্থক্যটি আমি সত্যিই বুঝতে পারি না। আমি আরও জিজ্ঞাসা করতে দ্বিধা বোধ করি, তবে আপনি কি কোনও ভাল (বেসিক) উল্লেখ জানেন? আমার পরিসংখ্যানের পটভূমি লিনিয়ার রিগ্রেশন এ থেমে গেছে এবং আমার মনে হয় যে আমি এমন প্রশ্ন জিজ্ঞাসা করছি যা ভালভাবে তৈরি করা হয়নি। ধন্যবাদ.

— বিকাশ

দেখে মনে হচ্ছে আপনার কাছে ডেটা যুক্ত করা আছে। পৃথক গোষ্ঠীগুলি বিবেচনা করার সময় (পিতা-মাতা বনাম তাদের সন্তানদের) বিবেচনা করার সময় এবং স্কোর নির্ভরযোগ্যতার প্রতিবেদন দেওয়ার জন্য আইসিসি ব্যবহার করার সময় আপনি তথ্যের কিছু অংশ ফেলে দেবেন, অর্থাত্ পিতা-মাতার কাছ থেকে রেটিং এবং তাদের আপেক্ষিক কাজটি একটি ধারাবাহিক উপায়ে করা হোক। আপনার দুটি আইসিসি কেবল আপনাকে জানিয়ে দেবে যে দুটি সিরিজই স্বতন্ত্র বলে ধরে নেওয়া স্কোরগুলি "নির্ভরযোগ্য" কিনা, এই বিবেচনায় যে বৈকল্পিকতার উল্লেখযোগ্য অংশটি রেটার ইফেক্টের দ্বারা গণ্য হতে পারে। (...)

— chl

(...) সংক্ষেপে, আপনি যদি পিতামাতার রেটিং বাচ্চাদের চেয়ে বেশি নির্ভরযোগ্য হয় তা দেখাতে চান, তবে আইসিসি ব্যবহার করা ভাল; অন্যদিকে, আপনি যদি পিতামাতার রেটিংগুলি বাচ্চাদের রেটিংয়ের সাথে কীভাবে সম্পর্কিত তা অধ্যয়ন করতে চান তবে আপনি অন্য ধরণের বিশ্লেষণ (অবিকল, ডায়াডিক ডেটার বিশ্লেষণ) অবলম্বন করতে পারেন।

— chl

উভয় পদ্ধতিই একই ধারণার উপর নির্ভর করে, পর্যবেক্ষিত ভিন্নতাটি বিভিন্ন অংশ বা উপাদানগুলিতে দ্রবীভূত করার ক্ষেত্রে। তবে, আমরা আইটেমগুলি এবং / অথবা রেটারগুলি স্থির বা এলোমেলো প্রভাব হিসাবে বিবেচনা করি কিনা তার মধ্যে সূক্ষ্ম পার্থক্য রয়েছে। মোট পরিবর্তনশীলতার কোন অংশটি মধ্যবর্তী ফ্যাক্টর দ্বারা ব্যাখ্যা করা হয়েছে (বা অবশিষ্টাংশের মধ্যে বৈকল্পিকতা কতটা বিচ্ছিন্ন হয়), এফ-টেস্ট খুব বেশি কিছু বলে না। কমপক্ষে এটি একটি একমুখী আনোভা সম্পর্কিত যেখানে আমরা একটি নির্দিষ্ট প্রভাব ধরে নিই (এবং যা আইসিসির সাথে মিলিত (১,১) নীচে বর্ণিত)। অন্যদিকে, আইসিসি বেশ কয়েকটি "এক্সচেঞ্জযোগ্য" রাটারের জন্য রেটিং নির্ভরযোগ্যতা বা বিশ্লেষণী ইউনিটের মধ্যে একচ্ছত্রতার মূল্যায়ন করার সময় একটি সীমাবদ্ধ সূচক সরবরাহ করে।

আমরা সাধারণত বিভিন্ন ধরণের আইসিসির মধ্যে নিম্নলিখিত পার্থক্য করি। এটি শ্রৌত এবং ফ্লাইসের (1979) এর চূড়ান্ত কাজ থেকে নিম্নলিখিত:

একমুখী র্যান্ডম এফেক্টস মডেল , আইসিসি (1,1): প্রতিটি আইটেম বিভিন্ন রেটার দ্বারা রেট করা হয় যারা সম্ভাব্য রাটারগুলির বৃহত পুল থেকে নমুনা হিসাবে বিবেচিত হয়, তাই এগুলিকে এলোমেলো প্রভাব হিসাবে ধরা হয়; আইসিসিকে তারপরে বিষয় / আইটেমের বৈকল্পিক হিসাবে বিবেচিত মোট বৈকল্পিকের% হিসাবে ব্যাখ্যা করা হয়। একে বলা হয় ধারাবাহিকতা আইসিসি।
দ্বি-মুখী র্যান্ডম এফেক্টস মডেল , আইসিসি (২,১): উভয় উপাদান - রাটার এবং আইটেম / বিষয় - এ এলোমেলো প্রভাব হিসাবে দেখা হয় এবং আমাদের অবশিষ্টাংশগুলি ছাড়াও দুটি ভিন্ন উপাদান (বা স্কোয়ারের অর্থ) রয়েছে; আমরা আরও ধরে নিই যে রাটারগুলি সমস্ত আইটেম / বিষয় মূল্যায়ন করে; আইসিসি এক্ষেত্রে রেটার + আইটেম / বিষয়গুলিকে দায়ী করতে পারে এমন বৈকল্পিকতার%% দেয়।
দ্বিমুখী মিশ্র মডেল , আইসিসি (৩,১): একমুখী পদ্ধতির বিপরীতে, এখানে রাটারগুলি স্থির প্রভাব হিসাবে বিবেচিত হয় (হাতের নমুনার বাইরে কোনও সাধারণীকরণ হয় না) তবে আইটেম / বিষয়গুলি এলোমেলো প্রভাব হিসাবে বিবেচিত হয়; বিশ্লেষণের একক ব্যক্তি বা গড় রেটিং হতে পারে।

এটি তাদের টেবিলের 1 থেকে 3 টি মামলার সাথে মিলে যায়। আমরা লক্ষ্য করেছি যে পর্যবেক্ষণ করা রেটিংগুলি বেশ কয়েকটি রেটিংয়ের গড় (তাদের আইসিসি (1, কে), আইসিসি (2, কে) বলা হয় কিনা তার উপর নির্ভর করে একটি অতিরিক্ত পার্থক্য তৈরি করা যেতে পারে, এবং আইসিসি (3, কে)) বা না।

সংক্ষেপে, আপনাকে সঠিক মডেলটি বেছে নিতে হবে (একমুখী বনাম দ্বি-মুখী), এবং এটি শ্রাউট এবং ফ্লাইসের কাগজে মূলত আলোচিত। একমুখী মডেল দ্বি-মুখী মডেলের তুলনায় ছোট মান অর্জন করে; একইভাবে, একটি এলোমেলো-প্রভাব মডেল সাধারণত স্থির-প্রভাব মডেলের চেয়ে কম মান দেয়। একটি স্থির-প্রতিক্রিয়া মডেল থেকে প্রাপ্ত একটি আইসিসি র‌্যাটারগুলির ধারাবাহিকতা (কারণ আমরা র‌টারের বৈচিত্র্যকে উপেক্ষা করি) মূল্যায়ন করার উপায় হিসাবে বিবেচিত হয় , যখন একটি এলোমেলো-প্রভাব মডেলের জন্য আমরা রাটার চুক্তির একটি প্রাক্কলনের কথা বলি (রাটারগুলি বিনিময়যোগ্য কিনা তা)। কেবল দ্বি-দ্বীনের মডেলগুলি রাটার এক্স সাবজেক্ট ইন্টারঅ্যাকশনকে অন্তর্ভুক্ত করে, যা আনপিকালিক্যাল রেটিং প্যাটার্নগুলি উন্মোচনের চেষ্টা করার সময় আগ্রহী হতে পারে।

নিম্নলিখিত চিত্রণ নির্দ্ধিধায় একটি কপি / থেকে উদাহরণস্বরূপ পেস্ট হয় ICC()মধ্যে Psych প্যাকেজ (ডেটা Shrout এবং Fleiss, 1979 থেকে আসা)। তথ্য 4 জন বিচারক (জে) নিয়ে 6 টি বিষয় বা লক্ষ্য (এস) নির্ধারণ করে এবং নীচে সংক্ষিপ্ত করা হয় (আমি ধরে নেব যে এটি নামক আর ম্যাট্রিক্স হিসাবে সঞ্চিত আছে sf)

   J1 J2 J3 J4
S1  9  2  5  8
S2  6  1  3  2
S3  8  4  6  8
S4  7  1  2  6
S5 10  5  6  9
S6  6  2  4  7

এই উদাহরণটি আকর্ষণীয় কারণ এটি দেখায় যে কীভাবে মডেলের পছন্দ ফলাফলকে প্রভাবিত করতে পারে, তাই নির্ভরযোগ্যতা অধ্যয়নের ব্যাখ্যা। সমস্ত ICC টি আইসিসি মডেল নিম্নরূপ (শ্রোট এবং ফ্লাইসের কাগজে এটি টেবিল ৪)

Intraclass correlation coefficients 
                         type  ICC    F df1 df2       p lower bound upper bound
Single_raters_absolute   ICC1 0.17  1.8   5  18 0.16477      -0.133        0.72
Single_random_raters     ICC2 0.29 11.0   5  15 0.00013       0.019        0.76
Single_fixed_raters      ICC3 0.71 11.0   5  15 0.00013       0.342        0.95
Average_raters_absolute ICC1k 0.44  1.8   5  18 0.16477      -0.884        0.91
Average_random_raters   ICC2k 0.62 11.0   5  15 0.00013       0.071        0.93
Average_fixed_raters    ICC3k 0.91 11.0   5  15 0.00013       0.676        0.99

যেমন দেখা যায়, রাটারগুলিকে স্থির প্রভাব হিসাবে বিবেচনা করে (অতএব র‌্যাটারগুলির বিস্তৃত পুলকে সাধারণীকরণের চেষ্টা করা নয়) পরিমাপের এককতার জন্য অনেক বেশি মান পাওয়া যাবে। ( আইআরএল প্যাকেজ ( icc()) এর সাথে অনুরূপ ফলাফল পাওয়া যেতে পারে ), যদিও আমাদের অবশ্যই মডেল ধরণের এবং বিশ্লেষণের ইউনিটের জন্য পৃথক বিকল্পের সাথে খেলতে হবে)

আনোভা পদ্ধতি আমাদের কী বলে? প্রাসঙ্গিক গড় স্কোয়ারগুলি পেতে আমাদের দুটি মডেল ফিট করতে হবে:

একমুখী মডেল যা কেবলমাত্র বিষয় বিবেচনা করে; এটি (গ্রুপ-এমএস, বিএমএস) -র মধ্যে নির্ধারিত লক্ষ্যগুলি পৃথক করতে এবং ত্রুটি-শর্তের (ডাব্লুএমএস) মেয়াদটির একটি অনুমান পেতে পারে
একটি দ্বি-মুখী মডেল যা বিষয়টিকে + রাটার + তাদের ইন্টারঅ্যাকশন বিবেচনা করে (যখন কোনও প্রতিলিপি নেই, এই শেষ শব্দটি বাকী অংশগুলির সাথে মিশ্রিত হবে); এটি রেটার মূল প্রভাব (জেএমএস) অনুমান করতে দেয় যা আমরা যদি কোনও এলোমেলো প্রভাবের মডেলটি ব্যবহার করতে চাই তবে তার জন্য হিসাব করা যায় (যেমন, আমরা এটিকে মোট চলকটিতে যুক্ত করব)

এফ-টেস্টটি দেখার দরকার নেই, কেবলমাত্র এমএসই এখানে আগ্রহী।

library(reshape)
sf.df <- melt(sf, varnames=c("Subject", "Rater"))
anova(lm(value ~ Subject, sf.df))
anova(lm(value ~ Subject*Rater, sf.df))

এখন, আমরা একটি প্রসারিত আনোভা টেবিলের বিভিন্ন টুকরোগুলি একত্রিত করতে পারি যা দেখতে নীচে দেখানো মত দেখাচ্ছে (এটি শ্রোট এবং ফ্লাইসের কাগজে টেবিল 3):

_{(উত্স: mathurl.com )}

যেখানে প্রথম দুটি সারি একমুখী মডেল থেকে আসে, সেখানে পরের দুটি সারি দ্বি-মুখী আনোভা থেকে আসে।

শ্রাউট এবং ফ্লাইসের নিবন্ধের সমস্ত সূত্রগুলি চেক করা সহজ এবং একক মূল্যায়নের জন্য নির্ভরযোগ্যতাটি অনুমান করার জন্য আমাদের যা কিছু দরকার তা আমাদের কাছে রয়েছে । একাধিক মূল্যায়নের গড় (যা প্রায়শই আন্তঃ-রাটার গবেষণায় আগ্রহের পরিমাণের জন্য) নির্ভরযোগ্যতা সম্পর্কে কী ? হেজেস এবং রেভিকি (২০০৫) অনুসরণ করে, দ্বি-পথে র্যান্ডম-এফেক্টস মডেলটি বাদ দিয়ে কেবল আমাদের এমএসএসের অনুপাতটি পুনরায় লিখতে হবে, কেবল ডিনোমিনেটরে বিবেচিত মোট এমএস পরিবর্তন করে উপরের পচন থেকে এটি পাওয়া যেতে পারে।

আইসিসি (1,1) = (বিএমএস-ডাব্লুএমএস) / (বিএমএস + (কে-1) • ডাব্লুএমএস) এর ক্ষেত্রে সামগ্রিক নির্ভরযোগ্যতা (বিএমএস-ডাব্লুএমএস) / বিএমএস=0.443 হিসাবে গণনা করা হয়।
আইসিসি (২,১) = (বিএমএস-ইএমএস) / (বিএমএস + (কে -১) • ইএমএস + কে • (জেএমএস-ইএমএস) / এন) এর সামগ্রিক নির্ভরযোগ্যতা হ'ল (এন • (বিএমএস-ইএমএস)) / (n • BMS + + JMS-একটি EMS) = 0,620।
অবশেষে, আইসিসি (3,1) = (বিএমএস-ইএমএস) / (বিএমএস + (কে -1) • ইএমএস) এর জন্য আমাদের (বিএমএস-ইএমএস) / বিএমএস=0.909 এর একটি নির্ভরযোগ্যতা রয়েছে।

আবার, আমরা দেখতে পাই যে রাটারগুলিকে স্থির প্রভাব হিসাবে বিবেচনা করার সময় সামগ্রিক নির্ভরযোগ্যতা বেশি।

তথ্যসূত্র

শ্রৌত, পিই এবং ফ্লাইস, জেএল (1979) ইন্ট্রাক্লাস পারস্পরিক সম্পর্ক: রেটার নির্ভরযোগ্যতা মূল্যায়নে ব্যবহার । মনস্তাত্ত্বিক বুলেটিন , 86, 420-3428।
হেজ, আরডি এবং রেভিকি, ডি (2005)। নির্ভরযোগ্যতা এবং বৈধতা (প্রতিক্রিয়াশীলতা সহ)। ফায়ার্স, পি। ও হেজেস, আরডি (সংস্করণ), ক্লিনিকাল ট্রায়ালসে লাইফের লাইফের মূল্যায়ন , ২ য় সংস্করণ, পৃষ্ঠা ২৩-৩৯। অক্সফোর্ড ইউনিভার্সিটি প্রেস.

— chl
সূত্র