উভয় পদ্ধতিই একই ধারণার উপর নির্ভর করে, পর্যবেক্ষিত ভিন্নতাটি বিভিন্ন অংশ বা উপাদানগুলিতে দ্রবীভূত করার ক্ষেত্রে। তবে, আমরা আইটেমগুলি এবং / অথবা রেটারগুলি স্থির বা এলোমেলো প্রভাব হিসাবে বিবেচনা করি কিনা তার মধ্যে সূক্ষ্ম পার্থক্য রয়েছে। মোট পরিবর্তনশীলতার কোন অংশটি মধ্যবর্তী ফ্যাক্টর দ্বারা ব্যাখ্যা করা হয়েছে (বা অবশিষ্টাংশের মধ্যে বৈকল্পিকতা কতটা বিচ্ছিন্ন হয়), এফ-টেস্ট খুব বেশি কিছু বলে না। কমপক্ষে এটি একটি একমুখী আনোভা সম্পর্কিত যেখানে আমরা একটি নির্দিষ্ট প্রভাব ধরে নিই (এবং যা আইসিসির সাথে মিলিত (১,১) নীচে বর্ণিত)। অন্যদিকে, আইসিসি বেশ কয়েকটি "এক্সচেঞ্জযোগ্য" রাটারের জন্য রেটিং নির্ভরযোগ্যতা বা বিশ্লেষণী ইউনিটের মধ্যে একচ্ছত্রতার মূল্যায়ন করার সময় একটি সীমাবদ্ধ সূচক সরবরাহ করে।
আমরা সাধারণত বিভিন্ন ধরণের আইসিসির মধ্যে নিম্নলিখিত পার্থক্য করি। এটি শ্রৌত এবং ফ্লাইসের (1979) এর চূড়ান্ত কাজ থেকে নিম্নলিখিত:
- একমুখী র্যান্ডম এফেক্টস মডেল , আইসিসি (1,1): প্রতিটি আইটেম বিভিন্ন রেটার দ্বারা রেট করা হয় যারা সম্ভাব্য রাটারগুলির বৃহত পুল থেকে নমুনা হিসাবে বিবেচিত হয়, তাই এগুলিকে এলোমেলো প্রভাব হিসাবে ধরা হয়; আইসিসিকে তারপরে বিষয় / আইটেমের বৈকল্পিক হিসাবে বিবেচিত মোট বৈকল্পিকের% হিসাবে ব্যাখ্যা করা হয়। একে বলা হয় ধারাবাহিকতা আইসিসি।
- দ্বি-মুখী র্যান্ডম এফেক্টস মডেল , আইসিসি (২,১): উভয় উপাদান - রাটার এবং আইটেম / বিষয় - এ এলোমেলো প্রভাব হিসাবে দেখা হয় এবং আমাদের অবশিষ্টাংশগুলি ছাড়াও দুটি ভিন্ন উপাদান (বা স্কোয়ারের অর্থ) রয়েছে; আমরা আরও ধরে নিই যে রাটারগুলি সমস্ত আইটেম / বিষয় মূল্যায়ন করে; আইসিসি এক্ষেত্রে রেটার + আইটেম / বিষয়গুলিকে দায়ী করতে পারে এমন বৈকল্পিকতার%% দেয়।
- দ্বিমুখী মিশ্র মডেল , আইসিসি (৩,১): একমুখী পদ্ধতির বিপরীতে, এখানে রাটারগুলি স্থির প্রভাব হিসাবে বিবেচিত হয় (হাতের নমুনার বাইরে কোনও সাধারণীকরণ হয় না) তবে আইটেম / বিষয়গুলি এলোমেলো প্রভাব হিসাবে বিবেচিত হয়; বিশ্লেষণের একক ব্যক্তি বা গড় রেটিং হতে পারে।
এটি তাদের টেবিলের 1 থেকে 3 টি মামলার সাথে মিলে যায়। আমরা লক্ষ্য করেছি যে পর্যবেক্ষণ করা রেটিংগুলি বেশ কয়েকটি রেটিংয়ের গড় (তাদের আইসিসি (1, কে), আইসিসি (2, কে) বলা হয় কিনা তার উপর নির্ভর করে একটি অতিরিক্ত পার্থক্য তৈরি করা যেতে পারে, এবং আইসিসি (3, কে)) বা না।
সংক্ষেপে, আপনাকে সঠিক মডেলটি বেছে নিতে হবে (একমুখী বনাম দ্বি-মুখী), এবং এটি শ্রাউট এবং ফ্লাইসের কাগজে মূলত আলোচিত। একমুখী মডেল দ্বি-মুখী মডেলের তুলনায় ছোট মান অর্জন করে; একইভাবে, একটি এলোমেলো-প্রভাব মডেল সাধারণত স্থির-প্রভাব মডেলের চেয়ে কম মান দেয়। একটি স্থির-প্রতিক্রিয়া মডেল থেকে প্রাপ্ত একটি আইসিসি র্যাটারগুলির ধারাবাহিকতা (কারণ আমরা রটারের বৈচিত্র্যকে উপেক্ষা করি) মূল্যায়ন করার উপায় হিসাবে বিবেচিত হয় , যখন একটি এলোমেলো-প্রভাব মডেলের জন্য আমরা রাটার চুক্তির একটি প্রাক্কলনের কথা বলি (রাটারগুলি বিনিময়যোগ্য কিনা তা)। কেবল দ্বি-দ্বীনের মডেলগুলি রাটার এক্স সাবজেক্ট ইন্টারঅ্যাকশনকে অন্তর্ভুক্ত করে, যা আনপিকালিক্যাল রেটিং প্যাটার্নগুলি উন্মোচনের চেষ্টা করার সময় আগ্রহী হতে পারে।
নিম্নলিখিত চিত্রণ নির্দ্ধিধায় একটি কপি / থেকে উদাহরণস্বরূপ পেস্ট হয় ICC()
মধ্যে Psych প্যাকেজ (ডেটা Shrout এবং Fleiss, 1979 থেকে আসা)। তথ্য 4 জন বিচারক (জে) নিয়ে 6 টি বিষয় বা লক্ষ্য (এস) নির্ধারণ করে এবং নীচে সংক্ষিপ্ত করা হয় (আমি ধরে নেব যে এটি নামক আর ম্যাট্রিক্স হিসাবে সঞ্চিত আছে sf
)
J1 J2 J3 J4
S1 9 2 5 8
S2 6 1 3 2
S3 8 4 6 8
S4 7 1 2 6
S5 10 5 6 9
S6 6 2 4 7
এই উদাহরণটি আকর্ষণীয় কারণ এটি দেখায় যে কীভাবে মডেলের পছন্দ ফলাফলকে প্রভাবিত করতে পারে, তাই নির্ভরযোগ্যতা অধ্যয়নের ব্যাখ্যা। সমস্ত ICC টি আইসিসি মডেল নিম্নরূপ (শ্রোট এবং ফ্লাইসের কাগজে এটি টেবিল ৪)
Intraclass correlation coefficients
type ICC F df1 df2 p lower bound upper bound
Single_raters_absolute ICC1 0.17 1.8 5 18 0.16477 -0.133 0.72
Single_random_raters ICC2 0.29 11.0 5 15 0.00013 0.019 0.76
Single_fixed_raters ICC3 0.71 11.0 5 15 0.00013 0.342 0.95
Average_raters_absolute ICC1k 0.44 1.8 5 18 0.16477 -0.884 0.91
Average_random_raters ICC2k 0.62 11.0 5 15 0.00013 0.071 0.93
Average_fixed_raters ICC3k 0.91 11.0 5 15 0.00013 0.676 0.99
যেমন দেখা যায়, রাটারগুলিকে স্থির প্রভাব হিসাবে বিবেচনা করে (অতএব র্যাটারগুলির বিস্তৃত পুলকে সাধারণীকরণের চেষ্টা করা নয়) পরিমাপের এককতার জন্য অনেক বেশি মান পাওয়া যাবে। ( আইআরএল প্যাকেজ ( icc()
) এর সাথে অনুরূপ ফলাফল পাওয়া যেতে পারে ), যদিও আমাদের অবশ্যই মডেল ধরণের এবং বিশ্লেষণের ইউনিটের জন্য পৃথক বিকল্পের সাথে খেলতে হবে)
আনোভা পদ্ধতি আমাদের কী বলে? প্রাসঙ্গিক গড় স্কোয়ারগুলি পেতে আমাদের দুটি মডেল ফিট করতে হবে:
- একমুখী মডেল যা কেবলমাত্র বিষয় বিবেচনা করে; এটি (গ্রুপ-এমএস, বিএমএস) -র মধ্যে নির্ধারিত লক্ষ্যগুলি পৃথক করতে এবং ত্রুটি-শর্তের (ডাব্লুএমএস) মেয়াদটির একটি অনুমান পেতে পারে
- একটি দ্বি-মুখী মডেল যা বিষয়টিকে + রাটার + তাদের ইন্টারঅ্যাকশন বিবেচনা করে (যখন কোনও প্রতিলিপি নেই, এই শেষ শব্দটি বাকী অংশগুলির সাথে মিশ্রিত হবে); এটি রেটার মূল প্রভাব (জেএমএস) অনুমান করতে দেয় যা আমরা যদি কোনও এলোমেলো প্রভাবের মডেলটি ব্যবহার করতে চাই তবে তার জন্য হিসাব করা যায় (যেমন, আমরা এটিকে মোট চলকটিতে যুক্ত করব)
এফ-টেস্টটি দেখার দরকার নেই, কেবলমাত্র এমএসই এখানে আগ্রহী।
library(reshape)
sf.df <- melt(sf, varnames=c("Subject", "Rater"))
anova(lm(value ~ Subject, sf.df))
anova(lm(value ~ Subject*Rater, sf.df))
এখন, আমরা একটি প্রসারিত আনোভা টেবিলের বিভিন্ন টুকরোগুলি একত্রিত করতে পারি যা দেখতে নীচে দেখানো মত দেখাচ্ছে (এটি শ্রোট এবং ফ্লাইসের কাগজে টেবিল 3):
(উত্স: mathurl.com )
যেখানে প্রথম দুটি সারি একমুখী মডেল থেকে আসে, সেখানে পরের দুটি সারি দ্বি-মুখী আনোভা থেকে আসে।
শ্রাউট এবং ফ্লাইসের নিবন্ধের সমস্ত সূত্রগুলি চেক করা সহজ এবং একক মূল্যায়নের জন্য নির্ভরযোগ্যতাটি অনুমান করার জন্য আমাদের যা কিছু দরকার তা আমাদের কাছে রয়েছে । একাধিক মূল্যায়নের গড় (যা প্রায়শই আন্তঃ-রাটার গবেষণায় আগ্রহের পরিমাণের জন্য) নির্ভরযোগ্যতা সম্পর্কে কী ? হেজেস এবং রেভিকি (২০০৫) অনুসরণ করে, দ্বি-পথে র্যান্ডম-এফেক্টস মডেলটি বাদ দিয়ে কেবল আমাদের এমএসএসের অনুপাতটি পুনরায় লিখতে হবে, কেবল ডিনোমিনেটরে বিবেচিত মোট এমএস পরিবর্তন করে উপরের পচন থেকে এটি পাওয়া যেতে পারে।
- আইসিসি (1,1) = (বিএমএস-ডাব্লুএমএস) / (বিএমএস + (কে-1) • ডাব্লুএমএস) এর ক্ষেত্রে সামগ্রিক নির্ভরযোগ্যতা (বিএমএস-ডাব্লুএমএস) / বিএমএস=0.443 হিসাবে গণনা করা হয়।
- আইসিসি (২,১) = (বিএমএস-ইএমএস) / (বিএমএস + (কে -১) • ইএমএস + কে • (জেএমএস-ইএমএস) / এন) এর সামগ্রিক নির্ভরযোগ্যতা হ'ল (এন • (বিএমএস-ইএমএস)) / (n • BMS + + JMS-একটি EMS) = 0,620।
- অবশেষে, আইসিসি (3,1) = (বিএমএস-ইএমএস) / (বিএমএস + (কে -1) • ইএমএস) এর জন্য আমাদের (বিএমএস-ইএমএস) / বিএমএস=0.909 এর একটি নির্ভরযোগ্যতা রয়েছে।
আবার, আমরা দেখতে পাই যে রাটারগুলিকে স্থির প্রভাব হিসাবে বিবেচনা করার সময় সামগ্রিক নির্ভরযোগ্যতা বেশি।
তথ্যসূত্র
- শ্রৌত, পিই এবং ফ্লাইস, জেএল (1979) ইন্ট্রাক্লাস পারস্পরিক সম্পর্ক: রেটার নির্ভরযোগ্যতা মূল্যায়নে ব্যবহার । মনস্তাত্ত্বিক বুলেটিন , 86, 420-3428।
- হেজ, আরডি এবং রেভিকি, ডি (2005)। নির্ভরযোগ্যতা এবং বৈধতা (প্রতিক্রিয়াশীলতা সহ)। ফায়ার্স, পি। ও হেজেস, আরডি (সংস্করণ), ক্লিনিকাল ট্রায়ালসে লাইফের লাইফের মূল্যায়ন , ২ য় সংস্করণ, পৃষ্ঠা ২৩-৩৯। অক্সফোর্ড ইউনিভার্সিটি প্রেস.