ম্যাকনামারের পরীক্ষা এবং চি-স্কোয়ার পরীক্ষার মধ্যে পার্থক্য কী এবং আপনি কীভাবে জানবেন যে কখন ব্যবহার করতে হয়?


30

আমি বিভিন্ন উত্সগুলিতে পড়ার চেষ্টা করেছি, তবে আমার ক্ষেত্রে কোন পরীক্ষাটি উপযুক্ত হবে তা এখনও পরিষ্কার নয়। আমার ডেটাসেট সম্পর্কে আমি তিনটি পৃথক প্রশ্ন জিজ্ঞাসা করছি:

  1. বিষয়গুলি বিভিন্ন সময় এক্স থেকে সংক্রমণের জন্য পরীক্ষা করা হয়। আমি জানতে চাই যে এক্স এর পরে পজিটিভের অনুপাতগুলি এক্স এর ইতিবাচক অনুপাতের সাথে সম্পর্কিত কিনা:

                 After   
               |no  |yes|
    Before|No  |1157|35 |
          |Yes |220 |13 |
    
    results of chi-squared test: 
    Chi^2 =  4.183     d.f. =  1     p =  0.04082 
    
    results of McNemar's test: 
    Chi^2 =  134.2     d.f. =  1     p =  4.901e-31
    

    আমার বোধগম্যতা থেকে, ডেটাগুলি যেমন বারবার ব্যবস্থা করা হয়, ততই আমাকে অবশ্যই ম্যাকনেমার পরীক্ষা ব্যবহার করতে হবে, যা এক্সের জন্য ধনাত্মক অনুপাত পরিবর্তিত হয়েছে কিনা তা পরীক্ষা করে।

    তবে আমার প্রশ্নগুলির জন্য চি-স্কোয়ার্ড টেস্টের দরকার মনে হচ্ছে - এক্স এর পরে ধনাত্মক অনুপাতটি এক্স এর আগে ধনাত্মক অনুপাতের সাথে সম্পর্কিত কিনা তা পরীক্ষা করে।

    আমি ম্যাকনেমার পরীক্ষা এবং চি-স্কোয়ারের মধ্যে পার্থক্যটি সঠিকভাবে বুঝতে পেরেছি কিনা তাও নিশ্চিত নই। আমার প্রশ্নটি হলে সঠিক পরীক্ষাটি কী হবে, "X এর পরে আক্রান্ত বিষয়ের অনুপাতটি কি আগের চেয়ে আলাদা?"

  2. একটি অনুরূপ ক্ষেত্রে, তবে যেখানে আগে এবং পরে পরিবর্তে, আমি সময়ে এক পর্যায়ে দুটি পৃথক সংক্রমণ পরিমাপ করি:

            Y   
          |no  |yes|
    X|No  |1157|35 |
     |Yes |220 |13 |
    

    এখানে কোন পরীক্ষাটি সঠিক হবে যদি প্রশ্নটি হয় "কোনও সংক্রমণের উচ্চ অনুপাত কি ওয়াইয়ের অনুপাতের সাথে সম্পর্কিত?"

  3. যদি আমার প্রশ্নটি ছিল, "সংক্রমণ ওয়াই কি টাইম টি 2 এর সাথে সংক্রমণের এক্স টি টি টাইম 1 এর সাথে সম্পর্কিত?" তবে কোন পরীক্ষাটি উপযুক্ত হবে?

                  Y at t2   
                |no  |yes|
    X at t1|No  |1157|35 |
           |Yes |220 |13 |

আমি এই সমস্ত ক্ষেত্রে ম্যাকনেমার পরীক্ষা ব্যবহার করছিলাম, তবে আমার প্রশ্নের উত্তর দেওয়ার জন্য যদি এটি সঠিক পরীক্ষা হয় তবে আমার সন্দেহ আছে। আমি আর ব্যবহার করছি। আমি কি glmপরিবর্তে দ্বিপদী ব্যবহার করতে পারি ? এটি কি চি-স্কোয়ার পরীক্ষার সাথে সমান হতে পারে?


1
আপনি কি এখানে ম্যাকনেমার পরীক্ষায় স্ট্যাটাস.স্ট্যাকেক্সেঞ্জার.কম / সেকশনস / ট্যাগড / এমসনেমার- টেষ্ট বিষয়গুলি পড়ার চেষ্টা করেছিলেন ?
ttnphns

"দুটি সম্ভাবনার মধ্যে সম্পর্ক" বলতে কী বোঝ?
মাইকেল এম

@ এনটিএনএফএনএস আমি সেগুলির মধ্য দিয়ে গিয়েছিলাম, তবে আমার প্রশ্নের সাথে এটি সংশোধন করতে পারিনি। আরও চিন্তাভাবনা করার পরে, মনে হয় আমি Q1 এর ভিত্তিতে দুটি প্রশ্নের উত্তর দিতে পারি: চি-বর্গ আমাকে জানায় যে + ve এক্স এর অনুপাতটি + ve এক্স এর অনুপাতের সাথে সম্পর্কিত কিনা এবং ম্যাকনেমার আমাকে বলবে যদি সেখানে হয়েছে কিনা অনুপাত পরিবর্তন। আমি কি সঠিক?
Anto

আপনি এখানে স্ট্যান্ডার্ড independence -স্বতন্ত্রতার সর্বোচ্চতম ব্যবহার করতে পারবেন না কারণ প্রতিটি ব্যক্তিকে দুটি মান দ্বারা প্রতিনিধিত্ব করা হয় যা এলোমেলো নমুনা সৃষ্টি করে। χ2
মাইকেল এম

ধন্যবাদ @ মিশেলমায়ার আমি ব্যবহার করছিলেন mcnemar পর্যন্ত আমি দেখেছি এর এই । যেখানে ম্যাকনেমার'কে ব্যাখ্যা করা হয়েছে, সেখানে তিনি বলেছেন যে চি চি-স্কু করানো একই ক্ষেত্রে কী জবাব দেবে। আমি বেশ বিচলিত। প্রতিটি পরীক্ষায় যেভাবে আমাদের জানান সেটিকে এই পৃষ্ঠায় ফ্রেম করা হয়েছে, আমাকে অবশ্যই চি-স্কয়ারের জন্য যেতে হবে তবে তারা যেহেতু একই বিষয়ে পরিমাপ, তাই অবশ্যই আমাকে ম্যাকনেমার বেছে নিতে হবে!
Anto

উত্তর:


48

এটা খুব দুর্ভাগ্যজনক যে ম্যাকনামারের পরীক্ষা মানুষের পক্ষে বোঝা এত কঠিন। আমি এমনকি লক্ষ্য করেছি যে এর উইকিপিডিয়া পৃষ্ঠার শীর্ষে এটি লেখা আছে যে পৃষ্ঠার ব্যাখ্যাটি মানুষের পক্ষে বোঝা মুশকিল। ম্যাকনামারের পরীক্ষার জন্য সাধারণ সংক্ষিপ্ত ব্যাখ্যাটি হ'ল: এটি একটি 'বিষয়গুলির মধ্যে চি-স্কোয়ার্ড পরীক্ষা', বা এটি 'একটি সংঘাতের টেবিলের প্রান্তিক একজাতীয়তার পরীক্ষা'। আমি এগুলির দুটিও খুব সহায়ক বলে মনে করি না। প্রথমত, এটি 'সাবজেক্টের মধ্যে চি-স্কোয়ার্ড' বলতে কী বোঝায় তা পরিষ্কার নয়, কারণ আপনি সর্বদা আপনার বিষয়গুলি দু'বার পরিমাপ করেন (প্রতিটি পরিবর্তনশীল একবার) এবং সেই ভেরিয়েবলগুলির মধ্যে সম্পর্ক নির্ধারণ করার চেষ্টা করছেন। এছাড়াও, 'প্রান্তিক একজাতীয়তা' (দুঃখজনকভাবে, এমনকি এই উত্তরটি বিভ্রান্তিকর হতে পারে it যদি এটি হয় তবে এটি আমার দ্বিতীয় প্রচেষ্টাটি নীচে পড়তে সহায়তা করতে পারে ))

আসুন দেখুন আমরা আপনার শীর্ষ উদাহরণের সাথে যুক্তি প্রক্রিয়াটির মাধ্যমে কাজ করতে পারি কিনা তা দেখতে আমরা ম্যাকনামারের পরীক্ষাটি উপযুক্ত কিনা তা (এবং যদি তাই হয় তবে) বুঝতে পারি কিনা তা দেখতে। আপনি লিখেছেন:

এখানে চিত্র বর্ণনা লিখুন

এটি একটি কন্টিনজেন্সি টেবিল, তাই এটি চ-স্কোয়ার বিশ্লেষণকে বোঝায়। অধিকন্তু, আপনার মধ্যেকার সম্পর্ককে বুঝতে চাই এবং একটি T ভেরিয়েবল মধ্যে একটি সম্পর্ক জন্য, এবং চি-স্কোয়ারড পরীক্ষা চেক, তাই প্রথম নজরে মনে হয় মত চি-স্কোয়ারড পরীক্ষা হওয়া আবশ্যক বিশ্লেষণ যা আপনার প্রশ্নের উত্তর দেয়। বিRএকজনটিR

তবে, এটি উল্লেখ করার মতো যে আমরা এই জাতীয় ডেটাগুলিও এর মতো উপস্থাপন করতে পারি:

এখানে চিত্র বর্ণনা লিখুন

আপনি ডাটা এই ভাবে তাকান, তখন আপনার মনে হতে পারে আপনি একটি নিয়মিত পুরাতন করতে পারে -test। কিন্তু একটি টন -test পুরোপুরি ঠিক নয়। দুটি বিষয় আছে: প্রথমত, কারণ প্রতিটি সারির তালিকা ডেটা একই বিষয়ের থেকে পরিমাপ, আমরা একটি মধ্যবর্তী-বিষয় না চাইবেন টি -test, আমরা একটি মধ্যে-বিষয় কাজ করতে চান টন বন্টন। (এই সম্পর্কে আরো জানার জন্য, এটা এখানে আমার উত্তর পড়তে সাহায্য করতে পারেন: z- র -test বনাম χটিটিটিটি -test। দ্বিতীয়ত, যেহেতু এই ডেটাগুলিকে দ্বি-দ্বি হিসাবে বিতরণ করা হয় , বৈকল্পিক গড়ের একটি কার্য is এর অর্থ এই যে একবারে নমুনাটির গড় অনুমান করার পরে উদ্বিগ্ন হওয়ার জন্য কোনও অতিরিক্ত অনিশ্চয়তা নেই (যেমন, আপনাকে পরবর্তীকালে বৈকল্পিকটি অনুমান করতে হবে না), তাই আপনাকে বিতরণ উল্লেখ করতে হবে না , আপনি এটি ব্যবহার করতে পারেন z- রটিz- রz- র পরীক্ষাχ2।) সুতরাং, আমরা একটি মধ্যে-বিষয় হবে-test। এটি হ'ল, আমাদের অনুপাতের সাম্যতার একটি অনন্য-বিষয় পরীক্ষা দরকার। z- র

আমরা দেখেছি যে এই ডেটাগুলি সম্পর্কে চিন্তাভাবনা এবং বিশ্লেষণের দুটি ভিন্ন উপায় রয়েছে (ডেটা দেখার দুটি ভিন্ন উপায় দ্বারা অনুরোধ করা)। সুতরাং আমাদের কোন উপায়টি ব্যবহার করা উচিত তা সিদ্ধান্ত নেওয়া দরকার। চি-স্কোয়ার পরীক্ষায় এবং A f t e r স্বাধীন কিনা তা নির্ধারণ করে। অর্থাত্, যে লোকেরা আগে কখনও অসুস্থ ছিল না তাদের চেয়ে বেশি অসুস্থ হওয়ার সম্ভাবনা বেশি। এই পরিমাপ একই বিষয়ের উপর মূল্যায়ন করা হয় তা কীভাবে ঘটবে না তা দেখা অত্যন্ত কঠিন। যদি আপনি কোনও অ-উল্লেখযোগ্য ফলাফল পেয়ে থাকেন (যেমন আপনি প্রায় করেন) তবে এটি কেবল একটি টাইপ II ত্রুটি হবে। পরিবর্তে বি বিRএকজনটিR এবং A f t eবিR স্বতন্ত্র, আপনি প্রায় অবশ্যই জানতে চান চিকিত্সাটি কাজ করে কিনা (একটি প্রশ্নের চি-স্কোয়ার উত্তর দেয় না)। এটি যে কোনও সংখ্যক চিকিত্সা বনাম নিয়ন্ত্রণ স্টাডির সাথে খুব অনুরূপ যেখানে আপনি দেখতে চান যে উপায়গুলি সমান কিনা, ব্যতীত এই ক্ষেত্রে আপনার পরিমাপ হ্যাঁ / না এবং সেগুলি সাবজেক্টের মধ্যে। আরও সাধারণ টি বিবেচনা করুনএকজনটিRটি-চিকিত্সার আগে এবং পরে রক্তচাপের সাথে পরিমাপযোগ্য পরিস্থিতি। যাদের বিপি আগে আপনার নমুনা গড়ের উপরে ছিল প্রায় অবশ্যই পরে উচ্চতর বিপিএসের মধ্যে থাকবে তবে আপনি র‌্যাঙ্কিংয়ের ধারাবাহিকতা সম্পর্কে জানতে চান না, আপনি জানতে চান চিকিত্সার গড় বিপি পরিবর্তন হয়েছে কিনা? । আপনার পরিস্থিতি এখানে সরাসরি অভিন্ন। বিশেষত, আপনি অনুপাতের সাম্যের সর্বোচ্চতম -বিষয়গুলির মধ্যে চালাতে চান । ম্যাকনামারের পরীক্ষাও তাই।z- র

সুতরাং, আমরা বুঝতে পেরেছি যে আমরা ম্যাকনামারের পরীক্ষা নিতে চাই, এটি কীভাবে কাজ করে? একটি মধ্যবর্তী-বিষয় চলমান সহজ -test কিন্তু কিভাবে আমরা একটি মধ্যে-বিষয় সংস্করণ চালানো? অনুপাতের অভ্যন্তরীণ-বিষয় পরীক্ষা কীভাবে করা যায় তা বোঝার মূল চাবিকাঠিটি হ'ল কন্টিনজেন্সি টেবিলটি পরীক্ষা করাz- র অনুপাতকে পচিয়ে দেয়:
একথাও ঠিক যেবিঅনুপাত সারি সামগ্রিক মোট দ্বারা বিভক্ত মোট, এবংএকটিTঅনুপাত কলাম মোট সামগ্রিক মোট দ্বারা বিভক্ত হয়। আমরা যখন আধ্যাত্মিক টেবিলটি দেখি আমরা দেখতে পাই যে সেগুলি উদাহরণস্বরূপ:অনুপাতের আগে হ্যাঁ=220+13

একজনটিRএনওয়াইগুলিটিটিএকটিবিRএন1157351192ওয়াইগুলি22013233টিটিএকটি1377481425
বিRএকজনটিR
এখানে লক্ষণীয় আকর্ষণীয় যে13 টিপর্যবেক্ষণ হ্যাঁ আগে এবং পরে উভয়ই ছিল। তারা উভয় অনুপাতের অংশ হিসাবে শেষ হয়, তবে উভয় গণনা হিসাবে থাকার ফলে তারা ইয়েসের অনুপাতের পরিবর্তন সম্পর্কে কোনও স্বতন্ত্র তথ্য যোগ করে না। তাছাড়া এগুলি দুটিবার গণনা করা হয় যা অবৈধ। একইভাবে, সামগ্রিক মোট দুটি গণনায় শেষ হয় এবং কোনও পৃথক তথ্য যুক্ত করে না। অনুপাতগুলি দ্রবীভূত করে আমরা স্বীকৃতি দিতে সক্ষম হয়েছি যে ইয়েসগুলির অনুপাতের আগে এবং পরে সম্পর্কে একমাত্র স্বতন্ত্র তথ্য220এবং35তে বিদ্যমান, সুতরাং আমাদের বিশ্লেষণ করার জন্য এটি সেই সংখ্যা। এটি ছিল ম্যাকনামারের অন্তর্দৃষ্টি। এছাড়াও, তিনি বুঝতে পেরেছিলেন যে শূন্যের নীচে এটি220/এর দ্বিপদী পরীক্ষা
অনুপাতের আগে হ্যাঁ=220+ +131425,অনুপাতের পরে হ্যাঁ=35+ +131425
1322035। (এখানে একটি সমতুল্য সূত্র রয়েছে যা চি-স্কোয়ার্ড হিসাবে বিতরণ করা হয়, যা এটি ফলাফল)) নাল অনুপাতের বিপরীতে 5220/(220+ +35).5R

ম্যাকনামারের পরীক্ষার বিষয়ে আরও একটি আলোচনা রয়েছে, যার সাথে 2x2 এর চেয়েও বড় আকারের কন্টিনজেন্সি টেবিলগুলির এক্সটেনশন রয়েছে, এখানে


এখানে একটি Rআপনার ডেটা সহ ডেমো রয়েছে:

mat = as.table(rbind(c(1157, 35), 
                     c( 220, 13) ))
colnames(mat) <- rownames(mat) <- c("No", "Yes")
names(dimnames(mat)) = c("Before", "After")
mat
margin.table(mat, 1)
margin.table(mat, 2)
sum(mat)

mcnemar.test(mat, correct=FALSE)
#  McNemar's Chi-squared test
# 
# data:  mat
# McNemar's chi-squared = 134.2157, df = 1, p-value < 2.2e-16
binom.test(c(220, 35), p=0.5)
#  Exact binomial test
# 
# data:  c(220, 35)
# number of successes = 220, number of trials = 255, p-value < 2.2e-16
# alternative hypothesis: true probability of success is not equal to 0.5
# 95 percent confidence interval:
#  0.8143138 0.9024996
# sample estimates:
# probability of success 
#              0.8627451 

আমরা যদি আপনার তথ্যগুলির অভ্যন্তরীণ প্রকৃতির বিষয়টি বিবেচনা না করি তবে অনুপাতের সাম্যের জন্য আমাদের সামান্য কম শক্তিশালী পরীক্ষা হবে:

prop.test(rbind(margin.table(mat, 1), margin.table(mat, 2)), correct=FALSE)
#  2-sample test for equality of proportions without continuity
#  correction
# 
# data:  rbind(margin.table(mat, 1), margin.table(mat, 2))
# X-squared = 135.1195, df = 1, p-value < 2.2e-16
# alternative hypothesis: two.sided
# 95 percent confidence interval:
#  0.1084598 0.1511894
# sample estimates:
#    prop 1    prop 2 
# 0.9663158 0.8364912 

যে, X-squared = 133.6627পরিবর্তে chi-squared = 134.2157। এই ক্ষেত্রে, এগুলি খুব অল্পই পৃথক, কারণ আপনার কাছে প্রচুর ডেটা রয়েছে এবং উপরের আলোচনা অনুসারে কেবল ক্ষেত্রে ওভারল্যাপিং হচ্ছে। (আর একটি এবং আরও গুরুত্বপূর্ণ সমস্যাটি হ'ল এটি আপনার ডেটা N = 1425 এর পরিবর্তে দুবার অর্থাৎ N = 2850 গণনা করে that13এন=2850এন=1425 ))


আপনার কংক্রিট প্রশ্নের উত্তর এখানে:

  1. সঠিক বিশ্লেষণটি হ'ল ম্যাকনামারের পরীক্ষা (উপরে যেমন উপরে আলোচনা করা হয়েছে)।
  2. এই সংস্করণটি কৌতূহলোদ্দীপক এবং শব্দবন্ধটি "ওয়াইয়ের উচ্চ অনুপাতের সাথে সম্পর্কিত একটি সংক্রমণের উচ্চতর অনুপাত" অস্পষ্ট। দুটি সম্ভাব্য প্রশ্ন রয়েছে:

    • এই সংক্রমণগুলির মধ্যে একটি রোগী অন্য রোগীর প্রবণতা পায় কিনা তা জানতে সম্পূর্ণভাবে যুক্তিযুক্ত, আপনি সেক্ষেত্রে স্বাধীনতার চি-স্কোয়ার পরীক্ষাটি ব্যবহার করতে পারবেন কিনা। এই প্রশ্নটি জিজ্ঞাসা করছে যে দুটি পৃথক সংক্রমণের সংবেদনশীলতা স্বতন্ত্র কিনা (সম্ভবত তারা বিভিন্ন শারীরবৃত্তীয় পথের মাধ্যমে সংকোচিত হয়ে থাকে) বা না (সম্ভবত তারা সাধারণভাবে দুর্বল প্রতিরোধ ক্ষমতাটির কারণে সংকুচিত হয়েছে)।
    • রোগীদের একই অনুপাত উভয়ই সংক্রমণে ঝুঁকির ঝুঁকির মুখোমুখি হয় কিনা তাও পুরোপুরি যুক্তিসঙ্গত, আপনি ম্যাকনেমার পরীক্ষাটি ব্যবহার করবেন। সংক্রমণটি সমানভাবে ভাইরাসজনিত কিনা তা নিয়ে এখানে প্রশ্ন।
  3. যেহেতু এটি আবার একই সংক্রমণ, অবশ্যই তারা সম্পর্কিত হবে। আমি সংগ্রহ করেছি যে এই সংস্করণটি কোনও চিকিত্সার আগে এবং পরে নয়, তবে সময়ের পরে। সুতরাং, আপনি জিজ্ঞাসা করছেন যে ব্যাকগ্রাউন্ড সংক্রমণের হারগুলি জৈবিকভাবে পরিবর্তিত হচ্ছে, যা আবার পুরোপুরি যুক্তিসঙ্গত প্রশ্ন। যে কোনও হারে, সঠিক বিশ্লেষণ হ'ল ম্যাকনেমার পরীক্ষা।
    সম্পাদনা: দেখে মনে হবে আমি আপনার তৃতীয় প্রশ্নের ভুল ব্যাখ্যা করেছি, সম্ভবত টাইপোর কারণে। আমি এখন এটিকে দুটি পৃথক সময় পয়েন্টে দুটি পৃথক সংক্রমণ হিসাবে ব্যাখ্যা করি। এই ব্যাখ্যার অধীনে চি-স্কোয়ার পরীক্ষা উপযুক্ত হবে।

@ অ্যালেক্সিস যতদূর আমি তৈরি করতে পারি, আপনি এবং গাং একে অপরের সাথে কথা বলছেন বলে মনে হচ্ছে। এমনকি তথাকথিত "বিজোড়" বা "স্বাধীন নমুনা" টি-পরীক্ষা, বা "একমুখী" বা "স্বাধীন নমুনা ANOVA", gung এর অর্থে আসলে জোড়া প্রয়োজন ডেটা: প্রতিটি বিষয়, আপনি রেকর্ড আবশ্যক উভয় একটি শ্রেণীগত গ্রুপ সদস্যতা পরিবর্তনশীল এবং একটি অবিচ্ছিন্ন ফলাফল পরিবর্তনশীল । (গ্রুপের সদস্যপদ ভেরিয়েবলের যদি দুটি স্তর থাকে তবে আমরা সাধারণত অবিযুক্ত টি-টেস্ট ব্যবহার করি; 3+ স্তরের জন্য আপনার একমুখী আনোভা প্রয়োজন)।
সিলভার ফিশ

2
কোন পরীক্ষাটি ব্যবহার করবেন তা ব্যাখ্যা করার সময়, আমি এটি দেখার দুটি উপায় দেখাই - যদি আপনার অবিচ্ছিন্ন পরিবর্তনশীলগুলির প্রতিটি পর্যায়ের জন্য একটি পর্যবেক্ষণ থাকে এবং বিষয়গুলি 2 (বা 3+) গ্রুপ থেকে আসে এবং আপনি এর মধ্যে পার্থক্যগুলিতে আগ্রহী হন গোষ্ঠীগুলি, তারপরে স্বতন্ত্র-নমুনা টি-পরীক্ষা (বা একমুখী আনোভা) ব্যবহার করুন। তারপরে আপনার ডেটা টেবিলটি দেখে আপনার পছন্দটি নিশ্চিত করুন: প্রতিটি বিষয়ের জন্য আপনার কাছে দুটি টুকরো তথ্য রয়েছে: গোষ্ঠী সদস্যতার জন্য বিভাগ এবং অবিচ্ছিন্ন পরিবর্তনশীল। আমরা এমনকি জিনিসগুলি ঘুরিয়ে দিতে পারি এবং বলতে পারি টি-টেস্ট হ'ল বাইনারি এবং অবিচ্ছিন্ন ভেরিয়েবলের মধ্যে এক ধরণের সংযোগের পরীক্ষা
সিলভার ফিশ

2
জোড়যুক্ত টি-টেস্ট (বা পারস্পরিক সম্পর্কযুক্ত নমুনাগুলি এএনওওএ) ব্যবহার করা হয়, যদি প্রতিটি বিষয়ের জন্য আপনার দুটি (বা 3+) একটানা পড়া হয়, বিভিন্ন অবস্থার অধীনে নেওয়া হয় এবং আপনি অবস্থার মধ্যে পার্থক্যের জন্য পরীক্ষা করতে চান। এটি অন্য অর্থে "জুটিবদ্ধ"। তবে এই প্রশ্নে আমাদের প্রতিটি বিষয়ের জন্য দুটি স্বতন্ত্র পরিবর্তনশীল রেকর্ড করা আছে । ডেটা টেবিলের দিকে তাকিয়ে, এই শ্রেণীবদ্ধ ভেরিয়েবলগুলির রেকর্ড করা মানগুলি অবশ্যই জোড়ায় আসতে হবে। তবে এর অর্থ এই নয় যে অধ্যয়নের নকশাটি নিজেই জুটিবদ্ধ। এটি বিভ্রান্তিকর (গাং নোট হিসাবে)। তবে আপনি যদি নিজের অধ্যয়নের নকশা জানেন তবে এটি সমাধান করতে পারে (
অ্যালেক্সিস

@ সিলভারফিশ যদি প্রতিটি বিষয়ে আপনার দুটি পর্যবেক্ষণ (একই নামমাত্র পরিবর্তনশীল) হয় তবে কোন অর্থে এটি জোড়যুক্ত নকশা নয়?
অ্যালেক্সিস

1
@ অ্যালেক্সিস এটি "একই পরিবর্তনশীল" এর যা মূল - এবং সম্ভাব্য বিভ্রান্তিকর। আপনি হয়ত জানেন যে এটি একই শর্তের প্রতিনিধিত্ব করে, যদিও বিভিন্ন পরিস্থিতিতে বা বিভিন্ন সময়ে, তবে আমরা যে ডাটা টেবিলটি আউট করেছি তার উপর নির্ভর করে সেগুলি বিভিন্ন ভেরিয়েবল হিসাবে রেকর্ড করা হতে পারে (যেমন একটি পৃথক "আগে" এবং "পরে" পরিবর্তনশীল)।
সিলভারফিশ

22

ঠিক আছে, মনে হচ্ছে আমি এটির একটি হ্যাশ তৈরি করেছি। আমাকে আবারও এটি ব্যাখ্যা করার চেষ্টা করুন, অন্যভাবে এবং আমরা দেখতে পাচ্ছি এটি কোনও জিনিস পরিষ্কার করতে সহায়তা করতে পারে।

ম্যাকনেমার পরীক্ষা বনাম চি-স্কোয়ার্ড টেস্টের ব্যাখ্যা দেওয়ার traditionalতিহ্যগত উপায়টি হল ডেটাটি "যুক্ত" করা হয়েছে কিনা তা জিজ্ঞাসা করা এবং ডেটাটি যুক্ত করা হয়েছে কিনা তা ম্যাকনেমার পরীক্ষার সুপারিশ করা এবং ডেটা "আনকিয়ারড" হলে চি-স্কোয়ার্ড টেস্টের পরামর্শ দেওয়া। আমি খুঁজে পেয়েছি যে এটি অনেকগুলি বিভ্রান্তির দিকে পরিচালিত করে (এই থ্রেডটি উদাহরণ হিসাবে!)। এর পরিবর্তে, আমি খুঁজে পেয়েছি যে আপনি যে প্রশ্নটি জিজ্ঞাসা করার চেষ্টা করছেন তার দিকে দৃষ্টি নিবদ্ধ করা এবং আপনার প্রশ্নের সাথে মেলে এমন পরীক্ষাটি ব্যবহার করা সবচেয়ে সহায়ক । এটি আরও কংক্রিট করতে, আসুন একটি মেক-আপ দৃশ্যের দিকে তাকান:

আপনি একটি পরিসংখ্যান সম্মেলন ঘুরে দেখেন এবং আপনি যে পরিসংখ্যানবিদদের সাথে মিলিত হন, আপনি মার্কিন যুক্তরাষ্ট্র বা যুক্তরাজ্য থেকে এসেছেন কিনা তা রেকর্ড করেন। তাদের উচ্চ রক্তচাপ বা স্বাভাবিক রক্তচাপ আছে কিনা তা আপনি রেকর্ডও করুন।

এখানে ডেটা:

mat = as.table(rbind(c(195,   5),
                     c(  5, 195) ))
colnames(mat)        = c("US", "UK")
rownames(mat)        = c("Hi", "Normal")
names(dimnames(mat)) = c("BP", "Nationality")
mat
#         Nationality
# BP        US  UK
#   Hi     195   5
#   Normal   5 195

এই মুহুর্তে, আমরা কীভাবে আমাদের ডেটা জিজ্ঞাসা করতে চাই তা নির্ধারণ করা গুরুত্বপূর্ণ is আমরা এখানে তিনটি ভিন্ন প্রশ্ন জিজ্ঞাসা করতে পারি:

  1. আমরা জানতে যদি শ্রেণীগত ভেরিয়েবল চাইতে পারেন BPএবং Nationalityসংশ্লিষ্ট অথবা স্বাধীন হয়;
  2. আমরা ভাবতে পারি যে যুক্তরাষ্টের পরিসংখ্যানবিদদের তুলনায় মার্কিন পরিসংখ্যানবিদদের মধ্যে উচ্চ রক্তচাপ বেশি দেখা যায়;
  3. পরিশেষে, আমরা ভাবতে পারি যে উচ্চ রক্তচাপের পরিসংখ্যানবিদদের অনুপাতটি আমরা যে মার্কিন পরিসংখ্যানবিদদের সাথে কথা বলেছি তার অনুপাতের সমান কিনা। এটি টেবিলের প্রান্তিক অনুপাতকে বোঝায়। এগুলি আর-তে ডিফল্টরূপে মুদ্রিত হয় না, তবে আমরা সেগুলি এগুলিতে পেতে পারি (লক্ষ্য করুন যে, এই ক্ষেত্রে তারা ঠিক একই রকম):

    margin.table(mat, 1)/sum(mat)
    # BP
    #    Hi Normal 
    #   0.5    0.5 
    margin.table(mat, 2)/sum(mat)
    # Nationality
    #  US  UK 
    # 0.5 0.5 

যেমনটি আমি বলেছি, প্রচলিত পাঠ্যপুস্তকগুলিতে আলোচিত traditionalতিহ্যবাহী পদ্ধতিটি ডেটা "যুক্ত" হয়েছে কিনা তার ভিত্তিতে কোন পরীক্ষাটি ব্যবহার করতে হবে তা নির্ধারণ করা। তবে এটি খুব বিভ্রান্তিকর, এই কন্টিনজেন্সি টেবিলটি কি "যুক্ত"? যদি আমরা মার্কিন যুক্তরাষ্ট্রে এবং যুক্তরাজ্যের পরিসংখ্যানবিদদের মধ্যে উচ্চ রক্তচাপের সাথে অনুপাতের তুলনা করি, আপনি বিভিন্ন সংখ্যক লোকের সাথে পরিমাপ করা দুটি অনুপাত (একই পরিবর্তনশীল হওয়া সত্ত্বেও) তুলনা করছেন। অন্যদিকে, আপনি যদি উচ্চ রক্তচাপের সাথে অনুপাতটিকে মার্কিন অনুপাতের সাথে তুলনা করতে চান, আপনি একই সংখ্যক লোকের সাথে পরিমাপকৃত দুটি অনুপাত (বিভিন্ন পরিবর্তনশীল হওয়া সত্ত্বেও) তুলনা করছেন। এই তথ্য উভয়"যুক্ত" এবং "অযথিত" একই সাথে (তথ্যের বিভিন্ন দিক বিবেচনা করেও)। এটি বিভ্রান্তির দিকে নিয়ে যায়। এই বিভ্রান্তি এড়াতে চেষ্টা করার জন্য, আমি যুক্তি দিচ্ছি যে আপনি কোন প্রশ্ন জিজ্ঞাসা করছেন তার দিক দিয়ে আপনার ভাবা উচিত। বিশেষত, যদি আপনি জানতে চান:

  1. যদি ভেরিয়েবলগুলি স্বতন্ত্র থাকে: চি-স্কোয়ার্ড পরীক্ষাটি ব্যবহার করুন।
  2. যদি উচ্চ রক্তচাপের অনুপাত জাতীয়তার সাথে আলাদা হয়: অনুপাতের পার্থক্যের জন্য জেড-পরীক্ষা ব্যবহার করুন।
  3. যদি প্রান্তিক অনুপাত একই হয়: ম্যাকনেমার পরীক্ষা ব্যবহার করুন।

কেউ এখানে আমার সাথে একমত হতে পারেন, যুক্তি দিয়েছিলেন যে কন্টিনজেন্সি টেবিলটি "যুক্ত" করা হয়নি, তাই ম্যাকনামারের পরীক্ষাটি প্রান্তিক অনুপাতের সাম্যতা পরীক্ষা করতে ব্যবহার করা যাবে না এবং পরিবর্তে চি-স্কোয়ার্ড টেস্ট ব্যবহার করা উচিত। যেহেতু এটি বিতর্কের কেন্দ্রবিন্দু, তাই ফলাফলগুলি অর্থবোধ করে কিনা তা উভয়কেই দেখার চেষ্টা করুন:

chisq.test(mat)
#  Pearson's Chi-squared test with Yates' continuity correction
# 
# data:  mat
# X-squared = 357.21, df = 1, p-value < 2.2e-16
mcnemar.test(mat)
#  McNemar's Chi-squared test
# 
# data:  mat
# McNemar's chi-squared = 0, df = 1, p-value = 1

50%=50% চি-স্কোয়ার পরীক্ষার ফলাফলগুলি কেবলমাত্র তথ্যের আলোকে কোনও অর্থ দেয় না। অন্যদিকে, ম্যাকনামারের পরীক্ষার পি-মান 1 পাওয়া যায়। এটি বলছে যে যদি সত্যিকারের প্রান্তিক অনুপাত সমান হয় তবে সাম্যতার কাছাকাছি বা সমতা থেকে আরও দূরে প্রান্তিক অনুপাত খুঁজে পাওয়ার আপনার 100% সম্ভাবনা থাকবে। যেহেতু পর্যবেক্ষিত প্রান্তিক অনুপাতগুলি তাদের তুলনায় সমান কাছাকাছি হতে পারে না, এই ফলাফলটি বোঝা যায়।

আসুন আরেকটি উদাহরণ চেষ্টা করুন:

mat2 = as.table(rbind(c(195, 195),
                      c(  5,   5) ))
colnames(mat2)        = c("US", "UK")
rownames(mat2)        = c("Hi", "Normal")
names(dimnames(mat2)) = c("BP", "Nationality")
mat2
#         Nationality
# BP        US  UK
#   Hi     195 195
#   Normal   5   5
margin.table(mat2, 1)/sum(mat2)
# BP
#     Hi Normal 
#  0.975  0.025 
margin.table(mat2, 2)/sum(mat2)
# Nationality
#  US  UK 
# 0.5 0.5 

97.5%»50%

chisq.test(mat2)
#  Pearson's Chi-squared test
# 
# data:  mat2
# X-squared = 0, df = 1, p-value = 1
mcnemar.test(mat2)
#  McNemar's Chi-squared test with continuity correction
# 
# data:  mat2
# McNemar's chi-squared = 178.605, df = 1, p-value < 2.2e-16

এবার, চি-স্কোয়ার্ড পরীক্ষাটি 1 এর একটি পি-মান দেয়, যার অর্থ প্রান্তিক অনুপাতটি তাদের সমান হয়। তবে আমরা দেখেছি যে প্রান্তিক অনুপাত খুব স্পষ্টতই সমান নয়, সুতরাং এই ফলাফলটি আমাদের তথ্যের আলোকে কোনও অর্থ দেয় না। অন্যদিকে, ম্যাকনামারের পরীক্ষায় পি-মান প্রায় পাওয়া যায় other অন্য কথায়, যদি তারা জনসংখ্যায় সত্যই সমান হয় তবে এগুলি সমতা থেকে দূরে প্রান্তিক অনুপাত সহ তথ্য প্রাপ্তির পক্ষে অত্যন্ত সম্ভাবনা নেই। যেহেতু আমাদের পর্যবেক্ষণ প্রান্তিক অনুপাত সমান থেকে অনেক দূরে, তাই এই ফলাফলটি বোঝা যায়।

আমাদের চিটা স্কোয়ার্ড টেস্টের ফলাফল ফল দেয় যা আমাদের উপাত্ত প্রদত্ত বলে বোঝায় না যে এখানে চি-স্কোয়ার পরীক্ষার সাথে কিছু ভুল আছে। অবশ্যই, ম্যাকনামারের পরীক্ষায় বুদ্ধিমান ফলাফল সরবরাহ করা সত্য যে এটি বৈধ বলে প্রমাণিত করে না, এটি কেবল একটি কাকতালীয় ঘটনা হতে পারে তবে চি-স্কোয়ার্ড পরীক্ষাটি স্পষ্টতই ভুল।

আসুন আমরা ম্যাকনামারের পরীক্ষা কেন সঠিক হতে পারে তার পক্ষে যুক্তির মাধ্যমে কাজ করতে পারি কিনা তা দেখুন see আমি তৃতীয় ডেটাসেট ব্যবহার করব:

mat3 = as.table(rbind(c(190,  15),
                      c( 60, 135) ))
colnames(mat3)        = c("US", "UK")
rownames(mat3)        = c("Hi", "Normal")
names(dimnames(mat3)) = c("BP", "Nationality")
mat3
#         Nationality
# BP        US  UK
#   Hi     190  15
#   Normal  60 135
margin.table(mat3, 1)/sum(mat3)
# BP
#     Hi Normal 
# 0.5125 0.4875 
margin.table(mat3, 2)/sum(mat3)
# Nationality
#    US    UK 
# 0.625 0.375 

51,25%62.5%

prop.test(x=c(205, 250), n=c(400, 400))
#  2-sample test for equality of proportions with continuity correction
# 
# data:  c(205, 250) out of c(400, 400)
# X-squared = 9.8665, df = 1, p-value = 0.001683
# alternative hypothesis: two.sided
# 95 percent confidence interval:
#   -0.18319286 -0.04180714
# sample estimates:
# prop 1 prop 2 
# 0.5125 0.6250 

( prop.test()প্রান্তিক অনুপাত পরীক্ষা করার জন্য , আমাকে 'সাফল্য' এবং মোট 'পরীক্ষার সংখ্যা' ম্যানুয়ালি লিখতে হয়েছিল, তবে আপনি আউটপুটের শেষ লাইন থেকে দেখতে পাচ্ছেন যে অনুপাতগুলি সঠিক)) আমাদের কাছে থাকা পরিমাণের পরিমাণের পরিমাণের তুলনায় যদি তারা আসলে সমান হয় তবে সাম্যতা থেকে এ পর্যন্ত প্রান্তিক অনুপাত পাওয়া সম্ভব নয়।

এই পরীক্ষাটি কি বৈধ? এখানে দুটি সমস্যা রয়েছে: পরীক্ষাটি বিশ্বাস করে যে আমাদের কাছে 800 টি তথ্য রয়েছে, যখন আমাদের কাছে কেবলমাত্র 400 থাকে This


% হাই বিপি: 190+ +15400% আমাদের: 190+ +60400
1904001560π=.5নাল অধীন। এটাই ছিল ম্যাকনামারের অন্তর্দৃষ্টি। প্রকৃতপক্ষে, ম্যাকনামারের পরীক্ষা মূলত কেবলমাত্র দ্বিপাক্ষিক পরীক্ষা যা পর্যবেক্ষণগুলি সেই দুটি কোষের মধ্যে সমানভাবে পড়ার সম্ভাবনা রয়েছে কিনা:
binom.test(x=15, n=(15+60))
#  Exact binomial test
# 
# data:  15 and (15 + 60)
# number of successes = 15, number of trials = 75, p-value = 1.588e-07
# alternative hypothesis: true probability of success is not equal to 0.5
# 95 percent confidence interval:
#   0.1164821 0.3083261
# sample estimates:
# probability of success 
#                    0.2 

এই সংস্করণে, শুধুমাত্র তথ্যমূলক পর্যবেক্ষণগুলি ব্যবহার করা হয় এবং সেগুলি দুটিবার গণনা করা হয় না। এখানে পি-মানটি খুব ছোট, 0.0000001588, যা প্রায়শই এমন হয় যখন ডেটা নির্ভরতা বিবেচনায় নেওয়া হয়। অর্থাৎ অনুপাতের পার্থক্যের জেড-টেস্টের চেয়ে এই পরীক্ষাটি আরও শক্তিশালী। আমরা আরও দেখতে পারি যে উপরের সংস্করণটি মূলত ম্যাকনামারের পরীক্ষার মতোই:

mcnemar.test(mat3, correct=FALSE)
#  McNemar's Chi-squared test
# 
# data:  mat3
# McNemar's chi-squared = 27, df = 1, p-value = 2.035e-07

অ-অভিন্নতা যদি বিভ্রান্তিকর হয় তবে ম্যাকনামারের পরীক্ষাটি সাধারণত এবং আর-তে ফলাফলকে স্কোয়ার করে এবং চি-স্কোয়ার ডিস্ট্রিবিউশনের সাথে তুলনা করে, যা উপরের দ্বিপদী হিসাবে সঠিক পরীক্ষা নয়:

(15-60)^2/(15+60)
# [1] 27
1-pchisq(27, df=1)
# [1] 2.034555e-07

সুতরাং, যখন আপনি কোনও কন্টিনজেন্সি টেবিলের প্রান্তিক অনুপাত সমান হয় তা পরীক্ষা করতে চান, ম্যাকনামারের পরীক্ষা (বা সঠিকভাবে দ্বিপদী পরীক্ষার ম্যানুয়ালি গণনা করা) সঠিক। এটি অবৈধভাবে কোনও তথ্য দুবার ব্যবহার না করে কেবলমাত্র সম্পর্কিত তথ্য ব্যবহার করে। এটি কেবল ফলাফল ঘটায় 'ঘটতে পারে না' যা ডেটা বোঝায়।

আমি বিশ্বাস করেই চলেছি যে, কোনও কন্টিনজেন্সি টেবিল "জোড়" রয়েছে কিনা তা বের করার চেষ্টা করা অসফল lp আমি পরীক্ষাটি ব্যবহার করার পরামর্শ দিচ্ছি যা আপনি ডেটা জিজ্ঞাসা করছেন এমন প্রশ্নের সাথে মেলে।


1
আপনি আমার ভোট পেয়েছেন। :)
অ্যালেক্সিস

11

χ2χ2


χ2

উদাহরণস্বরূপ, আপনার কাছে মার্কিন যুক্তরাষ্ট্রের 20 পরিসংখ্যানবিদদের একটি নমুনা এবং যুক্তরাজ্যের 37 জন পরিসংখ্যানবিদদের পৃথক স্বতন্ত্র নমুনা থাকতে পারে এবং এই পরিসংখ্যানবিদরা হাইপারটেনসিভ বা আদর্শবাদী কিনা সে সম্পর্কে একটি পরিমাপ থাকতে পারে। আপনার নাল হাইপোথিসিসটি হ'ল যুক্তরাজ্য এবং মার্কিন উভয় পরিসংখ্যানবিদদের হাইপারটেনসিভ হওয়ার একই অন্তর্নিহিত সম্ভাবনা রয়েছে (অর্থাত্ মার্কিন যুক্তরাষ্ট্রে বা ইউকে থেকে এসেছেন কিনা তা জেনে হাইপারটেনশনের সম্ভাবনা সম্পর্কে কাউকে কিছুই বলেনি)। অবশ্যই এটি সম্ভব যে আপনার প্রতিটি গ্রুপে একই নমুনার আকার থাকতে পারে, তবে এটি নমুনাগুলি স্বাধীন হওয়ার (যেমন আনপায়ার্ড ) সত্যকে পরিবর্তন করে না ।


χ2

উদাহরণস্বরূপ, আপনার কাছে আন্তর্জাতিক পরিসংখ্যানবিদ সম্মেলন থেকে স্বতন্ত্রভাবে ম্যাচ করা কেস-নিয়ন্ত্রণ স্টাডি তথ্য থাকতে পারে , যেখানে হাইপারটেনশন (কেস) সহ 30 পরিসংখ্যানবিদ এবং হাইপারটেনশন ছাড়াই 30 পরিসংখ্যানবিদ (নিয়ন্ত্রণ; যারা পৃথকভাবে বয়স, লিঙ্গ, বিএমআই এবং ধূমপান স্থিতির সাথে মিলে যায় বিশেষ ক্ষেত্রে), যুক্তরাজ্যের পেশাদার রেসিডেন্স বনাম অন্য কোথাও রেসিডেন্সির জন্য মূল্যায়ন করা হয়। শূন্যতাটি হল যে কেসগুলির মধ্যে ইউকেতে থাকার সম্ভাবনা নিয়ন্ত্রণ হিসাবে ইউকেতে থাকার সম্ভাবনা হিসাবে সমান (যেমন কারও হাইপারটেনসিভ স্ট্যাটাস সম্পর্কে জানার ফলে কারও ইউকে আবাসনের ইতিহাস সম্পর্কে কিছুই বলা যায় না)।

Rগুলিχ2=[(R-গুলি)-1]2(R+ +গুলি)

আপনার উদাহরণস্বরূপ, আপনার ডেটা যুক্ত করা হয়েছে (একই বিষয়টিতে দু'বার একই ভেরিয়েবল পরিমাপ করা হয়) এবং তাই ম্যাকনামারের পরীক্ষাটি সমিতির জন্য পরীক্ষার উপযুক্ত পছন্দ।

[গুং এবং আমি আগের উত্তর সম্পর্কে কিছু সময়ের জন্য দ্বিমত পোষণ করেছি]]

উদ্ধৃত রেফারেন্স
"ধরে নিচ্ছি যে আমরা এখনও অনুপাতের তুলনা করতে আগ্রহী, যদি আমাদের তথ্য স্বাধীন না হয়ে তৈরি করা হয় তবে আমরা কী করতে পারি? ... এই পরিস্থিতিতে আমরা ম্যাকনামারের পরীক্ষাটি ব্যবহার করি।" - প্যাগানো এবং গাওরিউ, বায়োস্টাটিক্সের নীতিবিদ , ২ য় সংস্করণ, পৃষ্ঠা 349. [ জোর দেওয়া ]

"ম্যাকনামার ম্যাচড -পেয়ার টেস্ট স্ট্যাটিস্টিক (ম্যাকনামার, 1949) হিসাবে এই অভিব্যক্তিটি বেশি পরিচিত এবং এটি ম্যাচ -জুটির বিশ্লেষণের মূল ভিত্তি হয়ে দাঁড়িয়েছে ।" - রথম্যান, গ্রিনল্যান্ড এবং ল্যাশ। আধুনিক এপিডেমিওলজি , পৃষ্ঠা ২66। [ জোর দেওয়া ]

" বৈকল্পিক বিশ্লেষণের জোড়যুক্ত টেস্ট পরীক্ষা এবং পুনরাবৃত্তিমূলক ব্যবস্থাগুলি পরীক্ষাগুলি বিশ্লেষণ করতে ব্যবহার করা যেতে পারে যার মধ্যে অধ্যয়নরত চলকটি একটি বিরতি স্কেল (এবং প্যারামেট্রিক পদ্ধতিগুলির জন্য প্রয়োজনীয় অন্যান্য অনুমানগুলি সন্তুষ্ট করে) পরিমাপ করা যায়। ৫ ম অধ্যায়ে, যেখানে ফলাফলটি নামমাত্র স্কেল হিসাবে পরিমাপ করা হয় ? এই সমস্যাটি প্রায়শই জিজ্ঞাসা করা হয় যখন কোনও ব্যক্তি কোনও চিকিত্সার প্রতি প্রতিক্রিয়া জানিয়েছেন কিনা বা একই ব্যক্তিদের মধ্যে ইতিবাচক বা নেতিবাচক শ্রেণিবদ্ধ দুটি পৃথক ডায়াগনস্টিক পরীক্ষার ফলাফলের তুলনা করার সময়? "আমরা এই জাতীয় পরীক্ষার পরিবর্তনগুলির জন্য ম্যাকনামারের পরীক্ষা, যেমন একটি গবেষণার প্রসঙ্গে বিশ্লেষণ করার একটি পদ্ধতি তৈরি করব " "- গ্লানজ, বায়োস্টাটিক্সের প্রাইমারχ2

" প্রতি ক্ষেত্রে একটি নিয়ন্ত্রণের সাথে মিলে যাওয়া কেস-নিয়ন্ত্রণ তথ্যের জন্য , ফলাফল বিশ্লেষণ সহজ, এবং উপযুক্ত পরিসংখ্যানগত পরীক্ষা হ'ল ম্যাকনেমার চি-স্কোয়ার্ড পরীক্ষা ... লক্ষ করুন যে প্রতিকূল অনুপাত এবং পরিসংখ্যান উভয়ের গণনার জন্য একমাত্র অবদানকারী যে জুড়িগুলি এক্সপোজারে পৃথক হয় , এটি সেই জুটি যেখানে মামলাটি প্রকাশ করা হয়েছিল কিন্তু নিয়ন্ত্রণ ছিল না, এবং যেখানে নিয়ন্ত্রণ প্রকাশ করা হয়েছিল কিন্তু কেসটি ছিল না। "- এলউড। এপিডেমিওলজিকাল স্টাডিজ এবং ক্লিনিকাল ট্রায়ালগুলির সমালোচনামূলক মূল্যায়ন , প্রথম সংস্করণ, পৃষ্ঠা 189-190। [ জোর দেওয়া ]


7

ম্যাকনামারের পরীক্ষার বিষয়ে আমার বোঝা নীচে: এটি কোনও হস্তক্ষেপের ফলে বাইনারি ফলাফলের ক্ষেত্রে উল্লেখযোগ্য পার্থক্য হয়েছে কিনা তা দেখা যায়। আপনার উদাহরণে, বিষয়গুলির একটি গ্রুপ সংক্রমণের জন্য পরীক্ষা করা হয় এবং প্রতিক্রিয়াটি হ্যাঁ বা না হিসাবে রেকর্ড করা হয়। অ্যান্টিবায়োটিক ওষুধ বলুন, তারপরে সমস্ত বিষয়কে কিছুটা হস্তক্ষেপ দেওয়া হয়। তারপরে তাদের আবার সংক্রমণের জন্য পরীক্ষা করা হয় এবং প্রতিক্রিয়াটি হ্যাঁ / না হিসাবে পুনরায় রেকর্ড করা হয়। (জোড়াগুলির) প্রতিক্রিয়াগুলি স্বাচ্ছন্দ্য সারণীতে রাখা যেতে পারে:

             After   
           |no  |yes|
Before|No  |1157|35 |
      |Yes |220 |13 |

এবং ম্যাকনেমার পরীক্ষা এই জন্য উপযুক্ত হবে।

টেবিল থেকে এটি স্পষ্ট যে আরও অনেকে 'হ্যাঁ' থেকে 'না' (220 / (220 + 13) বা 94.4%) 'না' থেকে 'হ্যাঁ' (35 / (1157 + 35) বা ২.৯ এ রূপান্তর করেছেন) %)। এই অনুপাত বিবেচনা করে, ম্যাকনেমার পি মান (4.901e-31) চি-স্কোয়ার পি মান (0.04082) এর চেয়ে বেশি সঠিক প্রদর্শিত হবে।

যদি স্বাচ্ছন্দ্য সারণী 2 টি পৃথক সংক্রমণের প্রতিনিধিত্ব করে (প্রশ্ন 2), তবে চি-স্কোয়ার আরও উপযুক্ত হবে।

আপনার তৃতীয় প্রশ্নটি দ্ব্যর্থক: আপনি প্রথমে y2 টি 2 তে Y এর সাথে t1 তে যুক্ত করেছেন তবে আপনি সারণীতে আপনি T1 বনাম Y তে t2 এ 'এক্স' লিখবেন। T1 বনাম Y1 টি 1 এ আপনার প্রথম প্রশ্নের সমান এবং তাই ম্যাকনামারের পরীক্ষা প্রয়োজন, যখন টি 1 এ এক্স এবং ওয়াই টি 2 তে নির্দেশ করে যে বিভিন্ন ইভেন্টের তুলনা করা হচ্ছে এবং তাই চি-স্কোয়ার আরও উপযুক্ত হবে।

সম্পাদনা: মন্তব্যে আলেকিসের দ্বারা যেমন উল্লেখ করা হয়েছে, মেকনামারের পরীক্ষায় মিলে যাওয়া কেস-নিয়ন্ত্রণ ডেটাও বিশ্লেষণ করা হয়। উদাহরণস্বরূপ, 1425 ক্যান্সার রোগীদের একটি অধ্যয়নের জন্য নিয়োগ দেওয়া হয় এবং প্রতিটি রোগীর জন্য একটি ম্যাচিং কন্ট্রোলও নিয়োগ করা হয়। এই সমস্ত (1425 * 2) সংক্রমণের জন্য পরীক্ষা করা হয়। প্রতিটি জুটির ফলাফল একই ধরণের টেবিল দ্বারা প্রদর্শিত হতে পারে:

             Normal   
           |no  |yes|
Cancer|No  |1157|35 |
      |Yes |220 |13 |

আরো পরিষ্কারভাবে:

                                    Normal:
                                    No infection   Infection  
Cancer patient:     No infection    1157            35      
                    Infection       220             13      

এটি দেখায় যে এটি প্রায়শই দেখা যায় যে ক্যান্সারে আক্রান্ত রোগীর সংক্রমণ ছিল এবং তার বিপরীতে পরিবর্তনের চেয়ে নিয়ন্ত্রণ ছিল না। ম্যাকনামারের পরীক্ষা দিয়ে এর তাত্পর্য পরীক্ষা করা যায়।

যদি এই রোগীদের এবং নিয়ন্ত্রণগুলি মিলে না যায় এবং স্বতন্ত্র না হয় তবে কেবলমাত্র একটি নীচের সারণী তৈরি করা যায় এবং একটি চিজকোয়ার পরীক্ষা করা যেতে পারে:

            Infection
            No    Yes
Cancer  No  1377   48
        Yes 1192  233

আরো পরিষ্কারভাবে:

                No infection        Infection
No cancer       1377                48
Cancer          1192                233

মনে রাখবেন যে এই সংখ্যাগুলি প্রথম টেবিলের মার্জিনের মতো:

> addmargins(mat)
      After
Before   No  Yes  Sum
   No  1157   35 1192
   Yes  220   13  233
   Sum 1377   48 1425

ম্যাকনামারের পরীক্ষায় 'প্রান্তিক ফ্রিকোয়েন্সি' এবং 'মার্জিনাল হোমোজেনিটি' এর মতো পদ ব্যবহারের কারণ অবশ্যই এটি হতে পারে।

মজার বিষয় হল, অ্যাডমারগিনস ফাংশন কোন পরীক্ষাটি ব্যবহার করবে তা সিদ্ধান্ত নিতেও সহায়তা করতে পারে। যদি গ্র্যান্ড-টোটাল পর্যবেক্ষণ করা বিষয়ের অর্ধেক সংখ্যার (নির্দেশক জুটি করা হয়েছে), তবে ম্যাকনামারের পরীক্ষা প্রযোজ্য, অন্যথায় চিজকোয়ার পরীক্ষা উপযুক্ত:

> addmargins(mat)
      Normal
Cancer   No  Yes  Sum
   No  1157   35 1192
   Yes  220   13  233
   Sum 1377   48 1425
> 
> addmargins(mat3)
      Infection
Cancer   No  Yes  Sum
   No  1377   48 1425
   Yes 1192  233 1425
   Sum 2569  281 2850

উপরের টেবিলগুলির জন্য আর কোডগুলি উপরের উত্তরগুলি থেকে:

mat = as.table(rbind(c(1157, 35), 
                      c( 220, 13) ))
colnames(mat) <- rownames(mat) <- c("No", "Yes")
names(dimnames(mat)) = c("Cancer", "Normal")

mat3 = as.table(rbind(c(1377, 48), 
                     c(1192, 233) ))
colnames(mat3) <- rownames(mat3) <- c("No", "Yes")
names(dimnames(mat3)) = c("Cancer", "Infection")

নিম্নলিখিত সিউডোকোড পার্থক্য জানার ক্ষেত্রেও সহায়তা করতে পারে:

subject_id      result_first_observation    result_second_observation   
1               no                          yes                     
2               yes                         no                      
...

mcnemar.test(table(result_first_observation, result_second_observation))



pair_id     result_case_subject     result_control_subject  
1           no                      yes                     
2           yes                     no                      
...

mcnemar.test(table(result_case_subject, result_control_subject))



subject_id      result_first_test       result_second_test
1               yes                     no
2               no                      yes
..

chisq.test(table(result_first_test, result_second_test))

সম্পাদনা:

mid-pম্যাকনেমার পরীক্ষার রূপ পরিবর্তন ( https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3716987/ ) আকর্ষণীয়। এটি তুলনামূলকভাবে bএবং cঅস্থির টেবিলের অর্থাত্ সংখ্যার যারা হ্যাঁ থেকে পরিবর্তিত হয়ে কোনও নম্বর থেকে হ্যাঁ পরিবর্তিত হয়েছে (যারা গবেষণার মাধ্যমে হ্যাঁ বা না রয়েছেন তাদের সংখ্যা উপেক্ষা করে)। এটি পাইথনে দ্বিপদী পরীক্ষা ব্যবহার করে করা যেতে পারে, যেমন https://gist.github.com/kylebgorman/c8b3fb31c1552ecbaafb তে দেখানো হয়েছে

এটি binom.test(b, b+c, 0.5)এলোমেলো পরিবর্তনের সাথে সমতুল্য হতে পারে , একজনের bসমান হওয়ার আশা করা যায় c


3
কেবল হস্তক্ষেপ বিশ্লেষণের জন্যই নয়: এটি পর্যবেক্ষণিক অর্থে মিলিত কেস-নিয়ন্ত্রণ ডেটা বিশ্লেষণ করতেও ব্যবহৃত হয়।
অ্যালেক্সিস

কিউ। এর টেবিলের পূর্বে বর্ণন / সেটআপটি দেওয়ার পরে, আমার সন্দেহ হয় যে "এক্স" একটি টাইপো, তবে এটি একটি ভাল ক্যাচ ছিল এবং এটি থ্রেড +1 এ একটি কার্যকর অবদান।
গুং - মনিকা পুনরায়

@ এমএসো সম্পাদিত কিউ 3। এটি টি 1 এ এক্স! অন্যথায়, যেমন আপনি বলেছেন এটি Q1 থেকে আলাদা নয়। এই প্রশ্নটি এক বছরেরও বেশি পুরানো এবং কেউ আমাকে আবার বিভ্রান্ত করেছে এমন একই চিন্তা নিয়ে ফিরে আসতে দেখে অবাক হয়েছে। অনেক আগ্রহ নিয়ে অনুসরণ করছি!
এন্টো

আমার ক্ষমা, ওপি Q3 স্পষ্ট করে দিয়েছে, স্পষ্টতই এটি 2 বিভিন্ন সময়ে 2 বিভিন্ন রোগ is আবারও ভালো ধরা।
গুং - মনিকা পুনরায়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.