গণনা সম্পর্কিত তথ্যের জন্য বীজগণিতভাবে সিম্পসনের প্যারাডক্সটি বোঝার জন্য এখানে একটি সাধারণ পদ্ধতি approach
মনে করুন যে কোনও এক্সপোজারের জন্য আমাদের বেঁচে থাকার ডেটা রয়েছে এবং আমরা একটি 2x2 কন্টিজেন্সি টেবিল তৈরি করি। জিনিসগুলি সহজ রাখতে প্রতিটি কক্ষে আমাদের একই গণনা থাকবে। আমরা এটিকে শিথিল করতে পারি, তবে এটি বীজগণিতকে যথেষ্ট অগোছালো করে তুলবে।
ExposedUnexposedDiedXXSurvivedXXDeath Rate0.50.5
এক্ষেত্রে প্রকাশিত এবং অপ্রকাশিত উভয় গোষ্ঠীতেই মৃত্যুর হার সমান।
এখন, যদি আমরা ডেটা বিভক্ত করি, মহিলাদের জন্য একটি গ্রুপে এবং পুরুষদের জন্য অন্য একটি গ্রুপে বলুন, আমরা নিম্নোক্ত গণনা সহ 2 টি টেবিল পেয়েছি:
পুরুষ:
ExposedUnexposedDiedXaXcSurvivedXbXdDeath Rateaa+bcc+d
এবং মহিলাদের জন্য:
ExposedUnexposedDiedX(a−1)X(c−1)SurvivedX(b−1)X(d−1)Death Ratea−1a+b−2c−1c+d−2
যেখানে হ'লa,b,c,d∈[0,1] পুরুষের সমষ্টিগত ডাটা টেবিলের প্রতিটি কক্ষের অনুপাত।
সিম্পসনের প্যারাডক্স তখন ঘটবে যখন অনাবৃত পুরুষের মৃত্যুর হারের তুলনায় অনাবৃত পুরুষদের মৃত্যুর হার বেশি এবং এক্সপোজড মহিলাদের জন্য মৃত্যুর হার অপ্রকাশিত মহিলাদের জন্য মৃত্যুর হারের চেয়ে বেশি। বিকল্পভাবে, এটি তখনও ঘটতে পারে যখন অনাবৃত পুরুষের মৃত্যুর হারের তুলনায় অনাবৃত পুরুষের মৃত্যুর হার কম থাকে এবং অনাবৃত মহিলাদের জন্য মৃত্যুর হার কম থাকে exposed ওটা যখন
(aa+b<cc+d) and (a−1a+b−2<c−1c+d−2)
Or
(aa+b>cc+d) and (a−1a+b−2>c−1c+d−2)
কংক্রিটের উদাহরণ হিসাবে, X=100 এবং a=0.5,b=0.8,c=0.9 । তারপরে আমাদের যখন সিম্পসনের প্যারাডক্স হবে:
(0.50.8+0.9<0.90.9+d) and (0.5−10.5+0.8−2<0.9−10.9+d−2)
(−9<d<1.44) and (0.96<d<1.1)
যা থেকে আমরা উপসংহারে পৌঁছেছি যে ডি অবশ্যই থাকা উচিত (0.96,1]
অসমতার দ্বিতীয় সেটটি দেয়:
(0.50.8+0.9>0.90.9+d) and (0.5−10.5+0.8−2>0.9−10.9+d−2)
(d<−0.9 or d>1.44) and (0.96<d or d>1.44)
যার d for [ 0 , 1 ] এর কোনও সমাধান নেইd∈[0,1]
a,b,cd0.99
0.5/(0.5+0.8)=38% in the exposed group
0.9/(0.9+0.99)=48% in the unexposed group
and for Females:
(0.5−1)/(0.5+0.8−2)=71% in the exposed group
(0.9−1)/(0.9+0.99−2)=91% in the unexposed group
So, males have a higher death rate in the unexposed group than in the exposed group, and females also have a higher death rate in the unexposed group than the exposed group, yet the death rates in the aggregated data are the same for exposed and unexposed.