কন্টিনজেন্সি টেবিলগুলির বেয়েসিয়ান বিশ্লেষণ: কীভাবে প্রভাবের আকারটি বর্ণনা করা যায়


9

আমি ক্রুশকের ডুং বায়েশিয়ান ডেটা অ্যানালাইসিসের উদাহরণগুলির মধ্যে কাজ করছি , বিশেষ করে সিএইচ-তে পোয়েসন এক্সফোনেনশিয়াল আনোভা । 22, যা তিনি কন্টিনজেন্সি টেবিলগুলির জন্য স্বাধীনতার ঘন ঘন ঘনবাদী চি-বর্গ পরীক্ষার বিকল্প হিসাবে উপস্থাপন করেন।

আমি দেখতে পাচ্ছি যে পরিবর্তনগুলি স্বতন্ত্র থাকলে (যেমন, এইচডিআই শূন্য বাদ দিলে) প্রত্যাশার চেয়ে কম বা কম ঘন ঘন ঘটে যাওয়া মিথস্ক্রিয়া সম্পর্কে আমরা কীভাবে তথ্য পাই।

আমার প্রশ্ন হ'ল আমি কীভাবে এই কাঠামোটিতে কোনও প্রভাব আকারের গণনা বা ব্যাখ্যা করতে পারি ? উদাহরণস্বরূপ, কুরুস্কে লিখেছেন "কালো চুলের সাথে নীল চোখের সংমিশ্রণটি চোখের রঙ এবং চুলের রঙ যদি স্বতন্ত্র থাকে তবে প্রত্যাশার চেয়ে কম ঘন ঘন ঘটে" তবে আমরা কীভাবে সেই সংঘটির শক্তি বর্ণনা করতে পারি? আমি কীভাবে বলতে পারি কোনটি ইন্টারঅ্যাকশনগুলি অন্যের চেয়ে চরম? যদি আমরা এই ডেটাগুলির একটি চি-বর্গক্ষেত্র পরীক্ষা করে থাকি তবে আমরা ক্রমারের ভিটিকে সামগ্রিক প্রভাবের আকার হিসাবে পরিমাপ করতে পারি। এই বায়েসীয় প্রসঙ্গে আমি কীভাবে প্রভাবের আকারটি প্রকাশ করব?

এখানে বইটি থেকে স্ব-নিখুঁত উদাহরণ রয়েছে (কোড করে দেওয়া হয়েছে R), যদি উত্তরটি সরল দৃষ্টিতে আমার কাছ থেকে লুকানো থাকে ...

df <- structure(c(20, 94, 84, 17, 68, 7, 119, 26, 5, 16, 29, 14, 15, 
10, 54, 14), .Dim = c(4L, 4L), .Dimnames = list(c("Black", "Blond", 
"Brunette", "Red"), c("Blue", "Brown", "Green", "Hazel")))

df

         Blue Brown Green Hazel
Black      20    68     5    15
Blond      94     7    16    10
Brunette   84   119    29    54
Red        17    26    14    14

প্রভাব আকারের ব্যবস্থাসমূহ (পুস্তকে নয়) সহ এখানে ঘন ঘন আউটপুট রয়েছে:

vcd::assocstats(df)
                    X^2 df P(> X^2)
Likelihood Ratio 146.44  9        0
Pearson          138.29  9        0

Phi-Coefficient   : 0.483 
Contingency Coeff.: 0.435 
Cramer's V        : 0.279

এইচডিআই এবং সেল সম্ভাব্যতা (সরাসরি বই থেকে) সহ এখানে বায়েশিয়ান আউটপুট রয়েছে:

# prepare to get Krushkes' R codes from his web site
Krushkes_codes <- c(
  "http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/openGraphSaveGraph.R", 
  "http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/PoissonExponentialJagsSTZ.R")

# download Krushkes' scripts to working directory
lapply(Krushkes_codes, function(i) download.file(i, destfile = basename(i)))

# run the code to analyse the data and generate output
lapply(Krushkes_codes, function(i) source(basename(i)))

এবং এখানে পোয়েসন এক্সফেনশনাল মডেলের পোস্টেরিয়রের প্লটগুলি ডেটাতে প্রয়োগ করা হয়েছে:

এখানে চিত্র বর্ণনা লিখুন

এবং আনুষাঙ্গিক কক্ষের সম্ভাব্যতার উপর পূর্ববর্তী বিতরণের প্লটগুলি:

এখানে চিত্র বর্ণনা লিখুন

উত্তর:


1

সূচী অনুসারে, ক্রুশ্চে কেবলমাত্র প্রভাবের আকারটি দু'বার উল্লেখ করেছে এবং উভয় সময় কোনও মেট্রিকের পূর্বাভাসযোগ্য ভেরিয়েবলের প্রসঙ্গে। কিন্তু এই বিট আছে পি। 601:

গবেষক স্বাধীনতার লঙ্ঘন আগ্রহী, তাহলে সুদ মাত্রার হয় । মডেলটি এই উদ্দেশ্যে বিশেষভাবে সুবিধাজনক, কারণ নন-দায়বদ্ধতা কোথায় ঘটছে তা নির্ধারণের জন্য নির্বিচারে ইন্টারঅ্যাকশন বিপরীতে তদন্ত করা যেতে পারে।βR

সুতরাং, আমি সংগ্রহ করি যে interpret প্যারামিটারটি ব্যাখ্যা করার জন্য। যাক এবং সব কোফিসিয়েন্টস পণ্য তাদের সংশ্লিষ্ট এক্স উপাদান, ব্যতীত এর সমষ্টি সমান এবং । যেহেতু এবং । যখন = 1, তারপরে গুণক দ্বারা বড় হয় বা সঙ্কুচিত হয়β1,2এসβ1,2এক্স1,2Yআমি~পিআমিগুলি(λআমি)λআমি=β1,2এক্স1,2+ +এস=β1,2এক্স1,2এসএক্স1,2λআমিβ1,2, না?


1

আনোভা মডেলটিতে প্রভাবের আকারটি অধ্যয়নের এক উপায় হ'ল "সুপার জনসংখ্যা" এবং "সীমাবদ্ধ জনসংখ্যা" স্ট্যান্ডার্ড বিচ্যুতিগুলি দেখে। আপনার দ্বিপথের টেবিল রয়েছে, সুতরাং এটি 3 টি বৈকল্পিক উপাদান (2 প্রধান প্রভাব এবং 1 টি ইন্টারঅ্যাকশন)। এটি এমসিএমসি বিশ্লেষণের ভিত্তিতে তৈরি। আপনি প্রতিটি এমসিএমসি নমুনার জন্য প্রতিটি প্রভাবের জন্য স্ট্যান্ডার্ড বিচ্যুতি গণনা করুন।

গুলি=1-1Σ=1(β,-β¯)2

কোথায় আনোভা সারণির "সারি" সূচী করে। এর এমএমসিসি নমুনার সরল বক্সপ্লটগুলি বনাম প্রভাব আকারে বেশ শিক্ষণীয়।

অ্যান্ড্রু গেলম্যান এই পদ্ধতির পক্ষে ছিলেন। তার 2005 এর কাগজটি "বৈকল্পিক বিশ্লেষণ: কেন এটি আগের চেয়ে বেশি গুরুত্বপূর্ণ" দেখুন


কাগজটি এখানে পাওয়া যায়
শান ইস্টার

এই উভয় উত্তর খুব আশাব্যঞ্জক বলে মনে হচ্ছে, ধন্যবাদ। Rএটির প্রোগ্রামিং কীভাবে হতে পারে তা দেখাতে আপনারা কি যথেষ্ট পরিচিত ?
বেন

@ সানিস্টার - লিঙ্কটি যুক্ত করার জন্য ধন্যবাদ @ বেন, এই গণনাগুলি আরে সহজ However তবে আপনার নমুনাগুলি কোন ফর্মের মধ্যে রয়েছে তা আমি নিশ্চিত sd ()। বক্সপ্লটগুলির জন্য, এগুলি বেসিকগুলি সাথে পাওয়া সহজ boxplot ()
সম্ভাব্যতাব্লোগিক

ধন্যবাদ, আপনি কি আমার প্রশ্নে উদাহরণস্বরূপ ডেটা এবং কোড ব্যবহার করে প্রদর্শন করতে পারবেন?
বেন

সংক্ষেপে, না কারণ আপনার পোস্ট করা কোডটি আমি বুঝতে পারি না - ডেটা কীভাবে সাজানো হয়েছে তা আমি দেখতে পাচ্ছি না। এবং আমি যেমন বলেছি, এটি নিজেকে করা কোনও কঠিন বিশ্লেষণ নয়। এই পদ্ধতির একটি সাধারণ পরিমাপ (স্ট্যান্ডার্ড বিচ্যুতি) গণনা করা হচ্ছে। অতিরিক্তভাবে, আর কোডিং আপনার প্রশ্নের অংশ নয় - আপনি কীভাবে आकस्मिकতা সারণী বিশ্লেষণের সংক্ষিপ্তকরণ করবেন সে সম্পর্কে জিজ্ঞাসা করেছিলেন।
সম্ভাব্যতাব্লোগিক
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.