আমি ক্রুশকের ডুং বায়েশিয়ান ডেটা অ্যানালাইসিসের উদাহরণগুলির মধ্যে কাজ করছি , বিশেষ করে সিএইচ-তে পোয়েসন এক্সফোনেনশিয়াল আনোভা । 22, যা তিনি কন্টিনজেন্সি টেবিলগুলির জন্য স্বাধীনতার ঘন ঘন ঘনবাদী চি-বর্গ পরীক্ষার বিকল্প হিসাবে উপস্থাপন করেন।
আমি দেখতে পাচ্ছি যে পরিবর্তনগুলি স্বতন্ত্র থাকলে (যেমন, এইচডিআই শূন্য বাদ দিলে) প্রত্যাশার চেয়ে কম বা কম ঘন ঘন ঘটে যাওয়া মিথস্ক্রিয়া সম্পর্কে আমরা কীভাবে তথ্য পাই।
আমার প্রশ্ন হ'ল আমি কীভাবে এই কাঠামোটিতে কোনও প্রভাব আকারের গণনা বা ব্যাখ্যা করতে পারি ? উদাহরণস্বরূপ, কুরুস্কে লিখেছেন "কালো চুলের সাথে নীল চোখের সংমিশ্রণটি চোখের রঙ এবং চুলের রঙ যদি স্বতন্ত্র থাকে তবে প্রত্যাশার চেয়ে কম ঘন ঘন ঘটে" তবে আমরা কীভাবে সেই সংঘটির শক্তি বর্ণনা করতে পারি? আমি কীভাবে বলতে পারি কোনটি ইন্টারঅ্যাকশনগুলি অন্যের চেয়ে চরম? যদি আমরা এই ডেটাগুলির একটি চি-বর্গক্ষেত্র পরীক্ষা করে থাকি তবে আমরা ক্রমারের ভিটিকে সামগ্রিক প্রভাবের আকার হিসাবে পরিমাপ করতে পারি। এই বায়েসীয় প্রসঙ্গে আমি কীভাবে প্রভাবের আকারটি প্রকাশ করব?
এখানে বইটি থেকে স্ব-নিখুঁত উদাহরণ রয়েছে (কোড করে দেওয়া হয়েছে R
), যদি উত্তরটি সরল দৃষ্টিতে আমার কাছ থেকে লুকানো থাকে ...
df <- structure(c(20, 94, 84, 17, 68, 7, 119, 26, 5, 16, 29, 14, 15,
10, 54, 14), .Dim = c(4L, 4L), .Dimnames = list(c("Black", "Blond",
"Brunette", "Red"), c("Blue", "Brown", "Green", "Hazel")))
df
Blue Brown Green Hazel
Black 20 68 5 15
Blond 94 7 16 10
Brunette 84 119 29 54
Red 17 26 14 14
প্রভাব আকারের ব্যবস্থাসমূহ (পুস্তকে নয়) সহ এখানে ঘন ঘন আউটপুট রয়েছে:
vcd::assocstats(df)
X^2 df P(> X^2)
Likelihood Ratio 146.44 9 0
Pearson 138.29 9 0
Phi-Coefficient : 0.483
Contingency Coeff.: 0.435
Cramer's V : 0.279
এইচডিআই এবং সেল সম্ভাব্যতা (সরাসরি বই থেকে) সহ এখানে বায়েশিয়ান আউটপুট রয়েছে:
# prepare to get Krushkes' R codes from his web site
Krushkes_codes <- c(
"http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/openGraphSaveGraph.R",
"http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/PoissonExponentialJagsSTZ.R")
# download Krushkes' scripts to working directory
lapply(Krushkes_codes, function(i) download.file(i, destfile = basename(i)))
# run the code to analyse the data and generate output
lapply(Krushkes_codes, function(i) source(basename(i)))
এবং এখানে পোয়েসন এক্সফেনশনাল মডেলের পোস্টেরিয়রের প্লটগুলি ডেটাতে প্রয়োগ করা হয়েছে:
এবং আনুষাঙ্গিক কক্ষের সম্ভাব্যতার উপর পূর্ববর্তী বিতরণের প্লটগুলি: