সাধারণত বিতরণ করা হয় এমন সংখ্যার একটি এলোমেলো সেট বিবেচনা করুন:
x <- rnorm(n=1000, mean=10)
আমরা গড়টি জানতে চাই এবং গড়টির মানগত ত্রুটি যাতে আমরা নিম্নলিখিতটি করি:
se <- function(x) { sd(x)/sqrt(length(x)) }
mean(x) # something near 10.0 units
se(x) # something near 0.03 units
গ্রেট!
তবে, ধরে নেওয়া যাক আমরা অগত্যা জানি না যে আমাদের মূল বিতরণটি একটি সাধারণ বিতরণ অনুসরণ করে। আমরা ডেটা লগ-রূপান্তর করি এবং একই স্ট্যান্ডার্ড ত্রুটি গণনা সম্পাদন করি।
z <- log(x, base=10)
mean(z) # something near 1 log units
se(z) # something near 0.001 log units
দুর্দান্ত, তবে এখন আমাদের উত্তরগুলিতে লগ নয় ইউনিটগুলিতে আমাদের উত্তর পেতে ব্যাক-ট্রান্সফর্ম করা দরকার।
10^mean(z) # something near 10.0 units
10^se(z) # something near 1.00 units
আমার প্রশ্ন: একটি সাধারণ বিতরণের জন্য, কেন বিতরণ থেকেই এটি গণনা করা হয়েছিল বা এটি রূপান্তরিত, গণনা করা, এবং পিছনে রূপান্তরিত হয়েছিল তার উপর নির্ভর করে স্ট্যান্ডার্ড ত্রুটি কেন পৃথক হয়? দ্রষ্টব্য: রূপান্তরটি নির্বিশেষে অর্থগুলি একইভাবে বেরিয়ে এসেছে।
সম্পাদনা # 1: অবশেষে, আমি অ-সাধারণভাবে বিতরণ করা ডেটার জন্য গড় এবং আত্মবিশ্বাসের অন্তরগুলি গণনা করতে আগ্রহী, সুতরাং আপনি যদি তাদের নেটিভ ইউনিটগুলিতে ব্যাক-ট্রান্সফর্ম করার পদ্ধতি সহ রূপান্তরিত ডেটাতে 95% সিআই কীভাবে গণনা করতে পারেন সে সম্পর্কে কিছু নির্দেশিকা দিতে পারলে , আমি কৃতজ্ঞ হবে!
শেষ সম্পাদনা # 1
সম্পাদনা # 2: আমি 95% আস্থা অন্তর পেতে কোয়ান্টাইল ফাংশনটি ব্যবহার করার চেষ্টা করেছি:
quantile(x, probs = c(0.05, 0.95)) # around [8.3, 11.6]
10^quantile(z, probs = c(0.05, 0.95)) # around [8.3, 11.6]
সুতরাং, এটি একই উত্তরে রূপান্তরিত হয়েছে, যা ভাল। তবে, এই পদ্ধতিটি ব্যবহার করে "ছোট" নমুনা মাপের সাথে অ-সাধারণ ডেটা ব্যবহার করে সঠিক একই ব্যবধানটি সরবরাহ করা হয় না:
t <- rlnorm(10)
mean(t) # around 1.46 units
10^mean(log(t, base=10)) # around 0.92 units
quantile(t, probs = c(0.05, 0.95)) # around [0.211, 4.79]
10^(quantile(log(t, base=10), probs = c(0.05, 0.95))) # around [0.209, 4.28]
কোন পদ্ধতিটি "আরও সঠিক" হিসাবে বিবেচিত হবে। আমি ধরে নিচ্ছি যে কেউ সবচেয়ে রক্ষণশীল হিসাবটি বেছে নেবে?
উদাহরণস্বরূপ, আপনি কি এই ফলাফলটি নন-নরমাল ডেটা (টি) হিসাবে [0.21, 4.79] এর 95% আত্মবিশ্বাসের ব্যবধান সহ 0.92 ইউনিট হিসাবে গড় হিসাবে প্রতিবেদন করবেন?
শেষ সম্পাদনা # 2
আপনার সময় জন্য ধন্যবাদ!