লগ-ট্রান্সফর্মের পরে স্ট্যান্ডার্ড ত্রুটির গণনা করা হচ্ছে


19

সাধারণত বিতরণ করা হয় এমন সংখ্যার একটি এলোমেলো সেট বিবেচনা করুন:

x <- rnorm(n=1000, mean=10)

আমরা গড়টি জানতে চাই এবং গড়টির মানগত ত্রুটি যাতে আমরা নিম্নলিখিতটি করি:

se <- function(x) { sd(x)/sqrt(length(x)) }
mean(x) # something near 10.0 units
se(x)   # something near 0.03 units

গ্রেট!

তবে, ধরে নেওয়া যাক আমরা অগত্যা জানি না যে আমাদের মূল বিতরণটি একটি সাধারণ বিতরণ অনুসরণ করে। আমরা ডেটা লগ-রূপান্তর করি এবং একই স্ট্যান্ডার্ড ত্রুটি গণনা সম্পাদন করি।

z <- log(x, base=10)
mean(z) # something near 1 log units
se(z)   # something near 0.001 log units

দুর্দান্ত, তবে এখন আমাদের উত্তরগুলিতে লগ নয় ইউনিটগুলিতে আমাদের উত্তর পেতে ব্যাক-ট্রান্সফর্ম করা দরকার।

10^mean(z) # something near 10.0 units
10^se(z)   # something near 1.00 units

আমার প্রশ্ন: একটি সাধারণ বিতরণের জন্য, কেন বিতরণ থেকেই এটি গণনা করা হয়েছিল বা এটি রূপান্তরিত, গণনা করা, এবং পিছনে রূপান্তরিত হয়েছিল তার উপর নির্ভর করে স্ট্যান্ডার্ড ত্রুটি কেন পৃথক হয়? দ্রষ্টব্য: রূপান্তরটি নির্বিশেষে অর্থগুলি একইভাবে বেরিয়ে এসেছে।

সম্পাদনা # 1: অবশেষে, আমি অ-সাধারণভাবে বিতরণ করা ডেটার জন্য গড় এবং আত্মবিশ্বাসের অন্তরগুলি গণনা করতে আগ্রহী, সুতরাং আপনি যদি তাদের নেটিভ ইউনিটগুলিতে ব্যাক-ট্রান্সফর্ম করার পদ্ধতি সহ রূপান্তরিত ডেটাতে 95% সিআই কীভাবে গণনা করতে পারেন সে সম্পর্কে কিছু নির্দেশিকা দিতে পারলে , আমি কৃতজ্ঞ হবে!
শেষ সম্পাদনা # 1

সম্পাদনা # 2: আমি 95% আস্থা অন্তর পেতে কোয়ান্টাইল ফাংশনটি ব্যবহার করার চেষ্টা করেছি:

quantile(x, probs = c(0.05, 0.95))     # around [8.3, 11.6]
10^quantile(z, probs = c(0.05, 0.95))  # around [8.3, 11.6]

সুতরাং, এটি একই উত্তরে রূপান্তরিত হয়েছে, যা ভাল। তবে, এই পদ্ধতিটি ব্যবহার করে "ছোট" নমুনা মাপের সাথে অ-সাধারণ ডেটা ব্যবহার করে সঠিক একই ব্যবধানটি সরবরাহ করা হয় না:

t <- rlnorm(10)
mean(t)                            # around 1.46 units
10^mean(log(t, base=10))           # around 0.92 units
quantile(t, probs = c(0.05, 0.95))                     # around [0.211, 4.79]
10^(quantile(log(t, base=10), probs = c(0.05, 0.95)))  # around [0.209, 4.28]

কোন পদ্ধতিটি "আরও সঠিক" হিসাবে বিবেচিত হবে। আমি ধরে নিচ্ছি যে কেউ সবচেয়ে রক্ষণশীল হিসাবটি বেছে নেবে?

উদাহরণস্বরূপ, আপনি কি এই ফলাফলটি নন-নরমাল ডেটা (টি) হিসাবে [0.21, 4.79] এর 95% আত্মবিশ্বাসের ব্যবধান সহ 0.92 ইউনিট হিসাবে গড় হিসাবে প্রতিবেদন করবেন?
শেষ সম্পাদনা # 2

আপনার সময় জন্য ধন্যবাদ!


1
এসই, এস এন ডি বর্গমূল দ্বারা বিভক্ত হয় কেবল এন নয়
পেঙ্গুইন_কাইট

3
ধন্যবাদ! আমি যে সমস্যাটি স্থির করেছি। আমি যে বিষয়টি নিয়ে আসছি তা এখনও রয়ে গেছে।
বিস্মিত

উত্তর:


12

প্রাথমিক গণনার সাথে আপনার প্রধান সমস্যা হ'ল এসডি ( ওয়াই ) এর মতো হওয়া উচিত এর কোনও ভাল কারণ নেই । এটি সাধারণত বেশ আলাদা differentSD(লগ(ওয়াই))SD(ওয়াই)

কিছু পরিস্থিতিতে, আপনি টেলর সম্প্রসারণের মাধ্যমে এসডি ( লগ ( ওয়াই ) ) থেকে মোটামুটি আনুমানিক হিসাব করতে পারেন ।SD(ওয়াই)SD(লগ(ওয়াই))

var((এক্স))('(μএক্স))2σএক্স2

যদি আমরা লগ স্কেলে কে এলোমেলো পরিবর্তনশীল হিসাবে বিবেচনা করি তবে এখানে g ( X ) = exp ( X )এক্স(এক্স)=মেপুঃ(এক্স)

তাহলে var(মেপুঃ(এক্স))মেপুঃ(μএক্স)2σএক্স2

তারপরে SD(মেপুঃ(এক্স))মেপুঃ(μএক্স)σএক্স

এই ধারণাগুলি নমুনা বিতরণ জুড়ে বহন করে।

এটি উদাহরণস্বরূপ ভাল কাজ করতে ঝোঁক যদি আপনার উদাহরণ হিসাবে যেমন গড় বিচ্যুতি গড়ের তুলনায় সত্যিই ছোট হয়।

> mean(y)
[1] 10
> sd(y)
[1] 0.03
> lm=mean(log(y))
> ls=sd(log(y))
> exp(lm)*ls
[1] 0.0300104 

আপনি যদি কোনও প্যারামিটারের জন্য সিআই রূপান্তর করতে চান , যা শেষ পয়েন্টগুলি রূপান্তর করে কাজ করে।

(মেপুঃ(এক্স))মেপুঃ(μএক্স)(1+ +σএক্স2/2)(মেপুঃ(এল),মেপুঃ(ইউ))এল,ইউ1+ +σএক্স2/2

লগ স্কেলে যদি আপনার ডেটা আনুমানিক স্বাভাবিক হয় তবে আপনি এটিকে লগইনালিক গড়ের জন্য ব্যবধান তৈরির সমস্যা হিসাবে বিবেচনা করতে চাইতে পারেন।


1
ধন্যবাদ গ্লেন_ বি। আমি তা কখনই পরিসংখ্যান শ্রেণিতে শিখিনি।
হতবাক

2
[(এক্স)](μএক্স)+ +''(μএক্স)2σএক্স2=মেপুঃ(μএক্স)(1+ +σএক্স22)
মেপুঃ(μএক্স)»σএক্স2[মেপুঃ(এক্স)]

ধন্যবাদ @ ডেমমন্ড। হ্যাঁ, এটা সঠিক। আমি আমার উত্তরে একটি সংশোধন করব, শেষের কাছাকাছি অংশের অংশটি বেশ ম্যাঙ্গালড।
গ্লেন_বি -রিনস্টেট মনিকা

0

দেখে মনে হচ্ছে আপনি জ্যামিতিক মানের ত্রুটির সাথে কার্যকরভাবে জ্যামিতিক গড় চান exp(mean(log(x)))

যদিও এটি গণনা করা যুক্তিসঙ্গত বলে মনে হতে পারে:

exp(sd(log(x)/sqrt(n-1)))

আপনি এবং অন্যরা ইতিমধ্যে চিহ্নিত করেছেন যে এটি কয়েকটি কারণে সঠিক নয়। পরিবর্তে, ব্যবহার করুন:

exp(mean(log(x))) * (sd(log(x))/sqrt(n-1))

যা জ্যামিতিক গড় লগ-মান ত্রুটি দ্বারা গুণিত। এটি প্রায় প্রাকৃতিক প্রাকৃতিক ত্রুটি প্রায় ভাল করা উচিত।

সূত্র: https://www.jstor.org/stable/pdf/2235723.pdf

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.