আমি স্ট্যান্ডার্ড ত্রুটি এবং স্ট্যান্ডার্ড বিচ্যুতি মধ্যে পার্থক্য বুঝতে সংগ্রাম করছি। এগুলি কীভাবে আলাদা এবং আপনার কেন স্ট্যান্ডার্ড ত্রুটি পরিমাপ করা দরকার?
আমি স্ট্যান্ডার্ড ত্রুটি এবং স্ট্যান্ডার্ড বিচ্যুতি মধ্যে পার্থক্য বুঝতে সংগ্রাম করছি। এগুলি কীভাবে আলাদা এবং আপনার কেন স্ট্যান্ডার্ড ত্রুটি পরিমাপ করা দরকার?
উত্তর:
প্রশ্নের উত্তরটি সম্পূর্ণ করার জন্য, ওক্রাম স্ট্যান্ডার্ড ত্রুটিটিকে সুন্দরভাবে সম্বোধন করেছে তবে এটি স্ট্যান্ডার্ড বিচ্যুতির সাথে তুলনা করে না এবং নমুনা আকারের উপর নির্ভরতা উল্লেখ করে না। হিসাবে অনুমানকারী একটি বিশেষ ক্ষেত্রে হিসাবে নমুনা গড় বিবেচনা। গড়ের জন্য আদর্শ ত্রুটি হ'ল যেখানেজনসংখ্যার মানক বিচ্যুতি। সুতরাং এই উদাহরণে আমরা স্পষ্টভাবে দেখতে পাই কীভাবে বৃদ্ধির নমুনার আকারের সাথে স্ট্যান্ডার্ড ত্রুটি হ্রাস পায়। স্ট্যান্ডার্ড বিচ্যুতিটি প্রায়শই পৃথক পর্যবেক্ষণগুলি উল্লেখ করতে ব্যবহৃত হয়। সুতরাং স্ট্যান্ডার্ড বিচ্যুতি পৃথক পর্যবেক্ষণের পরিবর্তনশীলতার বর্ণনা দেয় যখন মান ত্রুটিটি অনুমানের পরিবর্তনশীলতা দেখায়। ভাল অনুমানকারীগুলি সামঞ্জস্যপূর্ণ যার অর্থ তারা সত্য প্যারামিটার মানকে রূপান্তর করে। নমুনার আকার বৃদ্ধির সাথে সাথে যখন তাদের স্ট্যান্ডার্ড ত্রুটিটি 0 এ কমে যায় তখন অনুমানকারীগুলি সামঞ্জস্যপূর্ণ হয় যা বেশিরভাগ ক্ষেত্রেই ঘটে থাকে কারণ আমরা নমুনাটির গড়ের সাথে স্পষ্টভাবে দেখতে পাওয়ায় স্ট্যান্ডার্ড ত্রুটি 0 তে চলে যায়।
এখানে আরও ব্যবহারিক (এবং গাণিতিক নয়) উত্তর:
নোট করুন যে স্ট্যান্ডার্ড ত্রুটিগুলি কেবল কোনও গড় হিসাবে নয়, ডেটা থেকে আপনার গণনা করা প্রায় কোনও প্যারামিটারের জন্য গণনা করা যেতে পারে। "স্ট্যান্ডার্ড ত্রুটি" শব্দটি কিছুটা অস্পষ্ট। উপরের পয়েন্টগুলি কেবলমাত্র গড়ের স্ট্যান্ডার্ড ত্রুটি বোঝায়।
( আমি যে গ্রাফপ্যাড পরিসংখ্যান নির্দেশিকাটি লিখেছি তা থেকে))
(মনে রাখবেন যে আমি গড়ের স্ট্যান্ডার্ড ত্রুটির দিকে মনোনিবেশ করছি, যা আমি বিশ্বাস করি যে প্রশ্নকারীও ছিল তবে আপনি কোনও নমুনা পরিসংখ্যানের জন্য একটি আদর্শ ত্রুটি তৈরি করতে পারেন)
স্ট্যান্ডার্ড ত্রুটিটি স্ট্যান্ডার্ড বিচ্যুতির সাথে সম্পর্কিত তবে তারা একই জিনিস নয় এবং নমুনার আকার বাড়ানো তাদের একসাথে আরও ঘনিষ্ঠ করে না। বরং এটি তাদের আরও দূরে সরিয়ে দেয়। নমুনার মানক বিচ্যুতি নমুনার আকার বৃদ্ধি পাওয়ায় জনসংখ্যার মানক বিচ্যুতির কাছাকাছি হয়ে যায় তবে স্ট্যান্ডার্ড ত্রুটি হয় না।
কখনও কখনও এই কাছাকাছি পরিভাষাটি পেতে কিছুটা ঘন হয়।
আপনি যখন কোনও নমুনা সংগ্রহ করেন এবং সেই নমুনার মানক বিচ্যুতি গণনা করেন, সেই নমুনা আকারে বাড়ার সাথে মান বিচ্যুতির অনুমান আরও এবং আরও সঠিক হয়ে যায়। আপনার প্রশ্ন থেকে মনে হয় আপনি যা ভাবছিলেন তা ছিল। তবে এও বিবেচনা করুন যে নমুনার গড়টি গড়ে জনসংখ্যার কাছাকাছি চলেছে। এটি স্ট্যান্ডার্ড ত্রুটি বোঝার জন্য গুরুত্বপূর্ণ।
স্ট্যান্ডার্ড ত্রুটিটি হল আপনি যদি কোনও নির্দিষ্ট আকারের একাধিক নমুনা পেয়ে থাকেন তবে কী হবে। আপনি যদি 10 এর নমুনা নেন তবে আপনি গড়টির কিছুটা প্রাক্কলন পেতে পারেন। তারপরে আপনি 10 এর নতুন নমুনা এবং নতুন গড় প্রাক্কলন ইত্যাদি নিয়ে যান। এই নমুনাগুলির অর্থের স্ট্যান্ডার্ড বিচ্যুতি হ'ল স্ট্যান্ডার্ড ত্রুটি। আপনি আপনার প্রশ্ন জিজ্ঞাসা করেছেন যে আপনি সম্ভবত এখন দেখতে পাবেন যে যদি এন উচ্চ হয় তবে মান ত্রুটি আরও ছোট কারণ নমুনার মাধ্যমগুলি সত্যিকারের মান থেকে অনেকটা বিচ্যুত হওয়ার সম্ভাবনা কম থাকবে।
এমন কিছুকে যা একরকম অলৌকিক বলে মনে হয় যে আপনি এটি একটি নমুনা থেকে গণনা করেছেন। সুতরাং, আপনি যা করতে পারতেন তা হ'ল সম্পর্কটি প্রদর্শনের জন্য সিমুলেশনের মাধ্যমে একটি স্ট্যান্ডার্ড ত্রুটি বুটস্ট্র্যাপ করুন। আর এর মতো দেখতে হবে:
# the size of a sample
n <- 10
# set true mean and standard deviation values
m <- 50
s <- 100
# now generate lots and lots of samples with mean m and standard deviation s
# and get the means of those samples. Save them in y.
y <- replicate( 10000, mean( rnorm(n, m, s) ) )
# standard deviation of those means
sd(y)
# calcuation of theoretical standard error
s / sqrt(n)
আপনি দেখতে পাবেন যে শেষ দুটি কমান্ড একই নম্বর উত্পন্ন করে (প্রায়)। আপনি এন, মি এবং এর মানগুলি পরিবর্তিত করতে পারেন এবং সেগুলি সবসময় একে অপরের কাছাকাছি চলে আসে।