স্ট্যান্ডার্ড ত্রুটি এবং স্ট্যান্ডার্ড বিচ্যুতি মধ্যে পার্থক্য


96

আমি স্ট্যান্ডার্ড ত্রুটি এবং স্ট্যান্ডার্ড বিচ্যুতি মধ্যে পার্থক্য বুঝতে সংগ্রাম করছি। এগুলি কীভাবে আলাদা এবং আপনার কেন স্ট্যান্ডার্ড ত্রুটি পরিমাপ করা দরকার?


7
একটি তাত্ক্ষণিক মন্তব্য, একটি উত্তর নয় যেহেতু দুটি দরকারী ইতিমধ্যে উপস্থিত রয়েছে: স্ট্যান্ডার্ড বিচ্যুতিটি র্যান্ডম ভেরিয়েবল (গুলি) এর সম্পত্তি। স্ট্যান্ডার্ড ত্রুটি পরিবর্তে নির্দিষ্ট নমুনায় একটি পরিমাপের সাথে সম্পর্কিত। মহাবিশ্ব এবং আপনার নমুনার মধ্যে পার্থক্য ঝাপসা করার সময় দুটি বিভ্রান্ত হতে পারে।
ফ্রান্সেস্কো

সম্ভবত আগ্রহের বিষয়: stats.stackexchange.com/questions/15505/…
ম্যাক্রো

উত্তর:


31

প্রশ্নের উত্তরটি সম্পূর্ণ করার জন্য, ওক্রাম স্ট্যান্ডার্ড ত্রুটিটিকে সুন্দরভাবে সম্বোধন করেছে তবে এটি স্ট্যান্ডার্ড বিচ্যুতির সাথে তুলনা করে না এবং নমুনা আকারের উপর নির্ভরতা উল্লেখ করে না। হিসাবে অনুমানকারী একটি বিশেষ ক্ষেত্রে হিসাবে নমুনা গড় বিবেচনা। গড়ের জন্য আদর্শ ত্রুটি হ'ল যেখানেσ/এনσজনসংখ্যার মানক বিচ্যুতি। সুতরাং এই উদাহরণে আমরা স্পষ্টভাবে দেখতে পাই কীভাবে বৃদ্ধির নমুনার আকারের সাথে স্ট্যান্ডার্ড ত্রুটি হ্রাস পায়। স্ট্যান্ডার্ড বিচ্যুতিটি প্রায়শই পৃথক পর্যবেক্ষণগুলি উল্লেখ করতে ব্যবহৃত হয়। সুতরাং স্ট্যান্ডার্ড বিচ্যুতি পৃথক পর্যবেক্ষণের পরিবর্তনশীলতার বর্ণনা দেয় যখন মান ত্রুটিটি অনুমানের পরিবর্তনশীলতা দেখায়। ভাল অনুমানকারীগুলি সামঞ্জস্যপূর্ণ যার অর্থ তারা সত্য প্যারামিটার মানকে রূপান্তর করে। নমুনার আকার বৃদ্ধির সাথে সাথে যখন তাদের স্ট্যান্ডার্ড ত্রুটিটি 0 এ কমে যায় তখন অনুমানকারীগুলি সামঞ্জস্যপূর্ণ হয় যা বেশিরভাগ ক্ষেত্রেই ঘটে থাকে কারণ আমরা নমুনাটির গড়ের সাথে স্পষ্টভাবে দেখতে পাওয়ায় স্ট্যান্ডার্ড ত্রুটি 0 তে চলে যায়।


3
পুনরায়: "... ধারাবাহিক যার অর্থ তাদের স্ট্যান্ডার্ড ত্রুটি 0" এ কমে যায় - এটি সত্য নয়। আপনি কি এই আলোচনার কথা মনে রেখেছেন: stats.stackexchange.com/questions/31036/… ?
ম্যাক্রো

1
হ্যাঁ অবশ্যই আমি অস্বাভাবিক ব্যতিক্রমগুলির আলোচনাটি মনে করি এবং প্রশ্নের উত্তর দেওয়ার সময় আমি এটি নিয়ে ভাবছিলাম। তবে প্রশ্নটি স্ট্যান্ডার্ড ত্রুটিগুলি সম্পর্কে ছিল এবং সরল ভাষায় ভাল প্যারামিটারের অনুমানগুলি সামঞ্জস্যপূর্ণ এবং তাদের স্ট্যান্ডার্ড ত্রুটিগুলি নমুনাটির গড় হিসাবে 0 তে থাকে।
মাইকেল চেরনিক

4
আমি আপনার মন্তব্যের সাথে একমত - নমুনা গড়ের মান ত্রুটি 0 এ যায় এবং নমুনাটির গড়টি সামঞ্জস্যপূর্ণ। তবে এর মান ত্রুটি শূন্যে যাওয়ার বিষয়টি (বা এর সমতুল্য) সত্য নয় যে এটি ধারাবাহিক, যা আপনার উত্তর বলে says
ম্যাক্রো

3
@ ম্যাক্রো হ্যাঁ উত্তরটি উন্নত হতে পারে যা আমি করার সিদ্ধান্ত নিয়েছিলাম। আমি মনে করি যে ওপিগুলির সাথে খুব বেশি প্রযুক্তিগত না হওয়া গুরুত্বপূর্ণ কারণ যোগ্যতার সাথে সবকিছু জটিল এবং বিভ্রান্তিকর হতে পারে। প্রযুক্তিগত নির্ভুলতা সরলতার জন্য ত্যাগ করা উচিত নয়। সুতরাং আমি মনে করি যে আমার সম্পাদনায় আমি যেভাবে এটি সম্বোধন করেছি এটি এটি করার সর্বোত্তম উপায়।
মাইকেল চেরনিক

9
আমি একমত যে একেবারে প্রয়োজনীয় না হলে প্রযুক্তিগত না হওয়া গুরুত্বপূর্ণ। আমার একমাত্র মন্তব্যটি ছিল, একবার আপনি ইতিমধ্যে ধারাবাহিকতা (একটি প্রযুক্তিগত ধারণা) প্রবর্তন করার জন্য বেছে নিয়েছেন, উত্তরটি সহজ করে বোঝার নামে এটির ভুল বৈশিষ্ট্যযুক্ত করার কোনও লাভ নেই। আমি মনে করি আপনার সম্পাদনাটি আমার মন্তব্যগুলিকে সম্বোধন করে।
ম্যাক্রো

51

এখানে আরও ব্যবহারিক (এবং গাণিতিক নয়) উত্তর:

  • এসডি (স্ট্যান্ডার্ড বিচ্যুতি) স্ক্রটারকে পরিমাণমতো করে দেয় - মানগুলি একে অপরের থেকে কতটা পৃথক হয়।
  • এসইএম (গড়ের স্ট্যান্ডার্ড ত্রুটি) জনসংখ্যার আসল গড়টি আপনি কতটা সঠিকভাবে জানেন তা পরিমিত করে। এটি এসডি এর মান এবং নমুনা আকার উভয় বিবেচনায় নেয়।
  • এসডি এবং এসইএম উভয়ই একই ইউনিটে রয়েছে - ডেটার একক।
  • সংজ্ঞা অনুসারে এসইএম, এসডি থেকে সর্বদা ছোট।
  • আপনার নমুনা বড় হওয়ার সাথে সাথে এসইএম আরও ছোট হয় smaller এটি উপলব্ধি করে, কারণ একটি বৃহত নমুনার গড় অর্থ একটি ছোট নমুনার গড়ের চেয়ে প্রকৃত জনসংখ্যার কাছাকাছি হতে পারে। একটি বিশাল নমুনা সহ, আপনি ডেটা খুব ছড়িয়ে ছিটিয়ে থাকলেও অনেকগুলি নির্ভুলতার সাথে আপনি গড়টির মানটি জানবেন।
  • আপনি আরও ডেটা অর্জন করার সাথে সাথে এসডি পূর্বাভাস পরিবর্তন করে না। আপনি যে নমুনাটি থেকে এসডি গণনা করছেন এটি হ'ল সামগ্রিক জনগণের এসডির সর্বোত্তম সম্ভাবনা। আপনি আরও ডেটা সংগ্রহ করার সময়, আপনি আরও নির্ভুলতার সাথে জনসংখ্যার এসডি মূল্যায়ন করবেন। তবে কোনও বৃহত নমুনা থেকে এসডি একটি ছোট নমুনা থেকে এসডি থেকে আরও বড় বা ছোট হবে কিনা তা আপনি ভবিষ্যদ্বাণী করতে পারবেন না। (এটি একটি সরলীকরণ, একেবারেই সত্য নয় below নীচের মন্তব্য দেখুন))

নোট করুন যে স্ট্যান্ডার্ড ত্রুটিগুলি কেবল কোনও গড় হিসাবে নয়, ডেটা থেকে আপনার গণনা করা প্রায় কোনও প্যারামিটারের জন্য গণনা করা যেতে পারে। "স্ট্যান্ডার্ড ত্রুটি" শব্দটি কিছুটা অস্পষ্ট। উপরের পয়েন্টগুলি কেবলমাত্র গড়ের স্ট্যান্ডার্ড ত্রুটি বোঝায়।

( আমি যে গ্রাফপ্যাড পরিসংখ্যান নির্দেশিকাটি লিখেছি তা থেকে))


11
এন100*এন.18এন=2

4
@ শুভ: অবশ্যই আপনি ঠিক বলেছেন। এটি বৈকল্পিক (এসডি স্কোয়ার্ড) যা আপনি আরও ডেটা যুক্ত করার সাথে পূর্বে অনুভূত হয় না। নমুনার আকার বাড়ার সাথে সাথে এসডি কিছুটা বড় হবে, বিশেষত যখন আপনি ক্ষুদ্র নমুনা দিয়ে শুরু করেন with নমুনা আকারের পরিবর্তন হিসাবে SEM এর পরিবর্তনের সাথে এই পরিবর্তনটি সামান্য।
হার্ভে মোটুলসকি

@ হারেওমোটালস্কি: এসডি কেন বাড়বে?
অ্যান্ড্রু

বড় নমুনাগুলির সাথে, নমুনা বৈকল্পিকতা জনসংখ্যার বৈকল্পের বেশ কাছাকাছি থাকবে, সুতরাং নমুনা এসডিটি জনসংখ্যার এসডির কাছাকাছি থাকবে। আরও ছোট নমুনাগুলির সাথে, নমুনা বৈকল্পিক গড়ে জনসংখ্যার বৈচিত্রের সমান হবে, তবে তাত্পর্যগুলি আরও বেশি হবে। যদি রূপগুলি প্রতিসম হয় তবে এগুলি এসডি হিসাবে অসম্পৃক্ত হবে। উদাহরণ: জনসংখ্যার বৈকল্পিক 100. দুটি নমুনা রূপগুলি 80 বা 120 (প্রতিসম)। নমুনা এসডি 10 হওয়া উচিত, তবে তা 8.94 বা 10.95 হবে। জনসংখ্যার বৈচিত্রের চারপাশে একসম্মত বিতরণ থেকে গড় নমুনা এসডিগুলি, এবং গড় এসডি কম এন এর সাথে কম হবে
হার্ভি মোটুলস্কি

43

θএক্স={এক্স1,...,এক্সএন}θθ^(এক্স)θ^(এক্স)এক্সএক্স~θ^(এক্স~)θ^(এক্স)θ^θ^(এক্স)θ^


1
অনুমানের মানগত ত্রুটিটি কি আনুমানিক পরিবর্তকের মান হ্রাসের সমান?
ইউুরি

6

(মনে রাখবেন যে আমি গড়ের স্ট্যান্ডার্ড ত্রুটির দিকে মনোনিবেশ করছি, যা আমি বিশ্বাস করি যে প্রশ্নকারীও ছিল তবে আপনি কোনও নমুনা পরিসংখ্যানের জন্য একটি আদর্শ ত্রুটি তৈরি করতে পারেন)

স্ট্যান্ডার্ড ত্রুটিটি স্ট্যান্ডার্ড বিচ্যুতির সাথে সম্পর্কিত তবে তারা একই জিনিস নয় এবং নমুনার আকার বাড়ানো তাদের একসাথে আরও ঘনিষ্ঠ করে না। বরং এটি তাদের আরও দূরে সরিয়ে দেয়। নমুনার মানক বিচ্যুতি নমুনার আকার বৃদ্ধি পাওয়ায় জনসংখ্যার মানক বিচ্যুতির কাছাকাছি হয়ে যায় তবে স্ট্যান্ডার্ড ত্রুটি হয় না।

কখনও কখনও এই কাছাকাছি পরিভাষাটি পেতে কিছুটা ঘন হয়।

আপনি যখন কোনও নমুনা সংগ্রহ করেন এবং সেই নমুনার মানক বিচ্যুতি গণনা করেন, সেই নমুনা আকারে বাড়ার সাথে মান বিচ্যুতির অনুমান আরও এবং আরও সঠিক হয়ে যায়। আপনার প্রশ্ন থেকে মনে হয় আপনি যা ভাবছিলেন তা ছিল। তবে এও বিবেচনা করুন যে নমুনার গড়টি গড়ে জনসংখ্যার কাছাকাছি চলেছে। এটি স্ট্যান্ডার্ড ত্রুটি বোঝার জন্য গুরুত্বপূর্ণ।

স্ট্যান্ডার্ড ত্রুটিটি হল আপনি যদি কোনও নির্দিষ্ট আকারের একাধিক নমুনা পেয়ে থাকেন তবে কী হবে। আপনি যদি 10 এর নমুনা নেন তবে আপনি গড়টির কিছুটা প্রাক্কলন পেতে পারেন। তারপরে আপনি 10 এর নতুন নমুনা এবং নতুন গড় প্রাক্কলন ইত্যাদি নিয়ে যান। এই নমুনাগুলির অর্থের স্ট্যান্ডার্ড বিচ্যুতি হ'ল স্ট্যান্ডার্ড ত্রুটি। আপনি আপনার প্রশ্ন জিজ্ঞাসা করেছেন যে আপনি সম্ভবত এখন দেখতে পাবেন যে যদি এন উচ্চ হয় তবে মান ত্রুটি আরও ছোট কারণ নমুনার মাধ্যমগুলি সত্যিকারের মান থেকে অনেকটা বিচ্যুত হওয়ার সম্ভাবনা কম থাকবে।

এমন কিছুকে যা একরকম অলৌকিক বলে মনে হয় যে আপনি এটি একটি নমুনা থেকে গণনা করেছেন। সুতরাং, আপনি যা করতে পারতেন তা হ'ল সম্পর্কটি প্রদর্শনের জন্য সিমুলেশনের মাধ্যমে একটি স্ট্যান্ডার্ড ত্রুটি বুটস্ট্র্যাপ করুন। আর এর মতো দেখতে হবে:

# the size of a sample
n <- 10
# set true mean and standard deviation values
m <- 50
s <- 100

# now generate lots and lots of samples with mean m and standard deviation s
# and get the means of those samples. Save them in y.
y <- replicate( 10000, mean( rnorm(n, m, s) ) )
# standard deviation of those means
sd(y)
# calcuation of theoretical standard error
s / sqrt(n)

আপনি দেখতে পাবেন যে শেষ দুটি কমান্ড একই নম্বর উত্পন্ন করে (প্রায়)। আপনি এন, মি এবং এর মানগুলি পরিবর্তিত করতে পারেন এবং সেগুলি সবসময় একে অপরের কাছাকাছি চলে আসে।


আমি এটি সত্যিই সহায়ক খুঁজে পেয়েছি, পোস্ট করার জন্য ধন্যবাদ। স্ট্যান্ডার্ড ত্রুটিটিকে "নমুনা বিতরণের মানক বিচ্যুতি" হিসাবে বর্ণনা করা কি তবে ন্যায্য হবে? আপনার কোড ব্লকের উপরের নমুনা বিতরণ y? এটিই আমাকে বিভ্রান্ত করেছে, নমুনা পরামিতিগুলির এসডি বিভক্ত করে এবং নমুনা বিতরণ পরামিতিগুলির সাথে বোঝায়।
ডগ ফির

1
আপনি যদি এই ক্ষেত্রে নমুনার অর্থ নির্দিষ্ট করতে আপনার শব্দ পরিবর্তন করেন তবে হ্যাঁ।
জন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.