কেন স্ট্যান্ডার্ড বিচ্যুতিটি ভিন্নতার স্কোয়ার্ট হিসাবে সংজ্ঞায়িত করা হয় এবং এন এর উপরে বর্গাকার যোগফলের স্কয়ার্ট হিসাবে নয়?


16

আজ আমি পরিসংখ্যানের একটি প্রাথমিক শ্রেণি শিখিয়েছি এবং একজন শিক্ষার্থী আমার কাছে একটি প্রশ্ন নিয়ে এসেছিল, যা আমি এখানে পুনরায় উল্লেখ করেছি: "কেন স্ট্যান্ডার্ড বিচ্যুতিটি স্কোর্টের বিভাজন হিসাবে সংজ্ঞায়িত করা হয় এবং এন এর উপর বর্গাকার সমষ্টিগুলির স্কয়ার্ট হিসাবে নয়?"

আমরা জনসংখ্যার বৈকল্পিকতা সংজ্ঞায়িত করি:σ2=1N(xiμ)2

এবং মানক চ্যুতির:।σ=σ2=1N(xiμ)2

আমরা যে ব্যাখ্যাটি দিতে পারি তা হ'ল এটি জনসংখ্যার একককে X এর জনসংখ্যা থেকে গড় বিচ্যুতি দেয় ।σX

যাইহোক, এসডি সংজ্ঞা আমরা মাধ্যমে বর্গের সমষ্টি এর বর্গমূল ভাগ N । শিক্ষার্থী যে প্রশ্নটি উত্থাপন করে তা হ'ল আমরা কেন এর পরিবর্তে স্কোয়ার্সের স্কোয়ার্টের স্কয়ারটি N দ্বারা ভাগ করব না N। সুতরাং আমরা প্রতিযোগিতামূলক সূত্রে আসি:

σnew=1N(xiμ)2.
শিক্ষার্থী যুক্তি দিয়েছিলেন যে formula সিগমা হিসাবে \ sqrt {N through এর মাধ্যমে বিভাজন করার চেয়ে এই সূত্রটি গড় থেকে একটি "গড়" বিচ্যুতির মতো দেখায় ।Nσ

আমি ভেবেছিলাম এই প্রশ্নটি বোকা নয়। আমি সেই ছাত্রকে একটি উত্তর দিতে চাই যা আরও বেশি বলে যে এসডিটি গড় স্কোয়ার ডিভিয়েটন যা ভেরিয়েন্সটির স্কয়ার্ট হিসাবে সংজ্ঞায়িত করা হয়। অন্যভাবে বলতে গেলে, কেন ছাত্রটিকে সঠিক সূত্র ব্যবহার করা উচিত এবং তার ধারণাকে অনুসরণ করা উচিত নয়?

এই প্রশ্নটি এখানে সরবরাহ করা পুরানো থ্রেড এবং উত্তরগুলির সাথে সম্পর্কিত । উত্তরগুলি তিন দিকে যায়:

  1. σ হ'ল মূল-স্কোয়ার্ড (আরএমএস) বিচ্যুতি, গড় থেকে "সাধারণ" বিচ্যুতি নয় (যেমন, )। সুতরাং, এটি অন্যভাবে সংজ্ঞায়িত করা হয়।σnew
  2. এটিতে গাণিতিক বৈশিষ্ট্য রয়েছে।
  3. তদতিরিক্ত, স্কয়ার্টটি তাদের "ইউনিট" কে তাদের মূল স্কেলে ফিরিয়ে আনবে। তবে এটি for এর ক্ষেত্রেও হবে , যা পরিবর্তে দ্বারা ভাগ করে ।σnewN

1 এবং 2 পয়েন্ট উভয় আরএমএস যেমন SD পক্ষে আর্গুমেন্ট, কিন্তু আমি ব্যবহার করার বিরুদ্ধে একটি আর্গুমেন্ট দেখতে না । গড় থেকে আরএমএস দূরত্ব ব্যবহারের সূচনা স্তরের শিক্ষার্থীদের বোঝাতে ভাল যুক্তি কী হবে ?σnewσ


2
আমার মনে হয় "আদর্শ বিচ্যুতিটি কেন ..." হিসাবে সংজ্ঞায়িত করা খুব প্রশ্নের উত্তর দেওয়া শক্ত। সংজ্ঞাগুলি কেবল ইচ্ছামত লেবেলিং কনভেনশন। তাদের কেন মেনে চলতে হবে না ।
ttnphns

"Why is the standard deviation defined as sqrt of variance and not as average of [the root of] sum of squares?"এটি কি এমন হতে পারে যা বন্ধনীর ভিতরে রয়েছে কোনওভাবে প্রশ্নটিতে হারিয়ে গেছে?
ttnphns

1
কিন্তু এসডি বিভিন্ন উদ্দেশ্যে কাজ করে; এটির মতো সংজ্ঞায়িত হওয়ার চেয়ে আরও ভাল অনুপ্রেরণা থাকতে হবে। বিশেষত আন্ডারগ্রাজুয়েটদের পড়াতে এটি কার্যকর হবে। আমি চেবিশেভের অসমতার অর্থে একটি অনুপ্রেরণা কল্পনা করতে পারি (+/- এর ক্ষেত্রে সীমাবদ্ধতার অনুপাতের নূন্যতম এসডির একটি ধ্রুবক গুণক)।
টমকা

2
উত্তর দিতে পারবেন না কারণ আপনার প্রশ্নটি আটকে আছে, তবে এটি চেষ্টা করে দেখুন: আপনি প্রায় 1 এবং 3 এর মান মোটামুটি সমান অনুপাতে পর্যবেক্ষণ করুন (একটি মুদ্রা টু, , )। গড় থেকে পর্যবেক্ষণগুলির একটি "সাধারণ দূরত্ব" 1 টির মতো হওয়া উচিত আপনার সূত্রের সাথে বিবেচনা করুন , খুব, খুব বড় এর সাধারণ দূরত্বটির এই পরিমাপের কী ঘটে । প্রতিটি ক্ষেত্রে1 এর কাছাকাছি হবে, সুতরাং তাদের বর্গাকার যোগফল কাছাকাছি হবে । অঙ্কটি নিকটবর্তী হবে সুতরাং আপনার সূত্রটি বাড়ার সাথে সাথে আরও ছোট হয়ে উঠবে , যদিও গড় থেকে সাধারণত দূরত্ব পরিবর্তন হচ্ছে না। H=3T=1SSE/nn|xix¯|nnn
গ্লেন_বি -ইনস্টেট মনিকা

1
@ যাকে আমি আরেকটি আপডেট করেছি এবং আশা করি আমার যে পয়েন্টটি করা হয়েছে তা আরও স্পষ্ট হবে। দ্রষ্টব্য আমি পরিসংখ্যানের তহবিল সম্পর্কে একটি প্রশ্ন জিজ্ঞাসা করার পাশাপাশি এখানে শিক্ষণের পরামর্শ চাইছি। আমি বিকল্প ফর্মুলার পরামর্শ দিচ্ছি না, তবে ক্লাসরুমের একটি শিক্ষার্থীর দ্বারা উত্তম প্রশ্নের একটি ভাল প্রশ্নের একটি উদাহরণ দিয়েছি যার কাছে আমার তাত্ক্ষণিক উত্তর নেই have আপনি যদি রাজি হন তবে আমি দয়া করে প্রশ্নটি এখনই হোল্ড থেকে ছেড়ে দেওয়ার জন্য অনুরোধ করছি।
টমকা

উত্তর:


12

কমপক্ষে তিনটি প্রাথমিক সমস্যা রয়েছে যা প্রাথমিকভাবে প্রাথমিকভাবে ব্যাখ্যা করা যেতে পারে:

  1. "নতুন" এসডি এমনকি অসীম জনসংখ্যার জন্যও সংজ্ঞায়িত হয় না। (এ জাতীয় ক্ষেত্রে এটি সর্বদা শূন্যের সমান হতে পারে, তবে এটি এটিকে আর কার্যকর করে না))

  2. নতুন এসডি এলোমেলো নমুনার অধীনে গড়ের মতো আচরণ করে না।

  3. যদিও নতুন এসডি সমস্ত গাণিতিক দৃor়তার সাথে ব্যবহার করা যেতে পারে কোনও গড় থেকে (নমুনা এবং সীমাবদ্ধ জনগোষ্ঠীর) থেকে বিচ্যুতিগুলি মূল্যায়নের জন্য, তবে এর ব্যাখ্যা অহেতুক জটিল।

1. নতুন এসডি প্রয়োগযোগ্যতা সীমিত

পয়েন্ট (1) বাড়িতে আনা যেতে পারে, এমনকি সংহতকরণে দক্ষ নয় তাদের কাছেও উল্লেখ করে যে বৈচিত্রটি স্পষ্টতই একটি পাটিগণিত গড় (স্কোয়ার বিচ্যুতির), এটি "অসীম" জনসংখ্যার মডেলগুলির একটি দরকারী বর্ধিতাংশ যার জন্য একটি গাণিতিক অর্থের অস্তিত্বের অন্তর্দৃষ্টি এখনও ধারণ করে। সুতরাং এর স্কোয়ার রুট - সাধারণ এসডি - এ জাতীয় ক্ষেত্রেও পুরোপুরি সুস্পষ্টভাবে সংজ্ঞায়িত হয়েছে, এবং এর (ননলাইনারের পুনর্বিবেচনা) বৈকল্পিক হিসাবে তার ভূমিকাতে ঠিক ততটাই কার্যকর। যাইহোক, নতুন এসডি সেই গড়কে নির্বিচারে বৃহত by দ্বারা ভাগ করে দেয় , সীমাবদ্ধ জনসংখ্যা এবং সীমাবদ্ধ নমুনাগুলির বাইরে এর সাধারণীকরণকে সমস্যাযুক্ত করে তোলে: এই ক্ষেত্রে equal কে কী সমান করতে হবে?N1/N

2. নতুন এসডি গড় নয়

"গড়" নামের যোগ্য কোনও পরিসংখ্যানের এমন সম্পত্তি থাকতে হবে যা জনসংখ্যার থেকে এলোমেলো নমুনার আকার বাড়ার সাথে সাথে জনসংখ্যার মানকে রূপান্তর করে। এসডি-র যে কোনও স্থির একাধিকের এই সম্পত্তি থাকবে, কারণ গুণক নমুনা এসডি এবং জনসংখ্যার এসডি গণনা উভয় ক্ষেত্রেই প্রয়োগ করবে। (না হলেও সরাসরি যুক্তি Alecos Papadopoulos দ্বারা প্রদত্ত contradicting, এই পর্যবেক্ষণ বলে যে যুক্তি শুধুমাত্র বাস্তব সমস্যা স্পর্শিনী হয়।) কিন্তু "নতুন" এসডি, এর সমান হচ্ছে নমুনার আকারNবড়হওয়ার সাথে সাথে স্বাভাবিকের চেয়ে N বার,সমস্ত পরিস্থিতিতেস্পষ্টত0তেরূপান্তরিত হয়। সুতরাং,যদিও কোনও নির্দিষ্ট নমুনার আকারএন এরজন্য নতুন এসডি (যথাযথভাবে ব্যাখ্যা করা) এর প্রায়শই ভিন্নতার পুরোপুরি পর্যাপ্ত পরিমাপ,এটি যুক্তিযুক্তভাবেসমস্ত নমুনা আকারের জন্য একই ব্যাখ্যা সহ প্রযোজ্যসর্বজনীনপরিমাপহিসাবে বিবেচিত হতে পারে না এবং এটিও হতেপারে না সঠিকভাবে কোনও কার্যকর অর্থে একটি "গড়" বলা হয়।1/N0NN

৩. নতুন এসডি ব্যাখ্যা এবং ব্যবহার করা জটিল

(বলুন) আকার নমুনা নেওয়া বিবেচনা করুন । এই ক্ষেত্রে নতুন এসডি 1 / √ হয় √N=4বার চলিত এসডি। সুতরাং এটি তুলনামূলক ব্যাখ্যাগুলি উপভোগ করে যেমন 68৮-৯৯-৯৯ বিধিটির এনালগ (প্রায় 68%% তথ্যদুটিনতুন এসডিরমধ্যে থাকা উচিত, এর মধ্যে ৯৫%চারটিনতুন এসডিইত্যাদির মধ্যে থাকে ইত্যাদি); এবং এই ধরনের Chebychev ইচ্ছা হোল্ড (কোন চেয়ে বড় কিছু হিসাবে শাস্ত্রীয় অসাম্য সংস্করণ1/2ডেটার চেয়ে বেশি থাকা পারেন2তাদের গড় থেকে নতুন এসডিএস দূরে); এবং সেন্ট্রাল সীমা উপপাদ্য অনুরূপভাবে নতুন এসডি পদ restated যাবে (একটি দ্বারা বিভক্ত হয়1/N=1/21/k22k অর্ডার পরিবর্তনশীল প্রমিত করার জন্য) মধ্যে Times New এসডি। সুতরাং, এই নির্দিষ্ট এবং স্পষ্টভাবে সীমাবদ্ধ অর্থে,শিক্ষার্থীর প্রস্তাবে কোনও ভুল নেই। অসুবিধা, যদিও, এই বিবৃতিতে সমস্ত রয়েছে - বেশ স্পষ্টভাবে - √ এর কারণগুলিN। যদিও এর সাথে কোনও সহজাত গাণিতিক সমস্যা নেই তবে এটি অবশ্যই পরিসংখ্যানের সর্বাধিক মৌলিক আইনগুলির বিবৃতি এবং ব্যাখ্যা জটিল করে তোলে।N=2


এটি লক্ষণীয় যে গাউস এবং অন্যান্যরা মূলত দ্বারা গাউসীয় বিতরণকে পরামিতি করেছিলেন , কার্যকরভাবে using ব্যবহার করে2σসাধারণ র্যান্ডম ভেরিয়েবলের প্রসারণের পরিমাণ 2 বার এসডি SD এই historicalতিহাসিক ব্যবহারটি এসডিটির স্থিরভাবে অন্যান্যস্থিরবহুগুণব্যবহারের স্বতন্ত্রতা এবং কার্যকারিতা প্রদর্শন করে।2


আপনাকে ধন্যবাদ - একটি প্রশ্ন ফিরে (আপনার পয়েন্ট 2 সম্পর্কিত): না বিন্দুতে মিলিত0হিসাবেএনবৃহৎ বৃদ্ধি, যেহেতু11N0N অবশ্যই আছে? 1N
টোমকা

2
আমরা নমুনার এসডি তুলনা করছি বার নমুনা এসডি ( "নতুন এসডি")। হিসাবেএনবৃহৎ বৃদ্ধি, নমুনা এর এসডি পন্থা একটি (সাধারণত) অশূন্যধ্রুবকথেকে জনসংখ্যা এসডি সমান। অতএব1/1/NNনমুনা এসডি N বার শূন্য রূপান্তরিত। 1/N
হোবার

এটি স্ট্যান্ডার্ড উপাদান - গাণিতিক পরিসংখ্যানগুলির কোনও কঠোর পাঠ্যপুস্তকের সাথে পরামর্শ করুন (যা ন্যায্য হতে পারে, বেশিরভাগ নবজাতকের কাছে অ্যাক্সেসযোগ্য হবে না)। যাইহোক, আমার উত্তরের জন্য গুরুত্বপূর্ণ ফলাফলগুলি দুর্বল এবং স্বজ্ঞাতভাবে সুস্পষ্ট বক্তব্য অনুসরণ করে। একটি সংখ্যা ঠিক করুন দিন σ হতে জনসংখ্যা এসডি। সুযোগ যে নমুনা এসডি মধ্যে থাকবে বিবেচনা σ / একটি এবং একটি σ । এটি যথেষ্ট যে নমুনার আকার N বৃদ্ধি পাওয়ার সাথে সাথে এই সুযোগটি শূন্যে চলে গেছে । এটি একা দেখায় যে 1 / A>1σσ/AAσN বার নমুনা এসডিপ্রায় অবশ্যই0 এরূপান্তর করে, উত্তরে পয়েন্ট (2) প্রদর্শন করে। 1/N0
শুক্রবার

+1, প্লাস এটি স্কেল-ইনভেরিয়েন্ট ইত্যাদি নয় (এই ফর্মটির একটি মুহুর্তের জন্য প্রয়োজনীয় একটি শর্ত)
নিকোস এম।

@ নিকোস আপনাকে ধন্যবাদ, তবে স্কেল ইনগ্রেন্টেন্ট কী নয়? উভয় ডেটা পুনরুদ্ধার করা হলে এন এবংএসডিপরিবর্তন করে। SD/NSD
হোবার

5

ধরে নিন যে আপনার নমুনায় কেবল দুটি উপলব্ধ রয়েছে। আমি অনুমান করি যে বিচ্ছুরণের একটি স্বজ্ঞাত ব্যবস্থা হ'ল গড় পরম বিচ্যুতি (এএডি) হবে

AAD=12(|x1x¯|+|x2x¯|)=...=|x1x2|2

সুতরাং আমরা চাইব যে পরিমাপের একই একক স্তরের ছড়িয়ে পড়ার অন্যান্য পদক্ষেপগুলি উপরের "কাছাকাছি" হতে পারে।

নমুনা বৈকল্পিক হিসাবে সংজ্ঞায়িত করা হয়

σ2=12[(x1x¯)2+(x2x¯)2]=12[(x1x22)2+(x2x12)2]

=12[(x1x2)24+(x1x2)24]=12(x1x2)22

=12|x1x2|22

পরিমাপের আসল ইউনিটগুলিতে ফিরে আসার জন্য, আমরা যদি শিক্ষার্থী বিস্মিত / প্রস্তাবিত হিসাবে কাজ করি তবে আমরা পরিমাপটি গ্রহণ করব, এটিকে q বলিq

q12|x1x2|22=12|x1x2|2=12AAD<AAD

উদাহরণস্বরূপ, আমরা ছড়িয়ে পড়ার "স্বজ্ঞাত" পরিমাপকে "ডাউনপ্লে" করেছি, যখন আমরা যদি স্ট্যান্ডার্ড বিচ্যুতিটিকে সংজ্ঞায়িত হিসাবে বিবেচনা করি,

SDσ2=|x1x2|2=AAD

যেহেতু আমরা স্বজ্ঞাত মাপের "যতটা সম্ভব কাছে" থাকতে চাই, তাই আমাদের ব্যবহার করা উচিত ।SD

সংযোজন
এর এখন আকারের একটি নমুনা বিবেচনা আমাদের কাছেn

nAAD=i=1n|xix¯|

এবং

nVar(X)=i=1n(xix¯)2=i=1n|xix¯|2

we can write the right-hand side of the variance expression as

i=1n|xix¯|2=(i=1n|xix¯|)2ji|xix¯||xjx¯|

=(nAAD)2ji|xix¯||xjx¯|

Then the dispersion measure qn will be

qn1n[n2AAD2ji|xix¯||xjx¯|]1/2

=[AAD21n2ji|xix¯||xjx¯|]1/2

Now think informally: note that ji|xix¯||xjx¯| contains n2n terms, and so divided by n2 will left us with "one term in the second power". But also "one term in the 2nd power" is what we have in AAD2: this is a primitive way to "sense" why qn will tend to zero as n grows large. On the other hand the Standard Deviation as defined would be

SD1n[n2AAD2ji|xix¯||xjx¯|]1/2

=[nAAD21nji|xix¯||xjx¯|]1/2

Continuing are informal thinking, the first term gives us n "terms in the 2nd power", while the second term gives us n1 "terms in the second power" . So we will be left eventually with one such term, as n grows large, and then we will take its square root.
This does not mean that the Standard Deviation as defined will equal the Average Absolute Deviation in general (it doesn't), but it does show that it is suitably defined so as to be "on a par" with it for any n, as well as for the case when n.


1
Although this answer is interesting, I believe there are more important, convincing, and rigorous explanations (of which I have offered only a few in my own answer: much more could be said, especially concerning the role of the SD in the Central Limit theorem and algebraic rules for computing SDs of sums of independent random variables).
whuber

2
@whuber Certainly. I just opted for a "the bell has rung" approach to destroy the student's intermission!
Alecos Papadopoulos
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.