কেন আমরা স্ট্যান্ডার্ড বিচ্যুতি তৈরি করতে বৈকল্পিকের বর্গমূল গ্রহণ করব?


26

দুঃখিত এটির উত্তর যদি অন্য কোথাও দেওয়া হয় তবে আমি এটি সন্ধান করতে পারিনি।

আমি ভাবছি যে কেন আমরা স্ট্যান্ডার্ড বিচ্যুতি তৈরির জন্য বিশেষত বর্গাকারকে আলাদা করে নিই ? বর্গমূলটি কার্যকর মূল্য উত্পাদন করে এমনটি গ্রহণ সম্পর্কে কী?


নিবিড়ভাবে সম্পর্কিত: stats.stackexchange.com/questions/35123/…
সাইকোরাক্স বলেছেন

2
ইউক্যালিডিয়ান ভেক্টর আদর্শ হিসাবে স্ট্যান্ডার্ড বিচ্যুতি এবং তারপরে বর্গ হিসাবে বৈচিত্রটি সম্পর্কে ভাবেন। বৈকল্পিকের এই সংজ্ঞা এবং স্ট্যান্ডার্ড বিচ্যুতিতে কার্যকর বিশ্লেষণাত্মক বৈশিষ্ট্য রয়েছে।
theideasmith

উত্তর:


44

এক অর্থে এটি একটি তুচ্ছ প্রশ্ন, তবে অন্য একটি ক্ষেত্রে এটি আসলে বেশ গভীর!

  • অন্যরা যেমন উল্লেখ করেছেন, Stdev(X) বোঝা যায় যে স্টাডেভ ( এক্স ) এর সাথে X মতো একই ইউনিট রয়েছে ।

  • স্কোয়ার রুটটি গ্রহণ করা আপনাকে পরম একজাতীয়তা ওরফে পরম স্কেলাবিলিটি দেয় । যে কোনও স্কেলার α এবং এলোমেলো ভেরিয়েবল X আমাদের কাছে রয়েছে:

    Stdev[αX]=|α|Stdev[X]
    পরম সমসত্ত্বতা একটি হল প্রয়োজনীয় সম্পত্তি একটি এর আদর্শ । স্ট্যানডার্ড ডেভিয়েশন যে ঠিক একই ভাবে, (গড় শূন্য র্যান্ডম ভেরিয়েবল ভেক্টর স্থান) একটি আদর্শ হিসাবে ব্যাখ্যা করা যেতে পারে x2+y2+z2 ত্রিমাত্রিক স্থানে স্ট্যান্ডার্ড ইউক্লিডিয়ান আদর্শ। স্ট্যান্ডার্ড বিচ্যুতিটি এলোমেলো পরিবর্তনশীল এবং এর গড়ের মধ্যকার দূরত্বের একটি পরিমাপ।

স্ট্যান্ডার্ড বিচ্যুতি এবং L2 আদর্শ

সীমাবদ্ধ মাত্রার কেস:

একটি ইন n মাত্রিক ভেক্টর স্থান, ওরফে মান Euclidian আদর্শ L2 আদর্শ হিসাবে সংজ্ঞায়িত করা হয়:

x2=ixi2

আরও বিস্তৃতভাবে, p -norm xp=(i|xi|p)1p লাগেpপরম সমসত্ত্বতা পেতে তম রুট:αxp=(i|αxi|p)1p=|α|(i|xi|p)1p=|α|xp

আপনার যদি ওজন qi তবে ওজনের যোগফল ixi2qi একটি বৈধ আদর্শ নেই। উপরন্তু, এটা স্ট্যানডার্ড ডেভিয়েশন যদিqiসম্ভাব্যতা প্রতিনিধিত্ব করেন এবংE[x]ixiqi=0

অসীম মাত্রা কেস:

অসীম মাত্রিক হিলবার্ট স্পেসে আমরা একইভাবে L2 আদর্শকে সংজ্ঞায়িত করতে পারি :

X2=ωX(ω)2dP(ω)

যদি X একটি গড় শূন্য র্যান্ডম পরিবর্তনশীল হয় এবং P সম্ভাবনা পরিমাপ হয় তবে স্ট্যান্ডার্ড বিচ্যুতি কী? এটি একই: ωX(ω)2dP(ω)

সারাংশ:

বর্গমূল গ্রহণের অর্থ হ'ল মানক বিচ্যুতি নিখুঁত একজাতীয়তাকে সন্তুষ্ট করে , একটি আদর্শের প্রয়োজনীয় সম্পত্তি

র্যান্ডম ভেরিয়েবল একটি স্থান তারিখে, X,Y=E[XY] একটি হল ভেতরের পণ্য এবং X2=E[X2] আদর্শ যে ভেতরের পণ্য দ্বারা প্রবর্তিত। সুতরাং আদর্শ বিচ্যুতি হ'ল

Stdev[X]=XE[X]2
এলোমেলো পরিবর্তনশীলের আদর্শ:স্টাডেভ[এক্স]=এক্স-[এক্স]2 এটি গড়E[X]থেকেXএর দূরত্বের একটি পরিমাপ।

(টেকনিক্যাল পয়েন্ট: যখন E[X2] একটি আদর্শ, আদর্শ বিচ্যুতিE[(XE[X])2] সাধারণভাবে র্যান্ডম ভেরিয়েবল উপর একটি আদর্শ কারণ একটি জন্য প্রয়োজন নয়normed ভেক্টর স্থানহয়x=0যদি এবং কেবল যদিx=0। 0 এর একটি স্ট্যান্ডার্ড বিচ্যুতিটি এলোমেলো করে না যে এলোমেলো পরিবর্তনীয় হ'ল শূন্য উপাদান))


1
এই উত্তরটি সত্যই মেনে নিয়েছে, এটি বর্তমানে গৃহীত উত্তরটির চেয়ে আরও তথ্যপূর্ণ করে তুলেছে।
00 প্রোমিথিউস

26

ভেরিয়েন্সটি ভি ( এক্স ) = ( এক্স - ( এক্স ) ) 2 হিসাবে সংজ্ঞায়িত করা হয়েছে , সুতরাং এটি এক্স এবং এর প্রত্যাশিত মানের মধ্যে স্কোয়ারের পার্থক্যের প্রত্যাশা।XV(X)=E(XE(X))2

তাহলে সেকেন্ডের মধ্যে সময়, এক্স - ( এক্স ) সেকেন্ডের মধ্যে, কিন্তু ভী ( এক্স ) হয় সেকেন্ড 2 এবং XXE(X)V(X)seconds2 আবার সেকেন্ডে।V(X)


আহ আমি দেখছি, এটি কেবলমাত্র স্কেলের পরিবর্তনটিকে পূর্বাবস্থায় আনে যা পার্থক্যের স্কোয়ারিংয়ের ফলে পরিবর্তনের গণনায়?
ডেভ

11
ডান - তবে মাত্রা পরিবর্তন করুন , স্কেলে নয়।
জিন-

তবে এটি এখানে একক পদ আছে বলে মনে হয় না: অনেকগুলি থাকে এবং প্রতিটি যখন ক্ষমতায় থাকে 2, অন্য শর্তের তুলনায় কমবেশি নিয়ে আসে। কিন্তু যখন আমরা বর্গক্ষেত্রের মূল গ্রহণ করি, তখন আমরা সেই পার্থক্যের প্রতি অবহেলা করি, তাই না? আমরা প্রাথমিক সংখ্যাটি পাই না, সেভাবে সমস্ত পার্থক্যের সমষ্টি। প্রতিটি স্বতন্ত্র শব্দটির বর্গমূল গ্রহণ করা কি ভাল হবে না?
পার্সিকার

V^i=1n(xix¯)=i=1nxii=1nxi=0.
HStamper

@EricMittman Except that a2=|a|, not a, in which case you'd get the mean absolute error.
Dougal

6

The simple answer is that the units are on the same scale as the mean. Example: I estimate the mean for secondary student to be 160cm with a standard deviation (SD) of 20cm. It is intuitively easier to get a sense of the variation with the SD than the variance of 400cm^2.


0

In more simple terms standard deviation is designed to give us a positive number that says something about the spread of our data about it's mean.

If we were to just add up the distances of all the points from the mean, then points in the positive and negative directions would combine in a way that would tend to gravitate back toward the mean and we would lose information about the spread. This is why we measure variance first, so that all of the distances are preserved as positive quantities via squaring and they don't cancel each other out. In the end we want a positive value that represents the units we started with - this has already been commented on above - so we take the positive square root.


-3

It is a historical stupidity which we continue due to intellectual laziness. They chose to square the differences from the mean in order to get rid of the minus sign. Then they took the square root so as to bring it to a scale similar to the mean.

Someone should generate new statistics, computing variance and SD using modulus or absolute values of deviance from the mean. This would get rid of this whole squaring and then taking the square root business.


1
আমাদের কাছে ইতিমধ্যে, গড় (বা মধ্যমা) পরম বিচ্যুতি, এল 1 নিয়ম এবং এর মতো আকারে রয়েছে। তবে, the তিহ্যগত পদ্ধতির প্রধান সুবিধাটি হ'ল পরম মানগুলির থেকে পৃথক, এটি পৃথকযোগ্য, যা আপনাকে বিশ্লেষণাত্মকভাবে জিনিসগুলিকে হ্রাস এবং সর্বাধিক করতে দেয়।
ম্যাট ক্রাউস

1
You fail to provide substantive justification for your stance, please provide a clearly laid out mathematical argument. The sum of absolute values scale very differently to the square root of the sum of squares. The latter emphasises the contribution of extreme values, which is a useful property. Also, SSQ is central to least squares analytic methods. Please take the time to expand on the problems of SD and how the alternatives compare so readers can understand your point of view. .
ReneBt

(-1) It's all too easy to read phrases like "historical stupidity" and "intellectual laziness" as being self-referential.
whuber
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.