আমি কীভাবে একটি ভারী মানক বিচ্যুতি গণনা করব? এক্সেলে?


29

সুতরাং, আমার কাছে শতাংশের একটি ডেটা সেট রয়েছে:

100   /   10000   = 1% (0.01)
2     /     5     = 40% (0.4)
4     /     3     = 133% (1.3) 
1000  /   2000    = 50% (0.5)

আমি শতাংশের মানক বিচ্যুতি সন্ধান করতে চাই তবে তাদের ডেটা ভলিউমের জন্য ওজনযুক্ত। যেমন, প্রথম এবং শেষ ডেটা পয়েন্টগুলি গণনায় আধিপত্য করা উচিত।

আমি কেমন করে ঐটি করি? এবং এক্সেলে এটি করার কোনও সহজ উপায় আছে?


(এম -১) / এম সহ সূত্রটি সঠিক। আপনার যদি সন্দেহ থাকে তবে সমস্ত ওজন 1 এর সমান সেট করে এটি পরীক্ষা করুন এবং আপনি ডিনোমিনেটরে (N-1) এর সাথে স্ট্যান্ডার্ড বিচ্যুতির জন্য নিরপেক্ষ অনুমানের জন্য শাস্ত্রীয় সূত্র পাবেন। হুড়োহুড়ি করা: অস্বাভাবিক অর্থ ভুল নয়।

1
(এম -১) / এম সহ সূত্রটি সঠিক নয়। কল্পনা করুন আপনি এক ট্রিলিয়ন ভাগ ওজনের সাথে মিলিয়ন পয়েন্ট যুক্ত করেছেন। এই ওজনগুলি কী তা বিবেচনা না করে আপনি আপনার উত্তরটি মোটেও পরিবর্তন করবেন না, তবে আপনার মেয়াদ 1 হয়ে যায়? একেবারে না! আপনি যদি যত্নশীল করেন তবে আপনি এটিও ঠিক যে ভুল তাও যত্নবান হন। ( এম - 1 ) / এম 1(এম-1)/এম(এম-1)/এম1
রেক্স কের

সর্বোচ্চ ভোট সঠিক। অনুগ্রহ করে itl.nist.gov/div898/software/dataplot/refman2/ch2/weightsd.pdf
বো ওয়াং

আমি ভাবছি কেন আপনি এখানে স্ট্যান্ডার্ড বিচ্যুতি চান? আপনার কেবল নম্বর আছে! কিভাবে এটি অনেক নম্বর? বিশেষত যখন শতাংশগুলি আরও সহজে ব্যাখ্যা করা হয় এবং বোঝা যায়। 4
সম্ভাব্যতাব্লোগিক

প্রশ্নকে সংক্ষিপ্ত রাখার জন্য @ প্রব্যাবিলিসিস্লিক এটি একটি সরল উদাহরণ ছিল।
ইয়াহেল

উত্তর:


35

ভরযুক্ত স্ট্যানডার্ড ডেভিয়েশন জন্য সূত্র হল:

i=1Nwi(xix¯)2(M1)Mi=1Nwi,

কোথায়

পর্যবেক্ষণ সংখ্যা।N

ননজারো ওজনের সংখ্যা।M

ওজনwi

পর্যবেক্ষণ হয়।xi

ভরযুক্ত গড় হয়।x¯*

মনে রাখবেন ওজনিত গড়ের সূত্রটি হ'ল:

এক্স¯*=Σআমি=1এনWআমিএক্সআমিΣআমি=1এনWআমি

পছন্দসই ফলাফল পেতে উপযুক্ত ওজন ব্যবহার করুন। আপনার ক্ষেত্রে আমি বিভাগে মামলার সংখ্যা ব্যবহার করার পরামর্শ দেববিভাগে মামলার সংখ্যামোট মামলার সংখ্যা

এক্সেলে এটি করতে, আপনাকে প্রথমে ওজনযুক্ত গড় গণনা করতে হবে। তারপরে একটি পৃথক কলামে গণনা করুন । বাকিটি খুব সহজ হতে হবে।(এক্সআমি-এক্স¯*)2


2
@ গিলস, আপনি ঠিক বলেছেন। Deps_stats, এসডিতে ভগ্নাংশ অস্বাভাবিক। আপনার কি এই সূত্রের প্রশংসা আছে বা আপনি অন্তত সেই শব্দটি অন্তর্ভুক্ত করার কারণ ব্যাখ্যা করতে পারেন? (এম-1)/এম
whuber

4
@ অ্যারন ওজন সর্বদা unityক্যের সমষ্টি হিসাবে সংজ্ঞায়িত হয় না, যেমন এই প্রশ্নে দেওয়া ওজন দ্বারা অনুকরণীয়!
whuber

2
(-1) আমি এই উত্তরটিকে নিম্নমানের করছি কারণ পদের কোনও যৌক্তিকতা বা রেফারেন্স সরবরাহ করা হয়নি (এবং আমি দৃ sure়ভাবে নিশ্চিত যে এটি ভিন্নতার অনুমানটি নিরপেক্ষভাবে তৈরি করে না , যা এর সুস্পষ্ট হবে) প্রেরণা)। (এম-1)/এম
হোয়বার

1
যুক্ত রেফারেন্সের আলোকে (যা অনুমোদনযোগ্য নয়, তবে এটি একটি রেফারেন্স) আমি ডাউনভোটটি সরিয়ে দিচ্ছি। যদিও আমি এই উত্তরটি অগ্রাহ্য করছি না, কারণ গণনাগুলি দেখায় যে প্রস্তাবিত ওজন মোটেও কোনও পক্ষপাতহীন অনুমান তৈরি করে না (বাদে যখন সমস্ত ওজন সমান )। এখানে আসল অসুবিধা - যা প্রশ্নের দোষ, উত্তর নয় - এটি এই "ভারী মানক বিচ্যুতি" অনুমান করার চেষ্টা করছে তা পরিষ্কার নয়। একটি নির্দিষ্ট অনুমান ব্যতীত "পক্ষপাত হ্রাস" (বা অন্য কোনও কারণে) একটি ( এম - 1 ) / এম ফ্যাক্টর প্রবর্তনের কোনও যৌক্তিকতা নেই । 1(এম-1)/এম
হোবার

1
@ মিখাইল আপনি সঠিক যে "অস্বাভাবিক" এবং "ডান" একে অপরের সাথে সামান্যই সম্পর্কযুক্ত। তবে, অস্বাভাবিক ফলাফল স্পষ্টতই আরও কিছুটা ন্যায়সঙ্গত হওয়ার দাবি করে কারণ অস্বাভাবিক হওয়া এমন একটি সূচক যা কোনও ত্রুটি হয়েছে made আপনার যুক্তিটি অবৈধ: যদিও সমস্ত ওজন সমান হয় যখন সূত্রটি নিরপেক্ষ অনুমানকটির পক্ষে প্রকৃতপক্ষে হ্রাস পায় তবে এটি বোঝায় না যে অসম ওজন ব্যবহার করা হলে অনুমানকারী পক্ষপাতহীন থাকে। আমি আপনার উপসংহারটি ভুল বলে দাবি করছি না, তবে কেবল এখন পর্যন্ত কোনও বৈধ সমর্থনযোগ্যতা দেওয়া হয়নি।
whuber

18

সূত্রগুলি উইকিপিডিয়া সহ বিভিন্ন জায়গায় উপলব্ধ ।

মূলটি লক্ষ্য করা যায় যে এটি ওজন বলতে কী বোঝায় তার উপর নির্ভর করে । বিশেষত, ওজনগুলি ফ্রিকোয়েন্সি হলে (যেমন আপনি নিজের পুরো যোগফলটি এড়াতে চাইছেন), যদি ওজন প্রকৃতপক্ষে প্রতিটি পরিমাপের বৈকল্পিক হয়, বা তারা যদি কিছু বাহ্যিক মান হয় তবে আপনি বিভিন্ন উত্তর পাবেন আপনার ডেটা চাপিয়ে দিন।

আপনার ক্ষেত্রে, এটি সূক্ষ্মভাবে দেখে মনে হচ্ছে ওজনগুলি ফ্রিকোয়েন্সিগুলি তবে তারা তা নয় । আপনি ফ্রিকোয়েন্সিগুলি থেকে আপনার ডেটা তৈরি করেন তবে আপনার ডেটা সেটে 3 টির 45 টি রেকর্ড এবং 4 টির 15 টি রেকর্ড থাকা কোনও সাধারণ বিষয় নয়। পরিবর্তে, আপনাকে শেষ পদ্ধতিটি ব্যবহার করা দরকার। (আসলে, এই সব আবর্জনা - আপনি সত্যিই প্রক্রিয়ার একটি আরো পরিশীলিত মডেল যে এই সংখ্যা উৎপাদিত হয় ব্যবহার করতে হবে আপনি দৃশ্যত না! না এমন কিছু বিষয় যা আউট সাধারণত বিতরণ সংখ্যার থুতু ফেলে, তাই স্ট্যানডার্ড ডেভিয়েশন সঙ্গে সিস্টেম বৈশিষ্ট্য আছে সঠিক জিনিস না।)

যাই হোক না কেন, "নির্ভরযোগ্যতা" ওজন সহ প্রকরণের সূত্রটি (যেখান থেকে আপনি সাধারণ উপায়ে স্ট্যান্ডার্ড বিচ্যুতি গণনা করেন)

ΣWআমি(এক্সআমি-এক্স*)2ΣWআমি-ΣWআমি2ΣWআমি

এক্স*=ΣWআমিএক্সআমি/ΣWআমি

ওজনের জন্য আপনার কাছে কোনও অনুমান নেই, যা আমি ধরে নিচ্ছি যে আপনি নির্ভরযোগ্যতার তুলনামূলকভাবে নিতে চান। আপনি যেভাবে শতাংশ গ্রহণ করছেন তা বিশ্লেষণকে জটিল করে তুলছেন এমনকি যদি তারা বার্নোল্লি প্রক্রিয়া দ্বারা উত্পন্ন হয় তবে আপনি যদি 20 এবং 0 এর স্কোর পান তবে আপনার অসীম শতাংশ রয়েছে। SEM এর বিপরীত দ্বারা ওজন করা একটি সাধারণ এবং কখনও কখনও অনুকূল জিনিস। আপনার সম্ভবত কোনও বায়েশিয়ান অনুমান বা উইলসনের স্কোর ব্যবধান ব্যবহার করা উচিত ।


2
+1 টি। ওজনের বিভিন্ন অর্থের আলোচনার বিষয়টি আমি এই থ্রেডটিতে যাচ্ছিলাম তার পাশাপাশি all ওজনযুক্ত পরিসংখ্যান সম্পর্কে এই সাইটের সমস্ত প্রশ্নের মধ্যে এটি একটি গুরুত্বপূর্ণ অবদান। (আমি সাধারণ বিতরণ এবং স্ট্যান্ডার্ড বিচ্যুতি সম্পর্কে প্যারেন্টিফিকাল মন্তব্য সম্পর্কে কিছুটা হলেও উদ্বিগ্ন, কারণ তারা ভুলভাবে পরামর্শ দেয় যে সাধারণদের উপর ভিত্তি করে মডেলগুলির বাইরে এসডিগুলির কোনও ব্যবহার নেই))
শুভ

@ শুভ - ভাল, অবশ্যই উদ্ধারকেন্দ্রিক কেন্দ্রীয় তত্ত্বটি! তবে ওপি কী করছে, সেই সংখ্যার একটি গড় এবং স্ট্যান্ডার্ড বিচ্যুতি নিয়ে চিহ্নিত করার চেষ্টা করা অপ্রয়োজনীয় বলে মনে হয়। এবং সাধারণভাবে, অনেকগুলি ব্যবহারের জন্য স্ট্যান্ডার্ড বিচ্যুতিটি বোঝার একটি মিথ্যা অনুভূতিতে প্রলুব্ধ হয়। উদাহরণস্বরূপ, যদি বিতরণটি স্বাভাবিক (বা এটির একটি ভাল অনুমান) ছাড়া অন্য কিছু হয় তবে স্ট্যান্ডার্ড বিচ্যুতির উপর নির্ভর করা আপনাকে লেজগুলির আকৃতি সম্পর্কে একটি খারাপ ধারণা দেয়, যখন এটি সম্ভবত সেই লেজগুলি হয় যা আপনি সম্ভবত পরিসংখ্যানের ক্ষেত্রে সবচেয়ে বেশি যত্নবান হন পরীক্ষামূলক.
রেক্স কের

@ রেক্সার কেরার যদি লোকেরা এর দ্বারা অপ্রয়োজনীয় ব্যাখ্যা ব্যাখ্যা করে তবে আমরা স্ট্যান্ডার্ড বিচ্যুতিটিকে খুব কমই দোষ দিতে পারি। তবে আসুন আমরা স্বাভাবিকতা থেকে সরে আসি এবং সীমাবদ্ধ বৈকল্পিক (উদাহরণস্বরূপ) সহ অবিচ্ছিন্ন, প্রতিসাম্য ইউনিমোডাল বিতরণের অনেক বিস্তৃত শ্রেণি বিবেচনা করি। তারপরে 89% থেকে 100 শতাংশ বিতরণ দুটি স্ট্যান্ডার্ড বিচ্যুতির মধ্যে রয়েছে। এটি প্রায়শই জানার জন্য বেশ কার্যকর (এবং 95% মাঝখানে বেশ কিছুটা মিথ্যা, তাই এটি কখনও কখনও 7% ছাড়ের বেশি নয়); অনেকগুলি সাধারণ বিতরণ সহ, ড্রপিং প্রতিসম দিকটি খুব বেশি পরিবর্তন হয় না (উদাহরণস্বরূপ সূচককে দেখুন) .... সিটিডি
Glen_b -Reninstate মনিকা

সিটিডি ... - বা আমরা যদি এই অনুমানগুলির মধ্যে কোনটি না করি তবে সর্বদা সাধারণ চেবিশেভের সীমানা থাকে যা কমপক্ষে লেজ এবং মানক বিচ্যুতি সম্পর্কে কিছু বলে থাকে ..
গ্লেন_বি -রিনস্টেট মনিকা

1
@ গ্যাব্রিয়েল - হ্যাঁ, দুঃখিত, আমি ম্লান হয়ে যাচ্ছিলাম। (আমি লোকেরা কোনটি ঝাঁকুনির মাধ্যমে বলতে পারি তা বুঝি)) আমি আমার বিবরণটি সংশোধন করেছি।
রেক্স কের

5
=SQRT(SUM(G7:G16*(H7:H16-(SUMPRODUCT(G7:G16,H7:H16)/SUM(G7:G16)))^2)/
     ((COUNTIFS(G7:G16,"<>0")-1)/COUNTIFS(G7:G16,"<>0")*SUM(G7:G16)))

কলামটি Gওজন, কলাম Hমান


সিআরটিএল + শিফট + এন্টার ব্যবহার করা আমার পক্ষে গোটচা ছিল তবে এটি অন্যথায় কাজ করবে বলে মনে হচ্ছে।
ফিলিপকেড

1

পিআমি=বনামআমিΣআমিবনামআমি,
বনামআমি

μ^=Σআমিপিআমিএক্সআমি,
σ^2=Σআমিপিআমি(এক্সআমি-μ^)2

0
Option Explicit

Function wsdv(vals As Range, wates As Range)
Dim i, xV, xW, y As Integer
Dim wi, xi, WgtAvg, N
Dim sumProd, SUMwi

    sumProd = 0
    SUMwi = 0
    N = vals.Count  ' number of values to determine W Standard Deviation
    xV = vals.Column  ' Column number of first value element
    xW = wates.Column  ' Column number of first weight element
    y = vals.Row - 1  ' Row number of the values and weights

    WgtAvg = WorksheetFunction.SumProduct(vals, wates) / WorksheetFunction.Sum(wates)

    For i = 1 To N  ' step through the elements, calculating the sum of values and the sumproduct
        wi = ActiveSheet.Cells(i + y, xW).Value  ' (i+y, xW) is the cell containing the weight element
        SUMwi = SUMwi + wi
        xi = ActiveSheet.Cells(i + y, xV).Value  ' (i+y, xV) is the cell containing the value element
        sumProd = sumProd + wi * (xi - WgtAvg) ^ 2
    Next i

    wsdv = (sumProd / SUMwi * N / (N - 1)) ^ (1 / 2)  ' output of weighted standard deviation

End Function

2
@ Uswer71015, সাইটে আপনাকে স্বাগতম। এটি কেবল কোড বলে মনে হচ্ছে। কোডটি কীভাবে কাজ করে এবং কীভাবে প্রশ্নটির উত্তর দেয় তার কিছু পাঠ্য / ব্যাখ্যা যোগ করতে পারেন?
গুং - মনিকা পুনরায়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.