স্ট্যান্ডার্ড বিচ্যুতি গণনা করার সময় দ্বারা ভাগ করার জন্য স্বজ্ঞাত ব্যাখ্যা ?


136

আমি আজ ক্লাসে জিজ্ঞেস করা হয়েছিল কেন তুমি দ্বারা বর্গ ত্রুটির সমষ্টি ভাগ পরিবর্তে সঙ্গে , যখন স্ট্যানডার্ড ডেভিয়েশন গণনা।এনn1n

আমি বলেছিলাম যে আমি ক্লাসে এর উত্তর দেব না (যেহেতু আমি পক্ষপাতহীন অনুমানকারীদের মধ্যে যেতে চাই না), তবে পরে আমি অবাক হয়েছি - এর জন্য কোনও স্বজ্ঞাত ব্যাখ্যা আছে ?!


29
আমি এই আদাটি সংখ্যাসূচক রেসিপি বইটি থেকে উদ্ধৃত করতে চাই : "... যদি এবং মধ্যে পার্থক্যটি কখনও আপনার পক্ষে গুরুত্বপূর্ণ হয় তবে আপনি সম্ভবত কোনও উপকারে আসেন না - উদাহরণস্বরূপ, একটি সন্দেহজনক হাইপোথিসিসকে প্রমাণ করার চেষ্টা করছেন প্রান্তিক তথ্য সহ। " এন - 1nn1
জেএম

11
প্রকৃতপক্ষে একটি মার্জিত, স্বজ্ঞাত ব্যাখ্যা এখানে উপস্থাপন করা হয়েছে (প্রমাণের নীচে) en.wikedia.org/wiki/… মূল ধারণাটি হ'ল আপনার পর্যবেক্ষণগুলি স্বাভাবিকভাবেই জনসংখ্যার গড়ের চেয়ে নমুনাটির কাছাকাছি যেতে চলেছে।
ওয়েটল্যাব স্টুডেন্ট

12
@ টাল, এই কারণেই স্কুলগুলি স্তন্যপান করে। আপনি তাদের "কেন এটি ?" জিজ্ঞাসা করুন এবং তারা জবাব দেয় "কেবল এটি মুখস্ত করুন"।
পেসারিয়ার

1
আপনি যদি কোনও স্বজ্ঞাত ব্যাখ্যাটি খুঁজছেন, আপনার প্রকৃত নমুনা গ্রহণ করে নিজের কারণটি দেখতে হবে! এটি দেখুন, এটি আপনার প্রশ্নের অবিকল উত্তর দেয়। youtube.com/watch?v=xslIhnquFoE
সাহিল চৌধুরী

tl; dr: (উপরের জবাব থেকে :) "... নমুনা থেকে বিচ্যুতি ব্যবহার করে গণনা করা হয় এমন স্ট্যান্ডার্ড বিচ্যুতির অর্থ জনসংখ্যার কাঙ্ক্ষিত মানক বিচ্যুতিকে হ্রাস করা হয় ..." আরও দেখুন: en.wikedia.org/wiki/… সুতরাং, যদি আপনি কিছু জটিল কিছু গণনা করার মতো অনুভূত না হন, কেবলমাত্র কোনও নমুনা থেকে এন -1 ব্যবহার করুন।
অ্যান্ড্রু

উত্তর:


99

বিভাজকের সাথে গণনা করা মানক বিচ্যুতি হ'ল নমুনাটি যে জনসংখ্যার থেকে নমুনাটি আঁকানো হয়েছিল তার মান বিচ্যুতির অনুমান হিসাবে নমুনা থেকে গণনা করা একটি স্ট্যান্ডার্ড বিচ্যুতি। যেহেতু পর্যবেক্ষণকৃত মানগুলি জনসংখ্যার তুলনায় গড়ের তুলনায় নমুনাটির কাছাকাছি চলে আসে, নমুনা থেকে বিচ্যুতি ব্যবহার করে গণনা করা হয় এমন স্ট্যান্ডার্ড বিচ্যুতির অর্থ জনসংখ্যার কাঙ্ক্ষিত মানক বিচ্যুতিকে হ্রাস করা হয়। বিভাজক হিসাবে পরিবর্তে ব্যবহার করে ফলাফলটিকে কিছুটা বড় করে সংশোধন করে।এন - 1 এনn1n1n

উল্লেখ্য সংশোধন একটি বৃহত্তর সমানুপাতিক প্রভাব রয়েছে যে, যখন যখন এটি বড়, যা আমরা কি চাই কারণ বৃহত্তর এন যখন নমুনা অর্থ জনসংখ্যার একটি ভাল মূল্নির্ধারক মানে হতে পারে তুলনায় ছোট।n

নমুনা পুরো জনসংখ্যার আমরা যখন সহ স্ট্যান্ডার্ড ডেভিয়েশন ব্যবহার ভাজক যেমন কারণ নমুনা মানে হল জনসংখ্যা মানে।n

(আমি প্রথমত লক্ষ করি যে "দ্বিতীয় মুহূর্তটি একটি পরিচিত, নির্দিষ্ট অর্থের চারপাশে পুনরায় সংঘটিত হয়েছিল" দিয়ে শুরু হয় এমন কিছুই অন্তর্দৃষ্টির ব্যাখ্যা দেওয়ার জন্য প্রশ্নকর্তার অনুরোধটি পূর্ণ করতে যাচ্ছে না))


13
আসুন "স্বজ্ঞাত" কে "ননটেকনিকাল" দিয়ে বিভ্রান্ত করি না।
whuber

32
@ মিশেল, এটি ব্যাখ্যা করে না যে আমরা কেন (বা এমনকি ) n−1পরিবর্তে ব্যবহার করব ? n−2n−3
পেসারিয়ার

1
@ পেসারিয়ার সেই বিষয়টির বিস্তারিত তথ্যের জন্য নীচে হোবারের উত্তরটি দেখুন। সংক্ষেপে, সংশোধনটি এন -2 ইত্যাদির পরিবর্তে এন -1 হয় কারণ এন -1 সংশোধন ফলাফল দেয় যা আমাদের প্রয়োজনের খুব কাছাকাছি রয়েছে। আরও সঠিক সংশোধনগুলি এখানে দেখানো হয়েছে: এন.ইউইউইকিপিডিয়া.আর
মাইকেল লিউ

1
হাই @ মিশেল, সুতরাং কেন নমুনা থেকে গণনা বিচ্যুতি জনসংখ্যার চেয়ে ছোট হতে থাকে?
অ্যালেন

1
"যেহেতু পর্যবেক্ষণকৃত মানগুলি জনসংখ্যার চেয়ে গড়ের চেয়ে বেশি নমুনার কাছাকাছি চলে আসে, তাই নমুনা থেকে বিচ্যুতি ব্যবহার করে গণনা করা হয় এমন স্ট্যান্ডার্ড বিচ্যুতির অর্থ জনসংখ্যার কাঙ্ক্ষিত মানক বিচ্যুতিকে অবমূল্যায়ন করে।" কেন নমুনা মানে সর্বদা কম করা হয় না? যদি এটি অত্যধিক পর্যালোচনা করে?
বোরা এম। আল্পার

55

একটি সাধারণ এটি হ'ল বৈকল্পিক সংজ্ঞা (কোনও বিতরণের) দ্বিতীয় মুহূর্তটি একটি পরিচিত, নির্দিষ্ট গড়ের চারপাশে পুনরায় সংঘটিত হয় , যেখানে অনুমানকারী একটি আনুমানিক গড় ব্যবহার করে । স্বাধীনতা একটি ডিগ্রী এই ক্ষতি (গড় দেওয়া, আপনি শুধু জ্ঞান ডেটা সেটটি পুনর্গঠিত করতে পারে তথ্য মূল্যবোধের) ব্যবহারের প্রয়োজন বদলে RESULT "সমন্বয়" করা হয়েছে।এন - 1 এনn1n1n

এ জাতীয় ব্যাখ্যা আনোভা এবং বৈকল্পিক উপাদানগুলির বিশ্লেষণের আনুমানিক পরিবর্তনের সাথে সামঞ্জস্যপূর্ণ। এটি সত্যিই কেবল একটি বিশেষ ক্ষেত্রে।

করতে প্রয়োজন কিছু সমন্বয় যে ভ্যারিয়েন্স inflates, আমি মনে করি, একটি বৈধ যুক্তি হল যে ঠিক নয় সঙ্গে intuitively, সুস্পষ্ট করা যেতে পারে কাজ শেষ হইলে হাতে waving। (আমি স্মরণ করি যে ছাত্র টি-টেস্টের বিষয়ে তার ১৯০৮ এর গবেষণাপত্রে এই জাতীয় যুক্তি তৈরি করেছিল।) কেন বৈকল্পিকতার সামঞ্জস্যটি ঠিক এর একটি কারণ হতে হবে তা প্রমাণ করা শক্ত, বিশেষত যখন আপনি বিবেচনা করেন যে সমন্বয়কৃত এসডি হয় না একটি পক্ষপাতিত্বহীন মূল্নির্ধারক। (এটা নিছক ভ্যারিয়েন্সের একটি পক্ষপাতিত্বহীন মূল্নির্ধারক বর্গমূল হয়। পক্ষপাতিত্বহীন সাধারণত একটি অরৈখিক রূপান্তর টেকা হচ্ছে না।) সুতরাং, আসলে, এর এসডি সঠিক সমন্বয় মুছে ফেলার জন্য তার পক্ষপাত হয় না একটি গুণকn/(n1)n/(n1) আদৌ!

কিছু প্রাথমিক পাঠ্যপুস্তক এমনকি অ্যাডজাস্টেড এসডি প্রবর্তন করা বিরক্ত করে না: তারা একটি সূত্র শেখায় ( দ্বারা বিভক্ত )। এই জাতীয় বই থেকে পড়াতে গিয়ে আমি প্রথমে নেতিবাচক প্রতিক্রিয়া জানালাম তবে জ্ঞানের প্রশংসা করতে পেরেছিলাম: ধারণা এবং প্রয়োগগুলিতে মনোনিবেশ করতে লেখকরা সমস্ত অযৌক্তিক গাণিতিক ছদ্মবেশ বের করেছেন। দেখা যাচ্ছে যে কিছুই ক্ষতিগ্রস্থ হয়নি এবং কেউ বিভ্রান্ত হয় না।n


1
ধন্যবাদ হুইবার আমাকে ছাত্র-ছাত্রীদের এন -১ সংশোধন করে শিখিয়ে দিতে হবে, সুতরাং কেবল এন-তে ভাগ করা কোনও বিকল্প নয়। আমার আগে যেমন লেখা আছে, দ্বিতীয় মুহুর্তের সাথে সংযোগ উল্লেখ করা কোনও বিকল্প নয়। যদিও এর অর্থ কীভাবে ইতিমধ্যে অনুমান করা হয়েছিল তা উল্লেখ করার সাথে সাথে আমাদের এসডির জন্য কম "ডেটা" রেখেছিল - এটি গুরুত্বপূর্ণ। এসডির পক্ষপাতদুটি সম্পর্কে - আমার মনে হয়েছে এটির মুখোমুখি - এই পয়েন্টটি বাড়ি চালানোর জন্য ধন্যবাদ। সেরা, তাল
তাল গালিলি

3
@ টাল আমি আপনার ভাষায় লিখছিলাম, আপনার ছাত্রদের মতো নয়, কারণ আমি আত্মবিশ্বাসী যে আপনি যা জানেন সেগুলিতে এটি অনুবাদ করতে আপনি পুরোপুরি সক্ষম। অন্য কথায়, আমি আপনাকে স্বজ্ঞাত বোঝাতে আপনার প্রশ্নের "স্বজ্ঞাত" ব্যাখ্যা করেছি
whuber

1
হাই হুইবার আত্মবিশ্বাসের ভোটের জন্য আপনাকে ধন্যবাদ :) প্রত্যাশার অনুমানের জন্য স্বাধীনতার ডিগ্রির আলগাটি আমি ক্লাসে ব্যবহারের কথা ভাবছিলাম। সমস্যাটি হ'ল "স্বাধীনতার ডিগ্রি" ধারণাটি নিজেই জ্ঞান / অন্তর্দৃষ্টি প্রয়োজন। তবে এই থ্রেডে দেওয়া অন্যান্য উত্তরগুলির সাথে এটির সংমিশ্রণটি কার্যকর হবে (আমার কাছে এবং আমি ভবিষ্যতে অন্যদেরও আশা করি)। সেরা, তাল
তাল গালিলি

বৃহত্তর জন্য সাধারণত বা দ্বারা ভাগ করার মধ্যে খুব বেশি পার্থক্য নেই , সুতরাং এটি অপ্রচলিত সূত্রটি প্রবর্তন করা গ্রহণযোগ্য হবে যদি শর্ত থাকে যে এটি বড় আকারের নমুনাগুলির ক্ষেত্রে প্রয়োগ করার ইচ্ছা ছিল, না? nএন - 1nn1
প্যাট্রিকটি

1
@Patrick আপনি আমার উত্তর মধ্যে খুব বেশী পড়া যেতে পারে, কারণ এটি হয় কারণ সম্পর্কে স্পষ্ট: তারা প্রাতিষ্ঠানিক এবং কিনা সঙ্গে কোন সম্পর্ক নেই বড় বা নয়। n
হোবার

50

সংজ্ঞা অনুসারে, বৈচিত্রটি গণনা করা হয় গড় থেকে বর্গক্ষেত্রের পার্থক্যের যোগফল এবং আকার দ্বারা ভাগ করে। আমাদের কাছে সাধারণ সূত্র রয়েছে

μএনσ2=iN(Xiμ)2N যেখানে হল গড় এবং জনসংখ্যার আকার।μN

এই সংজ্ঞা অনুসারে, নমুনার বৈচিত্র্য (যেমন নমুনা )ও এই উপায়ে গণনা করতে হবে।t

¯ এক্স এনσt2=in(XiX¯)2n যেখানে the হল গড় এবং এই ছোট নমুনার আকার ।X¯n

তবে এমন নমুনা ভ্যারিয়েন্স দ্বারা , আমরা জনসংখ্যা ভ্যারিয়েন্সের একটি মূল্নির্ধারক মানে । আমরা কীভাবে কেবলমাত্র নমুনা থেকে মানগুলি ব্যবহার করে অনুমান করতে পারি ?σ 2 σ 2S2σ2σ2

উপরের সূত্র অনুসারে, এলোমেলো পরিবর্তনশীল নমুনা থেকে বিচ্যুত হয় সাথে । নমুনাটির অর্থ এছাড়াও ভেরিয়েন্সের সাথে থেকে বিচ্যুত হয় কারণ নমুনা গড়ের নমুনা থেকে নমুনায় আলাদা মান হয় এবং এটি গড় এবং বৈকল্পিক সহ একটি এলোমেলো পরিবর্তনীয় is । (এক সহজে প্রমাণ করতে পারেন।)¯ এক্স σ 2 টি ¯ এক্স μ σ 2XX¯σt2X¯μ μσ2σ2nμσ2n

অতএব, মোটামুটিভাবে, থেকে পথভ্রষ্ট উচিত একটি ভ্যারিয়েন্স জড়িত যে দুটি ভেরিয়ানস তাই এই দুই পর্যন্ত যোগ এবং পেতে সঙ্গে । এই সমাধান করে আমরা পেতে । প্রতিস্থাপন আমাদের জনসংখ্যার বৈচিত্রের জন্য অনুমানকারীকে দেয়:μ σ 2 = σ 2 টি + σ 2Xμ σ2=σ 2 টি ×nσ2=σt2+σ2n σ 2 টিσ2=σt2×nn1σt2

S2=in(XiX¯)2n1

যে কেউ true সত্য তা প্রমাণ করতে পারে।E[S2]=σ2


আমি আশা করি এটি খুব তুচ্ছ নয়: নমুনাটি যেভাবে এনডি ( , ) তে রূপান্তরিত হয় তা হ'ল সত্যতা হ'ল যে কারণে নমুনাটি হ'ল কারণ থেকে বিচ্যুত হয় বৈকল্পিকের সাথে প্রকৃত গড় ? σμ σ2σnσ2n
রেক্সওয়ান

6
এটি অন্যদের তুলনায় আরও ভাল ব্যাখ্যা কারণ এটি পরিসংখ্যানগত পদগুলির সাথে কেবল ইয়াগা ইয়াগগা না গিয়ে সমীকরণ এবং ডেরাইভেশনগুলি দেখায়।
নাভ

1
@ সেভেনকুল আমরা কীভাবে এটি দেখতে পারি? যখন আপনি বলবেন, এক্স থেকে পথভ্রষ্ট উচিত যে নেট ভ্যারিয়েন্স সঙ্গে, আমি যে visualizing হারিয়ে গেছিμ
Parthiban রাজেন্দ্রন

17

এটি মোট স্বজ্ঞাত, তবে এর সহজ উত্তরটি হ'ল 0-এর পরিবর্তে অপরিবর্তিত এক-উপাদান নমুনার মানক বিচ্যুতি করার জন্য করা একটি সংশোধন।


11
তাহলে, বা এমনকি সংশোধন হিসাবে ব্যবহার করবেন না কেন? :-) 1nn211exp(1)exp(1/n)
whuber

1
@ হুশিয়ার পার্সিমনি (-;

4
1n1 even আরও বেশি "পার্সিমোনিয়াস"। :-)
হুবুহু

2
@ এমবিকিউ, আপনার উত্তর সম্পর্কে ~ "0-এর পরিবর্তে এক-মৌলিক নমুনার অপরিজ্ঞাতকরণের মানক বিচ্যুতি তৈরি করা একটি সংশোধন", এটি কি সত্যই কারণটির কারণ, বা এটি একটি রসিক উত্তর? আপনি জানেন আমাদের মতো অ-ম্যাথাররা বলতে পারবেন না।
পেসারিয়ার

4
সাধারণত, এটি যুক্তির চেয়ে পরিণতি, তবে আমি যেমন লিখেছি, এটি মনে রাখার জন্য আমি এটি একটি ভাল অনুভূতি বলে মনে করি।

14

আপনি একা জ্যামিতির মাধ্যমে শব্দটির আরও গভীর উপলব্ধি অর্জন করতে পারেন , কেন এটি নয় কেন এটি ঠিক এই রূপটি গ্রহণ করে তবে আপনাকে প্রথমে ডাইমেনশনাল জ্যামিতির সাথে লড়াই করতে আপনার অন্তর্দৃষ্টি বাড়ানো দরকার need সেখান থেকে, যদিও এটি লিনিয়ার মডেলগুলিতে স্বাধীনতার ডিগ্রি (যেমন মডেল ডিএফ এবং রেসিডুয়াল ডিএফ) এর গভীর বোঝার এক ছোট পদক্ষেপ। আমি মনে করি যে ফিশার এইভাবে চিন্তা করেছিলেন তাতে সন্দেহ নেই । এখানে একটি বই যা ধীরে ধীরে এটি তৈরি করে:এন এনn1nn

সাবিলি ডিজে, উড জিআর পরিসংখ্যানগত পদ্ধতি: জ্যামিতিক পদ্ধতির । তৃতীয় সংস্করণ। নিউ ইয়র্ক: স্প্রিংগার-ভার্লাগ; 1991. 560 পৃষ্ঠা। 9780387975177

(হ্যাঁ, 560 পৃষ্ঠা। আমি ধীরে ধীরে বলেছিলাম।)


ধন্যবাদ অনেস্টপ - আমি ভাবিনি যে সে দিক থেকে কোনও উত্তর আসবে। অন্তর্দৃষ্টি যোগ করার কোনও উপায়, বা এটি সম্ভব হওয়ার সম্ভাবনা নেই? চিয়ার্স, তাল
তাল গালিলি

আমি নিজে এটি করতে পারিনি, তবে একটি বই পর্যালোচক আমেরের একটি অনুচ্ছেদে পদ্ধতির সংক্ষিপ্তসার জানাল। তাত্ক্ষণিকবাজার। 1993 সালে: jstor.org/stable/2684984 । আমি নিশ্চিত না যে আপনি যদি সম্পূর্ণ কোর্সের জন্য এটি অবলম্বন না করেন তবে আপনার শিক্ষার্থীদের সাথে এই পদ্ধতির ব্যবহার করা সত্যই বাস্তব।
onestop

আপনি কেবল একটি বইয়ের রেফারেন্সের চেয়ে কিছুটা অন্তর্দৃষ্টি সংক্ষিপ্ত করতে পারেন?
জলপাই

12

জনসংখ্যার নমুনার উপর প্রয়োগ করার সময় জনসংখ্যার বৈকল্পিকের অনুমানক পক্ষপাতদুষ্ট থাকে। এই পক্ষপাতিত্বের জন্য সামঞ্জস্য করার জন্য এন এর পরিবর্তে এন -1 দ্বারা ভাগ করা প্রয়োজন। কেউ গাণিতিকভাবে দেখাতে পারেন যে নমুনার বৈকল্পিকের অনুমানক পক্ষপাতহীন যখন আমরা n এর পরিবর্তে n-1 দ্বারা ভাগ করি। একটি আনুষ্ঠানিক প্রমাণ এখানে সরবরাহ করা হয়:

https://economictheoryblog.com/2012/06/28/latexlatexs2/

প্রাথমিকভাবে এটি গাণিতিক সঠিকতা যা সূত্রের দিকে নিয়েছিল, আমি মনে করি। তবে, যদি কোনও সূত্রে অন্তর্দৃষ্টি যোগ করতে চান তবে ইতিমধ্যে উল্লিখিত পরামর্শগুলি যুক্তিসঙ্গত বলে মনে হচ্ছে।

প্রথমত, কোনও নমুনার পর্যবেক্ষণগুলি জনসংখ্যার গড়ের তুলনায় গড় নমুনার গড়ের কাছাকাছি থাকে। ভেরিয়েন্স অনুমানকারী নমুনাটির ব্যবহারকে বোঝায় এবং ফলস্বরূপ জনসংখ্যার প্রকৃত বৈচিত্রকে কম দেখায়। N এর পরিবর্তে n-1 দ্বারা ভাগ করা সেই পক্ষপাতিত্বের জন্য সংশোধন করে।

তদুপরি, n-1 দ্বারা ভাগ করা শূন্যের পরিবর্তে এক-মৌলিক নমুনার বৈকল্পিক তৈরি করে।


12

কেন দ্বারা বিভক্ত করা বদলে ? কারণ এটি প্রথাগত এবং ফলাফলটির একটি বৈষম্যমূলক অনুমানের ফলাফল। যাইহোক, এটি স্ট্যান্ডার্ড বিচ্যুতিটির পক্ষপাতদুষ্ট (কম) অনুমানের ফলস্বরূপ, জেনসেনের বৈষম্যকে অবতল ফাংশন, বর্গমূলের ক্ষেত্রে প্রয়োগ করে দেখা যায়।এনn1n

সুতরাং একটি নিরপেক্ষ অনুমানক সম্পর্কে এত দুর্দান্ত কি? এটি অগত্যা মানে স্কোয়ার ত্রুটিটি হ্রাস করবে না। সাধারণ বিতরণের জন্য এমএলই হ'ল পরিবর্তে দ্বারা ভাগ করা । আপনার শিক্ষার্থীদের এক শতাব্দী আগের কাল থেকে পুনরায় সাজানো এবং নির্বোধভাবে পুরানো ধারণাগুলি প্রয়োগ করার চেয়ে ভাবতে শেখান।এন - 1nn1


8
(+1) এই পরিস্থিতি সম্পর্কে আমি যত বেশি চিন্তা করি (এবং এর উপস্থিতি কখন এবং কেন প্রকাশিত হয়েছিল তা অনুসন্ধান করার জন্য পূর্ববর্তী গবেষণাগুলি যেমন শিক্ষার্থীর 1908 বায়োমেট্রিক অবদানের গবেষণা করার পরিমাণ পর্যন্ত আমি এটিকে কিছুটা সত্য চিন্তা দিয়েছি) ), তত বেশি আমি মনে করি যে "কারণ এটি প্রচলিত" কেবলমাত্র সম্ভাব্য সঠিক উত্তর। নিম্নগামীদের দেখে আমি অসন্তুষ্ট এবং কেবলমাত্র অনুমান করতে পারি যে তারা শেষ বাক্যটির প্রতি সাড়া দিচ্ছে, যা সহজেই ওপিতে আক্রমণকারী হিসাবে দেখা যেতে পারে, যদিও আমি সন্দেহ করি যে এটি আপনার উদ্দেশ্য ছিল। n1
whuber

1
আমার শেষ বাক্যটি ওপিতে আক্রমণ করার বিরোধী হিসাবে সংশ্লিষ্ট সকলের কাছে বন্ধুত্বপূর্ণ পরামর্শ ছিল।
মার্ক এল। স্টোন

অনেক ব্যবহারে এটি বিবেচ্য হবে না, যখন পরীক্ষাগুলিতে বা আত্মবিশ্বাসের ব্যবধানগুলির জন্য ব্যবহার করা হয় তখন তাকে পদ্ধতির অন্যান্য অংশগুলি সমন্বয় করতে হবে এবং শেষ পর্যন্ত একই ফলাফলটি অর্জন করতে হবে!
কেজিটিল বি হলওয়ার্সন

8

এটা তোলে সুপরিচিত (অথবা সহজে প্রমানিত) দ্বিঘাত যে একটি এক্সট্রিমাম হয়েছে । এ থেকে জানা যায়, কোনো দেওয়া বাস্তব সংখ্যার , পরিমাণ এর নূন্যতম মান থাকে যখন ।z = - β βαz2+2βz+γz=βαnx1,x2,,xn

G(a)=i=1n(xia)2=(i=1nxi2)2a(i=1nxi)+na2,
a=1ni=1nxi=x¯

এখন, যে অনুমান করা আকারের একটি নমুনা হয় অজানা গড় সঙ্গে বন্টন থেকে এবং অজানা ভ্যারিয়েন্স । আমরা অনুমান করতে পারেন যেমন যা যথেষ্ট সহজ নিরূপণ করা হয়, কিন্তু অনুমান করার জন্য একটি প্রচেষ্টা যেমন এমন সমস্যায় পড়ে যা আমরা জানি না । আমরা অবশ্যই সহজেই গণনা করতে পারি এবং আমরা জানি যে , তবে কত বড় ? উত্তরটি হ'ল xinμσ2μ1ni=1nxi=x¯σ21ni=1n(xiμ)2=n1G(μ)μG(x¯)G(μ)G(x¯)G(μ)G(μ)চেয়ে বড় একটি দ্বারা ফ্যাক্টর প্রায় এর , যে, এবং সুতরাং অনুমান জন্য বিতরণের বৈকল্পিকতা G(x¯)nn1

(1)G(μ)nn1G(x¯)
n1G(μ)=1ni=1n(xiμ)21n1G(x¯)=1n1i=1n(xix¯)2.

সুতরাং, এর একটি স্বজ্ঞাত ব্যাখ্যা কি ? ঠিক আছে, আমাদের যে যেহেতু । এখন, (1)

G(μ)=i=1n(xiμ)2=i=1n(xix¯+x¯μ)2=i=1n((xix¯)2+(x¯μ)2+2(xix¯)(x¯μ))=G(x¯)+n(x¯μ)2+(x¯μ)i=1n(xix¯)(2)=G(x¯)+n(x¯μ)2
i=1n(xix¯)=nx¯nx¯=0
n(x¯μ)2=n1n2(i=1n(xiμ))2=1ni=1n(xiμ)2+2ni=1nj=i+1n(xiμ)(xjμ)(3)=1nG(μ)+2ni=1nj=i+1n(xiμ)(xjμ)
যখন আমাদের কাছে একটি অসাধারণ অস্বাভাবিক নমুনা থাকে যেখানে সমস্ত চেয়ে বড় হয় (বা তারা সকলেই চেয়ে ছোট হয় ), ডানদিকে ডাবল এর দিকটি ইতিবাচক পাশাপাশি নেতিবাচক মানগুলি গ্রহণ করে এবং এভাবে প্রচুর বাতিল হয় lations সুতরাং, দ্বিগুণ যোগফলের জন্য স্বল্প পরিপূর্ণ মান আশা করা যায় এবং আমরা এর ডানদিকে শব্দটির তুলনায় এটি কেবল উপেক্ষা করি । সুতরাং, হয়ে claimed হিসাবে দাবি করা হয়েছেxiμμ(xiμ)(xjμ)(3)1nG(μ)(3)(2)
G(μ)G(x¯)+1nG(μ)G(μ)nn1G(x¯)
(1)

8
কেবল এই স্ট্যাক এক্সচেঞ্জে এটি কখনও স্বজ্ঞাত উত্তর হিসাবে বিবেচিত হবে।
জোসেফ গারভিন

6

নমুনা ভেরিয়েন্সটি সমস্ত নমুনা পয়েন্টগুলির মধ্যে "শক্তি" এর সঠিক গড় হিসাবে ভাবা যেতে পারে । নমুনা পরিবর্তনের সংজ্ঞাটি তখন (xixj)2/2

s2=2n(n1)i<j(xixj)22=1n1i=1n(xix¯)2.

এটি জোড়যুক্ত শক্তির প্রত্যাশা হিসাবে একটি এলোমেলো পরিবর্তনশীলের পরিবর্তনের সংজ্ঞা সহ একমত, যেমন এবং একই বন্টন সহ স্বাধীন র্যান্ডম ভেরিয়েবল হতে দিন , তারপরে XY

V(X)=E((XY)22)=E((XE(X))2).

নমুনা বৈকল্পিকের সংজ্ঞাটির সাথে র্যান্ডম ভেরিয়েবলের নির্ধারিত সংজ্ঞা থেকে যাওয়া একটি অর্থ দ্বারা প্রত্যাশা অনুমান করার বিষয় যা আদর্শের দার্শনিক নীতি দ্বারা ন্যায্যতা অর্জন করতে পারে: নমুনাটি বিতরণের একটি সাধারণ প্রতিনিধিত্ব is (দ্রষ্টব্য, এটি সম্পর্কিত, তবে মুহুর্তগুলির দ্বারা অনুমানের মতো নয়))


2
আমি শেষ অনুচ্ছেদে আপনাকে বেশ অনুসরণ করতে পারিনি। গাণিতিক সত্য নয় যে ? সমীকরণটি আকর্ষণীয় হলেও, আমি কীভাবে এটি এন -1 শিখতে স্বজ্ঞাতভাবে ব্যবহার করতে পারি তা পাই না? V(X)=E((XY)22)=E((XE(X))2)
কেএইচ কিম

4
আমি এই পদ্ধতির পছন্দ করি তবে এটি একটি মূল ধারণা বাদ দেয়: সমস্ত জোড়া নমুনা পয়েন্টের মধ্যে গড় শক্তি গণনা করার জন্য, শূন্য হলেও, মানগুলি গণনা করতে হবে। সুতরাং অঙ্ক একই থাকে তবে ডিনোমিনেটর হওয়া উচিত , । এটি ঘটেছে এমন হস্তক্ষেপ দেখায়: কোনওভাবে আপনাকে এ জাতীয় স্ব-জুটি অন্তর্ভুক্ত না করে ন্যায়সঙ্গত হওয়া দরকার । (কারণ তারা হয় ভ্যারিয়েন্সের অনুরূপ জনসংখ্যা সংজ্ঞা অন্তর্ভুক্ত, এই একটি সুস্পষ্ট জিনিস না।)(xixi)2s2nn1
whuber

4

ধরা যাক আপনার এলোমেলো ঘটনা আছে। আবার ধরুন যে আপনি কেবল একটি নমুনা বা উপলব্ধি পেতে পারেন । আরও অনুমান ব্যতীত, একটি নমুনা গড়ের জন্য আপনার "কেবল" যুক্তিসঙ্গত পছন্দটি হ'ল । আপনি যদি আপনার থেকে বিয়োগ করেন না , তবে (অবৈধ) নমুনা বৈকল্পিকটি হবে , বা:N=1xm¯=x1

V=N(xnm¯)2N

V¯=(xm¯)21=0.

অদ্ভুতভাবে, শুধুমাত্র একটি নমুনা সঙ্গে বৈকল্পিক নਾਲ হবে। এবং দ্বিতীয় নমুনা রাখার ফলে হলে আপনার প্রকারটি বাড়িয়ে তোলার ঝুঁকি রয়েছে । এর কোন মানে নেই. স্বজ্ঞাতভাবে, একটি অসীম বৈকল্পিকতা আরও ভাল ফলাফল হতে পারে এবং আপনি কেবল এটি " দ্বারা ভাগ করে" পুনরুদ্ধার করতে পারেন ।yxyN1=0

একটি গড় নির্ধারণ করা হ'ল এক ডিগ্রি স্বাধীনতা (ডফ) থাকার সাথে ডেটাতে ডিগ্রি সহ বহুভুজ ফিট করে। এই বেসেল এর সংশোধন স্বাধীনতা মডেলের খুব উচ্চতর ডিগ্রি ক্ষেত্রে প্রযোজ্য: অবশ্যই আপনি পুরোপুরি ফিট করতে পারে একটি সঙ্গে পয়েন্ট , ডিগ্রী বহুপদী সঙ্গে dofs। শূন্য-বর্গক্ষেত্র-ত্রুটির মায়া কেবল ডোফসের সংখ্যার বিয়োগের সংখ্যা দ্বারা বিভক্ত হয়ে প্রতিরোধযোগ্য হতে পারে। খুব ছোট পরীক্ষামূলক ডেটাসেটগুলির সাথে কাজ করার সময় এই সমস্যাটি বিশেষত সংবেদনশীল ।0d+1dd+1


এটি অস্পষ্ট যে কেন শূন্য বৈচিত্রের চেয়ে "একটি অসীম বৈকল্পিকতা আরও ভাল ফলাফল হতে পারে"। প্রকৃতপক্ষে, আপনি কোনও বৈকল্পিক অনুমানকারী হিসাবে "নমুনা বৈকল্পিক" ব্যবহার করছেন বলে মনে হচ্ছে , যা এখনও আরও বিভ্রান্তিকর।
হোবার

1
আমি বুঝেছি. দুটি বিকল্পের মধ্যে একটি স্বজ্ঞাত ব্যাখ্যা দেওয়ার জন্য, আমি পরামর্শ দেওয়ার চেষ্টা করেছি যে এই জাগতিক নিয়মের ভিত্তিতে দুটির মধ্যে একটির কোনওরকমভাবে অগ্রহণযোগ্য । একটি পুনর্নির্মাণ সত্যই প্রয়োজনীয়, এবং আসন্ন0<
লরেন্ট ডুভাল

4

পরামর্শে whuber , এই উত্তর থেকে অনুলিপি করা হয়েছে আরেকটি অনুরূপ প্রশ্ন

সত্য ভিন্নতার একটি অনুমানকারী হিসাবে নমুনা বৈকল্পিক ব্যবহারে পক্ষপাতের জন্য সংশোধন করার জন্য বেসেলের সংশোধন গৃহীত হয়। অসম্পূর্ণ পরিসংখ্যানের পক্ষপাতিত্ব ঘটে কারণ নমুনাটির গড় অর্থ সত্যের চেয়ে পর্যবেক্ষণের মাঝের কাছাকাছি থাকে, এবং সুতরাং নমুনার চারপাশের স্কোয়ার বিচ্যুতির অর্থ সঠিক গড়ের চারপাশে স্কোয়ার বিচ্যুতিগুলি নিয়মিতভাবে হ্রাস করা হয়।

এই ঘটনাটি বীজগণিতভাবে দেখতে, বেসেলের সংশোধন না করে কেবলমাত্র একটি নমুনা বৈকল্পিকের প্রত্যাশিত মান অর্জন করুন এবং এটি দেখতে কেমন তা দেখুন। লেট করা আমাদের কাছে থাকা অরক্ষিত নমুনার বৈকল্পিকতা বোঝায় ( ব্যবহার করে )S2n

S2=1ni=1n(XiX¯)2=1ni=1n(Xi22X¯Xi+X¯2)=1n(i=1nXi22X¯i=1nXi+nX¯2)=1n(i=1nXi22nX¯2+nX¯2)=1n(i=1nXi2nX¯2)=1ni=1nXi2X¯2.

প্রত্যাশা ফলন গ্রহণ:

E(S2)=1ni=1nE(Xi2)E(X¯2)=1ni=1n(μ2+σ2)(μ2+σ2n)=(μ2+σ2)(μ2+σ2n)=σ2σ2n=n1nσ2

সুতরাং আপনি দেখতে পাচ্ছেন যে অপরিশোধিত নমুনা বৈকল্পিক পরিসংখ্যানগুলি প্রকৃত বৈকল্পিকতা অবমূল্যায়ন করে । বেসেলের সংশোধনটি হ'ল সাথে প্রতিস্থাপন করে যা একটি পক্ষপাতহীন অনুমানকারী দেয়। রিগ্রেশন বিশ্লেষণে এটি আরও সাধারণ ক্ষেত্রে প্রসারিত হয় যেখানে অনুমানিত গড়টি একাধিক ভবিষ্যদ্বাণীকের একটি লিনিয়ার ফাংশন হয় এবং এই পরবর্তী ক্ষেত্রে স্বতন্ত্রতার নিম্ন সংখ্যার জন্য ডিনোমিনেটর আরও হ্রাস পায়।σ2n1


প্রমাণের জন্য ধন্যবাদ!

0

ডিনোমিনেটরে সাধারণত "এন" ব্যবহার করা জনসংখ্যার বৈকল্পিকের চেয়ে কম মান দেয় যা আমরা অনুমান করতে চাই। এটি বিশেষত যদি ছোট নমুনাগুলি নেওয়া হয় happens পরিসংখ্যানের ভাষায়, আমরা বলেছি যে নমুনা বৈকল্পিক জনসংখ্যার বৈচিত্রের একটি "পক্ষপাতদুষ্ট" অনুমান সরবরাহ করে এবং "নিরপেক্ষ" করা দরকার।

যদি আপনি কোনও স্বজ্ঞাত ব্যাখ্যাটি খুঁজছেন, আপনার উচিত আপনার শিক্ষার্থীদের প্রকৃত নমুনা গ্রহণ করে নিজের কারণটি দেখতে দেওয়া! এটি দেখুন, এটি আপনার প্রশ্নের সঠিকভাবে উত্তর দেয় answers

https://www.youtube.com/watch?v=xslIhnquFoE


0

নমুনা গড়টি হিসাবে সংজ্ঞায়িত করা হয়েছে , যা বেশ স্বজ্ঞাত। তবে নমুনার ভেরিয়েন্সটি । কোথায় থেকে এসেছে?X¯=1ni=1nXiS2=1n1i=1n(XiX¯)2n1

এই প্রশ্নের উত্তর দিতে, আমাদের অবশ্যই একটি নিরপেক্ষ অনুমানক এর সংজ্ঞা ফিরে যেতে হবে। নিরপেক্ষ অনুমানক এমন এক, যার প্রত্যাশা সত্য প্রত্যাশার দিকে ঝুঁকে। নমুনা গড় একটি নিরপেক্ষ অনুমানক। কেন দেখুন:

E[X¯]=1ni=1nE[Xi]=nnμ=μ

আসুন আমরা নমুনা বৈকল্পিকের প্রত্যাশা তাকান,

S2=1n1i=1n(Xi2)nX¯2

E[S2]=1n1(nE[(Xi2)]nE[X¯2]).

লক্ষ্য করুন যে একটি এলোমেলো পরিবর্তনশীল এবং ধ্রুবক নয়, সুতরাং প্রত্যাশা একটি ভূমিকা পালন করে। পিছনে কারণটিX¯E[X¯2]n1

E[S2]=1n1(n(μ2+σ2)n(μ2+Var(X¯))).
Var(X¯)=Var(1ni=1nXi)=i=1n1n2Var(Xi)=σ2n

E[S2]=1n1(n(μ2+σ2)n(μ2+σ2/n)).=(n1)σ2n1=σ2

যেমন আপনি দেখতে পাচ্ছেন, আমাদের পরিবর্তে হিসাবে ডিনোমিনেটর থাকলে আমরা তারতম্যের জন্য পক্ষপাতদুষ্ট অনুমান করব! তবে এর সাথে অনুমানকারী একটি নিরপেক্ষ অনুমানক।nn1n1S2


3
তবে এটি অনুসরণ করে না যে মানক বিচ্যুতির একটি নিরপেক্ষ অনুমানক। S
স্কোর্টচি

-1

আমি মনে করি এটি বেয়েশিয়ার অনুমানের সাথে সংযোগটি নির্দেশ করার উপযুক্ত। ধরুন আপনি ধরে নিচ্ছেন যে আপনার ডেটা গাউসিয়ান, এবং সুতরাং আপনি পয়েন্টের নমুনার গড় এবং বৈকল্পিক পরিমাপ করেন । আপনি জনসংখ্যা সম্পর্কে উপসংহার আঁকতে চান। বায়েশিয়ান পদ্ধতির নমুনার উপরের উত্তর ভবিষ্যদ্বাণীমূলক বিতরণকে মূল্যায়ন করা হবে, এটি একটি সাধারণ শিক্ষার্থীর টি বিতরণ (টি-পরীক্ষার উত্স)। এই অর্থ , , এবং বৈকল্পিকσ 2 এন μ σ 2 ( এন + + 1μσ2nμ

σ2(n+1n1),

এটি আদর্শ সংশোধনের চেয়েও বড়। ( ডিগ্রি স্বাধীনতা রয়েছে))2n

সাধারণীকরণ করা শিক্ষার্থীদের টি বিতরণে তিনটি প্যারামিটার রয়েছে এবং এটি আপনার পরিসংখ্যানের তিনটিই ব্যবহার করে। যদি আপনি কিছু তথ্য ফেলে দেওয়ার সিদ্ধান্ত নেন, আপনি আপনার প্রশ্নে বর্ণিত হিসাবে একটি দ্বি-পরামিতি স্বাভাবিক বিতরণ ব্যবহার করে আপনার ডেটা আরও আনুমানিক করতে পারেন।

বায়েশিয়ান দৃষ্টিকোণ থেকে, আপনি কল্পনা করতে পারেন যে মডেলের হাইপারপ্যারামিটারগুলির মধ্যে অনিশ্চয়তা (গড় এবং বৈচিত্রের উপর বিতরণ) উত্তরোত্তর ভবিষ্যতের ভবিষ্যতের পরিবর্তনের চেয়ে জনসংখ্যার বৈচিত্রের চেয়ে বেশি হতে পারে।


-4

আমার ধার্মিকতা এটি জটিল হয়ে উঠছে! আমি ভেবেছিলাম সহজ উত্তরটি ছিল ... আপনার কাছে যদি সমস্ত ডেটা পয়েন্ট থাকে তবে আপনি "এন" ব্যবহার করতে পারেন তবে যদি আপনার "নমুনা" থাকে তবে এটি একটি এলোমেলো নমুনা ধরে নিলে, আপনি আদর্শ বিচ্যুতির ভিতরে থেকে আরও নমুনা পয়েন্ট পেয়েছেন বাইরে থেকে (স্ট্যান্ডার্ড বিচ্যুতি সংজ্ঞা)। আপনার এলোমেলোভাবে প্রয়োজনীয় সমস্ত ডেটা পয়েন্ট পাওয়ার জন্য আপনার কাছে পর্যাপ্ত ডেটা নেই। এন -1 "বাস্তব" স্ট্যান্ডার্ড বিচ্যুতির দিকে প্রসারিত করতে সহায়তা করে।


3
এটা কোন মানে নেই। বাহিরের চেয়ে এসডির ভিতরে থেকে আরও পয়েন্ট? যদি এর অর্থ যদি 1 এসডি-এর মধ্যে হয় তবে বনামের মধ্যে নয়, এটি সত্য কিনা কোনও নমুনা নেওয়ার সাথে কোনও সম্পর্ক নেই। গড়ের চারপাশের বিরতিগুলির মধ্যে ভগ্নাংশগুলিতে প্রয়োজনীয় বাধাগুলির জন্য, চেবিশেভের অসমতা দেখুন। এখানে মূল প্রশ্নের কাছে, "প্রসারিত করতে সহায়তা করে" কে মোটেও ব্যাখ্যা করে না , এমনকি আপনার যুক্তি করা আরও ভাল হতে পারে এবং আরও বলা যায়, এখানে কোনও বীজগণিত নেই এমনকি পুরোপুরিও বলা যায়। দুর্ভাগ্যক্রমে এটি ভুল বা অপ্রাসঙ্গিক ধারণাগুলির একটি বিভ্রান্ত সেট ব্যতীত অন্য উত্তরে আর কিছুই যোগ করে না। এন - 2n1n2
নিক কক্স
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.