পরিসংখ্যানবিদরা ঠিক কীভাবে (এন -১) সিমুলেশন ছাড়াই জনসংখ্যার বৈচিত্র্যের জন্য নিরপেক্ষ অনুমানক হিসাবে ব্যবহার করতে সম্মত হন?


67

গণ্যকরণের বৈকল্পিকের সূত্রটি ডিনোমিনেটরে রয়েছে:(n1)

s2=i=1N(xix¯)2n1

কেন আমি সবসময় ভাবছিলাম। যাইহোক, "কেন" এটি সম্পর্কে কয়েকটি ভাল ভিডিও পড়া এবং দেখা, দেখে মনে হয় জনসংখ্যার বৈচিত্রের একটি নিরপেক্ষ অনুমানক। যেখানে কম মূল্যায়ন করা হয় এবং জনসংখ্যার বৈচিত্র্যকে কমিয়ে দেয় ।(n1)n(n2)

আমি জানতে আগ্রহী, কোন কম্পিউটারের যুগে এই পছন্দটি ঠিক কীভাবে করা হয়েছিল? এটির প্রমাণ দেওয়ার জন্য কি কোনও গাণিতিক প্রমাণ রয়েছে বা এই নিখুঁত অভিজ্ঞতাবাদী এবং পরিসংখ্যানবিদরা সেই সময়ে "সেরা ব্যাখ্যা" দিয়ে এসেছিলেন হাতে হাতে প্রচুর গণনা?

ঠিক কীভাবে পরিসংখ্যানবিদরা কম্পিউটারের সহায়তায় 19 শতকের গোড়ার দিকে এই সূত্রটি নিয়ে এসেছিলেন? ম্যানুয়াল নাকি এর চেয়ে বেশি কিছু আছে চোখের দেখা?


13
আমি ধরে নিয়েছি আপনি " কম্পিউটারের সহায়তা ছাড়াই " বলতে চাইছেন । উত্তরটি - সম্ভবত আশ্চর্যজনকভাবে - বীজগণিতের ব্যবহার দ্বারা। ডেরাইভেশনটি বেশ সোজা এবং অনেক জায়গাতেই পরিসংখ্যান শিক্ষার্থীদের পক্ষে এটি একটি অনুশীলন হিসাবে আনা / আন্ডারগ্র্যাড হিসাবে শেখা সাধারণ।
গ্লেন_বি

: আমি এই একটি প্রশংসনীয় ভাল ব্যাখ্যা দেয় মনে en.wikipedia.org/wiki/Variance#Sample_variance
Verena Haunschmid


আমি আপনার সূত্রে ব্যবহার করতে সম্পাদনা করেছি এবং যেমন হর এ জন্য হয় নমুনা ভ্যারিয়েন্স (ল্যাটিন প্রতীক) না জনসংখ্যা ভ্যারিয়েন্স (গ্রিক প্রতীক)। ˉ x n - 1s2x¯n1
অ্যালেক্সিস

উত্তর:


40

সংশোধনটিকে বেসেলের সংশোধন বলা হয় এবং এটির গাণিতিক প্রমাণ রয়েছে। ব্যক্তিগতভাবে, আমাকে এটি সহজ উপায়ে শেখানো হয়েছিল: ব্যবহার করে আপনি কীভাবে ( এখানে দেখুন ) এর পক্ষপাত সংশোধন করেন ।[ 1n1E[1n1n(xix¯)2]

আপনি স্বাধীনতার ডিগ্রি ধারণার ভিত্তিতে সংশোধনও ব্যাখ্যা করতে পারেন, সিমুলেশন কঠোরভাবে প্রয়োজন হয় না।


15
প্রুফ বিকল্প # 3 এর একটি সুন্দর স্বজ্ঞাত ব্যাখ্যা রয়েছে যা একজন সাধারণ ব্যক্তিও বুঝতে পারে। মূল ধারণাটি হ'ল নমুনা গড়টি জনসংখ্যার গড় হিসাবে একই নয়। আপনার পর্যবেক্ষণগুলি প্রাকৃতিকভাবে জনসংখ্যার গড়ের চেয়ে নমুনা গড়ের কাছাকাছি যেতে চলেছে এবং এটি পদ পদগুলির সাথে অবমূল্যায়ন করে । এটি সম্ভবত বেশিরভাগ লোকের কাছেই সুস্পষ্ট তবে আমি "অন্তর্দৃষ্টি" সম্পর্কে কখনই ভাবিনি যে কেন পক্ষপাতদুষ্ট নমুনার বৈকল্পিকতা এখন পর্যন্ত পক্ষপাতদুষ্ট। আমি কেবল আনুষ্ঠানিক প্রমাণগুলি শিখেছি। ( x i - ˉ x ) 2(xiμ)2(xix¯)2
ওয়েটল্যাব স্টুডেন্ট

2
এন -1 দিয়ে কেন সংশোধন করতে হবে এমন একটি জ্যামিতিক পদ্ধতিরও রয়েছে (সাবিলি ও উড: পরিসংখ্যানগত পদ্ধতি: জ্যামিতিক পদ্ধতির ক্ষেত্রে খুব সুন্দরভাবে ব্যাখ্যা করা হয়েছে)। এটি শীঘ্রই রাখুন: এন এর একটি নমুনা একটি n- মাত্রিক ডেটা স্পেস হিসাবে বিবেচনা করা যেতে পারে। স্যাম্পল পয়েন্ট ভেক্টরগুলি একটি পর্যবেক্ষিত ভেক্টরকে যুক্ত করে যা পি প্যারামিটারের সাথে সম্পর্কিত পি-ডাইমেনশন এবং এনপি মাত্রা সহ একটি ত্রুটি ভেক্টর সহ একটি মডেল ভেক্টরের সাথে পচে যেতে পারে। ত্রুটি ভেক্টরের সাথে সম্পর্কিত পাইথাগোরিয়ান ব্রেকআপের এনপি স্কোয়ার রয়েছে যা গড়টি পরিবর্তনের জন্য একটি পরিমাপ।
জিওর্ডানো

আমি আপনাকে একটি সুন্দর লিঙ্ক দেব যার সংক্ষিপ্ত বিবরণ রয়েছে: এন.ইউইকিপিডিয়া.আর
ক্রিস্টিনা

প্রমাণের (বিকল্প 3) কেন আমরা ব্যাখ্যা করতে পারি যে আমরা অনুমান করতে পারি যে সত্য এবং পক্ষপাতদুষ্ট উভয় প্রকারকে 's ব্যবহার করে গণনা করা হয়েছে? যখন আমাদের জনসংখ্যা থাকে (প্রকৃত বৈকল্পের সাথে) এবং একটি নমুনা (পক্ষপাতদুষ্ট বৈকল্পের সহ) থাকে তখন বিভিন্ন রূপের সমস্যা দেখা দেয়। তবে আমরা যদি একই ডেটা, যেমন বৈকল্পিক গণনা করি তবে কেন সেগুলি কখনও আলাদা হয়? সেখানে আমরা কে পক্ষপাতদুষ্ট একটি হিসাবে ঠিক একই ব্যবহার করে গণনা করা একটি সত্য হিসাবে বিবেচনা করি । আমি এই প্রমাণের সাথে একমত হতে পারি না। দয়া করে সাহায্য করুন, আমি কী মিস করছি? এক্স এক্স 1 , x এর 2 , , x n σ 2 x s 2 পক্ষপাতদুষ্টn xx1,x2,...,xnσ2xsbiased2
তুরখান বাদলভ

56

আমি দেখেছি বেশিরভাগ প্রমাণ যথেষ্ট সহজ যে গৌস (তবে তিনি তা করেছিলেন) সম্ভবত এটি প্রমাণ করা বেশ সহজ বলে মনে হয়েছিল।

আমি সিভিতে এমন একটি উত্কর্ষের সন্ধান করছি যা আমি আপনাকে লিঙ্ক করতে পারলাম (অফ সাইট-র প্রমাণগুলির সাথে বেশ কয়েকটি লিঙ্ক রয়েছে, কমপক্ষে এখানে উত্তরগুলির মধ্যে একটিও রয়েছে), তবে আমি এখানে একটি সিভিতে পাইনি a বেশ কয়েকটি অনুসন্ধান, তাই সম্পূর্ণতার জন্য, আমি একটি সাধারণ একটি দেব। এর সরলতা দেওয়া, এটি সহজেই দেখা যায় যে লোকেরা সাধারণত বেসেলের সংশোধন বলে যা ব্যবহার করতে শুরু করবে ।

এটি ধরে নেওয়া জ্ঞান হিসাবে নেয় এবং ধরে নেওয়া হয় যে প্রথম কয়েকটি প্রাথমিক বৈকল্পিক বৈশিষ্ট্য জানা গেছে areE(X2)=Var(X)+E(X)2

E[i=1n(xix¯)2]=E[i=1nxi22x¯i=1nxi+nx¯2]=E[i=1nxi2nx¯2]=nE[xi2]nE[x¯2]=n(μ2+σ2)n(μ2+σ2/n)=(n1)σ2

1
শব্দটি কোন সম্পত্তি অদৃশ্য হয়ে যায়? 2x¯i=1nxi
সিপরিয়ান টমোইগ্যাগ

3
এটি অদৃশ্য হয় না। আপনি কি শেষ পদের চিহ্নটির পরিবর্তন লক্ষ্য করেছেন?
Glen_b

1
(+1) আমি সম্প্রতি একটি দুর্দান্ত প্রমাণ শুনেছি যা আমি ব্যক্তিগতভাবে আরও স্বজ্ঞাত বলে মনে করি। ফ্যাক্টরের সাথে নমুনা বৈকল্পিকতা সমস্ত জোড়া পয়েন্টের মধ্যে সমস্ত বর্গক্ষেত্রের পার্থক্যগুলির গড় হিসাবে আবার প্রকাশ করা যেতে পারে। এখন লক্ষ্য করুন যে একই দাগগুলি দু'বার একই পয়েন্টে প্রবেশ করে সেগুলি সমস্ত শূন্য এবং এটি অভিব্যক্তিটিকে পক্ষপাতদুষ্ট করে। এই সমস্ত জোড়াকে ডাবল যোগ থেকে বাদ দিয়ে এবং বাকি অংশে কেবল গড় হিসাবে এই পক্ষপাত সংশোধন করা যুক্তিসঙ্গত বলে মনে হয়। এটি বেসেলের সংশোধন করে। 1/n
অ্যামিবা

1
না, কিছু মনে করবেন না, এটিকে বুঝে নিন। , তাই আপনি শুধু আবেদন করছি যে একই পরিচয় আপনি উপরের উভয় পদ লাইন 3. উল্লিখিতV[x¯]=V[x]n
টেল

1
আইড পরিবর্তনের যে কোনওটির একই দ্বিতীয় মুহূর্ত থাকে। আমরা তাদের সবার সম্পর্কে কথা বলা থেকে শুরু করে কেবল তাদের একটি নিয়ে আলোচনা করতে যাই। আপনি যত সহজে গ্রহণ থাকতে পারে (এবং কিছু লোক না) অথবা বা ... কিন্তু আমি নিয়েছি -thx1x2xni
Glen_b

37

ওয়েইস্টেইনের ওয়ার্ল্ড অফ ম্যাথমেটিক্স অনুসারে এটি ১৮৩৩ সালে গৌস দ্বারা প্রথম প্রমাণিত হয়েছিল। রেফারেন্সটি গাউসের ওয়ার্কের ৪ ম খন্ড, যা https://archive.org/details/werkecarlf04gausrich এ পড়তে পারেন । সম্পর্কিত পৃষ্ঠাগুলি 47-49 বলে মনে হচ্ছে। দেখে মনে হয় গৌস প্রশ্নটি তদন্ত করেছেন এবং একটি প্রমাণ নিয়ে এসেছেন। আমি লাতিন পড়ি না, তবে লেখায় একটি জার্মান সংক্ষেপ রয়েছে। পৃষ্ঠাগুলি 103-104 ব্যাখ্যা করেছেন তিনি কী করেছিলেন (সম্পাদনা করুন: আমি মোটামুটি অনুবাদ যুক্ত করেছি):

অ্যালেইন দা ম্যান নিক্ট বেরেকটিগ্ট ইস্ট, ডাই সিচারস্টেন ওয়ার্ট ফুয়েয়ার ডু ওয়াহেন ওয়ার্ট সেল্স্টস্ট জু জুটেন, সুতরাং উবারজিউট ম্যান সিচ লেইচট, ডাস ম্যান ডার্ক ডাইস ভের্ফাহরেন এলালামাল ড্যান ওয়ারহসচেইনলিচস্টেন অ্যান্ড মিটলেন ফেরেল মেরিটেন গেরেগেইন চেঞ্জেন als sie wirklich besitzen। [তবে যেহেতু একজন অত্যন্ত সম্ভাব্য মানগুলি প্রকৃত মান হিসাবে বিবেচনা করার অধিকারী নয়, তাই সহজেই নিজেকে বোঝাতে পারেন যে সর্বাধিক সম্ভাব্য ত্রুটি এবং গড় ত্রুটি খুব ছোট, এবং তাই প্রদত্ত ফলাফলগুলি তাদের সত্যিকারের চেয়ে আরও বড় নির্ভুলতার অধিকারী]]

যা থেকে এটি মনে হয় এটি সুপরিচিত ছিল যে নমুনা বৈকল্পিকতা জনসংখ্যার বৈচিত্রের পক্ষপাতিত্বমূলক অনুমান। নিবন্ধটি আরও বলেছে যে দুজনের মধ্যে পার্থক্যটি সাধারণত উপেক্ষা করা হয় কারণ নমুনার আকারটি যথেষ্ট বড় হলে এটি গুরুত্বপূর্ণ নয়। তারপরে এটি বলে:

ডের ভার্ফাসার টুপি ডের ডেইসেন জেগেনস্ট্যান্ড ইইন বেসোন্ডের ইউনটারসুচং আনটারওয়ার্ফেন, ডু জু ইনেম সেহর মেরকওয়ুয়ারডিজেন হুইচস্ট আইনফাচেন রেজাল্ট জিফিউহর্ট টুপি। ম্যান ব্রুচ্ট নেমলিচ ড্যান নাচ ডেম অ্যাঞ্জেজিগেটেন ফাহারহাফটেন ভার্ফাহরেন গাইফুডেনেন মিটলেন ফেহলার, ওম মিং রিচটিজেন জু ভার্ভ্যান্ডেলন, নুর মিট

πρπ

Zu multiplicieren, Wo মরা Anzahl ডের beobachtungen (পর্যবেক্ষণ সংখ্যা) আন্ড মরা Anzahl ডের unbekannten groessen (অজানা সংখ্যা) bedeutet। [লেখক অতএব এই বিষয়টির একটি বিশেষ অধ্যয়ন করেছেন যা খুব বিস্ময়কর এবং অত্যন্ত সাধারণ ফলাফলের দিকে নিয়ে গেছে। যথা, একজনকে কেবলমাত্র প্রদত্ত গড় ত্রুটিযুক্ত প্রক্রিয়াটি দ্বারা প্রদত্ত গড় ত্রুটিটিকে (প্রদত্ত অভিব্যক্তি) দ্বারা ডানটিকে পরিবর্তিত করতে হবে যেখানে পর্যবেক্ষণের সংখ্যা এবং unknown অজানা পরিমাণের সংখ্যা]]πρπρ

সুতরাং যদি এটি প্রথমবার সংশোধনটি পাওয়া গিয়েছিল, তবে মনে হয় এটি গৌসের দ্বারা একটি চৌকস গণনা দ্বারা পাওয়া গিয়েছিল, তবে লোকেরা ইতিমধ্যে সচেতন ছিল যে কিছু সংশোধন করা দরকার ছিল, সুতরাং সম্ভবত অন্য কেউ এটির আগে অভিজ্ঞতাই খুঁজে পেতে পারত ir । অথবা সম্ভবত পূর্ববর্তী লেখকরা সুনির্দিষ্ট উত্তরটি পাওয়া যায় নি কারণ তারা যে কোনও উপায়ে মোটামুটি বড় ডেটা সেট নিয়ে কাজ করছিল।

সারাংশ: ম্যানুয়াল, কিন্তু মানুষ ইতিমধ্যে জানত যে হর বেশ অধিকার ছিল না।n


কেউ যদি জার্মান এর অনুবাদ সরবরাহ করতে পারে তবে তা চমৎকার হবে। আমি একজনের জন্য জার্মান পড়ি না।
ফাহিম মিঠা

2
হ্যাঁ, আমার বানান ত্রুটির কারণে গুগল অনুবাদ এত ভাল কাজ করে না! আমি অনুবাদে একটি প্রচেষ্টা যুক্ত করব; এটি আমার জার্মান অনুশীলনের একটি ভাল উপায় হবে।
ফ্লাউন্ডারিয়ার

14

আমার জন্য অন্তর্দৃষ্টি একটি টুকরা হ'ল

The degree to whichXi varies from X¯+The degree to whichX¯ varies from μ=The degree to which Xi varies from μ.

এটাই,

E[(XiX¯)2]+E[(X¯μ)2]=E[(Xiμ)2].

প্রকৃতপক্ষে উপরের সমীকরণটি প্রমাণ করতে কিছুটা বীজগণিত লাগে (এই বীজগণিতটি উপরের @ গ্লেন_ বি এর উত্তরের সাথে সমান)। তবে এটি সত্য বলে ধরে নিলাম, আমরা এটি পুনরায় সাজিয়ে তুলতে পারি:

E[(XiX¯)2]=E[(Xiμ)2]σ2E[(X¯μ)2]σ2n=n1nσ2.

আমার জন্য, স্বজ্ঞা অন্য টুকরা যে ব্যবহার করছে পরিবর্তে পক্ষপাত প্রবর্তন করে। আর এই পক্ষপাত ঠিক সমান ।X¯μE[(X¯μ)2]=σ2n


12

বেশিরভাগ উত্তর ইতিমধ্যে এটিকে বিস্তৃতভাবে ব্যাখ্যা করেছে তবে সেগুলি ছাড়াও একটি সহজ উদাহরণ রয়েছে যে কোনওটি সহায়ক পেতে পারে:

ধরুন আপনাকে দেওয়া হয়েছে যে এবং প্রথম তিনটি নম্বর হ'ল:n=4

8,4,6 , _

বাধা নেই বলে এখন চতুর্থ সংখ্যাটি যে কোনও কিছু হতে পারে। এখন পরিস্থিতিটি বিবেচনা করুন যখন আপনাকে সেই এবং , তবে প্রথম তিনটি সংখ্যা যদি তবে চতুর্থ সংখ্যাটি হতে হবে ।ˉ x = 6 8 , 4 , 6 6n=4x¯=68,4,66

এটি বলার জন্য যে আপনি যদি মান এবং জানেন তবে মানের কোনও স্বাধীনতা নেই। সুতরাং আমাদের একটি নিরপেক্ষ অনুমানক দেয়।ˉ x n t h n - 1n1x¯nthn1

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.