আপনি কোনও অ-পরিসংখ্যানবিদকে কেন্দ্রীয় সীমাবদ্ধ উপপাদ্যের সৌন্দর্যটি কীভাবে প্রকাশ করবেন?


33

আমার বাবা একজন গণিত উত্সাহী, তবে পরিসংখ্যান নিয়ে খুব একটা আগ্রহী না। পরিসংখ্যানের কিছু বিস্ময়কর বিট চিত্রিত করার চেষ্টা করা ঝরঝরে হবে এবং সিএলটি একজন প্রধান প্রার্থী। আপনি কীভাবে গাণিতিক সৌন্দর্য এবং কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটির প্রভাব কোনও অ-পরিসংখ্যানবিদকে বোঝাতে চান?


এক দ্রুত চিন্তার 68-95-99.7 শাসন (আনা হয় en.wikipedia.org/wiki/68-95-99.7_rule একরকম আলোচনার মধ্যে)।
রায়গটিন

উত্তর:


16

সিএলটি-র সাথে আমি যা সবচেয়ে বেশি পছন্দ করতাম সেগুলি হ'ল এটি যখন প্রযোজ্য না হয় - এটি আমাকে একটি আশা দেয় যে গৌস বক্ররেখা বলেছিল যে জীবনটি আরও কিছুটা আকর্ষণীয়। সুতরাং তাকে কচী বিতরণ দেখান।


কাচি বিতরণ এবং সিএলটি বা সিএলটি-র বিলম্বের মধ্যে কী সম্পর্ক?
রবিন গিরার্ড


সিএলটি প্রয়োজন যে এমজিএফ এর অস্তিত্ব 0 এর একটি পাড়ায় রয়েছে The কচী বিতরণে সেই সম্পত্তি নেই। সিএলটি উইন কৌচি এমনকি সিএলটি-র একটি শক্তিশালী সংস্করণের দুর্বল প্রয়োজনীয়তাও পূরণ করে না যেখানে প্রয়োজনীয় সমস্ত কিছুই তার মানে এবং বৈচিত্র রয়েছে। কচী বিতরণ দেখায় যে সিএলটি ধরে রাখার জন্য গড়টি থাকা দরকার to এটি সিএলটি ব্যর্থ করে না।
বাল্টিমার্ক

@ বাল্টিমার্ক আপনি আমার পোস্টটি ভুল বুঝেছেন - এটি স্পষ্টতই যে সিএলটি অনুমানের কারণে ক্যাচি সিএলটি দ্বারা আচ্ছাদিত নয়, অন্যথায় সিএলটি প্রমাণ করা অসম্ভব হবে। আমি এই উদাহরণটি দিয়েছি কারণ লোকেরা বিশ্বাস করে যে সিএলটি সমস্ত বিতরণের জন্য কাজ করে; সম্ভবত "ব্যর্থ" একটি নিখুঁত শব্দ নয়, তবে তবুও আমি ভাবি না যে এটি ডাউনভোটের কারণ। ঠিক আছে, আমি এটি প্রযোজ্য নয় এমনকি পরিবর্তন করেছি।

আমি আপনার সম্পাদনা পছন্দ। কচির বিতরণ অবশ্যই খুব দুর্দান্ত।
বাল্টিমার্ক

14

সিএলটির সম্পূর্ণ প্রশংসা করার জন্য এটি দেখা উচিত।

সুতরাং চিত্রের জন্য বিন মেশিন এবং প্রচুর ইউটিউব ভিডিওর ধারণা ।


আমি ভেবেছিলাম এটি দ্বিপদী বিতরণ দেখায়; আমি মনে করি না যে এর অ্যাসিম্পটিকের সিএলটি-এর সাথে সরাসরি সংযোগ রয়েছে।

2
শিম মেশিন প্যাকেজ অ্যানিমেশন লেখকের ... yihui.name/en/wp-content/uploads/2010/07/...
রবিন Girard

1
@mbq কটাক্ষপাত করা en.wikipedia.org/wiki/...
রবিন Girard

@ আরবিন আমি এ সম্পর্কে লিখেছি, সমস্যা কী?

1
@ শ্রীভাতসার আর মুল বক্তব্যটি হ'ল একটি ভাল চিত্রের কোনও কিছুর "মূল" দেখানো উচিত এবং (আইএমও কমপক্ষে) সিএলটি-র "কোর" মিথ্যাচারে সত্য যে এটি বিভিন্ন অদ্ভুত বিতরণ থেকে গাওসিতে বহু পরিবর্তনশীলকে মেল্ট করে, এটি নয় দ্বিপদী বিতরণের মাত্র একটি সীমা।

7

প্রায়শই যখন গণিতবিদরা সম্ভাব্যতা সম্পর্কে কথা বলেন তারা জ্ঞাত সম্ভাব্যতা বিতরণ দিয়ে শুরু করেন তবে ঘটনার সম্ভাবনা সম্পর্কে কথা বলেন। কেন্দ্রীয় সীমাবদ্ধ উপপাদ্যের প্রকৃত মান হ'ল এটি আমাদের সত্যিকারের বিতরণটি জানি না এমন ক্ষেত্রে একটি প্রাক্কলন হিসাবে সাধারণ বন্টনটি ব্যবহার করতে দেয়। আপনি আপনার বাবাকে একটি স্ট্যান্ডার্ড পরিসংখ্যান প্রশ্ন জিজ্ঞাসা করতে পারেন (তবে গণিত হিসাবে শব্দযুক্ত) কী কী সম্ভাবনা আছে যে কোনও নমুনাটির অর্থ প্রদত্ত মানের চেয়ে বেশি হবে যদি ডেটা মিউ এবং এসডি সিগমা সহ কোনও বিতরণ থেকে আসে, তবে দেখুন কিনা তিনি একটি বিতরণ ধরে (যা আপনি তখন বলেন আমরা জানি না) বা বলে যে তার বিতরণটি জানতে হবে। তারপরে আপনি দেখাতে পারেন যে আমরা অনেক ক্ষেত্রে সিএলটি ব্যবহার করে উত্তরটি প্রায় অনুমান করতে পারি।

পরিসংখ্যানের সাথে গণিতের তুলনা করার জন্য, আমি সংহতকরণের গড় মানের উপপাদ্যটি ব্যবহার করতে চাই (যা বলে যে একটি থেকে বি থেকে বিস্তারের ক্ষেত্রে একই ক্ষেত্রের সাথে একটি থেকে বি পর্যন্ত একটি আয়তক্ষেত্র বিদ্যমান এবং আয়তক্ষেত্রের উচ্চতা দৈর্ঘ্যের গড়) বক্ররেখা)। গণিতবিদ এই উপপাদ্যটির দিকে তাকান এবং বলেছেন "শীতল, আমি গড় গড়ের জন্য একটি সংহতকরণ ব্যবহার করতে পারি", যখন পরিসংখ্যানবিদ একই উপপাদ্যটি দেখেন এবং বলেন "শীতল, আমি একটি ইন্টিগ্রাল গণনা করতে গড় ব্যবহার করতে পারি"।

আমার কার্যত আমার গড় গড় তত্ত্ব এবং সিএলটি (বয়েস উপপাদ্য সহ) এর অফিসে ক্রস সেলাই প্রাচীরের ঝুলন্ত রয়েছে।


হুম। আমি মনে করব যে বেশিরভাগ গণিতবিদগণ এমভিটি ব্যবহার করে একটি আয়তক্ষেত্র হিসাবে আনুমানিক আনুমানিক হিসাবে।
কার্ডিনাল

5

আমি একটি "ইন-ক্লাস" অনুশীলনের মাধ্যমে নমুনার প্রকরণ এবং মূলত কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি প্রদর্শন করতে চাই। ক্লাসের 100 জন শিক্ষার্থী প্রত্যেকে একটি কাগজের টুকরোতে তাদের বয়স লেখেন। আমি গড় গণনা করার পরে কাগজের সমস্ত টুকরা একই আকারের এবং একই ফ্যাশনে ভাঁজ হয়। এই জনসংখ্যা এবং আমি গড় বয়স গণনা করি। তারপরে প্রতিটি শিক্ষার্থী এলোমেলোভাবে 10 টুকরো কাগজ নির্বাচন করে, বয়সগুলি লিখে তাদের ব্যাগে ফেরত দেয়। (এস) তিনি গড় গণনা করেন এবং ব্যাগটি পাশের শিক্ষার্থীর কাছে পাস করেন। শেষ পর্যন্ত আমাদের কাছে জনসংখ্যার অনুমানের জন্য 10 জন শিক্ষার্থীর 100 টি নমুনা রয়েছে যার অর্থ আমরা হিস্টোগ্রাম এবং কিছু বর্ণনামূলক পরিসংখ্যানের মাধ্যমে বর্ণনা করতে পারি।

আমরা এবার 100 টি মতামতের একটি সেট ব্যবহার করে এই প্রদর্শনীর পুনরাবৃত্তি করলাম যা সাম্প্রতিক জরিপগুলি থেকে কিছু হ্যাঁ / কোনও প্রশ্নের প্রতিরূপ তৈরি করেছে উদাহরণস্বরূপ (ব্রিটিশ জেনারেল) নির্বাচন যদি আগামীকাল বলা হয়, আপনি কি ব্রিটিশ ন্যাশনাল পার্টিকে ভোট দেওয়ার কথা বিবেচনা করবেন? শিক্ষার্থীরা তাদের এই মতামতের 10 নমুনা দেয়।

শেষে আমরা ধারাবাহিক এবং বাইনারি উভয় ডেটা সহ নমুনা প্রবর্তন, কেন্দ্রীয় সীমাবদ্ধ তত্ত্ব ইত্যাদি প্রমানিত করেছি।


4

নিম্নলিখিত কোডটি নিয়ে চারপাশে খেলা, মানটির পরিবর্তিত হওয়া Mএবং ইউনিফর্ম বাদে অন্য বিতরণগুলি বেছে নেওয়া মজাদার উদাহরণ হতে পারে।

N <- 10000
M <- 5
meanvals <- replicate(N, expr = {mean(runif(M,min=0, max=1))}) 
hist(meanvals, breaks=50, prob=TRUE) 

2

আপনি যদি স্টাটা ব্যবহার করেন, আপনি -clt- কমান্ডটি ব্যবহার করতে পারেন যা নমুনা বিতরণের গ্রাফ তৈরি করে, দেখুন

http://www.ats.ucla.edu/stat/stata/ado/teach/clt.htm


দেখে মনে হচ্ছে এটি খুব সুন্দর হতে পারে তবে আমি এটি স্টাটা ১১.১ এ ইনস্টল করে চালানোর চেষ্টা করেছি (যেমন সর্বশেষতম সংস্করণ) এবং এটি আমাকে টাইপ করেও ডায়ালগের "সম্পন্ন" ক্লিক করার পরে একটি আর (3000) ত্রুটি প্রদান করে চলেছে - সংস্করণ 6: clt-।
onestop

2

আমার অভিজ্ঞতায় সিএলটি প্রদর্শিত হওয়ার চেয়ে কম দরকারী। প্রকল্পের মাঝামাঝি কেউ কখনই জানতে পারবেন না যে কাজের জন্য পর্যাপ্ত পরিমাণে আনুমানিক জন্য এন যথেষ্ট বড় কিনা। এবং পরিসংখ্যানগত পরীক্ষার জন্য, সিএলটি আপনাকে প্রথম ধরণের ত্রুটি রক্ষা করতে সহায়তা করে তবে দ্বিতীয় ধরণের ত্রুটিটি উপসাগরীয়ভাবে রাখার জন্য খুব কম কাজ করে। উদাহরণস্বরূপ, যখন ডেটা বিতরণ চূড়ান্ত হয় তখন টি-টেস্টে বৃহত এনগুলির জন্য নির্বিচারে কম শক্তি থাকতে পারে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.