কেন এটি প্রায়শই গাউসীয় বিতরণ অনুমান করা হয়?


14

নিষ্পাপ বয়েস শ্রেণিবদ্ধের জন্য প্যারামিটার অনুমানের বিষয়ে উইকিপিডিয়া নিবন্ধের উদ্ধৃতি দিয়ে : "একটি সাধারণ ধারণা হ'ল প্রতিটি শ্রেণীর সাথে সম্পর্কিত ধারাবাহিক মানগুলি গাউসীয় বিতরণ অনুসারে বিতরণ করা হয়।"

আমি বুঝতে পারি যে কোনও গাউসীয় বিতরণ বিশ্লেষণাত্মক কারণে সুবিধাজনক। যাইহোক, এই অনুমান করার জন্য অন্য কোন বাস্তব-বিশ্ব কারণ আছে? যদি জনসংখ্যা দুটি উপ-জনসংখ্যা নিয়ে গঠিত (স্মার্ট / বোবা মানুষ, বড় / ছোট আপেল)?


5
সম্ভবত কেন্দ্রীয় সীমাবদ্ধ তত্ত্বের কারণে, গৌসিয়ান বিতরণ অনেকের সাথে খাপ খায়, যদিও কোনওভাবেই না, শারীরিক ঘটনার পরিমাপ? উপ-জনসংখ্যার সাথে, কেউ মিশ্রিত গাউসীয় বিতরণ পেতে পারে ।
দিলীপ সরোতে

1
একই বিভাগটি (আমি ধরে নিচ্ছি যে আপনি নায়েভ বেয়েস নিবন্ধটি দেখছেন) উল্লেখ করেছেন যে বন্টন সম্ভবত আপনি যদি বিতরণটি জানেন না তবে এটি আরও ভাল ধারণা। কারও কারও কাছে সম্ভবত উইকিপিডিয়া নিবন্ধটি সম্পাদনা করা উচিত যাতে এটি আরও স্পষ্ট হয় যে সে গাউসিয়ান (যেমন, ডেটা প্লট করে, বা এটি সিএলটি-র সংযোজনীয় প্যাটার্ন অনুসরণ করে) তর্ক করতে পারে তবেই কেবল গাউসিয়ানকে ধরে নেওয়া উচিত।
rm999

উত্তর:


6

কমপক্ষে আমার জন্য, স্বাভাবিকতার অনুমান দুটি (খুব পাওয়ারফুল) কারণে উত্থিত হয়:

  1. কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য।

  2. গাউসীয় বিতরণটি সর্বাধিক এনট্রপি (শ্যাননের এন্ট্রপির ধারাবাহিক সংস্করণকে সম্মান করে) বিতরণ।

আমি মনে করি আপনি প্রথম পয়েন্টটি সম্পর্কে সচেতন: আপনার নমুনাটি যদি অনেকগুলি সংগ্রহের যোগফল হয় তবে কিছুটা হালকা শর্তটি সন্তুষ্ট হলে বিতরণটি বেশ গাউসিয়ান হয় (সিএলটির সাধারণীকরণ রয়েছে যেখানে আপনি বাস্তবে না ধরে নিতে হবে যে যোগফলের আরভিগুলি অভিন্নভাবে বিতরণ করা হয়েছে, দেখুন, যেমন লায়াপুনভ সিএলটি)।

দ্বিতীয় বিষয়টি হ'ল কিছু লোকের জন্য (বিশেষত পদার্থবিজ্ঞানীরা) আরও বোধগম্য: কোনও বিতরণের প্রথম এবং দ্বিতীয় মুহুর্তে, বিতরণ যা কম তথ্য ধরে নিচ্ছে (অর্থাত্ সবচেয়ে রক্ষণশীল) অবিচ্ছিন্ন শ্যাননের এন্ট্রপি পরিমাপের ক্ষেত্রে (যা এটি অবিচ্ছিন্ন ক্ষেত্রে কিছুটা নির্বিচারে, তবে আমার পক্ষে কমপক্ষে বিচ্ছিন্ন ক্ষেত্রে সম্পূর্ণ উদ্দেশ্য, তবে এটি অন্য গল্প) গাউসীয় বিতরণ। এটি তথাকথিত "সর্বাধিক এনট্রপি নীতি" এর একটি ফর্ম, যা এতটা বিস্তৃত নয় কারণ এনট্রপির ফর্মটির প্রকৃত ব্যবহার কিছুটা নির্বিচারে ( এই পরিমাপ সম্পর্কে আরও তথ্যের জন্য এই উইকিপিডিয়া নিবন্ধটি দেখুন )।

μΣ

পিডি: আমার অবশ্যই সর্বোচ্চ এনট্রপি নীতিটি যুক্ত করতে হবে যা এই কাগজ অনুসারে , আপনার ভেরিয়েবলের প্রকরণের পরিধিটি জানতে পারলে আপনাকে সর্বাধিক এনট্রপি নীতি অনুসারে বিতরণে সামঞ্জস্য করতে হবে।


3

আমার উত্তর প্রথম প্রতিক্রিয়াকারীর সাথে একমত। কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য আপনাকে বলেছে যে আপনার পরিসংখ্যান যদি যোগফল বা গড় হয় তবে এটি নির্দিষ্ট প্রযুক্তিগত পরিস্থিতিতে স্বতন্ত্র নমুনাগুলির বিতরণ নির্বিশেষে প্রায় স্বাভাবিক হবে। তবে আপনি ঠিক বলেছেন যে কখনও কখনও লোকেরা এটিকে খুব দূরে বহন করে কেবল এটি সাধারণ বলে মনে হয়। যদি আপনার পরিসংখ্যান একটি অনুপাত হয় এবং ডিনোমিনেটর শূন্য বা এর কাছাকাছি হতে পারে তবে অনুপাতটি স্বাভাবিকের জন্য খুব বেশি ভারী হয়ে যাবে। গোসেটে দেখা গেছে যে আপনি যখন কোনও সাধারণ বিতরণ থেকে নমুনা পান তখনও যখন সাধারণকরণের ধ্রুবক হিসাবে নমুনা স্ট্যান্ডার্ড বিচ্যুতি ব্যবহার করা হয় তখন বন্টন হ'ল এন -1 ডিগ্রি সহ স্বাধীনতা হয় যখন এন নমুনার আকার হয় size গুইনিস ব্রোয়ারিতে তার মাঠের পরীক্ষাগুলিতে তার কাছে নমুনা আকার রয়েছে যা 5-10 এর মধ্যে হতে পারে। এই ক্ষেত্রে টি বিতরণ স্ট্যান্ডার্ড স্বাভাবিক বিতরণের সাথে সমান যে এটি প্রায় 0 টির প্রতিসাম্যযুক্ত তবে এটিতে বেশ ভারী লেজ রয়েছে। নোট বড় হওয়ার সাথে সাথে টি ডিস্ট্রিবিউশনটি স্ট্যান্ডার্ড স্বাভাবিককে রূপান্তরিত করে। এটি দুটি জনসংখ্যার মিশ্রণ হওয়ায় অনেক ক্ষেত্রে আপনার বিতরণটি দ্বিপশু হতে পারে। কিছু সময় এই বিতরণগুলি সাধারণ বিতরণের মিশ্রণ হিসাবে উপযুক্ত হতে পারে। তবে তারা কিছু সাধারণ বিতরণের মতো দেখায় না। আপনি যদি একটি মৌলিক পরিসংখ্যান পাঠ্যপুস্তকটি দেখেন তবে আপনি অনেকগুলি প্যারাম্যাট্রিক ক্রমাগত এবং বিযুক্ত বিতরণ দেখতে পাবেন যা প্রায়শই অনুমানের সমস্যাগুলির মধ্যে আসে। বিচ্ছিন্ন উপাত্তের জন্য আমাদের কাছে দ্বি-দ্বি, পইসন, জ্যামিতিক, হাইপারজোমেট্রিক এবং নেতিবাচক দ্বিপদী রয়েছে name অবিচ্ছিন্ন উদাহরণগুলির মধ্যে চি স্কোয়ার, লগনরমাল, কচি, নেতিবাচক ঘনিষ্ঠ, ওয়েবুল এবং গুম্বেল অন্তর্ভুক্ত রয়েছে।


2

গাউসীয় বিতরণের ব্যবহারকে ন্যায়সঙ্গত করার জন্য সিএলটি ব্যবহার একটি সাধারণ ত্রুটিযুক্ত কারণ সিএলটি পৃথক পর্যবেক্ষণের জন্য নয়, নমুনার অর্থের জন্য প্রয়োগ করা হয়। অতএব, আপনার নমুনার আকার বাড়ানোর অর্থ এই নয় যে নমুনাটি নরমাল্যের কাছাকাছি।

গাউসীয় বিতরণ সাধারণত ব্যবহৃত হয় কারণ:

  1. সর্বাধিক সম্ভাবনার অনুমান সোজা।
  2. বায়েশিয়ান অনুমান সহজ (কনজুগেট প্রিয়ার বা জেফরি-টাইপ প্রিয়ার ব্যবহার করে) is
  3. এটি বেশিরভাগ সংখ্যাসূচক প্যাকেজগুলিতে প্রয়োগ করা হয়।
  4. অনুমানের পরীক্ষার বিচারে এই বিতরণ সম্পর্কে প্রচুর তত্ত্ব রয়েছে।
  5. অন্যান্য বিকল্প সম্পর্কে জ্ঞানের অভাব (আরও নমনীয়)। ...

অবশ্যই, সর্বোত্তম বিকল্পটি এমন একটি বিতরণ ব্যবহার করা যা আপনার প্রসঙ্গের বৈশিষ্ট্যগুলিকে বিবেচনা করে তবে এটি চ্যালেঞ্জিং হতে পারে। যাইহোক, এমন কিছু যা মানুষের করা উচিত

"সবকিছু যতটা সম্ভব সহজ করা উচিত, তবে সহজ নয়।" (আলবার্ট আইনস্টাইন)

আশা করি এটা কাজে লাগবে.

শুভ কামনা.


ডাউনটা কেন? এই ব্যাখ্যা জন্য কি পাল্টা?
lmsasu

4
"গাউসীয় বিতরণের ব্যবহারকে ন্যায়সঙ্গত করার জন্য সিএলটি-র ব্যবহার একটি সাধারণ ত্রুটিযুক্ত কারণ সিএলটি নমুনার সাথে প্রয়োগ করা হয়" এটি নিজেই একটি ভ্রান্তি। উদাহরণস্বরূপ, কন্ডাক্টরের ইলেক্ট্রনগুলি এলোমেলোভাবে চলছে moving ছোট নেট প্রতিটি ইলেক্ট্রন অবদান চার্জ গোলমাল ভোল্টেজ (তাপ গোলমাল বলা হয়) যে কন্ডাকটর টার্মিনাল জুড়ে পরিমাপ করা যায়। প্রতিটি অবদান ছোট, অনেকগুলি ইলেক্ট্রন রয়েছে এবং তাই সিএলটি এর মাধ্যমে শব্দটি গাউসিয়ান এলোমেলো প্রক্রিয়া হিসাবে মডেল করা হয়। এই মডেলটি অসংখ্য পরীক্ষামূলক গবেষণায় ক্রস-বৈধ হয়েছে।
দিলীপ সরোতে

1
এই প্রথম অনুচ্ছেদটি বিভ্রান্তিকর এবং অফ-টপিক বলে মনে হচ্ছে। সিএলটি প্রয়োগ করার সময় আমরা প্রায়শই বলছি যে একটি বিতরণ গাউসিয়ান কারণ প্রতিটি স্বতন্ত্র পর্যবেক্ষণ হ'ল অনেক প্রক্রিয়ার যোগফল / গড়। যদি প্রথম অনুচ্ছেদটি সরানো হয় তবে আমার মনে হয় এটি ভাল উত্তর হবে।
rm999

1
@ rm999 "যদি প্রথম অনুচ্ছেদটি অপসারণ করা হয় তবে আমি মনে করি এটি একটি ভাল উত্তর হবে"। প্রকৃতপক্ষে, প্রথম অনুচ্ছেদে হ'ল উত্তরের জটিলতা, যেহেতু বাকী কেবল গাউসীয় মডেল কীভাবে বিশ্লেষণাত্মকভাবে সহায়তা করে - যা ওপি ইতিমধ্যে বোঝে - এবং জিজ্ঞাসিত প্রশ্নের প্রতিক্রিয়াশীল নয়।
দিলীপ সরোতে

1
@ দিলিপ: (+1) খুব ভাল উত্তরের কার্নেলটি আপনার প্রথম মন্তব্যে উপস্থিত রয়েছে। এটি আলাদা পোস্টে প্রসারিত বিবেচনা করুন।
কার্ডিনাল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.