সাধারণত তথ্য বিতরণের কারণ


19

এমন কিছু উপপাদ কী কী যা ব্যাখ্যা করতে পারে (অর্থাত্ জেনারেটালি) কেন বাস্তব-বিশ্বের ডেটাগুলি সাধারণত বিতরণের আশা করা যেতে পারে?

আমি জানি যে দুটি আছে:

  1. কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য (অবশ্যই), যা আমাদেরকে জানিয়েছে যে গড় এবং বৈচিত্রের সাথে বিভিন্ন স্বতন্ত্র এলোমেলো ভেরিয়েবলগুলির যোগফল (এমনকি যখন তারা স্বতন্ত্রভাবে বিতরণ করা হয় না) সাধারণত বিতরণের দিকে ঝোঁক

  2. এক্স এবং ওয়াই স্বতন্ত্র ধারাবাহিক আরভি এর পৃথক ঘনত্বের সাথে থাকতে দিন যাতে তাদের যৌথ ঘনত্ব কেবল + y 2 এর উপর নির্ভর করে । তাহলে এক্স এবং ওয়াই স্বাভাবিক।এক্স2Y2

( গণিত -পরিবর্তন থেকে ক্রস পোস্ট )

সম্পাদনা: পরিষ্কার করার জন্য, আমি সাধারণত বাস্তব বিশ্বের ডেটা কতটা বিতরণ করা হয় সে সম্পর্কে কোনও দাবি করছি না। আমি কেবল তাত্ত্বিক সম্পর্কে জিজ্ঞাসা করছি যা কোন ধরণের প্রক্রিয়াগুলি সাধারণত বিতরণ করা ডেটার দিকে নিয়ে যেতে পারে তার অন্তর্দৃষ্টি দিতে পারে।


7
আপনি আমাদের থ্রেডে আকর্ষণীয় সম্পর্কিত উপাদান খুঁজে পেতে পারেন stats.stackexchange.com/questions/4364 এ । কিছু পাঠকের মধ্যে সম্ভাব্য বিভ্রান্তি এড়াতে, আমি যুক্ত করতে চাই (এবং আমি আশা করি এটিই ছিল আপনার উদ্দেশ্য) যে আপনার প্রশ্নটি এমনটি পড়া হিসাবে পড়া উচিত নয় যে সমস্ত বা এমনকি সত্যিকারের ডেটাসেটগুলি একটি সাধারণ বিতরণ দ্বারা পর্যাপ্ত পরিমাণে সন্নিবিষ্ট করা যায়। বরং, নির্দিষ্ট কিছু ক্ষেত্রে যখন নির্দিষ্ট শর্ত থাকে, তখন ডেটা বোঝার বা ব্যাখ্যা করার জন্য রেফারেন্সের ফ্রেম হিসাবে একটি সাধারণ বিতরণকে কাজে লাগানো কার্যকর হতে পারে: তাহলে এই শর্তগুলি কী হতে পারে?
whuber

লিঙ্ক করার জন্য আপনাকে ধন্যবাদ! এবং এটি ঠিক সঠিক, স্পষ্টতার জন্য আপনাকে ধন্যবাদ। আমি এটি মূল পোস্টে সম্পাদনা করব।
বেনামে

@ ব্যবহারকারী 43228, "সত্যিকার অর্থেই এমন অনেকগুলি বিতরণ রয়েছে যা বাস্তব জগতের সমস্যার মধ্যে দেখা দেয় যা একেবারেই স্বাভাবিক মনে হয় না। " জিজ্ঞাসাথ্যাথিয়েটিশিয়ান
2010/

উত্তর:


17

বিচ্ছিন্ন আরভিগুলির অনেকগুলি সীমিত বিতরণ (পিয়সন, দ্বিপদী ইত্যাদি) প্রায় স্বাভাবিক। প্লিংকো ভাবুন। প্রায় সমস্ত ক্ষেত্রে যখন আনুমানিক স্বাভাবিকতা থাকে, স্বাভাবিকতা কেবলমাত্র বড় আকারের নমুনাগুলির জন্য কিক করে।

বেশিরভাগ রিয়েল-ওয়ার্ল্ড ডেটা সাধারণত বিতরণ করা হয় না। মাইসেসির (1989) দ্বারা প্রকাশিত একটি গবেষণাপত্র " ইউনিকর্ন, সাধারণ বক্ররেখা এবং অন্যান্য অসম্ভব প্রাণী " নামে 440 বৃহত আকারের কৃতিত্ব এবং সাইকোমেট্রিক ব্যবস্থা পরীক্ষা করে। তিনি তাদের মুহুর্তগুলিকে বিতরণে প্রচুর পরিবর্তনশীলতা পেয়েছিলেন এবং স্বাভাবিকতার পক্ষে খুব বেশি প্রমাণও পাননি।

স্টিভেন স্টিগলার ১৯ 1977 সালে " ডু রোস্ট এস্টিমেটরস উইথ রিয়েল ডেটা " নামে একটি গবেষণাপত্রে তিনি 18 তম শতাব্দীর বিখ্যাত ইতিহাস থেকে সংগৃহীত 24 ডেটা সেট ব্যবহার করেছিলেন যা পৃথিবী থেকে সূর্যের দূরত্ব পরিমাপ করার চেষ্টা করেছিল এবং 19 শতকের আলোর গতি মাপার চেষ্টা করেছিল। তিনি টেবিল ৩-তে নমুনা স্কিউনেস এবং কুর্তোসিসের প্রতিবেদন করেছেন heavy তথ্যগুলি ভারী-লেজযুক্ত।

পরিসংখ্যানগুলিতে আমরা প্রায়শই স্বাভাবিকতা ধরে নিই কারণ এটি সর্বাধিক সম্ভাবনা (বা অন্য কোনও পদ্ধতি) সুবিধাজনক করে তোলে। উপরোক্ত দুটি কাগজপত্র যা দেখায় তা হ'ল ধারণাটি প্রায়শই কঠোর হয়। এই কারণেই দৃust়তা অধ্যয়ন দরকারী।


2
এই পোস্টটির বেশিরভাগই দুর্দান্ত, তবে প্রবর্তক অনুচ্ছেদটি আমাকে বিরক্ত করে কারণ এটি এত সহজেই ভুল ব্যাখ্যা করা যায়। এটি বলে মনে হচ্ছে - বরং স্পষ্টভাবে - যে সাধারণভাবে একটি "বড় নমুনা" সাধারণত বিতরণ করা হবে। আপনার পরবর্তী মন্তব্যগুলির আলোকে আমি বিশ্বাস করি না যে আপনি সত্যই এটি বলেছিলেন।
হোবার

আমার আরও পরিষ্কার হওয়া উচিত ছিল - আমি প্রস্তাব দিচ্ছি না যে বেশিরভাগ আসল ওয়ার্ল্ড ডেটা সাধারণত বিতরণ করা হয়। কিন্তু যে উত্থাপন একটি দুর্দান্ত পয়েন্ট। এবং আমি ধরে নিচ্ছি আপনি কী বোঝাতে চেয়েছেন তা হ'ল বৃহত্তর এন দিয়ে দ্বি-দ্বি বিতরণ স্বাভাবিক, এবং বৃহত্তর মধ্য দিয়ে পোয়েসন বিতরণ করা স্বাভাবিক। অন্যান্য কি বিতরণ স্বাভাবিকতার দিকে ঝোঁক?
বেনামে

ধন্যবাদ, আমি প্রথম অনুচ্ছেদ সম্পাদনা করেছি। অনুমানের অধীনে রৈখিক রূপগুলিতে একটি উপপাদ্যের জন্য ওয়াল্ড এবং ওল্ফউইটজ (1944) দেখুন। উদাহরণস্বরূপ, তারা অনুমানের অধীনে দুটি নমুনা t পরিসংখ্যানকে অসম্পূর্ণভাবে স্বাভাবিক বলে দেখিয়েছে।
বিএসবিকে

একটি নমুনা বিতরণ "রিয়েল ওয়ার্ল্ড ডেটাসেট" নয়! আপনার পোস্টে আপাত অসঙ্গতিগুলির সাথে আমার যে অসুবিধা হচ্ছে তা সম্ভবত বিতরণ এবং ডেটার মধ্যে এই বিভ্রান্তি থেকে উদ্ভূত। সম্ভবত এটি আপনার মনে কী "সীমাবদ্ধ" প্রক্রিয়া রয়েছে তা সম্পর্কে স্পষ্টতার অভাব থেকে উদ্ভূত।
হোবার

3
মূল প্রশ্নটি ছিল "জেনারেটালি" ব্যাখ্যা করার বিষয়ে যা সাধারণ বাস্তব-বিশ্বের তথ্য কীভাবে আসতে পারে। এটা অনুমেয় যে সত্য দ্বি দ্বিপদী বা পোয়েসন প্রক্রিয়া থেকে উত্পন্ন হতে পারে, উভয়ই সাধারণ বিতরণের মাধ্যমে প্রায় অনুমান করা যায়। অপ্টটি অন্যান্য উদাহরণগুলির জন্য জিজ্ঞাসা করেছিল এবং যেটি মনে পড়েছিল তা হ'ল ফলশ্রুতি বিতরণ, যা অ্যাসিপোটোটিকভাবে স্বাভাবিক (বন্ধনের অভাবে)। আমি অফ-হ্যান্ডের কোনও উপায় ভাবতে পারি না যে বিতরণ থেকে আসল ডেটা উত্পন্ন হবে যাতে সম্ভবত এটি একটি প্রসারিত।
বিএসবিকে

10

সাধারণ বিতরণ ব্যবহারের জন্য একটি তথ্য তাত্ত্বিক সমর্থনযোগ্যতাও রয়েছে। গড় এবং বৈচিত্র্য দেওয়া, সাধারণ বিতরণে সমস্ত আসল-মূল্যবান সম্ভাব্যতা বিতরণের মধ্যে সর্বাধিক এনট্রপি থাকে। এই সম্পত্তি নিয়ে আলোচনা করার প্রচুর উত্স রয়েছে। একটি সংক্ষিপ্ত একটি এখানে পাওয়া যাবে । এখন পর্যন্ত উল্লিখিত বেশিরভাগ যুক্তি জড়িত গাউসীয় বিতরণ ব্যবহারের জন্য প্রেরণার আরও সাধারণ আলোচনা সিগন্যাল প্রসেসিং ম্যাগাজিনের এই নিবন্ধে পাওয়া যাবে ।


6
এটি পিছনের দিকে, যেমনটি আমি এটি বুঝতে পারি। এটি কীভাবে স্বাভাবিকতার অনুমানকে কঠোর সংজ্ঞায়িত অর্থে একটি দুর্বল অনুমান করা যায়। বাস্তব-বিশ্বের ডেটা সম্পর্কে যা বোঝায় তা আমি দেখতে পাচ্ছি না। আপনি পাশাপাশি তর্ক করতে পারেন যে বক্ররেখা সাধারণত সরল কারণ আপনি বক্রতা সম্পর্কে তৈরি করতে পারেন এটি সবচেয়ে সহজ ধারণা। জ্ঞানবিজ্ঞান অনটোলজিকে সীমাবদ্ধ করে না! আপনার উল্লেখ করা রেফারেন্স যদি এর বাইরে চলে যায় তবে দয়া করে যুক্তিগুলি বানান করুন।
নিক কক্স

3

পদার্থবিজ্ঞানে এটি সিএলটি যা সাধারণত অনেক পরিমাপে সাধারণত বিতরণ ত্রুটির কারণ হিসাবে উদ্ধৃত হয়।

পরীক্ষামূলক পদার্থবিজ্ঞানে সবচেয়ে সাধারণ দুটি ত্রুটি বিতরণ হ'ল স্বাভাবিক এবং পোইসন। উত্তরোত্তর সাধারণত তেজস্ক্রিয় ক্ষয় হিসাবে গণনা পরিমাপ, সম্মুখীন হয়।

এই দুটি বিতরণের আর একটি আকর্ষণীয় বৈশিষ্ট্য হ'ল গউসিয়ান এবং পোইসন থেকে র্যান্ডম ভেরিয়েবলগুলির যোগফল গউসিয়ান এবং পোইসনের অন্তর্ভুক্ত।

সেখানে যেমন পরীক্ষামূলক বিজ্ঞানে পরিসংখ্যান বেশ কয়েকটি বই এই গেরহার্ড Bohm, গুন্টার Zech, ভূমিকা পরিসংখ্যান এবং পদার্থবিদরা এর ডেটা বিশ্লেষণ, আইএসবিএন 978-3-935702-41-6: এক


0

জনসংখ্যার মতো জিনিসগুলি সম্পর্কে অনুলিপিগুলি তৈরি করার সময় সিএলটি অত্যন্ত কার্যকর কারণ আমরা পৃথক পরিমাপের একগুচ্ছের একরকম রৈখিক সংমিশ্রণ গণনা করে সেখানে পৌঁছেছি। যাইহোক, আমরা যখন পৃথক পর্যবেক্ষণগুলি, বিশেষত ভবিষ্যতের বিষয়গুলি ( উদাহরণস্বরূপ , ভবিষ্যদ্বাণী ব্যবস্থাগুলি) সম্পর্কে অনুলিপিগুলি তৈরি করার চেষ্টা করি, তখন আমরা বিতরণের লেজগুলিতে আগ্রহী হলে স্বাভাবিকতা থেকে বিচ্যুতি আরও বেশি গুরুত্বপূর্ণ। উদাহরণস্বরূপ, যদি আমাদের 50 টি পর্যবেক্ষণ থাকে, আমরা যখন ভবিষ্যতের পর্যবেক্ষণের গড় থেকে কমপক্ষে 3 টি স্ট্যান্ডার্ড বিচ্যুতির সম্ভাবনা সম্পর্কে কিছু বলি তখন আমরা একটি খুব বড় এক্সট্রাপোলেশন (এবং বিশ্বাসের লাফিয়ে) তৈরি করি।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.