বিজ্ঞানীরা কীভাবে সাধারণ বিতরণের সম্ভাব্যতা ঘনত্বের কার্যকারিতাটি আবিষ্কার করলেন?


36

এটি সম্ভবত একটি অপেশাদার প্রশ্ন, তবে আমি আগ্রহী যে বিজ্ঞানীরা কীভাবে সাধারণ বিতরণ সম্ভাবনার ঘনত্বের ফাংশনটির আকার নিয়ে এসেছিলেন? মূলত আমার বাগগুলি কী কারও পক্ষে এটি সম্ভবত আরও স্বজ্ঞাত হবে যে সাধারণত বিতরণ করা ডেটার সম্ভাব্যতা ফাংশনটি বেল বাঁকানোর চেয়ে আইসোসিল ত্রিভুজের আকার ধারণ করে এবং আপনি কীভাবে এমন ব্যক্তির কাছে প্রমাণ করবেন যে সম্ভাবনার ঘনত্বের কার্যটি সমস্ত সাধারণত বিতরণ করা ডেটার একটি ঘন্টার আকৃতি থাকে? পরীক্ষায়? বা কিছু গাণিতিক উত্স দ্বারা?

সর্বোপরি আমরা সাধারণত বিতরণ করা ডেটা কী বিবেচনা করি? কোনও সাধারণ বিতরণের সম্ভাব্যতার ধরণটি অনুসরণ করে এমন ডেটা বা অন্য কিছু?

মূলত আমার প্রশ্ন হ'ল কেন সাধারণ বিতরণ সম্ভাবনা ঘনত্ব ফাংশনটির ঘণ্টা আকৃতি থাকে এবং অন্য কোনওটি নয়? এবং বিজ্ঞানীরা কীভাবে আবিষ্কার করলেন যে কোন বাস্তব জীবনের পরিস্থিতিগুলির উপর সাধারণ বিতরণ প্রয়োগ করা যেতে পারে, পরীক্ষার মাধ্যমে বা নিজেই বিভিন্ন ডেটার প্রকৃতি অধ্যয়ন করে?


সুতরাং আমি এই লিঙ্কটি সাধারণ বিতরণ কার্ভের কার্যকরী ফর্মের ডাইরাইভেশন ব্যাখ্যা করার জন্য সত্যই সহায়ক হিসাবে খুঁজে পেয়েছি এবং এইভাবে "সাধারণ বন্টন এটির মতো দেখায় কেন অন্য কিছু দেখায় না?" প্রশ্নের উত্তর দিয়েছিল। সত্যিকারের মন খারাপের যুক্তি, অন্তত আমার জন্য least


2
পরীক্ষা করে দেখুন এই প্রশ্নের - এটা দাবি যে শুধুমাত্র সাধারন বন্টনের "বেল আকৃতির" হয় সত্য নয়।
সিলভারফিশ

11
সাধারণ বিতরণে কিছু জরুরী গুরুত্বপূর্ণ পরিসংখ্যানগত বৈশিষ্ট্য রয়েছে যা এটিকে অধ্যয়নের একটি বিশেষ বিষয় হিসাবে তৈরি করে এবং এর অর্থ এটি প্রায়শই "প্রাকৃতিকভাবে" উত্থিত হয়, যেমন অন্যান্য বিতরণের সীমিত ক্ষেত্রে। বিশেষত কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি দেখুন । যাইহোক, এটি কেবলমাত্র বিতরণ নয় যা মাঝখানে শীর্ষে এবং এর উভয় পাশে লেজ রয়েছে। লোকেরা প্রায়শই ধরে নেয় যে এই জাতীয় ডেটা স্বাভাবিক কারণ হিস্টোগ্রামটি "ঘন্টার আকৃতির দেখায়", তবে আমার লিঙ্কিত উত্তরটি দেখায় যে এই জাতীয় ডেটার সেটের জন্য আরও অনেক প্রার্থী বিতরণ কীভাবে রয়েছে।
সিলভারফিশ

4
নোট করুন যে পরিসংখ্যানবিদরা অনেকগুলি ডেটাসেট দেখে সাধারণ বিতরণ আবিষ্কার করতে পারেন নি এবং এই ঘনত্বের ফাংশনটি অনুধাবন করে তাদের মধ্যে বেশিরভাগের পক্ষে উপযুক্ত ছিল। আপনার প্রশ্নটিতে আপনি যেমন অবাক হন, সম্ভাবনা তত্ত্বের কিছু সমস্যার গাণিতিক তদন্তের একটি প্রক্রিয়া ছিল, যার উত্তর হিসাবে উত্তর বিতরণটি "পপ আউট" হয়। উদাহরণস্বরূপ এই উত্তরটি এখানে ভালভাবে ব্যাখ্যা করা হয়েছে
সিলভারফিশ

3
এবং মূলত যদি কেউ আমাকে তাদের কাছে সাধারণ বিতরণ কেন "স্বাভাবিক" তা বোঝাতে বলেছিলেন, আমি তাদেরকে সাধারণ বন্টনের ইতিহাস ব্যাখ্যা করতে হবে যা দ্বি-দ্বি বিতরণ থেকে শুরু করে নিজেই দীর্ঘ এবং জটিল, এবং তারপরে সম্ভবত কেন্দ্রীয় সীমাবদ্ধতা উপপাদ্য প্রমাণ করুন এবং দেখান যে বাস্তব বন্টন বাস্তব জীবনে অনেক পরিস্থিতিতে অধ্যয়ন করার জন্য প্রযোজ্য।
ahra

5
গালটন বোর্ড নামে পরিচিত এই নিফটি ডিভাইসগুলির একটির মাধ্যমে আপনি একটি সাধারণ বিতরণের আকারটি কল্পনা করতে পারেন । আসলে এটি দ্বিপদী বিতরণ, তবে আপনি জানেন, কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য।
ফেডেরিকো পোলোনি

উত্তর:


21

সল স্টাএল দ্বারা " সাধারণ বিতরণের বিবর্তন " আপনার পোস্টের সমস্ত প্রশ্নের উত্তর দেওয়ার জন্য তথ্যের উত্স source আমি কেবল আপনার সুবিধার্থে কয়েকটি পয়েন্ট আবৃত্তি করব কারণ আপনি কাগজের অভ্যন্তরে বিস্তারিত আলোচনা পাবেন।

এটি সম্ভবত একটি অপেশাদার প্রশ্ন

না, এটি যে কারও কাছে পরিসংখ্যান ব্যবহার করে তাদের কাছে একটি আকর্ষণীয় প্রশ্ন, কারণ এটি স্ট্যান্ডার্ড কোর্সে কোথাও বিশদে আবৃত নয়।

মূলত আমার বাগগুলি কী কারও পক্ষে এটি সম্ভবত আরও স্বজ্ঞাত হবে যে সাধারণত বিতরণ করা ডেটার সম্ভাব্যতা ফাংশনটি বেল বাঁকানোর চেয়ে আইসোসিল ত্রিভুজের আকার ধারণ করে এবং আপনি কীভাবে এমন ব্যক্তির কাছে প্রমাণ করবেন যে সম্ভাবনার ঘনত্বের কার্যটি সমস্ত বিতরণ করা ডেটার একটি ঘন্টার আকৃতি আছে?

কাগজ থেকে এই ছবি দেখুন। এটি পরীক্ষামূলক ডেটা বিশ্লেষণ করতে গাউসিয়ান (সাধারণ) আবিষ্কার করার আগে সিম্পসন যে ত্রুটিযুক্ত রেখাচিত্রগুলি নিয়ে এসেছিল তা দেখায়। সুতরাং, আপনার অন্তর্দৃষ্টি স্পট হয়

এখানে চিত্র বর্ণনা লিখুন

পরীক্ষায়?

হ্যাঁ, এ কারণেই তাদের "ত্রুটিযুক্ত কার্ভ" বলা হয়েছিল। পরীক্ষাটি ছিল জ্যোতির্বিদ্যার পরিমাপ। জ্যোতির্বিজ্ঞানীরা বহু শতাব্দী ধরে পরিমাপের ত্রুটির সাথে লড়াই করেছিলেন।

অথবা কিছু গাণিতিক উত্স দ্বারা?

আবার, হ্যাঁ! দীর্ঘ গল্প সংক্ষিপ্ত: জ্যোতির্বিদ্যা সংক্রান্ত তথ্যের ত্রুটির বিশ্লেষণ গাউসকে তার (ওরফে নরমাল) বিতরণে নিয়ে যায়। এই অনুমানগুলি তিনি ব্যবহার করেছেন:

এখানে চিত্র বর্ণনা লিখুন

যাইহোক, ল্যাপ্লেস কয়েকটি পৃথক পদ্ধতি ব্যবহার করেছিলেন এবং জ্যোতির্বিদ্যার তথ্য নিয়ে কাজ করার সময় তার বিতরণও নিয়ে এসেছিলেন:

এখানে চিত্র বর্ণনা লিখুন

কেন পরিমাপের ত্রুটি হিসাবে পরীক্ষায় সাধারণ বিতরণ প্রদর্শিত হয়, এখানে একটি সাধারণ "হ্যান্ড-ওয়েভি" ব্যাখ্যা পদার্থবিজ্ঞানী ব্যবহার করতে ব্যবহৃত হয় (জেরহার্ড বোহম, গন্টার জেইচের একটি পরিসংখ্যান , পদার্থবিজ্ঞানীদের পরিসংখ্যান এবং ডেটা অ্যানালাইসিসের সূচনা পৃষ্ঠা 85):

অনেক পরীক্ষামূলক সিগন্যাল একটি খুব সাধারণ আনুষাঙ্গিক একটি সাধারণ বিতরণ অনুসরণ করে। এটি বহু অবদানের যোগফল এবং কেন্দ্রীয় সীমাবদ্ধতা উপপাদ্যের একটি পরিণতিতে গঠিত এই কারণে এটি ঘটে।


2
স্টাহল রেফারেন্স মূল প্রশ্নটি মূল কোণটিকে যে কোণ থেকে উত্থাপিত হয়েছিল তা থেকে খুব সম্বোধন করে - এটি সত্যিই দুর্দান্ত একটি সন্ধান।
সিলভার ফিশ

44

আপনি আপনার প্রশ্নে ধরে নিয়েছেন বলে মনে হচ্ছে যে বিতরণ শনাক্তকরণের আগেই সাধারণ বিতরণের ধারণাটি প্রায় ছিল এবং লোকেরা এটি কী তা নির্ধারণের চেষ্টা করেছিল। এটি কীভাবে কাজ করবে তা আমার কাছে পরিষ্কার নয়। [সম্পাদনা করুন: কমপক্ষে একটি ধারণা রয়েছে যা আমরা সেখানে "বন্টনের সন্ধান" বলে বিবেচনা করতে পারি তবে এটি "প্রচুর পরিমাণে এবং প্রচুর ঘটনাকে বর্ণনা করে এমন বিতরণের অনুসন্ধান নয়"]

এই ক্ষেত্রে না হয়; বিতরণটিকে সাধারণ বিতরণ বলা হওয়ার আগে জানা ছিল।

আপনি কীভাবে এই জাতীয় ব্যক্তিকে প্রমাণ করবেন যে সমস্ত বিতরণ করা ডেটার সম্ভাব্যতা ঘনত্ব ফাংশনটির একটি ঘণ্টা থাকে

সাধারণ বিতরণ ফাংশনটি এমন জিনিস যা সাধারণত একটি "বেল শেপ" বলা হয় - সমস্ত সাধারণ বিতরণের একই "আকৃতি" থাকে (এই অর্থে যে তারা কেবল স্কেল এবং অবস্থানের মধ্যে পৃথক)।

ডেটা বিতরণে কমবেশি "বেল-আকৃতির" দেখতে পারে তবে এটি এটিকে স্বাভাবিক করে না। প্রচুর অ-সাধারণ বিতরণগুলি একইভাবে "বেল-আকৃতির" দেখায়।

প্রকৃত জনসংখ্যার বিতরণগুলি যেগুলি থেকে ডেটা আঁকা হয় সম্ভবত কখনও কখনও স্বাভাবিক হয় না যদিও এটি কখনও কখনও যুক্তিসঙ্গত প্রায় হয়।

বাস্তব বিশ্বের জিনিসগুলিতে আমরা প্রায় সমস্ত বিতরণের ক্ষেত্রে এটি সাধারণতভাবে সত্য - এগুলি মডেল , বিশ্ব সম্পর্কে তথ্য নয়। [উদাহরণস্বরূপ, আমরা যদি কিছু অনুমান করি (তবে পইসন প্রক্রিয়াধীন), আমরা পোইসন বিতরণ পেতে পারি - যা বহুল ব্যবহৃত বিতরণ। কিন্তু এই অনুমানগুলি কি আসলেই সন্তুষ্ট? সাধারণত আমরা বলতে পারি সবচেয়ে ভাল (সঠিক পরিস্থিতিতে) যে তারা খুব প্রায় সত্য।]

আমরা সাধারণত বিতরণ করা ডেটা কী বিবেচনা করি? কোনও সাধারণ বিতরণের সম্ভাব্যতার ধরণটি অনুসরণ করে এমন ডেটা বা অন্য কিছু?

হ্যাঁ, প্রকৃতপক্ষে সাধারণত বিতরণ করার জন্য, যে জনসংখ্যার নমুনাটি আঁকা হয়েছিল তার একটি বন্টন থাকতে হবে যা সাধারণ বন্টনের সঠিক কার্যকরী রূপ রয়েছে। ফলস্বরূপ, কোনও সীমাবদ্ধ জনসংখ্যা স্বাভাবিক হতে পারে না। পরিবর্তনশীল যেগুলি আবশ্যকভাবে আবদ্ধ হয় সেগুলি স্বাভাবিক হতে পারে না (উদাহরণস্বরূপ, নির্দিষ্ট কাজের জন্য সময় নেওয়া, নির্দিষ্ট জিনিসের দৈর্ঘ্য .ণাত্মক হতে পারে না, তাই এগুলি আসলে সাধারণত বিতরণ করা যায় না)।

এটি সম্ভবত আরও স্বজ্ঞাত হবে যে সাধারণত বিতরণ করা ডেটার সম্ভাব্যতা ফাংশনটি একটি আইসোসিল ত্রিভুজের আকার ধারণ করে

আমি কেন দেখছি না এটি অগত্যা আরও স্বজ্ঞাত। এটি অবশ্যই সহজ।

ত্রুটি বিতরণের জন্য প্রথম যখন মডেলগুলি বিকাশ করা হয়েছিল (বিশেষত প্রথম দিকে জ্যোতির্বিদ্যার জন্য), তখন গণিতবিদরা ত্রুটি বিতরণের ক্ষেত্রে বিভিন্ন আকারকে বিবেচনা করেছিলেন (এক প্রথম দিকে ত্রিভুজাকার বিতরণ সহ) তবে এই কাজের বেশিরভাগ ক্ষেত্রে এটি গণিতের (বরং পরিবর্তে) ছিল অন্তর্দৃষ্টি চেয়ে) ব্যবহৃত হয়েছিল। ল্যাপ্লেস উদাহরণস্বরূপ, ডাবল সূচকীয় এবং সাধারণ বিতরণের দিকে নজর রেখেছিল (উদাহরণস্বরূপ) একইভাবে গৌস একই সময়ে প্রায়শই এটি আবিষ্কার করতে গণিত ব্যবহার করেছিলেন, তবে ল্যাপলেসের চেয়ে ভিন্ন ভিন্ন বিবেচনার ক্ষেত্রে।

ল্যাপ্লেস এবং গাউস যে সংকীর্ণ অর্থে "ত্রুটির বিতরণ" হিসাবে বিবেচনা করছিলেন, আমরা সেখানে "বিতরণের অনুসন্ধান" হিসাবে বিবেচনা করতে পারি, কমপক্ষে কিছু সময়ের জন্য। উভয়ই ত্রুটিগুলি বিতরণের জন্য কিছু সম্পত্তি চিহ্নিত করেছিলেন যেগুলি তারা গুরুত্বপূর্ণ বলে বিবেচিত হয়েছিল (ল্যাপ্লেস সময়ের সাথে কিছুটা আলাদা মানদণ্ডের অনুক্রম হিসাবে বিবেচিত) বিভিন্ন বিতরণের দিকে পরিচালিত করে।

মূলত আমার প্রশ্ন হ'ল কেন সাধারণ বিতরণ সম্ভাবনা ঘনত্ব ফাংশনটির ঘণ্টা আকৃতি থাকে এবং অন্য কোনওটি নয়?

যে জিনিসটির সাধারণ ঘনত্ব ফাংশন বলা হয় তার ক্রিয়াকলাপটি এটিকে সেই আকার দেয়। সাধারণ স্ট্যান্ডার্ডটি বিবেচনা করুন (সরলতার জন্য; প্রতিটি অন্যান্য স্বাভাবিকের একই আকার রয়েছে, কেবলমাত্র স্কেল এবং অবস্থানের ক্ষেত্রে পৃথক):

জেড(z- র)=-12z- র2;-<z- র<

এক্স

কিছু লোকেরা সাধারণ বিতরণকে কোনওরকম "স্বাভাবিক" হিসাবে বিবেচনা করেছেন যদিও এটি সত্যিকার অর্থে নির্দিষ্ট পরিস্থিতিতে রয়েছে যা আপনি এটিকে প্রায় অনুমান হিসাবে দেখতেও চান।


ডিস্ট্রিবিউশনের আবিষ্কারটি সাধারণত ডি মাইভ্রেকে (দ্বিপদী হিসাবে একটি আনুমানিক হিসাবে) জমা দেওয়া হয়। আনুমানিক দ্বিপদী সহগ (/ দ্বিপদী সম্ভাবনা) আনুমানিক অন্যথায় ক্লান্তিকর গণনার চেষ্টা করার সময় তিনি কার্যকরী ফর্মটি উদ্ভব করেছিলেন তবে - যখন তিনি কার্যকরভাবে সাধারণ বিতরণের ফর্মটি উপার্জন করেন - তখন মনে হয় যে তিনি তার সান্নিধ্য হিসাবে তার সান্নিধ্য সম্পর্কে ভাবেননি সম্ভাব্যতা বিতরণ, যদিও কিছু লেখক পরামর্শ দিয়েছেন যে তিনি করেছিলেন। একটি নির্দিষ্ট পরিমাণ ব্যাখ্যার প্রয়োজন হয় সুতরাং সেই ব্যাখ্যার মধ্যে পার্থক্যের সুযোগ রয়েছে।

গস এবং ল্যাপ্লেস 1800 এর দশকের গোড়ার দিকে এটিতে কাজ করেছিলেন; সিমেট্রিক র‌্যান্ডম ভেরিয়েবলের পরিমাণের বিতরণের আনুমানিক রূপ হিসাবে গৌস ১৮০৯ সালে (যার অর্থ কেন্দ্রের এমএলই হ'ল বিতরণ হওয়ার সাথে সম্পর্কিত) এবং ল্যাপ্লেস সম্পর্কে এটি লিখেছিলেন। এক দশক পরে ল্যাপ্লেস পৃথক এবং অবিচ্ছিন্ন পরিবর্তনশীলগুলির জন্য কেন্দ্রীয় সীমাবদ্ধ উপপাদ্যের প্রাথমিক রূপ দেয় gives

বিতরণের জন্য প্রারম্ভিক নাম অন্তর্ভুক্ত ত্রুটির আইন , ত্রুটি ফ্রিকোয়েন্সি আইন , এবং এটি মাঝে মাঝে যৌথভাবে উভয় Laplace এবং গাউস নামানুসারে।

"সাধারন" শব্দটি 1870 এর দশকে তিনটি পৃথক লেখক (পেয়ার্স, লেক্সিস এবং গালটন) দ্বারা স্বাধীনভাবে বিতরণটি বর্ণনা করতে ব্যবহৃত হয়েছিল, প্রথমটি 1873 সালে এবং অন্য দুটি 1877 সালে। গৌসের রচনার ষাট বছরেরও বেশি সময় এটি এবং ল্যাপ্লেস এবং ডি মাইভেরের সমীকরণের দ্বিগুণেরও বেশি। গ্যাল্টনের এটির ব্যবহার সম্ভবত সবচেয়ে প্রভাবশালী ছিল তবে তিনি ১৮ normal77 সালের এই কাজের ক্ষেত্রে "নরমাল" শব্দটি ব্যবহার করেছিলেন (বেশিরভাগ ক্ষেত্রে এটি "বিচ্যুতি আইন" হিসাবে অভিহিত করেছেন)।

যাইহোক, 1880 এর দশকে গ্যাল্টন বিতরণের ক্ষেত্রে "সাধারণ" বিশেষণটি বহুবার ব্যবহার করেছিলেন (যেমন 1889 সালে "স্বাভাবিক বক্র হিসাবে") এবং পরবর্তীকালে তিনি যুক্তরাজ্যের পরবর্তী পরিসংখ্যানবিদদের উপর বিশেষ প্রভাব ফেলেছিলেন (বিশেষত কার্ল পিয়ারসন) )। তিনি কেন এইভাবে "নরমাল" শব্দটি ব্যবহার করেছিলেন তা তিনি বলেননি, তবে সম্ভবত এটি "আদর্শ" বা "স্বাভাবিক" অর্থে বোঝানো হয়েছে।

"সাধারণ বিতরণ" শব্দটির প্রথম স্পষ্ট ব্যবহার কার্ল পিয়ারসন দ্বারা প্রদর্শিত হবে; তিনি অবশ্যই এটি 1894 সালে ব্যবহার করেছেন, যদিও তিনি দাবি করেছেন যে এটি বহু আগে ব্যবহার করা হয়েছে (দাবিটি আমি কিছু সতর্কতার সাথে দেখব)।


তথ্যসূত্র:

মিলার, জেফ
"গণিতের কিছু শব্দের প্রাথমিক জ্ঞাত ব্যবহার:"
সাধারণ বিতরণ (জন অলডরিকের প্রবেশ)
http://jeff560.tripod.com/n.html

স্টাহল, শৌল (২০০)),
"সাধারণ বিতরণের বিবর্তন",
গণিত ম্যাগাজিন , খণ্ড। 79, নং 2 (এপ্রিল), পিপি 96-113
https://www.maa.org/sites/default/files/pdf/upload_library/22/Alelendoerfer/stahl96.pdf

সাধারণ বিতরণ, (2016, আগস্ট 1)
উইকিপিডিয়ায়, ফ্রি এনসাইক্লোপিডিয়া।
12:02, 3 আগস্ট, 2016, থেকে পুনরুদ্ধার করা হয়েছে
Https://en.wikedia.org/w/index.php?title=Normal_dist

হাল্ড, এ (২০০)),
"ডি মাইভেরের দ্বিপদীকরণের সাধারণ অনুমান, 1733 এবং এর সাধারণীকরণ",
মাইভেরের বিনোমিয়ালের ইন: আ হিস্ট্রি অফ প্যারাম্যাট্রিক স্ট্যাটিস্টিকাল ইনফারেন্স অফ বার্নৌলি থেকে ফিশার, 1713–1935; পৃষ্ঠা 17-24

[আপনি তাদের ডি মাইভ্রের অ্যাকাউন্টের সাথে সম্পর্কিত এই উত্সগুলির মধ্যে যথেষ্ট তাত্পর্যগুলি লক্ষ্য করতে পারেন]


গভীর উত্তরের জন্য আপনাকে ধন্যবাদ! আমি কীভাবে স্বাভাবিক বিতরণের আকারটি প্রাপ্ত হয়েছিল তা আরও খতিয়ে দেখেছি এবং আমি এই নথিটি কোর্সটি খুঁজে পেয়েছি ncncssm.edu/math/Talks/PDFS/normal.pdf এবং আমি বুঝতে পারি যে কীভাবে আমরা ধরে নিতে পারি যে ত্রুটিগুলি স্থানাঙ্ক ব্যবস্থার অভিমুখীকরণের উপর নির্ভর করে না (এমন একটি ধারণা যা পরে একটি গুরুত্বপূর্ণ উপসংহার সক্ষম করে) যখন আমার কাছে মনে হয় যে এই ধরণের ধারণাটি কেবল ডার্টের উদাহরণেই ধারণ করবে তবে দুর্ঘটনাজনিত পরীক্ষামূলক ত্রুটির উদাহরণে নয় ।
ahra

প্রকৃতপক্ষে পুরো ডার্টস পদ্ধতির বিষয়টি আমাকে বিভ্রান্ত করে যেহেতু আমি ঘটনামূলক পরীক্ষামূলক ত্রুটির প্রসঙ্গে সাধারণ বিতরণ অধ্যয়ন করছি। আমি অনুমান করছি যে ডার্টস পদ্ধতির ধারণা ধরে নেওয়া হয়েছে যে আপনি দুটি মাত্রায় স্বতন্ত্র ত্রুটি করতে পারেন যা ব্যবহৃত প্রসঙ্গে ঠিক আছে তবে পরীক্ষামূলক ত্রুটিগুলির প্রসঙ্গে যেখানে এটি আপনার নির্ভরশীল এবং একটি স্বতন্ত্র ভেরিয়েবল আছে তার অনুবাদ কী করবে তা আমার কাছে অস্পষ্ট is যার অর্থ আপনি কেবলমাত্র একটি মাত্রায় একটি ত্রুটি করতে পারেন।
ahra

1
উল্লেখের দুর্দান্ত ব্যবহার। +1 টি
অ্যারন হল

2
আমি মনে করি যে "কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য" এখানে কোথাও উল্লেখ করা উচিত, যেহেতু ওপি মনে হয় (অন্তত অংশে) এই নির্দিষ্ট বিতরণটি কেন এত বেশি প্রচলিত তা জিজ্ঞাসা করছে।
জোক

1
@ জোক আমি প্রশ্নটি বিস্তৃততা সম্পর্কে জিজ্ঞাসা করা এমনকি এটি সম্পর্কে একটি প্রশ্ন প্রস্তাব দেওয়ার জন্য দেখছি না। যাইহোক, আমি দ্বিপদী সম্পর্কিত ডি মাইভারের কাজ এবং ল্যাপ্লেসের সমমিত র্যান্ডম ভেরিয়েবলগুলির পরিমাণের জন্য সাধারণ আনুমানিক সম্পর্কিত সম্পর্কিত কাজ সম্পর্কে ... যা প্রশ্নের সাথে আরও সরাসরি সম্পর্কিত talk তবে, আমি সমস্যা নিয়ে ল্যাপ্লেসের কাজের সাথে সম্পর্কিত একটি বাক্য যুক্ত করব (যদিও এটি অন্য শতাব্দীর জন্য বলা হবে না)।
গ্লেন_বি -রিনস্টেট মনিকা

11

"সাধারণ" বিতরণটি সেই নির্দিষ্ট বন্টন হিসাবে সংজ্ঞায়িত করা হয়।

প্রশ্নটি হ'ল আমরা কেন এই নির্দিষ্ট বিতরণটি প্রকৃতিতে সাধারণ হওয়ার প্রত্যাশা করব এবং আসল তথ্য সেই বিতরণটিকে যথাযথভাবে অনুসরণ করে না, এমনকি কেন এটি প্রায়শই প্রায় অনুমান হিসাবে ব্যবহৃত হয়? (আসল তথ্যগুলিতে প্রায়শই একটি "ফ্যাট লেজ" পাওয়া যায়, অর্থাত্ সাধারণ বিতরণের পূর্বাভাসের তুলনায় গড় থেকে মানগুলি অনেক বেশি সাধারণ)।

এটি অন্য উপায়ে বলতে গেলে, সাধারণ বিতরণে বিশেষ কী?

স্বাভাবিকের মধ্যে প্রচুর "সুন্দর" পরিসংখ্যানগত বৈশিষ্ট্য রয়েছে (উদাহরণস্বরূপ https://en.wikedia.org/wiki/Central_limit_theorem দেখুন ) তবে সবচেয়ে প্রাসঙ্গিক আইএমও হ'ল যে কোনও বিতরণের জন্য "সর্বাধিক এনট্রপি" ফাংশন একটি নির্দিষ্ট গড় এবং বৈকল্পিক। https://en.wikipedia.org/wiki/Maximum_entropy_probability_distribution

এটিকে সাধারণ ভাষায় প্রকাশ করার জন্য, যদি আপনাকে কেবল কোনও বিতরণের গড় (কেন্দ্রীয় বিন্দু) এবং ভিন্নতা (প্রস্থ) দেওয়া হয় এবং আপনি এ সম্পর্কে যা কিছু বলেন না, আপনি সাধারণ বন্টন আঁকতে বাধ্য হবেন। অন্য যে কোনও কিছুর জন্য অতিরিক্ত তথ্য ( শ্যানন ইনফরমেশন তত্ত্বের অর্থে ) প্রয়োজন, উদাহরণস্বরূপ skewness এটি নির্ধারণ করার জন্য।

সর্বাধিক এনট্রপির মূলনীতিটি ইটি জেইনেস বাইয়েশিয়ান অনুমানের মধ্যে যুক্তিসঙ্গত প্রিয়ার নির্ধারণের উপায় হিসাবে প্রবর্তন করেছিলেন এবং আমি মনে করি তিনিই প্রথম এই সম্পত্তিটির দিকে দৃষ্টি আকর্ষণ করেছিলেন।

আরও আলোচনার জন্য এটি দেখুন: http://www.inf.fu-berlin.de/inst/ag-ki/rojas_home/documents/tutorials/ গাউসিয়ান-ডিস্ট্রিবিউশন.পিডিএফ


6
"অন্য কথায় যদি আপনাকে কেবলমাত্র বিতরণের গড় (কেন্দ্রীয় পয়েন্ট) এবং প্রকরণ (প্রস্থ) দেওয়া হয় এবং আপনি এ সম্পর্কে যা কিছু বলেন না, আপনি একটি সাধারণ বিতরণ আঁকতে বাধ্য হবেন।" আমার ধারণা এটি "জোরপূর্বক" সংজ্ঞাটি কী তার উপর নির্ভর করে। আপনি বাধ্য হতে পারেন। আমি হবে না। আপনি যা বর্ণনা করেছেন তা হ'ল "জোর করে" কোনও ফাংশন ধরে নিতে বাধ্য হওয়ার নৈতিক সমতুল্য যখন আপনি এর ফর্মটি জানেন না, বা এলোমেলো ভেরিয়েবলগুলি স্বাধীন হয় যখন আপনি তাদের সঠিক নির্ভরতা জানেন না। আমি এগুলি করি না, আমিও নই এবং এই অনুমানগুলির কোনওরকম করতে বাধ্য হবো না।
মার্ক এল স্টোন

5
@ নীল আমি বিশ্বাস করি যে মার্কের বক্তব্যটির একটি অংশ হতে পারে যে ন্যায়সঙ্গতীকরণ বাধ্যতামূলক
হোবার

5
এটি থেকে নিল দূরে! প্রথমে আপনাকে ধরে নিতে হবে সর্বাধিক এনট্রপির মূলনীতিটি আপনার পরিসংখ্যানগত সমস্যার জন্য কার্যকর এবং প্রযোজ্য। এরপরে আপনাকে অবশ্যই নিশ্চিত হতে হবে যে বিতরণ সম্পর্কে আপনি ধরে নিতে পারেন এমন আর কিছুই নেই। এই দুটিই সমস্যাযুক্ত। (সবচেয়ে পরিসংখ্যানগত সমস্যার আমি সম্মুখীন - তাত্ত্বিক পদার্থবিজ্ঞানের অন্তর্জগৎ বাইরে - সাবেক সত্য নয় হয়েছে; এবং আমি একটি বাস্তব-বিশ্বের সমস্যা যেখানে আধুনিক ক্ষেত্রে দেখা যায় দেখিনি।)
whuber

1
@ নীল মার্ক এবং হুবুহু আমি সেই অনুচ্ছেদটি পরিষ্কার করার চেষ্টা করেছি। আমি মনে করি যে "সর্বোচ্চ কিছু এনট্রপির মূলনীতিটি কী করার চেষ্টা করছে" এর যুক্তিসঙ্গত একটি সাধারণ ভাষা ব্যাখ্যা "অন্য কিছু নয়" সাধারণ ভাষা হওয়ায় আপনি অবশ্যই এটির একটি আলাদা ব্যাখ্যা রাখতে পারেন। এজন্য আমাদের গণিত প্রয়োজন। আরও সুনির্দিষ্ট বিবৃতিটি হ'ল আমরা শ্যাননের অর্থে কোনও তথ্য যুক্ত করছি না। লিঙ্কগুলি আরও ব্যাখ্যা করে।
গ্যার্থ

1
@ সমস্ত বাস্তবের উপর অভিন্ন বিতরণ (যা আমি মনে করি আপনি আপনার সর্বশেষ মন্তব্যে বোঝাতে চেয়েছিলেন) একটি অত্যন্ত অনুচিত বিতরণ হবে। আপনার সাধারণ চালকের হিসাবে ড্রাইভার হিসাবে সর্বোচ্চ এনট্রপির দাবিটি একটি বড় অনুমান করে; এটি ন্যূনতম পরিসরের মতো অন্য কিছু ধরে নেওয়ার চেয়ে আরও শক্তিশালী কেন?
হেনরি 14

3

সাধারন বিতরণ (ওরফে " গসিয়ান বিতরণ ") একটি দৃঢ় গাণিতিক ভিত্তি হয়েছে। কেন্দ্রীয় সীমা উপপাদ্য বলেছেন যে আপনি এন স্বাধীন ও অভিন্নরুপে একটি নির্দিষ্ট গড় এবং ভ্যারিয়েন্স থাকার র্যান্ডম ভেরিয়েবল বিতরণ, এবং আপনাকে সেই র্যান্ডম ভেরিয়েবল গড় নেওয়া, ফলে বিতরণের এন হিসাবে একটি গসিয়ান বন্টন বিন্দুতে মিলিত হবে একটি নির্দিষ্ট সেট আছে যদি অনন্ত যায়। এখানে কোনও অনুমানের কাজ নেই, যেহেতু গাণিতিক উত্সটি এই নির্দিষ্ট বিতরণ কার্যের দিকে পরিচালিত করে এবং অন্য কোনওটি নয়।

এটিকে আরও স্পষ্ট শর্তে রাখতে, একটি একক এলোমেলো পরিবর্তনশীল বিবেচনা করুন, যেমন ফর্সা মুদ্রা উল্টানো (সমান 2 সম্ভাব্য ফলাফল)। একটি নির্দিষ্ট ফলাফল পাওয়ার প্রতিক্রিয়াগুলি মাথাগুলির জন্য 1/2 এবং লেজগুলির জন্য 1/2।

আপনি যদি কয়েনের সংখ্যা বৃদ্ধি করেন এবং প্রতিটি পরীক্ষার সাথে প্রাপ্ত মোট মাথাগুলির ট্র্যাক রাখেন তবে আপনি দ্বিপদী বিতরণ পাবেন যা মোটামুটি ঘণ্টা আকৃতিযুক্ত। এক্স-অক্ষ বরাবর মাথা সংখ্যার সাথে কেবল গ্রাফ এবং আপনি যে সংখ্যাটি y- অক্ষ বরাবর উল্টিয়েছেন তার সংখ্যা।

আপনি যত বেশি মুদ্রা ব্যবহার করবেন এবং আপনি যখন মুদ্রাগুলি আরও বেশি ফ্লিপ করবেন তখন গ্রাফটি আরও কাছাকাছি গাউসিয়ান বেল বাঁকের মতো দেখতে আসবে। কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি এটাই দাবি করে।

আশ্চর্যজনক বিষয় হ'ল উপপাদ্যটি এলোমেলো ভেরিয়েবলগুলি আসলে কীভাবে বিতরণ করা হয় তার উপর নির্ভর করে না, যতক্ষণ না প্রতিটি এলোমেলো ভেরিয়েবলের একই বন্টন থাকে। উপপাদ্যের একটি মূল ধারণা হ'ল আপনি এলোমেলো পরিবর্তনগুলি যুক্ত বা গড় করছেন are আরেকটি মূল ধারণাটি হ'ল উপপাদ্যটি গাণিতিক সীমা বর্ণনা করছে কারণ এলোমেলো ভেরিয়েবলের সংখ্যা আরও বড় এবং বৃহত্তর হয়। আপনি যত বেশি ভেরিয়েবল ব্যবহার করবেন ততই বিতরণটি একটি সাধারণ বিতরণের কাছে আসবে।

আমি গাণিতিক পরিসংখ্যানগুলিতে একটি ক্লাস নেওয়ার পরামর্শ দিচ্ছি যদি আপনি গণিতবিদরা কীভাবে নির্ধারণ করে যে নরমাল ডিস্ট্রিবিউশনটি আসলে বেল বক্ররেখার জন্য গাণিতিকভাবে সঠিক ফাংশন তা দেখতে চান want


আপনার অবদানের জন্য ধন্যবাদ. এটি সঠিক হবে যদি আপনি ব্যাখ্যা করেন যে যোগফলের (বা গড়) বন্টনকে মানদণ্ডিত করতে হবে। অন্যথায়, যোগফলের বিতরণ কোনও সীমাতে পৌঁছায় না এবং গড়ের বন্টন একটি ধ্রুবকের কাছে যায়। তবে এই পোস্টটি যে প্রশ্নগুলি উত্থাপিত হয়েছিল তার উত্তর দেয় কীভাবে? (বোঝা যাচ্ছে যে নেতারা, বিভিন্ন প্রশ্নের যাকে জাহির করা হচ্ছে এবং তারা সব বিভ্রান্ত ও অস্পষ্ট, কিন্তু কিভাবে তারা গসিয়ান পিডিএফ জন্য সূত্র আবিষ্কৃত হয় বা উদ্ভুত সম্পর্কে জিজ্ঞাসা করা হবে বলে মনে হচ্ছে।)
whuber

2

এই থ্রেডে কিছু দুর্দান্ত উত্তর রয়েছে। আমি অনুভব করতে সাহায্য করতে পারি না যে ওপি একই প্রশ্ন জিজ্ঞাসা করছে না সবাই যেমন উত্তর দিতে চায়। যদিও আমি পেয়েছি, কারণ এটি উত্তর দেওয়ার জন্য সবচেয়ে উত্তেজনাপূর্ণ প্রশ্নগুলির কাছাকাছি - আমি আসলে এটি খুঁজে পেয়েছিলাম কারণ আমি আশা করি কারও কাছে এই প্রশ্নটি ছিল "" আমরা কীভাবে জানব যে সাধারণ পিডিএফ পিডিএফ? " এবং আমি এটি অনুসন্ধান করেছিলাম। তবে আমি মনে করি যে প্রশ্নের উত্তরটি হতে পারে সাধারণ বন্টনের উত্সটি প্রদর্শিত হয়।

সাধারণ বিতরণটি প্রথম ডিজাইন করা হয়েছিল খুব বড় জন্য দ্বিপদী বিতরণ আনুমানিক হিসাবে ব্যবহার করতে এন। 1744 সালে, ডি মাইভ্রে নামে একজন গণিতবিদ দেখালেন যে, দ্বিপদী বিতরণটি বড় আকারের জন্যএন, গড়ের সাথে সাধারণ বিতরণে খুব একই রকম সম্ভাবনা রয়েছে এনপি এবং বৈকল্পিক এনপি(1-পি)। এর প্রমাণটি দ্বিপদী পিডিএফের সীমা গ্রহণ করা থেকে স্বাভাবিকভাবেই অনুসরণ করেএন, এবং স্টার্লিংয়ের সমীকরণের সাথে কল্পিত মানগুলি প্রতিস্থাপন।

তবে আমি আবার প্রলুব্ধ হয়েছি যে এই ঘটনাটি ঘটেছিল তার প্রমাণের গভীরে andুকতে, এবং আমি জানি না যে ওপি কী চেয়েছিল। আগ্রহী হলে এটি এখানে ব্যাখ্যা করা হয়েছে । কেবল জানি যে আমরা "সহজেই" প্রমাণ করতে পারি যে দ্বিপদী বিতরণের সীমাটিএন এবং পি0 যেমন যে এনপি=1 একটি সাধারণ বিতরণ।

সেই জ্ঞানটি গ্রহণ করে আমরা দেখতে পারি যে কেন দ্বিপদী বন্টন বেল আকারযুক্ত, যা দেখতে খুব সহজ, আমরা যদি দেখতে পারি যে সাধারণ বিতরণটি বেল আকারযুক্ত হয়। এগিয়ে যান এবং এটি নিজের জন্য চেষ্টা করুন - এর দ্বিপদী সম্ভাবনার একটি পৃথক গ্রাফ তৈরি করুনএন=10 এবং পি=0.5। এটি কেমন আকারযুক্ত? দ্বিপদী সম্ভাবনার একটি পৃথক গ্রাফ সম্পর্কে কিএন=100 এবং পি=0.5? প্রকৃতপক্ষে, এটিকে উত্সর্গীয়ভাবে করুন, দ্বিপদীভাবে বিতরণ করা কিছু এলোমেলো ডেটা তৈরি করুন এবং দেখুন যে হিস্টোগ্রামটি কেমন দেখাচ্ছে! অবশ্যই এটি দেখতে বেশ সুন্দর ব্লক বেল, তবে এটি আরও বেশি বক্র হয়এনহয়। তবে কেন একেবারেই ঘণ্টা আকারের?

যদি আমি এই মুহূর্তে মাটিতে 100 টি মুদ্রা ফেলে দিই এবং আমি কতটা মাথা পেয়েছি তা গণনা করতে পারি, তবে আমি 0 টি গণনা করতে পারি, বা আমি 100 টি শনাক্ত করতে পারি তবে আমি কোথাও কোথাও কোনও সংখ্যা গণনা করার সম্ভাবনা বেশি। আপনি দেখতে পাচ্ছেন কেন এই হিস্টগ্রামটি বেল আকারযুক্ত করা উচিত?


+1 - তবে নোট করুন যে আমি আমার উত্তরের বেশ কয়েকটি অংশে ডি মাইভ্রে নিয়ে আলোচনা করেছি। রেফারেন্সগুলিতে আকর্ষণীয়তার সাথে আমার উত্তরটিতে আপনি চূড়ান্ত নোটটি খুঁজে পেতে পারেন - ডি মাইভ্রে তাঁর কাজের বিভিন্ন বৈশিষ্ট্য যে পরিমাণে ধারণ করেছে তা কতটা দেখার জন্য এটি আসলে দেখার বিষয় worth বোনমিয়াল সিডিএফ উপযুক্ত অবস্থার অধীনে কেন
Glen_b- পুনরায় ইনস্টল করুন মনিকা

1

দুটি অনুমান থেকে স্বাধীন মাল্টিভারিয়েট সাধারণ বিতরণ ম্যাক্সওয়েল-হার্চেল ডেরিভিয়েশনও উল্লেখ করবেন:

  1. বিতরনটি ভেক্টরের আবর্তনের দ্বারা প্রভাবিত হয় না।

  2. ভেক্টরের উপাদানগুলি স্বাধীন।

এখানে জেনেসের প্রকাশ

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.