উত্তর:
স্বাভাবিকতার অনুমান কেবলমাত্র অনুমান করা হয় যে অন্তর্নিহিত এলোমেলো সুদের সুদের পরিমাণ স্বাভাবিকভাবে বিতরণ করা হয় বা প্রায় তাই হয়। স্বজ্ঞাতভাবে, স্বাভাবিকতা বৃহত্তর সংখ্যক স্বতন্ত্র এলোমেলো ইভেন্টের যোগফলের ফলাফল হিসাবে বোঝা যেতে পারে।
আরও নির্দিষ্টভাবে, সাধারণ বিতরণগুলি নিম্নলিখিত ফাংশন দ্বারা সংজ্ঞায়িত করা হয়:
যেখানে এবং যথাক্রমে গড় এবং বৈকল্পিক এবং যা নীচে প্রদর্শিত হয়:σ 2
এটি একাধিক উপায়ে পরীক্ষা করা যেতে পারে , এটি এন এর আকারের মতো এর বৈশিষ্ট্যগুলি দ্বারা আপনার সমস্যার সাথে কম-বেশি উপযুক্ত হতে পারে। মূলত, বিতরণটি যদি স্বাভাবিক (যেমন প্রত্যাশিত কোয়ান্টাইল বিতরণ ) হয় তবে প্রত্যাশিত বৈশিষ্ট্যগুলির জন্য এগুলি সমস্ত পরীক্ষা করে ।
একটি নোট: স্বাভাবিকতা অনুমান করা প্রায়শই আপনার পরিবর্তনশীলগুলির সম্পর্কে নয়, তবে ত্রুটি সম্পর্কে, যা অবশিষ্টাংশ দ্বারা অনুমান করা হয়। উদাহরণস্বরূপ, লিনিয়ার রিগ্রেশন ; কোনও অনুমান নেই যে সাধারণত বিতরণ করা হয়, কেবলমাত্র ।Y e
ত্রুটির স্বাভাবিক অনুমান (বা আমাদের কাছে তথ্য সম্পর্কে পূর্ববর্তী জ্ঞান না থাকলে ডেটা আরও সাধারণভাবে) সম্পর্কে একটি সম্পর্কিত প্রশ্ন এখানে পাওয়া যাবে ।
মূলত,
সেখানকার একটি গুরুত্বপূর্ণ নোটটি হ'ল, টেরেন্স টাও এখানে যেমন বলেছেন , "এই উপপাদ্যটি দৃser়ভাবে জানিয়েছে যে যদি কেউ এমন একটি পরিসংখ্যান গ্রহণ করে যা অনেকগুলি স্বতন্ত্র এবং এলোমেলো ওঠানাময় উপাদানগুলির সংমিশ্রণ হয়, যার কোনও উপাদানই পুরো সিদ্ধান্তের উপর নির্ভর করে না , তারপরে সেই পরিসংখ্যানগুলি সাধারণ বিতরণ "নামে একটি আইন অনুসারে প্রায় বিতরণ করা হবে।
এটি পরিষ্কার করার জন্য, আমি একটি পাইথন কোড স্নিপেট লিখি
# -*- coding: utf-8 -*-
"""
Illustration of the central limit theorem
@author: İsmail Arı, http://ismailari.com
@date: 31.03.2011
"""
import scipy, scipy.stats
import numpy as np
import pylab
#===============================================================
# Uncomment one of the distributions below and observe the result
#===============================================================
x = scipy.linspace(0,10,11)
#y = scipy.stats.binom.pmf(x,10,0.2) # binom
#y = scipy.stats.expon.pdf(x,scale=4) # exp
#y = scipy.stats.gamma.pdf(x,2) # gamma
#y = np.ones(np.size(x)) # uniform
y = scipy.random.random(np.size(x)) # random
y = y / sum(y);
N = 3
ax = pylab.subplot(N+1,1,1)
pylab.plot(x,y)
# Plotting details
ax.set_xticks([10])
ax.axis([0, 2**N * 10, 0, np.max(y)*1.1])
ax.set_yticks([round(np.max(y),2)])
#===============================================================
# Plots
#===============================================================
for i in np.arange(N)+1:
y = np.convolve(y,y)
y = y / sum(y);
x = np.linspace(2*np.min(x), 2*np.max(x), len(y))
ax = pylab.subplot(N+1,1,i+1)
pylab.plot(x,y)
ax.axis([0, 2**N * 10, 0, np.max(y)*1.1])
ax.set_xticks([2**i * 10])
ax.set_yticks([round(np.max(y),3)])
pylab.show()
হিসাবে পরিসংখ্যান থেকে দেখা যায়, পৃথক বিতরণ প্রকার নির্বিশেষে ফলাফল বিতরণ (যোগফল) একটি সাধারণ বিতরণ দিকে ঝোঁক। সুতরাং, যদি ডেটাতে অন্তর্নিহিত প্রভাবগুলি সম্পর্কে আমাদের কাছে পর্যাপ্ত তথ্য না থাকে তবে স্বাভাবিকতা অনুমিতি যুক্তিযুক্ত।
স্বাভাবিকতা আছে কিনা তা আপনি জানতে পারবেন না এবং সে কারণেই আপনাকে সেখানে একটি অনুমান করতে হবে। আপনি কেবল পরিসংখ্যান পরীক্ষা দিয়ে স্বাভাবিকতার অনুপস্থিতি প্রমাণ করতে পারেন।
আরও খারাপ, যখন আপনি বাস্তব বিশ্বের ডেটা নিয়ে কাজ করেন এটি প্রায় নিশ্চিত যে আপনার ডেটাতে সত্যিকারের স্বাভাবিকতা নেই।
তার অর্থ হল আপনার পরিসংখ্যান পরীক্ষা সর্বদা কিছুটা পক্ষপাতদুষ্ট থাকে। প্রশ্ন আপনি এটি পক্ষপাতিত্ব সঙ্গে বাঁচতে পারেন কিনা। এটি করার জন্য আপনাকে আপনার ডেটা এবং আপনার পরিসংখ্যানের সরঞ্জাম অনুমান করে এমন স্বাভাবিকতা বুঝতে হবে।
ফায়ারসিডনিস্ট সরঞ্জামগুলি বায়েসিয়ান সরঞ্জামগুলির মতোই বিষয়গত হওয়ার কারণ এটি। এটি সাধারণত বিতরণ করা ডেটার ভিত্তিতে আপনি নির্ধারণ করতে পারবেন না। আপনি স্বাভাবিকতা ধরে নিতে হবে।
স্বাভাবিকতার অনুমানটি আপনার ডেটাগুলি সাধারণত বিতরণ করা হয় (ঘণ্টা বক্ররেখা বা গাউসীয় বিতরণ)। আপনি ডেটা প্লট করে বা কুরটোসিসের চিকিত্সাগুলি (শিখরটি কতটা তীক্ষ্ণ হয়) এবং স্কিউডনেস (?) পরীক্ষা করে দেখতে পারেন (যদি অর্ধেকেরও বেশি ডেটা পিকের একপাশে থাকে)।
অন্যান্য উত্তরে স্বাভাবিকতা কী তা অন্তর্ভুক্ত করা হয়েছে এবং স্বাভাবিকতা পরীক্ষা পদ্ধতির প্রস্তাব দেওয়া হয়েছে। খ্রিস্টান হাইলাইট করেছিলেন যে অনুশীলনে নিখুঁত স্বাভাবিকতা সবেমাত্র বিদ্যমান।
আমি হাইলাইট করেছি যে স্বাভাবিকতা থেকে পর্যবেক্ষণের বিচ্যুতিটির অর্থ এই নয় যে স্বাভাবিকতা ধরে নেওয়া পদ্ধতিগুলি ব্যবহার করা যেতে পারে না এবং স্বাভাবিকতা পরীক্ষা খুব কার্যকর নাও হতে পারে।
এই তিনটি অনুমানের মধ্যে, 2) এবং 3) বেশিরভাগ ক্ষেত্রে 1 এর চেয়ে বেশি গুরুত্বপূর্ণ! সুতরাং আপনি তাদের সাথে নিজেকে আরও নিবিড় করা উচিত। জর্জ বক্স "" লাইনের লাইনে কিছু বলেছিলেন যে বৈকল্পের বিষয়ে প্রাথমিক পরীক্ষা করা বরং একটি সারি নৌকায় সমুদ্রের মতো রাখার মতো যা সমুদ্রের বন্দর ছেড়ে যাওয়ার জন্য পরিস্থিতি যথেষ্ট শান্ত কিনা তা খুঁজে বের করার মতো! "- [বাক্স," অ বৈচিত্রের উপর সাধারণতা এবং পরীক্ষা ", 1953, বায়োমেট্রিক 40, পৃষ্ঠা 318-335]"
এর অর্থ হ'ল, অসম বৈচিত্রগুলি খুব উদ্বেগের বিষয়, তবে প্রকৃতপক্ষে তাদের জন্য পরীক্ষা করা খুব কঠিন, কারণ পরীক্ষাগুলি অ-স্বাভাবিকতা দ্বারা এতটা ছোট প্রভাবিত হয় যে এটি পরীক্ষার উপায়গুলির জন্য কোনও গুরুত্ব নয়। আজ, অসম বৈকল্পের জন্য অ-প্যারাম্যাট্রিক পরীক্ষা রয়েছে যা অবশ্যই ব্যবহার করা উচিত।
সংক্ষেপে, অসম বৈকল্পিকতা সম্পর্কে নিজেকে প্রথমে ব্যস্ত রাখুন, তারপরে স্বাভাবিকতা সম্পর্কে। আপনি যখন এগুলি সম্পর্কে নিজের মতামত তৈরি করেন, আপনি স্বাভাবিকতা সম্পর্কে ভাবতে পারেন!
এখানে অনেক ভাল পরামর্শ দেওয়া হয়েছে: http://rfd.uoregon.edu/files/rfd/StatisticalResources/glm10_homog_var.txt