স্বাভাবিকতা কী?


33

বিভিন্ন বিভিন্ন পরিসংখ্যান পদ্ধতিতে একটি "স্বাভাবিকতার অনুমান" রয়েছে। "নরমালটি" কী এবং আমি কীভাবে জানব যদি স্বাভাবিকতা থাকে?


2
আপনি প্রথমে গুগল / উইকিপিডিয়া চেষ্টা করেছিলেন? en.wikipedia.org/wiki/Normal_distribution
রবিন Girard

উত্তর:


29

স্বাভাবিকতার অনুমান কেবলমাত্র অনুমান করা হয় যে অন্তর্নিহিত এলোমেলো সুদের সুদের পরিমাণ স্বাভাবিকভাবে বিতরণ করা হয় বা প্রায় তাই হয়। স্বজ্ঞাতভাবে, স্বাভাবিকতা বৃহত্তর সংখ্যক স্বতন্ত্র এলোমেলো ইভেন্টের যোগফলের ফলাফল হিসাবে বোঝা যেতে পারে।

আরও নির্দিষ্টভাবে, সাধারণ বিতরণগুলি নিম্নলিখিত ফাংশন দ্বারা সংজ্ঞায়িত করা হয়:

বিকল্প পাঠ

যেখানে এবং যথাক্রমে গড় এবং বৈকল্পিক এবং যা নীচে প্রদর্শিত হয়:σ 2μσ2

বিকল্প পাঠ

এটি একাধিক উপায়ে পরীক্ষা করা যেতে পারে , এটি এন এর আকারের মতো এর বৈশিষ্ট্যগুলি দ্বারা আপনার সমস্যার সাথে কম-বেশি উপযুক্ত হতে পারে। মূলত, বিতরণটি যদি স্বাভাবিক (যেমন প্রত্যাশিত কোয়ান্টাইল বিতরণ ) হয় তবে প্রত্যাশিত বৈশিষ্ট্যগুলির জন্য এগুলি সমস্ত পরীক্ষা করে ।


33

একটি নোট: স্বাভাবিকতা অনুমান করা প্রায়শই আপনার পরিবর্তনশীলগুলির সম্পর্কে নয়, তবে ত্রুটি সম্পর্কে, যা অবশিষ্টাংশ দ্বারা অনুমান করা হয়। উদাহরণস্বরূপ, লিনিয়ার রিগ্রেশন ; কোনও অনুমান নেই যে সাধারণত বিতরণ করা হয়, কেবলমাত্র ।Y eY=a+bx+eYe


16
+1 টি। পরিশেষে কেউ এই প্রশ্নের সবচেয়ে গুরুত্বপূর্ণ দিকটি সম্ভবত কোনটি উল্লেখ করেছেন: বেশিরভাগ পরিস্থিতিতে, জনসংখ্যার বন্টন সম্পর্কিত নয়, অবশিষ্টাংশের ক্ষেত্রে বা পরিসংখ্যানের নমুনা বিতরণের ক্ষেত্রে "স্বাভাবিকতা" গুরুত্বপূর্ণ!
whuber

4
আমি যোগ করব যে যদি সাধারণত বিতরণ করা হয় তবে Y কমপক্ষে শর্তাধীনও স্বাভাবিক। আমি মনে করি এটি এটি হারিয়ে যায় - লোকেরা মনে করে যে ওয়াই প্রান্তিক স্বাভাবিক তবে এটির প্রয়োজনীয় শর্তাধীন স্বাভাবিকতা ity এর সহজ উদাহরণটি এক দিকের আনোভা। e
সম্ভাব্যতা ব্লগ

শর্তসাপেক্ষে কি?
বিল_ই

1
@ বিল_e স্বতন্ত্র ভেরিয়েবলগুলি
গ্লেন_বি -রিনস্টেট মনিকা

10

ত্রুটির স্বাভাবিক অনুমান (বা আমাদের কাছে তথ্য সম্পর্কে পূর্ববর্তী জ্ঞান না থাকলে ডেটা আরও সাধারণভাবে) সম্পর্কে একটি সম্পর্কিত প্রশ্ন এখানে পাওয়া যাবে ।

মূলত,

  1. এটি সাধারণ বিতরণ ব্যবহার করার জন্য গাণিতিকভাবে সুবিধাজনক। (এটি সর্বনিম্ন স্কোয়ারগুলির সাথে সম্পর্কিত এবং সিউডোয়েন্টার সহ সমাধান করা সহজ)
  2. কেন্দ্রীয় সীমাবদ্ধ তত্ত্বের কারণে, আমরা ধরে নিতে পারি যে প্রক্রিয়াটি প্রভাবিত করে এমন অনেকগুলি অন্তর্নিহিত তথ্য রয়েছে এবং এই স্বতন্ত্র প্রভাবগুলির যোগফল স্বাভাবিক বন্টনের মতো আচরণ করবে। অনুশীলনে, এটি মনে হয় তাই।

সেখানকার একটি গুরুত্বপূর্ণ নোটটি হ'ল, টেরেন্স টাও এখানে যেমন বলেছেন , "এই উপপাদ্যটি দৃser়ভাবে জানিয়েছে যে যদি কেউ এমন একটি পরিসংখ্যান গ্রহণ করে যা অনেকগুলি স্বতন্ত্র এবং এলোমেলো ওঠানাময় উপাদানগুলির সংমিশ্রণ হয়, যার কোনও উপাদানই পুরো সিদ্ধান্তের উপর নির্ভর করে না , তারপরে সেই পরিসংখ্যানগুলি সাধারণ বিতরণ "নামে একটি আইন অনুসারে প্রায় বিতরণ করা হবে।

এটি পরিষ্কার করার জন্য, আমি একটি পাইথন কোড স্নিপেট লিখি

# -*- coding: utf-8 -*-
"""
Illustration of the central limit theorem

@author: İsmail Arı, http://ismailari.com
@date: 31.03.2011
"""

import scipy, scipy.stats
import numpy as np
import pylab

#===============================================================
# Uncomment one of the distributions below and observe the result
#===============================================================
x = scipy.linspace(0,10,11)
#y = scipy.stats.binom.pmf(x,10,0.2) # binom
#y = scipy.stats.expon.pdf(x,scale=4) # exp
#y = scipy.stats.gamma.pdf(x,2) # gamma
#y = np.ones(np.size(x)) # uniform
y = scipy.random.random(np.size(x)) # random

y = y / sum(y);

N = 3
ax = pylab.subplot(N+1,1,1)
pylab.plot(x,y)

# Plotting details 
ax.set_xticks([10])
ax.axis([0, 2**N * 10, 0, np.max(y)*1.1])
ax.set_yticks([round(np.max(y),2)])

#===============================================================
# Plots
#===============================================================
for i in np.arange(N)+1:
    y = np.convolve(y,y)
    y = y / sum(y);    

    x = np.linspace(2*np.min(x), 2*np.max(x), len(y))
    ax = pylab.subplot(N+1,1,i+1)
    pylab.plot(x,y)
    ax.axis([0, 2**N * 10, 0, np.max(y)*1.1])
    ax.set_xticks([2**i * 10])
    ax.set_yticks([round(np.max(y),3)])

pylab.show()

এলোমেলো বিতরণ

সূচকীয় বিতরণ

সমবন্টন

হিসাবে পরিসংখ্যান থেকে দেখা যায়, পৃথক বিতরণ প্রকার নির্বিশেষে ফলাফল বিতরণ (যোগফল) একটি সাধারণ বিতরণ দিকে ঝোঁক। সুতরাং, যদি ডেটাতে অন্তর্নিহিত প্রভাবগুলি সম্পর্কে আমাদের কাছে পর্যাপ্ত তথ্য না থাকে তবে স্বাভাবিকতা অনুমিতি যুক্তিযুক্ত।


1
সিএলটি আমাদের প্রদত্ত যে কোনও প্রক্রিয়াতে প্রচুর স্বতন্ত্র প্রভাব রয়েছে তা ধরে নিতে দেয় না - যদি আমাদের দেওয়া হয় যে পরিমাপে অবদান রাখার মতো খুব বেশি নির্ভরশীল স্বতন্ত্র কারণ নেই (যার মধ্যে মোটের খুব বেশি পরিমাণ নেই) প্রকরণ), আমরা সিএলটি আহ্বানের মাধ্যমে স্বাভাবিকতা ধরে নেওয়ার পক্ষে ন্যায়সঙ্গত হতে পারি। অনেকগুলি অবদানের ধারনা সিএলটি প্রয়োগের আগে, এটি কোনও অর্থে সিএলটি-র ফলাফল নয়। অন্যথায় সবকিছু স্বাভাবিক হবে, যখন বাস্তবে এটি কেবল কখনও কখনও মোটামুটি সত্য।
গ্লেন_বি -রিনস্টেট মনিকা

5

স্বাভাবিকতা আছে কিনা তা আপনি জানতে পারবেন না এবং সে কারণেই আপনাকে সেখানে একটি অনুমান করতে হবে। আপনি কেবল পরিসংখ্যান পরীক্ষা দিয়ে স্বাভাবিকতার অনুপস্থিতি প্রমাণ করতে পারেন।

আরও খারাপ, যখন আপনি বাস্তব বিশ্বের ডেটা নিয়ে কাজ করেন এটি প্রায় নিশ্চিত যে আপনার ডেটাতে সত্যিকারের স্বাভাবিকতা নেই।

তার অর্থ হল আপনার পরিসংখ্যান পরীক্ষা সর্বদা কিছুটা পক্ষপাতদুষ্ট থাকে। প্রশ্ন আপনি এটি পক্ষপাতিত্ব সঙ্গে বাঁচতে পারেন কিনা। এটি করার জন্য আপনাকে আপনার ডেটা এবং আপনার পরিসংখ্যানের সরঞ্জাম অনুমান করে এমন স্বাভাবিকতা বুঝতে হবে।

ফায়ারসিডনিস্ট সরঞ্জামগুলি বায়েসিয়ান সরঞ্জামগুলির মতোই বিষয়গত হওয়ার কারণ এটি। এটি সাধারণত বিতরণ করা ডেটার ভিত্তিতে আপনি নির্ধারণ করতে পারবেন না। আপনি স্বাভাবিকতা ধরে নিতে হবে।


5
আপনি পরিসংখ্যান ব্যবহার করে কিছু প্রমাণ করতে পারবেন না। একটি প্রমাণ হুবহু বোঝানো হয়। পরিসংখ্যান সম্ভাবনা সম্পর্কে হয়। এমনকি এপি = 0.99 চি চি স্কোয়ারের ফলাফলটি "প্রমাণ" দেয় না যে অন্তর্নিহিত বিতরণটি স্বাভাবিক নয়। এটি সাধারণ যে এটি সাধারণ unlikely
xmjx

@ এক্সএমজেএক্স: আপনি এমনকি বলতে পারবেন না যে প্রদত্ত বিতরণ সম্ভবত সাধারণ বিতরণ। আপনার মানগুলির যেখানে 99.99% সেখানে 1 তবে আপনার মানগুলির 0.01% 1000000 এর একটি পরিসংখ্যান পরীক্ষার সাথে যদি আপনার বিতরণ হয় তবে 100 টি মানের সাথে আপনার মানগুলি ভুলভাবে জানানোর ভাল সুযোগ রয়েছে যে আপনার বিতরণটি সাধারণত বিতরণ করা হয়।
খ্রিস্টান

2
আমি খুব বেশি পরিসংখ্যান বিশেষজ্ঞ নই, সুতরাং এটি একটি নির্বোধ প্রশ্নের মতো মনে হতে পারে ... অন্তর্নিহিত প্রক্রিয়াতে "সত্য স্বাভাবিকতা" উপস্থিত থাকে না যা ডেটা পরিবর্তে পরিবর্তনশীল উত্পন্ন করে? এটি একটি নির্বোধ পার্থক্য মত মনে হতে পারে, কিন্তু সম্ভবত এটি কিছু আত্মা-অনুসন্ধান সংরক্ষণ করতে পারে। যদি সংগৃহীত ডেটা হুবহু স্বাভাবিক না হয় তবে অন্তর্নিহিত এলোমেলো প্রক্রিয়াটি মূলত সাধারণ পদ্ধতিতে কাজ করে, আপনি কি "পক্ষপাতের সাথে বেঁচে থাকার" সিদ্ধান্ত নিতে পারেন এমন একটি পরিস্থিতি কি?
জোনাথন

@ ক্রিশ্চিয়ান - আপনার মন্তব্য যে "... ১০০ মানগুলির একটি ভাল সুযোগ রয়েছে ..." আমার হ্যাকিংয়ের দ্বারা একেবারে উত্পন্ন হয় না: x = সি (রেপ (1,99), রেপ (1000000,1)); ks.test (x, pnorm)> স্বাভাবিকতার অনুমান কেএস টেস্টের দ্বারা এখনও "প্রত্যাখ্যান" is
Rolando2

আমি এই উত্তরটি পছন্দ করি (+1) তবে স্বাভাবিকতা অনুমান করে কী করা যায় তা নিয়ে কিছুটা হতাশাবাদী। এটি যে কোনও মডেলিংয়ের জন্য সাধারণত একটি ভাল সূচনা পয়েন্ট এবং আপনি সাধারণত বিতরণ করা এলোমেলো ভেরিয়েবলের মিশ্রণ বা ফাংশন গ্রহণ করে বিতরণের খুব বিস্তৃত শ্রেণিতে সাধারণীকরণ করতে পারেন।
সম্ভাব্যতাব্লোগিক

4

স্বাভাবিকতার অনুমানটি আপনার ডেটাগুলি সাধারণত বিতরণ করা হয় (ঘণ্টা বক্ররেখা বা গাউসীয় বিতরণ)। আপনি ডেটা প্লট করে বা কুরটোসিসের চিকিত্সাগুলি (শিখরটি কতটা তীক্ষ্ণ হয়) এবং স্কিউডনেস (?) পরীক্ষা করে দেখতে পারেন (যদি অর্ধেকেরও বেশি ডেটা পিকের একপাশে থাকে)।


2
স্বাভাবিকতা অনুমানের জন্য কুর্তোসিস এবং স্কিউডনেস কোন স্তরের গ্রহণযোগ্য?
একটি সিংহ

5
বেশিরভাগ পরিসংখ্যানগত পদ্ধতিগুলি ডেটা হিসাবে নয়, বরং ধরে নেওয়া যায় এলোমেলো পরিবর্তনশীল, যেমন লিনিয়ার রিগ্রেশনতে ত্রুটি শব্দটি ধরে রাখে normal চেকিংয়ের মধ্যে মূল তথ্য নয়, অবশিষ্টাংশগুলি অনুসন্ধান করা জড়িত!

3

অন্যান্য উত্তরে স্বাভাবিকতা কী তা অন্তর্ভুক্ত করা হয়েছে এবং স্বাভাবিকতা পরীক্ষা পদ্ধতির প্রস্তাব দেওয়া হয়েছে। খ্রিস্টান হাইলাইট করেছিলেন যে অনুশীলনে নিখুঁত স্বাভাবিকতা সবেমাত্র বিদ্যমান।

আমি হাইলাইট করেছি যে স্বাভাবিকতা থেকে পর্যবেক্ষণের বিচ্যুতিটির অর্থ এই নয় যে স্বাভাবিকতা ধরে নেওয়া পদ্ধতিগুলি ব্যবহার করা যেতে পারে না এবং স্বাভাবিকতা পরীক্ষা খুব কার্যকর নাও হতে পারে।

  1. স্বাভাবিকতা থেকে বিচ্যুতি আউটলিয়ারদের দ্বারা হতে পারে যা ডেটা সংগ্রহের ত্রুটির কারণে হয়। অনেক ক্ষেত্রে ডেটা সংগ্রহের লগগুলি পরীক্ষা করে আপনি এই পরিসংখ্যানগুলি সংশোধন করতে পারেন এবং স্বাভাবিকতা প্রায়শই উন্নতি করে।
  2. বড় নমুনাগুলির জন্য একটি স্বাভাবিকতা পরীক্ষা স্বাভাবিকতা থেকে নগণ্য বিচ্যুতি সনাক্ত করতে সক্ষম হবে।
  3. স্বাভাবিকতা ধরে নেওয়ার পদ্ধতিগুলি অ-স্বাভাবিকতা শক্তিশালী হতে পারে এবং গ্রহণযোগ্য নির্ভুলতার ফলাফল দেয়। টি-টেস্টটি এই অর্থে শক্তিশালী হিসাবে পরিচিত, যখন F পরীক্ষাটি উত্স ( পারমালিঙ্ক ) নয় । একটি নির্দিষ্ট পদ্ধতি সম্পর্কে দৃ rob়তা সম্পর্কে সাহিত্য পরীক্ষা করা ভাল।

1
আমি মনে করি স্বাভাবিকতা কেন ভাল ধারণা হওয়ার কারণ এটি সম্পর্কিত তথ্য ব্যবহারের তুলনামূলক অভাব - কেবলমাত্র প্রথম দুটি মুহুর্ত স্বাভাবিক বন্টনের সাথে অনুমান হিসাবে ব্যবহৃত হয়। এটি ন্যূনতম স্কোয়ারের মডেলটির ডায়াগনস্টিক চেকিংকে খুব সহজ করে তোলে - মূলত আপনি কেবলমাত্র বিদেশী খুঁজছেন যা যথেষ্ট পরিসংখ্যানকে প্রভাবিত করতে পারে।
সম্ভাব্যতা ব্লগ

3

ওয়াই=μ+ +এক্সβ+ +εεσ2ε

এই তিনটি অনুমানের মধ্যে, 2) এবং 3) বেশিরভাগ ক্ষেত্রে 1 এর চেয়ে বেশি গুরুত্বপূর্ণ! সুতরাং আপনি তাদের সাথে নিজেকে আরও নিবিড় করা উচিত। জর্জ বক্স "" লাইনের লাইনে কিছু বলেছিলেন যে বৈকল্পের বিষয়ে প্রাথমিক পরীক্ষা করা বরং একটি সারি নৌকায় সমুদ্রের মতো রাখার মতো যা সমুদ্রের বন্দর ছেড়ে যাওয়ার জন্য পরিস্থিতি যথেষ্ট শান্ত কিনা তা খুঁজে বের করার মতো! "- [বাক্স," অ বৈচিত্রের উপর সাধারণতা এবং পরীক্ষা ", 1953, বায়োমেট্রিক 40, পৃষ্ঠা 318-335]"

এর অর্থ হ'ল, অসম বৈচিত্রগুলি খুব উদ্বেগের বিষয়, তবে প্রকৃতপক্ষে তাদের জন্য পরীক্ষা করা খুব কঠিন, কারণ পরীক্ষাগুলি অ-স্বাভাবিকতা দ্বারা এতটা ছোট প্রভাবিত হয় যে এটি পরীক্ষার উপায়গুলির জন্য কোনও গুরুত্ব নয়। আজ, অসম বৈকল্পের জন্য অ-প্যারাম্যাট্রিক পরীক্ষা রয়েছে যা অবশ্যই ব্যবহার করা উচিত।

সংক্ষেপে, অসম বৈকল্পিকতা সম্পর্কে নিজেকে প্রথমে ব্যস্ত রাখুন, তারপরে স্বাভাবিকতা সম্পর্কে। আপনি যখন এগুলি সম্পর্কে নিজের মতামত তৈরি করেন, আপনি স্বাভাবিকতা সম্পর্কে ভাবতে পারেন!

এখানে অনেক ভাল পরামর্শ দেওয়া হয়েছে: http://rfd.uoregon.edu/files/rfd/StatisticalResources/glm10_homog_var.txt


আমি পুরোপুরি নিশ্চিত যে আমার ব্যাখ্যাটি সঠিক। বক্স, হান্টার এবং হান্টারে বাক্সটি এ সম্পর্কে দীর্ঘমেয়াদে লিখেছিল: পরীক্ষকদের পরিসংখ্যান যা আমি ভাল করে পড়েছি। তবে এখন আমি দেখতে পাচ্ছি যে আমি যা লিখেছিলাম তার অর্থ কি নয়, তার উচিত উচিত ... তারপরে স্বাভাবিকতা সম্পর্কে! অসম বৈকল্পিকতা স্বাভাবিকতার চেয়ে অনেক বেশি গুরুত্বপূর্ণ। অবশ্যই স্বাধীনতা সকল অনুমানের জনক।
কেজেটিল বি হালওয়ারসন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.