যদি আমরা দৃশ্যমানভাবে একটি অবিচ্ছিন্ন ডেটা বন্টন দেখতে চাই, তবে হিস্টোগ্রাম এবং পিডিএফ এর মধ্যে কোনটি ব্যবহার করা উচিত?
হিস্টোগ্রাম এবং পিডিএফ-এর মধ্যে সূত্রের ভিত্তিতে নয়, ফর্মুলা কী?
যদি আমরা দৃশ্যমানভাবে একটি অবিচ্ছিন্ন ডেটা বন্টন দেখতে চাই, তবে হিস্টোগ্রাম এবং পিডিএফ এর মধ্যে কোনটি ব্যবহার করা উচিত?
হিস্টোগ্রাম এবং পিডিএফ-এর মধ্যে সূত্রের ভিত্তিতে নয়, ফর্মুলা কী?
উত্তর:
ডার্কস পয়েন্টটি স্পষ্ট করতে:
বলুন আপনার ডেটা একটি সাধারণ বিতরণের একটি নমুনা। আপনি নিম্নলিখিত প্লটটি নির্মাণ করতে পারেন:
লাল রেখাটি অনুমিত ঘনত্বের অনুমান, নীল রেখাটি অন্তর্নিহিত স্বাভাবিক বন্টনের তাত্ত্বিক পিডিএফ। মনে রাখবেন যে হিস্টগ্রাম এখানে ঘনত্বের মধ্যে নয়, ঘনত্বের সাথে প্রকাশিত হয়েছে। এটি চক্রান্তের উদ্দেশ্যে করা হয়, সাধারণ ফ্রিকোয়েন্সি হিস্টোগ্রামে ব্যবহৃত হয়।
সুতরাং আপনার প্রশ্নের উত্তর দেওয়ার জন্য: আপনি যদি নিজের নমুনাটি বর্ণনা করতে চান তবে আপনি অনুমিত অভিজ্ঞতা (যেমন হিস্টোগ্রাম) এবং পিডিএফ ব্যবহার করেন যদি আপনি অনুমানযুক্ত অন্তর্নিহিত বিতরণটি বর্ণনা করতে চান to
আর তে কোড অনুসরণ করে প্লট তৈরি করা হয়:
x <- rnorm(100)
y <- seq(-4,4,length.out=200)
hist(x,freq=F,ylim=c(0,0.5))
lines(density(x),col="red",lwd=2)
lines(y,dnorm(y),col="blue",lwd=2)
একটি হিস্টগ্রাম একটি ঘনত্বের প্রাক-কম্পিউটার বয়সের প্রাক্কলন। একটি ঘনত্বের অনুমান একটি বিকল্প।
আজকাল আমরা উভয়ই ব্যবহার করি এবং একটি সমৃদ্ধ সাহিত্য রয়েছে যা সম্পর্কে কারও ডিফল্ট ব্যবহার করা উচিত।
অন্যদিকে, একটি পিডিএফ হ'ল প্রদত্ত বিতরণের জন্য বদ্ধ-রূপের অভিব্যক্তি । এটি একটি আনুমানিক ঘনত্ব বা হিস্টগ্রাম সহ আপনার ডেটাসেটের বর্ণনা থেকে আলাদা ।
এখানে কোন কঠোর এবং দ্রুত নিয়ম নেই। আপনি যদি নিজের জনসংখ্যার ঘনত্ব জানেন তবে একটি পিডিএফ আরও ভাল। অন্যদিকে, প্রায়শই আমরা নমুনাগুলি নিয়ে কাজ করি এবং একটি হিস্টগ্রাম এমন কিছু তথ্য পৌঁছে দিতে পারে যা একটি আনুমানিক ঘনত্ব .েকে দেয়। উদাহরণস্বরূপ, অ্যান্ড্রু গেলম্যান এই বিষয়টি করেছেন:
হিস্টোগ্রামের মূল সুবিধাটি হ'ল কাঁচা ডেটার প্লট হিসাবে এটির নিজস্ব ত্রুটি নির্ধারণের বীজ রয়েছে। অথবা, এটি অন্যভাবে বলতে গেলে, সামান্য নিম্নচাপযুক্ত হিস্টোগ্রামের জাগ্রততা নমুনা পরিবর্তনের পরিবর্তনশীলতার সাথে দৃষ্টিভঙ্গি দেখিয়ে একটি দরকারী পরিষেবা সম্পাদন করে। এ কারণেই, আপনি যদি আমার বই এবং প্রকাশিত নিবন্ধগুলিতে হিস্টোগ্রামগুলি দেখেন তবে আমি প্রায় সবসময় প্রচুর বিন্দু ব্যবহার করি। আমি প্রায়শই কখনই সেই কার্নেল ঘনত্বের অনুমানগুলি পছন্দ করি না যে লোকেরা মাঝে মাঝে এক-মাত্রিক বিতরণ প্রদর্শন করতে ব্যবহার করে। আমি বরং হিস্টোগ্রামটি দেখতে এবং ডেটা কোথায় তা জানতাম।
আপেক্ষিক ফ্রিকোয়েন্সি হিস্টগ্রাম ( বিযুক্ত )
ঘনত্বের হিস্টোগ্রাম ( বিযুক্ত )
সম্ভাবনা ঘনত্ব ফাংশন পিডিএফ ( অবিচ্ছিন্ন )
এই তথ্যসূত্রগুলি সহায়ক ছিল :) http://stattrek.com/statistics/d शब्दको. aspx? definition =Probability_density_function
উপরের সাইট থেকে অবিচ্ছিন্ন_প্রবণতা_ বিতরণ
http://www.geog.ucsb.edu/~joel/g210_w07/lecture_notes/lect04/oh07_04_1.html