হিস্টোগ্রাম এবং পিডিএফ মধ্যে পার্থক্য?


18

যদি আমরা দৃশ্যমানভাবে একটি অবিচ্ছিন্ন ডেটা বন্টন দেখতে চাই, তবে হিস্টোগ্রাম এবং পিডিএফ এর মধ্যে কোনটি ব্যবহার করা উচিত?

হিস্টোগ্রাম এবং পিডিএফ-এর মধ্যে সূত্রের ভিত্তিতে নয়, ফর্মুলা কী?


আপনি কি দয়া করে পরিষ্কার করতে পারেন যে এই প্রশ্নটি ডেটা (যার বিতরণটি হিস্টগ্রাম দ্বারা উপস্থাপিত হতে পারে) বা তাত্ত্বিক গঠন (যেমন একটি পিডিএফ, যা সম্ভাব্যতা বন্টন বর্ণনা করে) সম্পর্কিত কিনা।
হোবল

4
কিন্তু পিডিএফ কোথা থেকে আসে? সংজ্ঞা অনুসারে, একটি পিডিএফ একটি তাত্ত্বিক সম্ভাব্যতা বন্টন বর্ণনা করে। আপনি সম্ভবত এডিএফ (অভিজ্ঞতা অভিজ্ঞতা বিতরণ) বোঝাতে চান?
হোবার

উত্তর:


22

ডার্কস পয়েন্টটি স্পষ্ট করতে:

বলুন আপনার ডেটা একটি সাধারণ বিতরণের একটি নমুনা। আপনি নিম্নলিখিত প্লটটি নির্মাণ করতে পারেন:

বিকল্প পাঠ

লাল রেখাটি অনুমিত ঘনত্বের অনুমান, নীল রেখাটি অন্তর্নিহিত স্বাভাবিক বন্টনের তাত্ত্বিক পিডিএফ। মনে রাখবেন যে হিস্টগ্রাম এখানে ঘনত্বের মধ্যে নয়, ঘনত্বের সাথে প্রকাশিত হয়েছে। এটি চক্রান্তের উদ্দেশ্যে করা হয়, সাধারণ ফ্রিকোয়েন্সি হিস্টোগ্রামে ব্যবহৃত হয়।

সুতরাং আপনার প্রশ্নের উত্তর দেওয়ার জন্য: আপনি যদি নিজের নমুনাটি বর্ণনা করতে চান তবে আপনি অনুমিত অভিজ্ঞতা (যেমন হিস্টোগ্রাম) এবং পিডিএফ ব্যবহার করেন যদি আপনি অনুমানযুক্ত অন্তর্নিহিত বিতরণটি বর্ণনা করতে চান to

আর তে কোড অনুসরণ করে প্লট তৈরি করা হয়:

x <- rnorm(100)
y <- seq(-4,4,length.out=200)

hist(x,freq=F,ylim=c(0,0.5))
lines(density(x),col="red",lwd=2)
lines(y,dnorm(y),col="blue",lwd=2)

ফ্রিকোয়েন্সি এবং ঘনত্বের মধ্যে পার্থক্য কী?
লক্ষ্যা

2
@ লক্ষীর ফ্রিকোয়েন্সি গণনা করা। সংক্ষিপ্ত সমস্ত ফ্রিকোয়েন্সি পর্যবেক্ষণের সংখ্যার সমান। পিডিএফ (সম্ভাব্যতা ঘনত্ব ফাংশন) এর জন্য ঘনত্ব সংক্ষিপ্ত, যা একটি নির্দিষ্ট মান থাকার সম্ভাবনার জন্য প্রক্সি। পিডিএফ এর অধীনে
অঞ্চলটির

13

একটি হিস্টগ্রাম একটি ঘনত্বের প্রাক-কম্পিউটার বয়সের প্রাক্কলন। একটি ঘনত্বের অনুমান একটি বিকল্প।

আজকাল আমরা উভয়ই ব্যবহার করি এবং একটি সমৃদ্ধ সাহিত্য রয়েছে যা সম্পর্কে কারও ডিফল্ট ব্যবহার করা উচিত।

অন্যদিকে, একটি পিডিএফ হ'ল প্রদত্ত বিতরণের জন্য বদ্ধ-রূপের অভিব্যক্তি । এটি একটি আনুমানিক ঘনত্ব বা হিস্টগ্রাম সহ আপনার ডেটাসেটের বর্ণনা থেকে আলাদা ।


1
μσ2density

*ab***ab**$\sqrt{2}$2

6

এখানে কোন কঠোর এবং দ্রুত নিয়ম নেই। আপনি যদি নিজের জনসংখ্যার ঘনত্ব জানেন তবে একটি পিডিএফ আরও ভাল। অন্যদিকে, প্রায়শই আমরা নমুনাগুলি নিয়ে কাজ করি এবং একটি হিস্টগ্রাম এমন কিছু তথ্য পৌঁছে দিতে পারে যা একটি আনুমানিক ঘনত্ব .েকে দেয়। উদাহরণস্বরূপ, অ্যান্ড্রু গেলম্যান এই বিষয়টি করেছেন:

হিস্টোগ্রামে বিভিন্নতা

হিস্টোগ্রামের মূল সুবিধাটি হ'ল কাঁচা ডেটার প্লট হিসাবে এটির নিজস্ব ত্রুটি নির্ধারণের বীজ রয়েছে। অথবা, এটি অন্যভাবে বলতে গেলে, সামান্য নিম্নচাপযুক্ত হিস্টোগ্রামের জাগ্রততা নমুনা পরিবর্তনের পরিবর্তনশীলতার সাথে দৃষ্টিভঙ্গি দেখিয়ে একটি দরকারী পরিষেবা সম্পাদন করে। এ কারণেই, আপনি যদি আমার বই এবং প্রকাশিত নিবন্ধগুলিতে হিস্টোগ্রামগুলি দেখেন তবে আমি প্রায় সবসময় প্রচুর বিন্দু ব্যবহার করি। আমি প্রায়শই কখনই সেই কার্নেল ঘনত্বের অনুমানগুলি পছন্দ করি না যে লোকেরা মাঝে মাঝে এক-মাত্রিক বিতরণ প্রদর্শন করতে ব্যবহার করে। আমি বরং হিস্টোগ্রামটি দেখতে এবং ডেটা কোথায় তা জানতাম।


3
আমাকে অবশ্যই স্বীকার করতে হবে আমি কখনই পুরোপুরি বুঝতে পারি না কেন জেলম্যান ছোট বিন প্রস্থ সহ হিস্টোগ্রামের ব্যবহারের পক্ষে পরামর্শ দেয়; সুপার্পোজযুক্ত কার্নেল ঘনত্বের প্রাক্কলন সহ স্ট্রিপচার্ট প্লট বা কাঁচা ডেটা কেন ব্যবহার করা হচ্ছে না, যা পর্যবেক্ষণ করা ডেটার অভিজ্ঞতাগত বিতরণকে আরও ভাল করে বোঝায়?
chl

2
@ সিএইচএল: স্যাম্পলিংয়ের পরিবর্তনশীলতার ধারণাটি পাওয়ার জন্য অবশ্যই অন্যান্য ভাল ভিজ্যুয়ালাইজেশন পদ্ধতি রয়েছে। তবে এখানে আলোচনার অধীনে হিস্টোগ্রাম বনাম পিডিএফ-এর সংক্ষিপ্ত তুলনা সম্পর্কে, আমি মনে করি যে তাঁর বক্তব্যটি ভালভাবে তৈরি হয়েছে।
Ars

1
এটি একটি দুর্দান্ত লিঙ্ক, যেমনটি এখানে আলোচনা করা হয়েছে। তবে, এই দৃষ্টিভঙ্গি কি সিমুলেশনগুলির জন্য ধারণ করে, সেই ক্ষেত্রে আমরা আসলে ঘনত্বের অনুমান করার চেষ্টা করছি?
ডেভিড লেবাউর 21

1

আপেক্ষিক ফ্রিকোয়েন্সি হিস্টগ্রাম ( বিযুক্ত )

  • 'y' অক্ষ হ'ল সাধারন গণনা count
  • 'y' অক্ষটি সেই নির্দিষ্ট বিন / ব্যাপ্তির জন্য পৃথক সম্ভাবনা
  • সাধারণ হিসাবে গণনাগুলি 1 অবধি

ঘনত্বের হিস্টোগ্রাম ( বিযুক্ত )

  • 'y' অক্ষ হ'ল ঘনত্বের মান ('বিনা প্রস্থ' দ্বারা বিভক্ত 'সাধারণ গণনা')
  • বার অঞ্চলগুলি সমষ্টি 1

সম্ভাবনা ঘনত্ব ফাংশন পিডিএফ ( অবিচ্ছিন্ন )

  • পিডিএফ হিস্টোগ্রামের ধারাবাহিক সংস্করণ, যেহেতু হিস্টগ্রামের বিনগুলি পৃথক হয়
  • কার্ভের অধীনে মোট অঞ্চলটি 1 তে সংহত করে

এই তথ্যসূত্রগুলি সহায়ক ছিল :) http://stattrek.com/statistics/d शब्दको. aspx? definition =Probability_density_function

উপরের সাইট থেকে অবিচ্ছিন্ন_প্রবণতা_ বিতরণ

http://www.geog.ucsb.edu/~joel/g210_w07/lecture_notes/lect04/oh07_04_1.html

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.