আমি কার্নেলের ঘনত্বের অনুমান করতে আর-তে ' ঘনত্ব ' ফাংশনটি ব্যবহার করার চেষ্টা করছি । ফলাফলগুলি ব্যাখ্যা করতে এবং বিভিন্ন ডেটাসেটের তুলনা করতে আমার কিছুটা সমস্যা হচ্ছে কারণ মনে হয় বক্ররেখার অধীনে অঞ্চলটি অগত্যা 1 নয়। কোনও সম্ভাবনার ঘনত্ব ফাংশন (পিডিএফ) জন্য আমাদের অঞ্চলটি ∫ ∞ - ∞ ϕ ( x ) d x = 1 । আমি ধরে নিচ্ছি যে কার্নেলের ঘনত্বের অনুমান পিডিএফ রিপোর্ট করে reports আমি বক্ররেখার নীচে অঞ্চলটি অনুমান করার জন্য sfsmisc থেকে ইন্টিগ্রেট.ক্সি ব্যবহার করছি ।
> # generate some data
> xx<-rnorm(10000)
> # get density
> xy <- density(xx)
> # plot it
> plot(xy)
> # load the library
> library(sfsmisc)
> integrate.xy(xy$x,xy$y)
[1] 1.000978
> # fair enough, area close to 1
> # use another bw
> xy <- density(xx,bw=.001)
> plot(xy)
> integrate.xy(xy$x,xy$y)
[1] 6.518703
> xy <- density(xx,bw=1)
> integrate.xy(xy$x,xy$y)
[1] 1.000977
> plot(xy)
> xy <- density(xx,bw=1e-6)
> integrate.xy(xy$x,xy$y)
[1] 6507.451
> plot(xy)
বক্ররেখার ক্ষেত্রফলটি সর্বদা 1 হওয়া উচিত নয়? মনে হচ্ছে ছোট ব্যান্ডউইথগুলি একটি সমস্যা, তবে কখনও কখনও আপনি লেজগুলিতে বিবরণ ইত্যাদি প্রদর্শন করতে চান এবং ছোট ব্যান্ডউইথের প্রয়োজন হয়।
আপডেট / উত্তরঃ
> xy <- density(xx,n=2^15,bw=.001)
> plot(xy)
> integrate.xy(xy$x,xy$y)
[1] 1.000015
> xy <- density(xx,n=2^20,bw=1e-6)
> integrate.xy(xy$x,xy$y)
[1] 2.812398