আরএমএসইর আত্মবিশ্বাসের ব্যবধান


20

আমি জনসংখ্যার থেকে ডাটা পয়েন্টগুলির নমুনা নিয়েছি । এই পয়েন্টগুলির প্রতিটিটির একটি সত্য মান (স্থল সত্য থেকে পরিচিত) এবং একটি আনুমানিক মান। আমি তারপরে প্রতিটি নমুনাযুক্ত পয়েন্টের জন্য ত্রুটিটি গণনা করি এবং তারপরে নমুনার আরএমএসই গণনা করি।n

নমুনার আকার উপর ভিত্তি করে আমি কীভাবে এই আরএমএসইয়ের চারপাশে কিছুটা আত্মবিশ্বাসের ব্যবধান অনুমান করতে পারি ?n

আমি যদি আরএমএসইয়ের পরিবর্তে গড়টি ব্যবহার করতাম তবে আমি মানক সমীকরণটি ব্যবহার করতে পারি বলে এটি করার ক্ষেত্রে আমার সমস্যা হবে না

m=Zσn

তবে আরএমএসইয়ের পক্ষে গড়ের চেয়ে বৈধ কিনা তা আমি জানি না। এই উপায়টি কি আমি মানিয়ে নিতে পারি?

(আমি এই প্রশ্নটি দেখেছি , তবে আমার জনসংখ্যার সাধারণত বিতরণ করা হয় কিনা তা নিয়ে আমার কোনও সমস্যা নেই, যা সেখানে উত্তরটির সাথে কী উত্তর দেয়)


আপনি যখন "নমুনার আরএমএসই গণনা করেন" তখন আপনি বিশেষত কী গণনা করছেন? এটি RMSE হয় , সত্য মান এর আনুমানিক মান, বা তাদের পার্থক্যের?
হোবার

2
আমি পার্থক্যগুলির আরএমএসই গণনা করছি, এটি হ'ল সত্য এবং আনুমানিক মানের মধ্যে স্কোয়ার পার্থক্যগুলির গড়ের বর্গমূলকে গণনা করছি।
রবিন্টউ

আপনি যদি 'স্থল সত্য' জানেন (যদিও এর সত্যিকারের অর্থ আমি নিশ্চিত না) তবে কেন আরএমএসইতে আপনার অনিশ্চয়তার প্রয়োজন হবে? আপনি যে মামলার মূল সত্যতা নেই সেগুলি সম্পর্কে কি কোনও প্রকার অনুমান তৈরির চেষ্টা করছেন? এটি কি একটি ক্রমাঙ্কন সমস্যা?
গ্লেন_বি -রিনস্টেট মনিকা

@ গ্লেন_ বি: হ্যাঁ, আমরা ঠিক তাই করার চেষ্টা করছি। কেবলমাত্র নমুনার জন্য, আমাদের কাছে সমগ্র জনগণের পক্ষে স্থল সত্য নেই। তারপরে আমরা নমুনার জন্য একটি আরএমএসই গণনা করছি, এবং আমরা জনগণের আরএমএসই অনুমান করতে এই নমুনাটি ব্যবহার করছি বলে আমরা এই বিষয়ে আস্থা অন্তর রাখতে চাই।
রবিন্টইউ

উত্তর:


15

এখানে যেমন একটি যুক্তিযুক্ত , আমি কিছু শর্তে আপনার প্রশ্নের উত্তর দিতে সক্ষম হতে পারে।

যাক জন্য আপনার প্রকৃত মান হতে এবং ডাটা পয়েন্ট আনুমানিক মান। যদি আমরা ধরে নিই যে অনুমান এবং সত্য মানের মধ্যে পার্থক্য রয়েছেxiithx^i

  1. শূন্য মানে (যেমন around প্রায় বিতরণ করা হয়েছে )এক্সআমিx^ixi

  2. একটি সাধারণ বিতরণ অনুসরণ করুন

  3. এবং সবার একই মানক বিচ্যুতি σ

সংক্ষেপে:

x^ixiN(0,σ2),

তারপর আপনি সত্যিই জন্য একটি কনফিডেন্স ব্যবধান চান σ

উপরের অনুমানগুলি যদি সত্য এন এনএমএসই 2 ধরে থাকে স্বাধীনতারn(n-1) ডিগ্রিসহ একটিχ 2 n বিতরণঅনুসরণ করে। এর অর্থ

এনRMSE2σ2=এন1এনΣআমি(এক্সআমি^-এক্সআমি)2σ2
χএন2এনএন-1

পি(χα2,এন2এনRMSE2σ2χ1-α2,এন2)=1-αপি(এনRMSE2χ1-α2,এন2σ2এনRMSE2χα2,এন2)=1-αপি(এনχ1-α2,এন2RMSEσএনχα2,এন2RMSE)=1-α

অতএব, হল আপনার আত্মবিশ্বাসের ব্যবধানval

[nχ1α2,n2RMSE,nχα2,n2RMSE]

এখানে একটি অজগর প্রোগ্রাম রয়েছে যা আপনার পরিস্থিতি অনুকরণ করে

from scipy import stats
from numpy import *
s = 3
n=10
c1,c2 = stats.chi2.ppf([0.025,1-0.025],n)
y = zeros(50000)
for i in range(len(y)):
    y[i] =sqrt( mean((random.randn(n)*s)**2))

print "1-alpha=%.2f" % (mean( (sqrt(n/c2)*y < s) & (sqrt(n/c1)*y > s)),)

আশা করি এইটি কাজ করবে.

অনুমানগুলি প্রযোজ্য কিনা তা আপনি নিশ্চিত না হন বা আমি যা লিখেছি তা অন্য কোনও পদ্ধতিতে তুলনা করতে চাইলে আপনি সর্বদা বুটস্ট্র্যাপিং চেষ্টা করতে পারেন ।


1
σ

1
MSE=σ^2=1এনΣআমি=1এন(এক্সআমি-এক্স^আমি)2এনএন-1σσ

10

আমি=1,...,এনএক্সআমিএক্স^আমি

εআমি

εআমি=এক্স^আমি-এক্সআমি,পক্ষপাত=ε¯=1এনΣআমি=1এনεআমি,MSE=ε2¯=1এনΣআমি=1এনεআমি2,RMSE=MSE

ε

STDE2=(ε-ε¯)2¯=1এনΣআমি=1এন(εআমি-ε¯)2,
STDE2=(ε-ε¯)2¯=ε2¯-ε¯2=RMSE2-পক্ষপাত2

εএন<30STDE/এন


2
আরএমএস2=এসটিডি2আরএমএস2বিআমিএকজনএস2χ2χ2
ফেবি

0

σ(আরএমএস^)/আরএমএস=12এন
এন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.