লিনিয়ার রিগ্রেশন প্রেডিকশন ইন্টারভাল


24

যদি আমার ডাটা পয়েন্টগুলির মধ্যে সর্বোত্তম রৈখিক আনুমানিকতা (সর্বনিম্ন স্কোয়ার ব্যবহার করে) লাইন হয় তবে আমি কীভাবে আনুমানিক ত্রুটি গণনা করতে পারি? যদি আমি পর্যবেক্ষণ এবং পূর্বাভাসগুলির মধ্যে পার্থক্যগুলির স্ট্যান্ডার্ড বিচ্যুতি গণনা করি , তবে আমি পরে বলতে পারি যে একটি বাস্তব (তবে পর্যবেক্ষণ করা হয়নি) মান অন্তর অন্তর্গত ( ) সম্ভাব্যতা সহ ~ 68%, সাধারণ বিতরণ ধরে?y=mx+bei=real(xi)(mxi+b)yr=real(x0)[ypσ,yp+σ]yp=mx0+b

স্পষ্ট করা:

আমি একটি ফাংশন কিছু পয়েন্ট মূল্যায়ন করে পর্যবেক্ষণ করেছি । আমি এই পর্যবেক্ষণগুলিকে একটি লাইনে ফিট করি । জন্য যে আমি পালন করে নি, আমি জানতে চাই কিভাবে বড় করতে পারেন চাই হতে। উপরের পদ্ধতিটি ব্যবহার করে, এটি কি ঠিক বলেছেন যে সাথে। ~ 68%?f(x)xil(x)=mx+bx0f(x0)l(x0)f(x0)[l(x0)σ,l(x0)+σ]


1
আমার মনে হয় আপনি পূর্বাভাস অন্তরগুলি সম্পর্কে জিজ্ঞাসা করছেন। তবে দ্রষ্টব্য, আপনি " " এর পরিবর্তে " " ব্যবহার করেন । এটি কি টাইপো? আমরা এর ভবিষ্যদ্বাণী করি নাxiyix
গুং - মনিকা পুনরায়

@gung: আমি ব্যবহার x উদাহরণ সময় জন্য বোঝাতে, এবং y যে সময়ে কিছু ভেরিয়েবলের মান, তাই y=f(x) মানে যে আমি একটি পর্যবেক্ষণ করেছেন y এ সময় x । Y এর আসল মান থেকে ফিটিং ফাংশন পূর্বাভাস কত দূর হতে পারে তা জানতে চাই want যে জানার জন্য? ফাংশন real(xi) ফেরৎ "সঠিক" মান yxi , আর আমার ডাটা পয়েন্টের গঠিত (xi,real(xi))
বিএমএক্স

1
এটি পুরোপুরি যুক্তিযুক্ত বলে মনে হচ্ছে। আমি যে অংশগুলিতে ফোকাস করছি সেগুলি হ'ল, " ", সাধারণত আমরা একটি রেগ মডেলের ত্রুটিগুলি / অবশিষ্টাংশগুলিকে " e i = হিসাবে মনে করি y i - ( মি x আমি + বি ) "। অবশিষ্টাংশ এর এসডি করে ভবিষ্যদ্বাণী অন্তর গণক একটি ভূমিকা পালন করে। এটি " x iei=real(xi)(mxi+b)ei=yi(mxi+b)xiআমি ভাবছি করছি যদি এটি একটি টাইপো, অথবা আপনি কিছু আমাকে চিনতে পারছেন না সম্পর্কে বলছি; "যে আমার কাছে অদ্ভুত।
পুনর্বহাল মনিকা - gung

আমার মনে হয় আমি দেখছি; আমি আপনার সম্পাদনা মিস করেছি এর মানে দাড়ায় যে সিস্টেম পুরোপুরি নির্ণায়ক হয় & যদি আপনি অ্যাক্সেস ছিল বাস্তব অন্তর্নিহিত ফাংশন, আপনি সবসময় ভবিষ্যদ্বাণী করতে পারে পুরোপুরি W / O ত্রুটি। নিয়মিত মডেলগুলি সম্পর্কে আমরা সাধারণত এমনভাবে চিন্তা করি না। yi
গুং - মনিকা পুনরায়

4
বিএমএক্স, আমার কাছে মনে হচ্ছে আপনার কাছে আপনার প্রশ্ন সম্পর্কে একটি পরিষ্কার ধারণা এবং কয়েকটি বিষয় সম্পর্কে ভাল সচেতনতা রয়েছে। আপনি তিনটি ঘনিষ্ঠভাবে সম্পর্কিত থ্রেড পর্যালোচনা করতে আগ্রহী হতে পারে। stats.stackexchange.com/questions/17773 ননটেকনিকাল পদগুলিতে পূর্বাভাস অন্তরগুলি বর্ণনা করে; stats.stackexchange.com/questions/26702 আরও গাণিতিক বিবরণ দেয়; এবং stats.stackexchange.com/questions/9131 এ , রব হ্যান্ডম্যান আপনার সন্ধানের সূত্রটি সরবরাহ করে। যদি এগুলি আপনার প্রশ্নের পুরোপুরি উত্তর না দেয় তবে কমপক্ষে তারা আপনাকে এটি পরিষ্কার করার জন্য একটি মানক স্বরলিপি এবং শব্দভাণ্ডার দিতে পারে।
হুবুহু

উত্তর:


30

@ হুইবার আপনাকে তিনটি উত্তরের জন্য নির্দেশ করেছেন তবে সম্ভবত আমি এখনও মূল্যবোধের কিছু লিখতে পারি। আপনার স্পষ্ট প্রশ্নটি যেমন আমি বুঝতে পেরেছি তা হ'ল:

আমার লাগানো প্রদত্ত Y আমি = মি এক্স আমি + + y^i=m^xi+b^ (নোটিশ আমি 'টুপি' যোগ করা হয়েছে) , এবং আমার অবশিষ্টাংশ স্বাভাবিকভাবে বিতরণ অভিমানী হয়, , আমি এখনো হিসাবে একটি যে পূর্বাভাস দিতে পারি অলক্ষিত প্রতিক্রিয়া, Y এন W , সঙ্গে একটি পরিচিত predictor মান, এক্স এন W , ব্যবধান মধ্যে পড়ে যাবে ( Y - σ , Y + + σN(0,σ^e2)ynewxnew , সম্ভাব্যতার সাথে 68%?(y^σe,y^+σe)

স্বজ্ঞাতভাবে, উত্তরটি 'হ্যাঁ' হওয়া উচিত বলে মনে হলেও সত্য উত্তরটি সম্ভবত । এটি তখন ঘটবে যখন প্যারামিটারগুলি (যেমন, এবং σ ) জানা থাকে এবং ত্রুটি ছাড়াই। আপনি যেহেতু এই প্যারামিটারগুলি অনুমান করেছেন তাই আমাদের তাদের অনিশ্চয়তা বিবেচনায় নেওয়া উচিত। m,b,σ

আসুন প্রথমে আপনার অবশিষ্টাংশগুলির মানক বিচ্যুতি সম্পর্কে ভাবি। এটি আপনার ডেটা থেকে অনুমান করা হয়েছে বলে অনুমানের ক্ষেত্রে কিছু ত্রুটি হতে পারে। ফলস্বরূপ, আপনার পূর্বাভাস ব্যবধান গঠনের জন্য আপনার যে বিতরণটি ব্যবহার করা উচিত তা সাধারণ নয়, হওয়া উচিত । তবে, যেহেতু টি দ্রুত স্বাভাবিকের দিকে রূপান্তরিত হয়, এটি অনুশীলনে সমস্যা হওয়ার সম্ভাবনা কম। tdf errort

সুতরাং, আমরা শুধু ব্যবহার করতে পারেন Y নতুন ± টি ( 1 - α / 2 , df প্রয়োগ ত্রুটি ) গুলি পরিবর্তে Y নতুন ± z- র ( 1 - α / 2 ) গুলি , এবং আমাদের শুভ পথে সম্পর্কে যাব? দুর্ভাগ্যক্রমে না. বড় ইস্যু সেখানে অনিশ্চয়তা কারণে যে অবস্থানে সাড়া শর্তসাপেক্ষ গড় আপনার অনুমান সম্পর্কে অনিশ্চয়তা থাকেন তবে আপনার অনুমান হয় মি & । সুতরাং,y^new±t(1α/2, df error)sy^new±z(1α/2)sm^b^আপনার ভবিষ্যৎবাণী স্ট্যান্ডার্ড ডেভিয়েশন শুধু চেয়ে বেশি নিগমবদ্ধ প্রয়োজন serror । কারণ ভেরিয়ানস যোগ , ভবিষ্যৎবাণী আনুমানিক ভ্যারিয়েন্স হবে: নোটিশ যে, " এক্স " নতুন জন্য নির্দিষ্ট মান প্রতিনিধিত্ব করতে subscripted হয় পর্যবেক্ষণ এবং " s 2 " যথাযথভাবে সাবস্ক্রিপশন করা হয়েছে। অর্থাৎ, আপনার পূর্বাভাস ব্যবধানটি এক্স বরাবর নতুন পর্যবেক্ষণের অবস্থানের উপর নির্ভরশীল

spredictions(new)2=serror2+Var(m^xnew+b^)
xs2xঅক্ষ। আপনার ভবিষ্যদ্বাণীগুলির স্ট্যান্ডার্ড বিচ্যুতিটি নিম্নলিখিত সূত্রের সাথে আরও স্বাচ্ছন্দ্যে অনুমান করা যেতে পারে: হিসাবে একটি আকর্ষণীয় সাইড নোট, আমরা এই সমীকরণ থেকে ভবিষ্যদ্বাণী অন্তর সম্পর্কে কিছু তথ্য আবিষ্কার করতে পারেন। প্রথমত, ভবিষ্যদ্বাণী অন্তর আরো ডেটা আমরা ছিল যখন আমরা (এই হল কম অনিশ্চয়তা আছে, কারণ ভবিষ্যদ্বাণী মডেল নির্মিত সংকীর্ণ হতে হবেমি&)। দ্বিতীয়ত, পূর্বাভাসগুলি সুনির্দিষ্ট হবে যদি সেগুলিআপনার মডেলটি বিকাশের জন্য ব্যবহৃতx টিমানের সাথে তৈরি করা হয়, তৃতীয় মেয়াদটির সংখ্যার0 হবে। কারণটি হ'ল সাধারণ পরিস্থিতিতেএক্সএর গড় সময়ে আনুমানিক slাল সম্পর্কে কোনও অনিশ্চয়তা নেই
spredictions(new)=serror2(1+1N+(xnewx¯)2(xix¯)2)
m^b^x0x, রিগ্রেশন লাইনের প্রকৃত উলম্ব অবস্থান সম্পর্কে কেবল কিছু অনিশ্চয়তা। সুতরাং, পূর্বাভাস মডেলগুলি তৈরির জন্য কিছু পাঠ শিখতে হবে: যে আরও তথ্য উপাত্ত, 'তাত্পর্য' সন্ধানের সাথে নয়, ভবিষ্যতের ভবিষ্যদ্বাণীগুলির নির্ভুলতার উন্নতি করার জন্য; এবং যে আপনার ভবিষ্যতে ভবিষ্যদ্বাণী করা উচিত (যেখানে এই সংখ্যাকে হ্রাস করতে) আপনার ডেটা সংগ্রহের প্রচেষ্টাগুলি কেন্দ্রিয় হওয়া উচিত তবে সেই কেন্দ্র থেকে পর্যবেক্ষণগুলি যতটা সম্ভব প্রসারিত করুন (সেই সংখ্যাকে সর্বাধিকতর করতে)।

এই পদ্ধতিতে সঠিক মান গণনা করে, আমরা তারপরে এটি উল্লিখিত হিসাবে উপযুক্ত বিতরণ দিয়ে ব্যবহার করতে পারি । t

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.