আত্মবিশ্বাসের ব্যবধান এবং ভবিষ্যদ্বাণী ব্যবস্থার মধ্যে পার্থক্য


80

লিনিয়ার রিগ্রেশনটিতে পূর্বাভাস ব্যবধানের জন্য আপনি এখনও বিরতি উত্পন্ন করতে ব্যবহার করেন। আপনি একটি আত্মবিশ্বাসের ব্যবধান তৈরি করতে এটি ব্যবহার করেন । দুজনের মধ্যে পার্থক্য কী?E^[Y|x]=β0^+β^1xE[Y|x0]


7
E^[Y|x]=β0^+β^1x "অন্তর তৈরি করে না"।
Glen_b

উপরের উত্তরগুলির মধ্যে দুটি পদ্ধতির মধ্যে বিভক্ত হওয়ার কোনও কারণ আমি দেখতে পাচ্ছি না। রিগ্রেশন ফলাফলগুলি সাধারণত প্যারামিট্রিক শিক্ষার্থীর টি বিতরণের প্যারামিটারগুলির ভিত্তিতে এবং সাধারণত রিগ্রেশন ভিত্তিতে অনুমান করা হয়, বিশেষত ডেটা রিগ্রেশন মডেলগুলির সাথে খারাপভাবে মিলে যাওয়া থেকে, অবশিষ্টাংশগুলিতে নেতৃত্ব দেয় যা স্টাডাইজড হয় না, উদাহরণস্বরূপ, স্কিউড হয় না বিশেষত ভারী লেজগুলি সাধারণত (যদি সর্বদা না থাকে) তৈরি করে তাদের সম্পর্কিত প্রত্যাশিত পরিমাপক কোয়ান্টাইলের চেয়ে ডেটা বিচ্ছুরণের প্যারাম্যাট্রিক ব্যবস্থা। থাম্বের একটি নিয়ম আমি দরকারী বলে মনে করেছি: যদি আমি বিদেশী, দীর্ঘ লেজ, এবং ইউ এর সাথে অবশিষ্টাংশগুলি দেখতে পাই
কার্ল

উত্তর:


75

আপনার প্রশ্নটি বেশ সঠিক নয়। আপনি যেমন বলছেন তেমন একটি আত্মবিশ্বাসের ব্যবধান জন্য একটি পরিসর দেয় । একটি পূর্বাভাস ব্যবধানটি জন্য একটি ব্যাপ্তি দেয় । স্বাভাবিকভাবেই, আমাদের সেরা অনুমান হয় অন্তর উভয় একই মান, চারপাশে কেন্দ্রীভূত হবে, তাই ।Y Y [ Y | এক্স ] এক্স βE[yx]yyE[yx]xβ^

@Greg বলেন, মান ত্রুটি বিভিন্ন হতে যাচ্ছে --- আমরা প্রত্যাশিত মান অনুমান আরো স্পষ্ট করে চেয়ে, আমরা নির্ধারণ করেছি নিজেই। অনুমান করার জন্য প্রকৃত ত্রুটি শব্দটি থেকে আসা বৈকল্পিকগুলিও অন্তর্ভুক্ত থাকে।y yE[yx]yy

পার্থক্যটি চিত্রিত করার জন্য, কল্পনা করুন যে আমরা আমাদের সহগগুলির নিখুঁত অনুমান পেতে পারি । তারপরে, আমাদের অনুমানটি নিখুঁত হবে। কিন্তু আমরা এখনও তা নিশ্চিত না হবে নিজেই ছিল একটি সত্য ত্রুটি শব্দটি যে আমরা বিবেচনা করতে হবে না থাকায়। আমাদের আত্মবিশ্বাস "বিরতি" কেবলমাত্র একটি পয়েন্ট হবে কারণ আমরা অনুমান করি যে ঠিক সঠিক, তবে আমাদের ভবিষ্যদ্বাণী ব্যবধানটি আরও বিস্তৃত হবে কারণ আমরা সত্য ত্রুটির শব্দটিকে বিবেচনা করি।[ y x ] y [ y x ]βE[yx]yE[yx]

অতএব, একটি পূর্বাভাস অন্তর একটি আত্মবিশ্বাসের ব্যবধানের চেয়ে প্রশস্ত হবে।


40

পূর্বাভাস ব্যবধান এবং আত্মবিশ্বাসের ব্যবধানের মধ্যে পার্থক্য হ'ল মান ত্রুটি।

গড় হিসাবে একটি আত্মবিশ্বাস ব্যবধানের জন্য স্ট্যান্ডার্ড ত্রুটি নমুনার কারণে অনিশ্চয়তা বিবেচনা করে। আপনার নমুনা থেকে আপনি যে রেখাটি গণনা করেছেন তা লাইন থেকে আলাদা হবে যা গণনা করা হত যদি আপনার পুরো জনসংখ্যা থাকে, স্ট্যান্ডার্ড ত্রুটি এই অনিশ্চয়তাটিকে বিবেচনায় নেয়।

কোনও পৃথক পর্যবেক্ষণে পূর্বাভাস ব্যবধানের জন্য স্ট্যান্ডার্ড ত্রুটি উপরের মতো নমুনা তৈরির কারণে অনিশ্চয়তার বিষয়টি বিবেচনা করে, তবে ভবিষ্যদ্বাণী করা গড়ের আশেপাশের ব্যক্তিদের পরিবর্তনের বিষয়টিও বিবেচনা করে। পূর্বাভাস ব্যবধানের জন্য স্ট্যান্ডার্ড ত্রুটি আত্মবিশ্বাসের ব্যবধানের চেয়ে আরও বিস্তৃত হবে এবং তাই ভবিষ্যদ্বাণী ব্যবধানটি আত্মবিশ্বাসের ব্যবধানের চেয়ে প্রশস্ত হবে।


39

আমি নীচের ব্যাখ্যাটি সহায়ক বলে মনে করেছি:

আত্মবিশ্বাসের বিরতিগুলি আপনাকে কতটা ভালভাবে গড় নির্ধারণ করেছে তা আপনাকে জানায়। ধরে নিন যে ডেটাগুলি এলোমেলোভাবে গাউসির বিতরণ থেকে নমুনাযুক্ত। আপনি যদি এটি বহুবার করেন এবং প্রতিটি নমুনা থেকে গড়ের একটি আত্মবিশ্বাসের ব্যবধান গণনা করেন, আপনি আশা করতে পারেন যে এই অন্তরগুলির প্রায় 95% জনসংখ্যার আসল মান অন্তর্ভুক্ত করবেন। মূল বিষয়টি হ'ল আত্মবিশ্বাসের ব্যবধান আপনাকে সত্য জনসংখ্যার প্যারামিটারের সম্ভাব্য অবস্থান সম্পর্কে বলে।

পূর্বাভাস অন্তরগুলি আপনাকে জানায় যে আপনি পরবর্তী ডেটা পয়েন্টের নমুনা দেখতে কোথায় আশা করতে পারেন। ধরে নিন যে ডেটাগুলি এলোমেলোভাবে গাউসির বিতরণ থেকে নমুনাযুক্ত। ডেটার নমুনা সংগ্রহ করুন এবং ভবিষ্যদ্বাণী ব্যবধান গণনা করুন। তারপরে জনসংখ্যার থেকে আরও একটি মান নমুনা করুন। আপনি যদি অনেকবার এটি করেন, আপনি প্রত্যাশা করতেন যে পরবর্তী মানটি সেই ভবিষ্যদ্বাণী ব্যবধানের মধ্যে 95% নমুনাগুলির মধ্যে রয়েছে key মূল বক্তব্যটি হ'ল পূর্বাভাস ব্যবধান আপনাকে মানগুলির বন্টন সম্পর্কে বলে, জনসংখ্যা নির্ধারণে অনিশ্চয়তা না মানে।

ভবিষ্যদ্বাণী ব্যবধানগুলি জনসংখ্যার মান বোঝার ক্ষেত্রে ডেটা বিক্ষিপ্ত উভয়ের অনিশ্চয়তার জন্য অবশ্যই দায়বদ্ধ। সুতরাং একটি পূর্বাভাস অন্তর একটি আত্মবিশ্বাস ব্যবধান চেয়ে সর্বদা প্রশস্ত হয়।

সূত্র: http://www.ographicpad.com/support/faqid/1506/


এখানে "ডেটা স্ক্যাটার" বলতে হ্যাকের অর্থ কী?
টেলিফোন করুন

2
@ হিট: স্পষ্টতই বৈকল্পিক
ভনজড

36

একটি হ'ল ভবিষ্যতের পর্যবেক্ষণের পূর্বাভাস এবং অন্যটি হ'ল ভবিষ্যদ্বাণী করা গড় প্রতিক্রিয়া। আমি পার্থক্যটি কোথায় এবং কোথা থেকে এসেছে তা ব্যাখ্যা করার জন্য আমি আরও বিশদ উত্তর দেব, পাশাপাশি আত্মবিশ্বাসের চেয়ে এই পার্থক্যটি কীভাবে বিস্তৃত অন্তরঙ্গগুলিতে পূর্বাভাসের জন্য প্রকাশিত হয়।

এই উদাহরণটি আত্মবিশ্বাস এবং পূর্বাভাসের ব্যবধানগুলির মধ্যে পার্থক্যের চিত্র তুলে ধরতে পারে: ধরুন আমাদের কাছে একটি রিগ্রেশন মডেল রয়েছে যা শয়নকক্ষ, আকার ইত্যাদির উপর ভিত্তি করে বাড়ির দামের পূর্বাভাস দেয় যেখানে প্রদত্ত জন্য দুটি ধরণের পূর্বাভাস দিতে পারি :x0

  1. আমরা বৈশিষ্ট্যযুক্ত বাজারে আসা একটি নির্দিষ্ট নতুন বাড়ির দামের পূর্বাভাস দিতে পারি ( "এই বাড়ির জন্য পূর্বাভাসের কী? "? )। এর আসল দাম হবে । যেহেতু , পূর্বাভাসের হবে এই ভবিষ্যদ্বাণীটির বৈকল্পিকতা মূল্যায়নের ক্ষেত্রে, আমাদের about সম্পর্কে আমাদের অনিশ্চয়তা অন্তর্ভুক্ত করতে হবে পাশাপাশি আমাদের ভবিষ্যদ্বাণী সম্পর্কে আমাদের অনিশ্চয়তা (আমাদের পূর্বাভাসের ত্রুটি) এবং তাই অবশ্যই (আমাদের পূর্বাভাসের ত্রুটি) বৈচিত্র অন্তর্ভুক্ত করতে হবে । একে সাধারণত ভবিষ্যতের মূল্যের পূর্বাভাস বলা হয়x0x0

    y=x0Tβ+ϵ
    E(ϵ)=0
    y^=x0Tβ^
    β^ϵ
  2. এছাড়া আমরা যাদের কাছে একটা বাড়ির গড় মূল্য পূর্বাভাস দিতে পারি বৈশিষ্ট্য ( "কি বৈশিষ্ট্য সঙ্গে একটি ঘর জন্য গড় মূল্য হবে ?" )। বিন্দুর অনুমানটি এখনও , তবে এখন কেবলমাত্র in এর বৈকল্পিক হিসাবে গণ্য করা দরকার। এটিকে সাধারণত গড় প্রতিক্রিয়ার পূর্বাভাস বলা হয় x0x0

    y^=x0Tβ^
    β^

বেশিরভাগ সময়, আমরা যা চাই তা হ'ল প্রথম ঘটনা। আমরা জানি যে

var(x0Tβ^)=x0T(XTX)1x0σ2

এটি আমাদের গড় প্রতিক্রিয়া (কেস 2) এর বৈকল্পিক। তবে, ভবিষ্যতের পর্যবেক্ষণের একটি পূর্বাভাসের জন্য (কেস 1) মনে রাখবেন যে আমাদের এর বৈকল্পিক প্রয়োজন ; ভ্যারিয়েন্স হয়েছে এবং স্বাধীন হতে অধিকৃত হয় । কিছু সাধারণ বীজগণিত ব্যবহার করে, এটি নিম্নলিখিত আত্মবিশ্বাসের বিরতিতে ফলাফল করে:ε σ 2 βx0Tβ^+ϵϵσ2β^

  1. জন্য একটি একক ভবিষ্যৎ প্রতিক্রিয়ার জন্য সি আই :Y 0 ± টি ( α / 2 ) এন - পি σx0

    y^0±tnp(α/2)σ^x0T(XTX)1x0+1
  2. গড় প্রতিক্রিয়া দেওয়া সি আই :Y 0 ± টি ( α / 2 ) এন - পি σx0

    y^0±tnp(α/2)σ^x0T(XTX)1x0

যেখানে a একটি টি-স্ট্যাটিস্টিক যেখানে of কোয়ান্টিলিতে স্বাধীনতার ডিগ্রি রয়েছে । এন - পি α / 2tnpα/2npα/2

আশা করা যায় এটি কেন ভবিষ্যদ্বাণী ব্যবধান সর্বদা বিস্তৃত এবং দুটি ব্যবধানের মধ্যে অন্তর্নিহিত পার্থক্যটি আরও স্পষ্ট করে তোলে। এই উদাহরণটি ফ্যারাওয়ে, আর, সেকেন্ড সহ লিনিয়ার মডেলগুলি থেকে অভিযোজিত হয়েছিল। 4.1।


2
একটি সুস্পষ্ট এবং চিন্তাশীল প্রতিক্রিয়া দ্বারা পুরানো থ্রেড যথেষ্ট উন্নত দেখতে ভাল লাগছে। আমাদের সাইটে আপনাকে স্বাগতম!
শুকনো

এটি হওয়া উচিত নয় ... x0 + 1 / n +1 (পূর্বাভাস ব্যবধানের জন্য (1)), এবং ... x0 + 1 / এন (আত্মবিশ্বাসের ব্যবধানের জন্য (2) _ www2.stat.duke.edu /~tjl13/s101/slides/unit6lec3H.pdf রিয়েল
স্ট্যাটিসটিক্স

12

সংক্ষিপ্ত উত্তর:

একটি ভবিষ্যদ্বাণী ব্যবধান একটি এলোপাতাড়ি ভেরিয়েবলের এখনো পালন করা (পূর্বাভাস) সঙ্গে যুক্ত একটি বিরতি হয়।

একটি আত্মবিশ্বাসের বিরতি একটি প্যারামিটারের সাথে যুক্ত একটি অন্তর এবং এটি একটি ঘনত্ববাদী ধারণা।

আর এর পূর্বাভাস প্যাকেজের স্রষ্টা রব হ্যান্ডম্যানের কাছ থেকে এখানে পুরো উত্তরটি পরীক্ষা করুন


3

এই উত্তরটি সেই পাঠকদের জন্য যারা পূর্ববর্তী উত্তরগুলি পুরোপুরি বুঝতে পারেন নি। আসুন একটি নির্দিষ্ট উদাহরণ আলোচনা করা যাক। মনে করুন আপনি মানুষের ওজন তাদের উচ্চতা, লিঙ্গ (পুরুষ, মহিলা) এবং ডায়েট (স্ট্যান্ডার্ড, লো কার্ব, নিরামিষ) থেকে অনুমান করার চেষ্টা করছেন। বর্তমানে পৃথিবীতে 8 বিলিয়নেরও বেশি লোক রয়েছে। অবশ্যই, আপনি একই উচ্চতা এবং অন্যান্য দুটি পরামিতি তবে বিভিন্ন ওজনযুক্ত হাজার হাজার লোককে দেখতে পাবেন। তাদের ওজন বন্যভাবে পৃথক হয় কারণ তাদের মধ্যে কিছুতে স্থূলত্ব রয়েছে এবং অন্যরা অনাহারে ভুগতে পারেন। সেই লোকদের বেশিরভাগই মাঝখানে কোথাও থাকবে।

একটি কাজ হ'ল তিনটি ব্যাখ্যামূলক ভেরিয়েবলের একই মান থাকা সমস্ত ব্যক্তির গড় ওজনের পূর্বাভাস দেওয়া। এখানে আমরা আত্মবিশ্বাসের ব্যবধানটি ব্যবহার করি। আরেকটি সমস্যা হ'ল কিছু নির্দিষ্ট ব্যক্তির ওজন পূর্বাভাস দেওয়া। এবং আমরা সেই ব্যক্তির জীবিত পরিস্থিতি জানি না। এখানে ভবিষ্যদ্বাণী ব্যবধান অবশ্যই ব্যবহার করা উচিত। এটি একই পয়েন্টকে কেন্দ্র করে, তবে এটি অবশ্যই আত্মবিশ্বাসের ব্যবধানের চেয়ে অনেক প্রশস্ত হতে হবে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.