লিনিয়ার রিগ্রেশন-এ পূর্বাভাসিত মানগুলির জন্য আত্মবিশ্বাসের ব্যবধানের আকার


69

আমি লক্ষ করেছি যে একটি লিনিয়ার রিগ্রেশন মধ্যে পূর্বাভাসিত মানগুলির জন্য আস্থার ব্যবধান ভবিষ্যদ্বাণীকারীর ন্যূনতম এবং সর্বাধিক মানগুলির কাছাকাছি পূর্বাভাসকের গড় এবং চর্বি হিসাবে প্রায় সংকীর্ণ থাকে। এটি এই 4 লিনিয়ার রিগ্রেশনগুলির প্লটে দেখা যায়:

এখানে চিত্র বর্ণনা লিখুন

আমি প্রাথমিকভাবে ভেবেছিলাম কারণ এটি ছিল ভবিষ্যদ্বাণীকারীদের বেশিরভাগ মানগুলি ভবিষ্যদ্বাণীকের গড়ের চারপাশে কেন্দ্রীভূত হয়েছিল। যাইহোক, আমি তখন লক্ষ্য করেছি যে আত্মবিশ্বাসের ব্যবধানের সংকীর্ণ মাঝারিটি ঘটবে এমনকি যদি অনেকগুলি মান পূর্বাভাসকারীর চূড়াগুলির চারপাশে কেন্দ্রীভূত হয় তবে নীচে বাম লিনিয়ার রিগ্রেশন হিসাবে, যা পূর্বাভাসীর অনেকগুলি মান সর্বনিম্নের কাছাকাছি কেন্দ্রীভূত হয় ভবিষ্যদ্বাণী।

লিনিয়ার রিগ্রেশন মধ্যে পূর্বাভাসিত মানগুলির জন্য আস্থা অন্তর কেন মাঝখানে সংকীর্ণ এবং চূড়ান্তভাবে চর্বি বলে বোঝাতে সক্ষম কেউ?

উত্তর:


86

আমি এটি স্বজ্ঞাত পদে আলোচনা করব।

আবেগের আত্মবিশ্বাসের অন্তর এবং ভবিষ্যদ্বাণী উভয় বিরতি এই বিষয়টি বিবেচনা করে যে বিরতি এবং opeাল অনিশ্চিত - আপনি ডেটা থেকে মানগুলি অনুমান করেন, তবে জনসংখ্যার মানগুলি ভিন্ন হতে পারে (যদি আপনি একটি নতুন নমুনা নিয়ে থাকেন তবে আপনি আলাদা অনুমান করতে পারবেন মান)।

একটি রিগ্রেশন রেখা কেটে যাবে এবং সেই পয়েন্টের চারপাশে ফিটের পরিবর্তনগুলি নিয়ে আলোচনার কেন্দ্রবিন্দু করা ভাল - যে লাইনটি সম্পর্কে ভাবতে হবে (এই সূচনায়, )।(x¯,y¯)y=a+b(xx¯)a^=y¯

লাইনটি যদি পয়েন্টটি দিয়ে যায় তবে slালটি কিছুটা বেশি বা নিম্ন ছিল (অর্থাত্ যদি মাঝের লাইনের উচ্চতা স্থির করা হয়েছিল তবে opeালটি কিছুটা আলাদা ছিল) তবে কী হবে? দেখতে কেমন?(x¯,y¯)

আপনি দেখতে পাবেন যে নতুন লাইনটি মাঝের কাছের চেয়ে প্রান্তের কাছাকাছি থেকে বর্তমান রেখাটি থেকে আরও দূরে সরে যাবে এবং এক ধরণের স্ল্যাটেড এক্স তৈরি করবে যা গড় পেরিয়ে গেছে (নীচের বেগুনি রেখাগুলির প্রতিটি যেমন লাল রেখার সাথে সম্পর্কিত ; বেগুনি রেখাগুলি আনুমানিক ope -দুপুরে theালের দুটি মানের ত্রুটি উপস্থাপন করে)।±

এখানে চিত্র বর্ণনা লিখুন

যদি আপনি estiালের সাথে এর অনুমানের থেকে কিছুটা পৃথক পৃথক রেখার একটি সংগ্রহ আঁকেন তবে আপনি প্রান্তটি 'ফ্যান আউট' এর কাছাকাছি পূর্বাভাসিত মানগুলির বন্টন দেখতে পাবেন (ধূসর বর্ণের দুটি বেগুনি রেখার মধ্যবর্তী অঞ্চলটি কল্পনা করুন, উদাহরণস্বরূপ, কারণ আমরা আবার নমুনা নিয়েছি এবং আনুমানিক একটির কাছে এমন অনেক opালু আঁকছি; আমরা বিন্দু ( )) এর মধ্য দিয়ে একটি লাইন বুটস্ট্র্যাপ করে এর উপলব্ধি পেতে পারি । প্যারামেট্রিক বুটস্ট্র্যাপ সহ 2000 টি রেজসম ব্যবহার করে এখানে একটি উদাহরণ দেওয়া হয়েছে:x¯,y¯

এখানে চিত্র বর্ণনা লিখুন

আপনি ধ্রুবক অনিশ্চয়তা হিসাব যদি পরিবর্তে (উপার্জন লাইন পাস ঘনিষ্ঠ কিন্তু বেশ মাধ্যমে ), যে কোনো সময়ে গড় জন্য আপ করুন এবং নিচে লাইন চলে আসে, তাই অন্তর হবে লাগানো লাইনের উপরে এবং নীচে বসে থাকুন।(x¯,y¯)x

এখানে চিত্র বর্ণনা লিখুন

(এখানে বেগুনি লাইনগুলি আনুমানিক লাইনের উভয় পাশের ধ্রুবক শব্দটির দুটি মানগত ত্রুটি - )।±

যখন আপনি উভয়ই একসাথে করেন (লাইনটি একটি সামান্য বিট উপরে বা নীচে হতে পারে এবং slাল কিছুটা খাড়া বা অগভীর হতে পারে), তখন আপনি মাঝখানে কিছুটা স্প্রেড পাবেন, , কারণ অনিশ্চয়তার কারণে ধ্রুবক, এবং yourালের অনিশ্চয়তার কারণে আপনি কিছু অতিরিক্ত কৌতুক অর্জন করেন, এর মধ্যে আপনার প্লটের বৈশিষ্ট্যযুক্ত হাইপারবোলিক আকার তৈরি করে।x¯

এটা অন্তর্দৃষ্টি।


এখন, আপনি যদি চান তবে আমরা কিছুটা বীজগণিত বিবেচনা করতে পারি (তবে এটি অত্যাবশ্যক নয়):

এটি আসলে সেই দুটি প্রভাবের স্কোয়ারের যোগফলের বর্গমূল - এটি আপনি আত্মবিশ্বাসের বিরতির সূত্রে দেখতে পারেন। টুকরো টুকরো করা যাক:

সহ স্ট্যান্ডার্ড এরর পরিচিত (স্মরণ কর এখান থেকে প্রত্যাশিত মান এ গড় , না স্বাভাবিক পথিমধ্যে; এটি শুধু একটি গড় একটি প্রমিত ত্রুটি)। এটি গড় ( ) লাইনের অবস্থানের স্ট্যান্ডার্ড ত্রুটি ।abσ/nayxx¯

সহ স্ট্যান্ডার্ড এরর পরিচিত । কিছু মান এ opeালুতে অনিশ্চয়তার প্রভাবটি আপনি গড় থেকে কত দূরে ( ) দ্বারা গুণিত হয় (কারণ স্তরের পরিবর্তনটি আপনার সরে যাওয়ার দূরত্বের slালের বারের পরিবর্তন) ।baσ/i=1n(xix¯)2xxx¯(xx¯)σ/i=1n(xix¯)2

এখন সামগ্রিক প্রভাবটি এই দুটি জিনিসের স্কোয়ারের যোগফলের মূল বর্গমূল (কেন? কারণ অসামঞ্জস্যযুক্ত জিনিসের রূপগুলি যুক্ত করে, এবং যদি আপনি আপনার লাইনটি আকারে লিখেন , এবং এর অনুমানগুলি অসামঞ্জস্যিত So সুতরাং সামগ্রিক মান ত্রুটিটি সামগ্রিক পরিবর্তনের বর্গমূল, এবং ভেরিয়েন্সটি উপাদানগুলির পরিবর্তনের যোগফল - যা আমাদের রয়েছেy=a+b(xx¯)ab

(σ/n)2+[(xx¯)σ/i=1n(xix¯)2]2

সামান্য সাধারণ হেরফেরটি এ গড় মানের অনুমানের স্ট্যান্ডার্ড ত্রুটির জন্য সাধারণ শব্দটি দেয় :x

σ1n+(xx¯)2i=1n(xix¯)2

যদি আপনি এটি ফাংশন হিসাবে আঁকেন তবে আপনি দেখতে পাবেন এটি একটি বক্ররেখা তৈরি করে (হাসির মতো দেখায়) সর্বনিম্ন , যা আপনি বেরিয়ে যাওয়ার সাথে সাথে বড় হয়। এটিই লাগানো লাইন থেকে সংযুক্ত / বিয়োগ করা হয় (ভাল, এটির একাধিকটি, একটি পছন্দসই আত্মবিশ্বাসের স্তর পাওয়ার জন্য)।ˉ xxx¯

[পূর্বাভাস অন্তরগুলির সাথে, প্রক্রিয়াটির পরিবর্তনের কারণে অবস্থানের পার্থক্যও রয়েছে; এটি আরও একটি শব্দ যুক্ত করে যা সীমাটিকে উপরে এবং নীচে সরিয়ে নিয়ে যায়, আরও ব্যাপকতর ছড়িয়ে পড়ে এবং কারণ যে শব্দটি বর্গমূলের নীচে যোগফলকে প্রাধান্য দেয়, বক্রতাটি খুব কম উচ্চারণ করা হয়]]


ধন্যবাদ গ্লেন_ বি যে খুব স্বজ্ঞাত। আত্মবিশ্বাসের ব্যবধানটি এটিই আমার মনকে ছাড়েনি।
লুচিয়ানো

1

গৃহীত উত্তর প্রকৃতপক্ষে প্রয়োজনীয় স্বজ্ঞাততা এনেছে। এটি কেবল রৈখিক এবং কৌণিক অনিশ্চয়তা উভয়ের সংমিশ্রণের ভিজ্যুয়ালাইজেশনকে মিস করে, যা প্রশ্নের প্লটগুলিতে খুব সুন্দরভাবে উল্লেখ করে। সুতরাং এখানে এটি যায়। এর কল করা যাক a'এবং b'এর অনিশ্চয়তা a, এবং bযথাক্রমে, পরিমাণে সাধারণভাবে কোনো জনপ্রিয় পরিসংখ্যান প্যাকেজ দ্বারা ফিরে আসেন। তারপরে আমাদের কাছে সেরা ফিট ছাড়াও a*x + bচারটি সম্ভাব্য লাইন আঁকতে হবে (1 কোভারিয়েট এক্স এর ক্ষেত্রে):

  • (a+a')*x + b+b'
  • (a-a')*x + b-b'
  • (a+a')*x + b-b'
  • (a-a')*x + b+b'

এটি নীচের গ্রাফের চারটি সংযুক্ত লাইন। মাঝখানে কালো ঘন লাইনটি অনিশ্চয়তা ছাড়াই সেরা ফিটকে উপস্থাপন করে। সুতরাং "হাইপারবোলিক" শেডগুলি আঁকতে, এই চারটি রেখার সর্বাধিক এবং ন্যূনতম মানগুলি একত্রিত করা উচিত, যা প্রকৃতপক্ষে চারটি রেখাংশ রয়েছে, সেখানে কোনও বক্ররেখা নেই (আমি অবাক হই যে এই ফেন্সি প্লটগুলি বক্ররেখাকে কীভাবে আঁকিয়েছে, মনে হয় না) আমার কাছে কোনও নির্ভুল)।

আমি আশা করি এটি @ গ্লেন_বি এর ইতিমধ্যে সুন্দর উত্তরে কিছু যুক্ত করেছে।

এখানে চিত্র বর্ণনা লিখুন

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.