ত্রুটি শব্দটির বিতরণ প্রতিক্রিয়া বিতরণকে কীভাবে প্রভাবিত করে?


14

সুতরাং যখন আমি অনুমান যে ত্রুটি পদ সাধারণত একটি রৈখিক রিগ্রেশনে বিতরণ করা হয়, এটা কি প্রতিক্রিয়া পরিবর্তনশীল জন্য মানে y ?

উত্তর:


7

হয়তো আমি বন্ধ নই কিন্তু আমি মনে করি আমরা সম্পর্কে হতাশ করা কর্তব্য , যা আমি ওপি পড়ুন। লিনিয়ার রিগ্রেশন-এর খুব সাধারণ ক্ষেত্রে যদি আপনার মডেলটি y = X β + ϵ হয় তবে আপনার মডেলের একমাত্র স্টোকাস্টিক উপাদানটি হচ্ছে ত্রুটি শব্দ। এটি y এর নমুনা বিতরণকে নির্ধারণ করে । যদি ϵ N ( 0 , σ 2 I ) হয় তবে y | এক্স , β এন ( এক্স β ,f(y|β,X)y=Xβ+ϵyϵN(0,σ2I) । @ অ্যানিকো যা বলেছেন তা অবশ্যই f ( y ) এর ক্ষেত্রে ( এক্সের তুলনায়সামান্য , β )অবশ্যই সত্য। সুতরাং এটি দাঁড়িয়ে প্রশ্নটি কিছুটা অস্পষ্ট।y|X,βN(Xβ,σ2I)f(y)X,β


আমি সব মন্তব্য পছন্দ! এবং তারা সব ঠিক আছে বলে মনে হচ্ছে। তবে আমি কেবল সহজ উত্তরটি সন্ধান করছিলাম :) আপনি যখন ধরে নেন যে ভুল ত্রুটিটি সাধারণ বিতরণ করা হয়েছে। এটি এখন প্রায়শই বাস্তবে ঘটে যা অন্য উত্তরগুলি থেকে পরিষ্কার হয়ে যায়! অনেক ধন্যবাদ!
মার্কডোলার

17

সংক্ষিপ্ত উত্তরটি হ'ল আপনি এর বিতরণ সম্পর্কে কোনও সিদ্ধান্তে পৌঁছাতে পারবেন না , কারণ এটি এক্স এর বিতরণ এবং সম্পর্কের শক্তি এবং আকারের উপর নির্ভর করে । আরো আনুষ্ঠানিকভাবে, Y বন্টন একটি "লম্ব সংমিশ্রণ", বাস্তবে প্রশংসনীয় অনেক কিছু হতে পারে যা থাকবে।yxy

এটি চিত্রিত করার জন্য এখানে দুটি চরম উদাহরণ রয়েছে:

  1. ধরুন, কেবল দুটি সম্ভাব্য মান রয়েছে, 0 এ 1 এবং y = 10 x + N ( 0 , 1 ) । তারপর Y 0 এবং 10 বাধা বিপত্তি সঙ্গে একটি জোরালোভাবে bimodal বন্টন করতে হবে।xy=10x+N(0,1)y
  2. এখন একই সম্পর্কটি ধরে নিন, তবে 0- এর ব্যবধানে প্রচুর মান সহ সমানভাবে বিতরণ করা যাক । তারপরে y 0-10 ব্যবধানে প্রায় প্রায় সমানভাবে বিতরণ করা হবে (প্রান্তে কিছু অর্ধ-স্বাভাবিক লেজ সহ)।xy

প্রকৃতপক্ষে, যেহেতু প্রতিটি বিতরণ স্বাভাবিকের মিশ্রণ সহ স্বেচ্ছায় আনুমানিকভাবে করা যায় তাই আপনি জন্য কোনও বিতরণ পেতে পারেন ।y


8
+1 সর্বশেষ বিবৃতি পুনরায়: আমি একবারও এটি ভেবে ভুল করেছিলাম। গাণিতিকভাবে আপনি সঠিক তবে অনুশীলনে নরমাল (যেমন জে বা ইউ-আকারের বিতরণগুলি) সহ একটি অবিস্মরণীয় স্পাইকের অনুমান করা প্রায় অসম্ভব: স্প্রাইকগুলির ঘনত্ব ক্যাপচার করার জন্য নরমালগুলি তাদের শিখরে খুব সমতল। আপনার উপায় অনেক বেশি উপাদান প্রয়োজন। সাধারণগুলি ডিস্ট্রিবিউশনের জন্য ভাল যার পিডিএফগুলি খুব মসৃণ।
হোবার

1
@ ভুবার সম্মত অনুশীলনে যে কোনও বিতরণের জন্য আমি একটি সাধারণ মিশ্রণের সান্নিধ্য ব্যবহার করার পরামর্শ দেব না, আমি কেবল চরম পাল্টা-উদাহরণ দেওয়ার চেষ্টা করছিলাম।
আনিকো

5

আমরা বাস্তব ডেটাতে একটি কল্পিত মডেল চাপিয়ে ত্রুটি শব্দটি আবিষ্কার করি; ত্রুটি শব্দটির বিতরণ প্রতিক্রিয়া বিতরণকে প্রভাবিত করে না।

আমরা প্রায়শই ধরে নিয়েছি যে ত্রুটিটি সাধারণত বিতরণ করা হয় এবং এভাবে আমাদের আনুমানিক অবশিষ্টাংশগুলি সাধারণত বিতরণ করা হয় এমন মডেলটি তৈরির চেষ্টা করি। কিছু বিতরণের জন্য এটি কঠিন হতে পারে । এই ক্ষেত্রে, আমি মনে করি আপনি বলতে পারেন যে প্রতিক্রিয়া বিতরণ ত্রুটি শব্দটি প্রভাবিত করে।y


2
"আমরা প্রায়ই মডেল যেমন যে আমাদের ত্রুটি শব্দটি স্বাভাবিকভাবে বিতরণ করা হয় গঠন করা চেষ্টা" - ভালো হবে, আমি মনে করি আপনি অবশিষ্টাংশ উল্লেখ করা হয় । এগুলি হল অনুমান একই ভাবে ত্রুটি পদ যে এক্স β এর একটি অনুমান ( Y ) = এক্স β । আমরা অবশিষ্টাংশগুলি দেখতে স্বাভাবিক দেখতে চাই কারণ ত্রুটি শর্তগুলি নিয়ে এটিই আমরা ধরে নিয়েছিলাম। আমরা কোনও মডেল নির্দিষ্ট করে এটির শর্তটি "উদ্ভাবন" করি না, এটি ফিট না করে। yXβ^Xβ^E(y)=Xβ
জেএমএস

আমি আপনার নির্ভুলতার সাথে একমত, জেএমএস। +1 এবং আমি আমার উত্তর সামঞ্জস্য করব।
থমাস লেভাইন

2

আপনি যেমন প্রতিক্রিয়া লিখতে কোথায় মি "মডেল" (জন্য ভবিষ্যদ্বাণী Y ) এবং "ত্রুটিগুলি" হয়, তাহলে এই পুনরায় সাজানো ইঙ্গিত হতে পারে Y - মি = । সুতরাং ত্রুটিগুলির জন্য একটি বিতরণ বরাদ্দ করা আপনার মডেলটি কীভাবে অসম্পূর্ণ তা নির্দেশ করে। এটিকে অন্যভাবে বলতে গেলে এটি নির্দেশ করে যে আপনি যে পরিমাণ পর্যবেক্ষণ করছেন তা কেন জানেন না যে পর্যবেক্ষিত প্রতিক্রিয়াটি আসলে এটির মূল্য কী ছিল, এবং মডেলটির পূর্বাভাসটি নয় not যদি আপনি জানতেন যে আপনার মডেলটি নিখুঁত, তবে আপনি ত্রুটিগুলির জন্য শূন্যের উপর তার সমস্ত ভর সহ একটি সম্ভাব্যতা বিতরণ বরাদ্দ করবেন। একটি এন বরাদ্দ করা (

y=m+e
myeym=e মূলত বলছেন যে ত্রুটি ইউনিট ছোট σ । ধারণা যে মডেল ভবিষ্যৎবাণী "ভুল" বিভিন্ন পর্যবেক্ষণের জন্য অনুরূপ পরিমাণ দ্বারা হতে থাকে, এবং স্কেল এ "সঠিক" হয় σ । একটি বৈসাদৃশ্য হিসাবে, একটি বিকল্প নিয়োগ হয় সি একটি U Y ( 0 , γ ) যা বলছেন যে ত্রুটি অধিকাংশ ছোট, কিন্তু কিছু ত্রুটি বেশ বড় হয় - মডেল অনিয়মিত "সাঙ্ঘাতিক ভুল" বা পদ "অখাদ্য" আছে প্রতিক্রিয়া পূর্বাভাস।N(0,σ2)σσCauchy(0,γ)

এক অর্থে ত্রুটি বিতরণ প্রতিক্রিয়ার চেয়ে মডেলের সাথে আরও জড়িত। এই উপরে সমীকরণের অ identifiability থেকে দেখা যায়, যদি উভয়ের জন্য এবং অজানা তারপর একটি অবাধ ভেক্টর যোগ মি এবং তা থেকে বিয়োগ বিশালাকার একই মান Y , Y = মি + + = ( মি + ) + ( - বি ) = মি + memeyy=m+e=(m+b)+(eb)=m+e। একটি ত্রুটি বিতরণ এবং একটি মডেল সমীকরণের কার্যভার মূলত বলা হয় কোন স্বেচ্ছাসেবক ভেক্টর অন্যদের তুলনায় বেশি প্রশংসনীয়।


"This seems strange because you will only observe y once and only once (y is the complete vector/matrix/etc. of responses). How can this be "distributed"? In my view it can only be distributed in some imaginary ensemble, nothing to do with your actual observed response. At the very least, any such presumption of the response "being distributed" is untestable" I'm confused; are you saying we can't test H0:yf0 vs H1:yf1?
JMS

no, sorry, that can't be what you're saying. I'm still confused though. Maybe it's slightly imprecise, but the way I read it he's got n samples of yi from Y with fixed xi, his model is Y=Xβ+ϵ, and he's wondering what the assumed distribution of ϵ implies about the distribution of Y|β,X under his model. Here it would imply that it's normal; we can test that with our sample
JMS

@JMS - I think I might delete that first paragraph. I don't think it adds anything to my answer (besides confusion).
probabilityislogic

one of my favorite things to add to my answers :)
JMS
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.