বহুবর্ষীয় রিগ্রেশন (এমএলআর) এর জন্য আত্মবিশ্বাসের ব্যবধানের আকার বোঝা


11

বহুবর্ষীয় রিগ্রেশনের আত্মবিশ্বাসের ব্যবধানের আকারটি বুঝতে আমার অসুবিধা হয়।

এখানে একটি কৃত্রিম উদাহরণ, । বাম চিত্রটি ইউপিভি (চিত্রবিহীন পূর্বাভাসের বৈকল্পিক) চিত্রিত করে এবং ডান গ্রাফটি আত্মবিশ্বাসের বিরতি এবং (কৃত্রিম) পরিমাপক বিন্দুগুলিকে X = 1.5, X = 2 এবং X = 3 দেখায়।Y^=a+bX+cX2

অন্তর্নিহিত তথ্য বিশদ:

  • ডেটা সেটটিতে তিনটি ডাটা পয়েন্ট (1.5% 1), (2; 2.5) এবং (3; 2.5) থাকে।

  • প্রতিটি পয়েন্টটি 10 ​​বার "পরিমাপ করা" হয়েছিল এবং প্রতিটি পরিমাপ করা মানটি । 30 ফলাফলের পয়েন্টগুলিতে একটি পোয়নোমিয়াল মডেল সহ একটি এমএলআর সঞ্চালিত হয়েছিল।y±0.5

  • আত্মবিশ্বাসের ব্যবধানটি এবং সূত্রগুলির সাথে গণনা করা হয়েছিল (উভয় সূত্রই মায়ার্স, মন্টগোমেরি, অ্যান্ডারসন-কুক, "রেসপন্স সারফেস মেথডোলজি") এর চতুর্থ সংস্করণ, পৃষ্ঠা 407 এবং 34 থেকে নেওয়া হয়েছে)Y(এক্স0)-টিα/2,()

    UPV=Var[y^(x0)]σ^2=x0(XX)1x0
    μY| এক্স0Y(এক্স0)+ +Tα/2,()
    y^(x0)tα/2,df(error)σ^2x0(XX)1x0
    μy|x0y^(x0)+tα/2,df(error)σ^2x0(XX)1x0.

tα/2,df(error)=2 এবং ।σ^2=MSE=SSE/(np)0.075

আমি আত্মবিশ্বাসের ব্যবধানের পরম মানগুলিতে বিশেষভাবে আগ্রহী নই, বরং আকারে যা কেবলমাত্র উপর নির্ভর করে ।x0(XX)1x0

চিত্র 1: এখানে চিত্র বর্ণনা লিখুন

  • ডিজাইনের জায়গার বাইরে খুব উচ্চ পূর্বাভাসিত প্রকরণটি স্বাভাবিক কারণ আমরা এক্সট্রাপোলটিং করছি

  • তবে কেন পরিমাপ করা বিন্দুগুলির তুলনায় এক্স = 1.5 এবং এক্স = 2 এর মধ্যে পার্থক্যটি ছোট?

  • এবং X = 2 এর চেয়ে বেশি মানের জন্য কেন বৈকল্পিক আরও প্রশস্ত হয় তবে X = 2.3 এর পরে X = 3 এর পরিমাপ করা বিন্দুর চেয়ে আবার ছোট হয়ে যায়?

পরিমাপক পয়েন্টগুলিতে ভেরিয়েন্সটি ছোট এবং তাদের মধ্যে বড় হওয়া কি যৌক্তিক হবে না?

সম্পাদনা করুন: একই পদ্ধতিতে তবে ডেটা পয়েন্টগুলির সাথে [(1.5%; 1), (2.25; 2.5), (3; 2.5)] এবং [(1.5%; 1), (2; 2.5), (2.5; 2.2), (3); 2.5)]।

চিত্র ২: এখানে চিত্র বর্ণনা লিখুন

চিত্র 3: এখানে চিত্র বর্ণনা লিখুন

এটা খেয়াল করা জরুরী আকর্ষণীয়, যা চিত্রে 1 এবং 2 উপর, পয়েন্ট UPV ঠিক 1. সমান মানে হল এই যে আস্থা ব্যবধান অবিকল হতে হবে সমান । পয়েন্টের ক্রমবর্ধমান সংখ্যার (চিত্র 3) দিয়ে আমরা পরিমাপ করা পয়েন্টগুলিতে UPV- মান পেতে পারি যা 1 এর চেয়ে ছোট arey^±tα/2,df(error)MSE


2
আপনি যে ডেটা দিয়ে কাজ করেন তা অন্তর্ভুক্ত করতে আপনি কি আপনার পোস্ট সম্পাদনা করতে পারেন?
স্টিফান কোলাসা

@ স্টেফানকোলাসা আমি কী ডেটা ব্যবহার করেছি তা বোঝানোর চেষ্টা করেছি। তবুও প্রশ্নটি সাধারণ উপায়ে বেশি এবং একটি নির্দিষ্ট উদাহরণে আবদ্ধ নয়।
জন টোকা টাকোস

আপনি যদি ডেটা সরবরাহ করেন তবে একটি উত্তর ব্যাখ্যা করা আরও সহজ হবে।
স্টিফান কোলাছা

উত্তর:


6

এই জাতীয় সংক্ষিপ্ত বিবরণ বোঝার দুটি প্রধান উপায় বীজগণিত - তাদের সমাধানের জন্য সাধারণ সমীকরণ এবং সূত্রগুলি - এবং জ্যামিতিক দ্বারা ম্যানিপুলেট করে বীজগণিত, যেমন নিজেই প্রশ্নে চিত্রিত হয়েছে, ভাল। তবে রিগ্রেশন সম্পর্কিত বেশ কয়েকটি দরকারী জ্যামিতিক সূত্র রয়েছে। এই ক্ষেত্রে স্পেসের ডেটা ভিজ্যুয়ালাইজ করা অন্তর্দৃষ্টি দেয়(x,y)(x,x2,y) যা অন্যথায় আসতে অসুবিধা হতে পারে।

আমরা ত্রি-মাত্রিক বস্তুগুলিকে দেখার প্রয়োজনের মূল্য প্রদান করি, যা একটি স্ট্যাটিক স্ক্রিনে করা কঠিন। (আমি অবিচ্ছিন্নভাবে ঘোরানো চিত্রগুলি বিরক্তিকর বলে মনে করি এবং তাই এটি আপনার পক্ষে থাকা কারওর পক্ষে সহায়ক হতে পারে তা সত্ত্বেও তা তাদের ক্ষতি করে না)) সুতরাং, এই উত্তরটি সবার কাছে আবেদন নাও করতে পারে। তবে যারা তাদের কল্পনা দিয়ে তৃতীয় মাত্রা যুক্ত করতে ইচ্ছুক তাদের পুরস্কৃত করা হবে। আমি আপনাকে এই প্রচেষ্টাটিতে কিছু সাবধানতার সাথে নির্বাচিত গ্রাফিক্সের সাহায্যে সহায়তা করার প্রস্তাব করছি।


আসুন স্বাধীন ভেরিয়েবল ভিজ্যুয়ালাইজেশন দিয়ে শুরু করা যাক । চতুষ্কোণ রিগ্রেশন মডেলটিতে

(1)yi=β0+β1(xi)+β2(xi2)+error,

দুটি শব্দ এবং পর্যবেক্ষণের মধ্যে পৃথক হতে পারে: এগুলি স্বতন্ত্র ভেরিয়েবল । আমরা এবং সাথে অক্ষযুক্ত একটি প্লেনে বিন্দু হিসাবে সমস্ত জোড়া প্লট করতে পারি এছাড়া এর বক্ররেখা উপর সব পয়েন্ট চক্রান্ত প্রকাশক হয় সম্ভব আদেশ জোড়া(xi)(xi2)(xi,xi2)xx2.(t,t2):

চিত্র 1

এই চিত্রটি পিছনে নিক্ষেপ করে এবং সেই মাত্রার জন্য উল্লম্ব দিকটি ব্যবহার করে তৃতীয় মাত্রায় প্রতিক্রিয়াগুলি (নির্ভরশীল পরিবর্তনশীল) ভিজ্যুয়ালাইজ করুন। প্রতিটি প্রতিক্রিয়া একটি বিন্দু প্রতীক হিসাবে চক্রান্ত করা হয়। এই সিমুলেটেড ডেটাটিতে প্রথম চিত্রটিতে প্রদর্শিত তিনটি প্রত্যেকটির জন্য দশটি প্রতিক্রিয়া রয়েছে ; প্রতিটি স্ট্যাকের সম্ভাব্য উচ্চতা ধূসর উল্লম্ব লাইনের সাথে দেখানো হয়েছে:(x,x2)

চিত্র ২

চতুর্ভুজীয় রিগ্রেশন এই পয়েন্টগুলির সাথে একটি বিমানকে ফিট করে ।

(আমরা এটি কীভাবে জানব? কারণ যে কোনও প্যারামিটারের করার জন্য স্পেসে পয়েন্টের সেট যা সমীকরণ সেগুলির শূন্য সেট ফাংশন যা ভেক্টরটির জন্য একটি সমতলকে বিশ্লেষণমূলক জ্যামিতির এই বিট চিত্রের জন্য আমাদের কিছু পরিমাণগত সমর্থনও কিনে: কারণ এই চিত্রগুলিতে ব্যবহৃত প্যারামিটারগুলি এবং এবং উভয়ই তুলনায় বড় এই বিমানটি প্রায় উল্লম্ব হবে ত্রিভুজভাবে সমতলে(β0,β1,β2),(x,x2,y)(1)β1(x)β2(x2)+(1)yβ0,(β1,β2,1).β1=55/8β2=15/2,1,(x,x2)

এই পয়েন্টগুলির সাথে এখানে সর্বনিম্ন বর্গাকার প্লেন লাগানো আছে:

এখানে চিত্র বর্ণনা লিখুন

সমতল, যা আমরা ফর্মের একটি সমীকরণ আছে অনুমান করা পারে আমি "প্রত্যাহার" আছে বক্ররেখা বক্ররেখায় এবং এটি কালো রঙে আঁকুন।y=f(x,x2),(t,t2)

t(t,t2,f(t,t2))

আসুন, সমস্ত কিছু আরও পিছনে করুন যাতে কেবল এবং অক্ষগুলি প্রদর্শিত হয়, যাতে আপনার পর্দা থেকে অদৃশ্যভাবে নেমে আসা অক্ষটি ছেড়ে যায়:xyx2

চিত্র 4

আপনি দেখতে পাবেন কীভাবে উত্তোলিত বক্ররেখাটি যথাযথভাবে পছন্দসই চতুর্ভুজীয় রিগ্রেশন হয়: এটি সমস্ত আদেশযুক্ত জোড়া টু যেখানে স্বাধীন ভেরিয়েবল সেট করার সময় লাগানো মান(x,y^)y^x.

আস্থা ব্যান্ড এই লাগানো বক্ররেখা জন্য রচিত কি হইয়া ঘটতে পারে যখন ডাটা পয়েন্টের এলোমেলোভাবে ভিন্নতা হয়। দৃষ্টিকোণটি পরিবর্তন না করেই আমি পাঁচটি ফিটেড প্লেন (এবং তাদের উত্তোলিত কার্ভগুলি) পাঁচটি স্বতন্ত্র নতুন সেটগুলিতে ডেটা তৈরি করেছি (যার মধ্যে কেবল একটি দেখানো হয়েছে):

চিত্র 5

এটি আরও ভালভাবে দেখার জন্য, আমি বিমানগুলিও প্রায় স্বচ্ছ করে তুলেছি made স্পষ্টতই উত্তোলিত বক্ররেখাগুলি এবং এর নিকটে পারস্পরিক ছেদ দেখাতে পারেx1.75x3.

আসুন ত্রি-মাত্রিক প্লটটি উপরে ঘোরাফেরা করে কিছুটা নীচে এবং বিমানের তির্যক অক্ষটি বরাবর তাকান। প্লেনগুলি কীভাবে পরিবর্তিত হয় তা আপনাকে সহায়তা করতে, আমি উল্লম্ব দিকটিও সংকুচিত করেছি।

চিত্র 6

উল্লম্ব সোনার বেড়াটি বক্ররেখার উপরে সমস্ত পয়েন্ট দেখায় যাতে আপনি আরও সহজেই দেখতে পান যে এটি পাঁচটি লাগানো প্লেন পর্যন্ত কীভাবে উপরে উঠে যায়। ধারণাগতভাবে, আত্মবিশ্বাস ব্যান্ডটি ডেটা পৃথক করে পাওয়া যায়, যার ফলে লাগানো বিমানগুলি পরিবর্তিত হয়, যার ফলে উত্তোলিত বক্ররেখা পরিবর্তিত হয়, যেহেতু তারা প্রতিটি মান এর সম্ভাব্য লাগানো মানগুলির একটি খাম খুঁজে বের করে(t,t2)(x,x2).

এখন আমি বিশ্বাস করি একটি পরিষ্কার জ্যামিতিক ব্যাখ্যা সম্ভব। যেহেতু ফর্মের পয়েন্টগুলি তাদের প্লেনে প্রায় লাইন রেখেছে, সমস্ত ফিট প্লেনগুলি এই পয়েন্টগুলির উপরে থাকা কিছু সাধারণ লাইনের চারপাশে ঘোরানো হবে (এবং একটি ছোট্ট বিড়াল টানবে)। (আসুন সেই লাইনের প্রজেক্টটি নীচে দিকে আনতে হবে: এটি প্রথম চিত্রের মধ্যে বক্ররেখার কাছাকাছি সময় আনুমানিকভাবে অনুমান করবে)) যখন এই বিমানগুলি ভিন্ন হয়, তখন উত্তোলিত বক্ররেখা পরিবর্তিত হয় ( উল্লম্বভাবে) যেকোন প্রদত্ত অবস্থানটি সরাসরি দূরত্বের সাথে সমানুপাতিক হবে থেকে lies(xi,xi2)L(x,x2)(x,x2)(x,x2)L.

চিত্র 7

এই চিত্রটি আসল পরিকল্পনাকারী দৃষ্টিকোণে প্রত্যাবর্তন করে সম্পর্কিত তুলনায় স্বতন্ত্র ভেরিয়েবলের বিমানে in এর নিকটতম বক্ররেখার দুটি বিন্দু লাল চিহ্নযুক্ত। আনুমানিকভাবে এখানে, যেখানে প্রতিক্রিয়াগুলি এলোমেলোভাবে পরিবর্তিত হওয়ায় লাগানো প্লেনগুলি নিকটবর্তী হতে হবে। সুতরাং, সম্পর্কিত মানগুলিতে উত্তোলিত বক্ররেখাগুলি (প্রায় এবং কাছাকাছি) এই পয়েন্টগুলির নিকটে কমপক্ষে পরিবর্তিত হবে।Lt(t,t2)Lx1.72.9

বীজগণিতভাবে, এই "নোডাল পয়েন্টগুলি" সন্ধান করা একটি চতুষ্কোণ সমীকরণ সমাধান করার বিষয়: সুতরাং, তাদের মধ্যে বেশিরভাগের দুটি উপস্থিত থাকবে। সুতরাং আমরা একটি সাধারণ প্রস্তাব হিসাবে আশা করতে পারি যে চতুর্ভুজ বিশিষ্ট আত্মবিশ্বাস ব্যান্ডের ডেটা ফিট করতে পারে যেখানে দুটি একসাথে নিকটে আসে - তবে এর চেয়ে বেশি আর কিছু না।(x,y)


এই বিশ্লেষণটি উচ্চতর-ডিগ্রি বহুবর্ষীয় রিগ্রেশন এবং সেইসাথে সাধারণত একাধিক প্রতিরোধের ক্ষেত্রে ধারণাগতভাবে প্রযোজ্য। যদিও আমরা তিনটি মাত্রার চেয়ে বেশি সত্যই "দেখতে" পাচ্ছি না, লিনিয়ার রিগ্রেশন এর গণিত গ্যারান্টি দেয় যে এখানে দেখানো ধরণের দ্বি এবং ত্রিমাত্রিক প্লট থেকে প্রাপ্ত অন্তর্দৃষ্টি উচ্চ মাত্রায় সঠিক রয়ে গেছে।


এই দুর্দান্ত উত্তরের জন্য আপনাকে ধন্যবাদ! আমার কাছে কখনই ঘটেনি যে চতুর্ভুজীয় রিগ্রেশন পয়েন্টগুলির সাথে একটি বিমানকে ফিট করে। এই জ্যামিতিক সূত্রগুলি সত্যই স্বজ্ঞাত, এবং আমাকে অনেক সহায়তা করেছিল।
জন টোকা টাকোস

1
এটি এমন দুর্দান্ত উত্তর - আমাদের আপনার সেরা পোস্টগুলি সংকলন করা উচিত এবং সেগুলি একটি ওপেন সোর্স বইতে তৈরি করা উচিত
জাভিয়ের বুরেট সিকোট

1
@ জাভায়ার দয়া করে এই শব্দটির জন্য আপনাকে ধন্যবাদ। আমি এরকম কিছু নিয়ে ভাবছিলাম এবং সমস্ত গঠনমূলক পরামর্শ এবং সমালোচনাকে স্বাগত জানাই।
শুক্র

1

স্বজ্ঞাত

খুব স্বজ্ঞাত এবং রুক্ষ অর্থে আপনি দুটি বহনকারী বক্ররেখা একসাথে সেলাই করা হিসাবে একটি বহুত্ববিন্দু বক্ররেখা দেখতে পাবেন (একটি ক্রমবর্ধমান একটি হ্রাস হচ্ছে)। এই লিনিয়ার কার্ভগুলির জন্য আপনি মাঝখানে সরু আকৃতি মনে করতে পারেন ।

শিখরের বাম দিকের পয়েন্টগুলির শিখরের ডানদিকে ভবিষ্যদ্বাণীগুলির তুলনামূলকভাবে খুব কম প্রভাব এবং তদ্বিপরীত।

  • সুতরাং আপনি শিখরের উভয় পক্ষের দুটি সংকীর্ণ অঞ্চল আশা করতে পারেন (যেখানে উভয় পক্ষের opালুতে পরিবর্তনগুলি তুলনামূলকভাবে খুব কম প্রভাব ফেলে)।

  • শিখরের আশেপাশের অঞ্চল তুলনামূলকভাবে অনিশ্চিত কারণ কার্ভের slালু পরিবর্তনের ফলে এই অঞ্চলে আরও বেশি প্রভাব পড়ে। আপনি শীর্ষের একটি বড় শিফট সহ অনেকগুলি বক্ররেখা আঁকতে পারেন যা পরিমাপের পয়েন্টগুলিতে এখনও যথাযথভাবে গর্তে যায়

চিত্রণ

নীচে কিছু আলাদা ডেটার সাথে একটি চিত্র দেওয়া আছে, যা এই প্যাটার্নটি (আপনি একটি ডাবল নট বলতে পারেন) কীভাবে উত্থিত হতে পারে তা আরও সহজে দেখায়:

ডাবল গিঁটের সাথে পূর্বাভাস অন্তরগুলি দেখানো হচ্ছে

set.seed(1)
x <- c(rep(c(-6, -5, 6, 5), 5))
y <- 0.2*x^2 + rnorm(20, 0, 1)
plot(x, y, 
     ylim=c(-10,30), xlim=c(-10,10),
     pch=21, col=1, bg=1, cex=0.3)

data    = list(y=y,           x=x,                x2=x^2)
newdata = list(y=rep(0,3001), x=seq(-15,15,0.01), x2=seq(-15,15,0.01)^2  )

model <- lm(y~1+x+x2, data=data)
predictions = predict(model, newdata = newdata, interval="predict")
lines(newdata$x, predictions[,1])
lines(newdata$x, predictions[,2], lty=2)
lines(newdata$x, predictions[,3], lty=2)

আনুষ্ঠানিক

চালিয়ে যাওয়া: আমি আরও আনুষ্ঠানিক ব্যাখ্যা হিসাবে পরে একটি বিভাগ রাখব। বিভিন্ন স্থানে আস্থার ব্যবধানের উপর একটি নির্দিষ্ট পরিমাপের প্রভাবটির প্রকাশ করতে সক্ষম হওয়া উচিত । এই অভিব্যক্তিতে একজনকে আরও স্পষ্টভাবে (স্পষ্টভাবে) দেখতে হবে যে কোনও নির্দিষ্ট (এলোমেলো) পরিমাপ পয়েন্টের পরিবর্তনগুলি পরিমাপের দিকগুলি থেকে আরও দূরে বিভাজনযুক্ত অঞ্চলের ত্রুটির উপর আরও প্রভাব ফেলবেx

আমি বর্তমানে পূর্বাভাস অন্তরগুলির avyেউয়ের প্যাটার্নের একটি ভাল চিত্রটি উপলব্ধি করতে পারি না তবে আমি আশা করি যে এই রুক্ষ ধারণাটি চতুর্ভুজ ফিটগুলির মধ্যে এই প্যাটার্নটি স্বীকৃতি না দেওয়ার বিষয়ে হুবারের মন্তব্যকে যথেষ্টভাবে সম্বোধন করবে। এটি চতুর্ভুজ ফিটের বিষয়ে এবং সাধারণভাবে ইন্টারপোলেশন সম্পর্কে আরও বেশি কিছু নয়, এই ক্ষেত্রে ক্ষেত্রে বিচ্ছিন্নতা বা এক্সট্রোপোলেশন নির্বিশেষে পয়েন্টগুলি থেকে দূরে প্রকাশ করা হলে নির্ভুলতা পূর্বাভাসগুলির পক্ষে কম শক্তিশালী। (আরও বেশি পরিমাপের পয়েন্ট, বিভিন্ন যোগ করা হলে অবশ্যই এই প্যাটার্নটি আরও হ্রাস পাবে )x


1
এই বৈশিষ্ট্যটি বা এটির যে কোনও সিদ্ধান্তে বিশ্বাস করতে আমার খুব কষ্ট হচ্ছে, কারণ আমি নিশ্চিত যে চতুর্ভুজীয় সামঞ্জস্যতা ঠিক এইভাবে আচরণ করে না। আপনি তাদের জন্য কিছু ন্যায্যতা প্রদান করে আমাকে বোঝাতে পারেন?
হোবল

1
আমার ধারণা এটি পয়েন্টগুলির অবস্থানের উপর নির্ভর করে। উদাহরণে পয়েন্টগুলি শীর্ষের উভয় পাশে রয়েছে। তারপরে আপনি শিখরটির অবস্থানকে এক প্রকার এক্সট্রাপোলেশন হিসাবে বিবেচনা করতে পারেন। আমি পরে আরও চরম উদাহরণ মামলা করব। (আমিও আশ্চর্য হয়েছি যে রিগ্রেশনটি কীভাবে সম্পাদন করা হয় তবে আমি কল্পনা করি যে সহগের ত্রুটিটি পরস্পর সম্পর্কিত বলে মনে করা হয় বা অন্যথায় আপনি প্রকৃতপক্ষে এই ধরণটি পান না)
Sextus Empiricus

এটি পয়েন্টগুলির অবস্থানের উপর নির্ভর করে তবে জটিল পদ্ধতিতে। (বীজগণিত দেখায় যে তথ্যের কোভারিয়ান্স ম্যাট্রিক্সের জড়িত রয়েছে।) তবে "শীর্ষে অবস্থিত পয়েন্টগুলিতে" ফোকাস করা সঠিকভাবে নয়, এমনকি কী দরকারী, তার বিবরণও রয়েছে যাচ্ছে. সহগের ত্রুটিগুলি প্রায়শই দৃ strongly ়ভাবে সম্পর্কিত হয় (যদি আপনি এবং অরথোগোনালটির আশ্বাস না দিয়ে থাকেন ), সুতরাং এটি ব্যাখ্যাটির অংশ। এই বিতর্ককে সমর্থন করার জন্য আমি প্রশ্নের মধ্যে ব্যবহৃত ডেটাগুলির চিত্রণ বিশ্লেষণ পোস্ট করেছি। x x 2(xi,xi2)xx2
শুক্র
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.