ওএলএসের অবশিষ্টাংশগুলি সাধারণত বিতরণ না করা হলে রিগ্রেশন


43

এই সাইটটিতে বেশ কয়েকটি থ্রেড রয়েছে যা কীভাবে নির্ধারণ করবেন যে ওএলএসের অবশিষ্টাংশগুলি সাধারণত অসম্পূর্ণভাবে সাধারণত বিতরণ করা হয়। আর কোড সহ অবশিষ্টাংশের স্বাভাবিকতা মূল্যায়নের আরেকটি উপায় এই দুর্দান্ত উত্তরে সরবরাহ করা হয়েছে । মানকৃত এবং পর্যবেক্ষিত অবশিষ্টাংশগুলির মধ্যে ব্যবহারিক পার্থক্য সম্পর্কে এটি আরেকটি আলোচনা is

তবে আসুন আমরা এই উদাহরণটির মতো অবশিষ্টাংশগুলি অবশ্যই সাধারণত বিতরণ করা হয় না । এখানে আমাদের কয়েক হাজার পর্যবেক্ষণ রয়েছে এবং পরিষ্কারভাবে আমাদের অবশ্যই সাধারণভাবে বিতরণকৃত অবশিষ্টাংশ অনুমানকে প্রত্যাখ্যান করতে হবে। সমস্যার সমাধানের একটি উপায় হ'ল উত্তরে বর্ণিত মজবুত অনুমানের কিছু ফর্ম নিয়োগ। তবে আমি ওএলএস-এর মধ্যে সীমাবদ্ধ নই এবং বাস্তবে আমি অন্যান্য গ্ল্যাম বা অ-লিনিয়ার পদ্ধতিগুলির সুবিধাগুলি বুঝতে চাই।

ওএলএস-এর অবশেষত অনুমানের স্বাভাবিকতা লঙ্ঘন করে ডেটা মডেল করার সর্বাধিক দক্ষ উপায় কোনটি? বা কমপক্ষে একটি শব্দ রিগ্রেশন বিশ্লেষণ পদ্ধতিটি বিকাশের প্রথম পদক্ষেপটি কী হওয়া উচিত?


5
বেশ কয়েকটি থ্রেডও রয়েছে যে কীভাবে স্বাভাবিকতার জন্য বিভিন্ন উদ্দেশ্যে প্রয়োজনীয়ভাবে অপ্রাসঙ্গিক তা নিয়ে আলোচনা করা হচ্ছে । আপনার যদি স্বতন্ত্র পর্যবেক্ষণ থাকে এবং কমপক্ষে মাঝারি নমুনার আকার থাকে তবে ওএলএসের অনুমানের জন্য গুরুত্বপূর্ণ বিষয়টি হল সমস্ত অবশিষ্টাংশের একই বৈচিত্র রয়েছে। স্বাভাবিকতা নয়। যদি আপনি স্ট্যান্ডার্ড ত্রুটির মজবুত / heteroskedasticity- সামঞ্জস্যপূর্ণ / স্যান্ডউইচ / হুবার-আইকার-হোয়াইট অনুমান ব্যবহার করেন তবে এমনকি ধ্রুবক ভিন্নতার প্রয়োজন হয় না।
অতিথি

@ গেষ্ট আমি কেবল সেই থ্রেডে স্বাভাবিকতা পরীক্ষার দক্ষতা সম্পর্কে পড়ছি। রিগ্রেশন বিশ্লেষণ এমনকি ট্যাগ হয় না।
রবার্ট কুব্রিক

ব্যবহার করে দেখুন এই এক । এখানে একটি বাহ্যিক লিঙ্ক । এবং যেমন ওএলএস অধ্যায়গুলি দেখুন স্টক এবং ওয়াটসন, ইকোনোমেট্রিক্সের পরিচিতি । আমি শপথ করছি আমি এই জিনিসগুলি তৈরি করছি না!
অতিথি

@ গুয়েস্ট দুটি লিঙ্ক ফলাফলের স্বাভাবিকতা বন্টন নিয়ে কাজ করেছে, অবশিষ্টাংশ নয়।
রবার্ট কুব্রিক

1
না তারা না। লেখকরা প্রায়শই "এক্স এর ওয়াই শর্তাধীন বিতরণ" এর জন্য শর্টহ্যান্ড হিসাবে "ওয়াইয়ের বিতরণ" উল্লেখ করেন। আপনার মূল প্রশ্নে ফিরে যেতে; আপনার যদি একটি ক্ষুদ্র নমুনা বা ব্যাপকভাবে ভারী-লেজযুক্ত ডেটা না থাকে তবে শক্তিশালী স্ট্যান্ডার্ড ত্রুটির সাথে ওএলএস ব্যবহার করা ভাল প্রথম পদক্ষেপ। এই ক্ষেত্রে সাধারণতা কেবল একটি ইস্যু নয়।
অতিথি

উত্তর:


53

সাধারণ ন্যূনতম স্কোয়ারের অনুমানটি এখনও সাধারণ-ত্রুটিজনিত ত্রুটির মধ্যে যুক্তিসঙ্গত অনুমানক। বিশেষত, গাউস-মার্কভ থিওরেম বলেছে যে সাধারণ ন্যূনতম স্কোয়ারের অনুমান যতক্ষণ ত্রুটি হয় ততক্ষণ রিগ্রেশন কো-স্যাফিসিয়েন্টগুলির ('সেরা' অর্থ সর্বোত্তম যার অর্থ সর্বোত্তম) এর সেরা লিনিয়ার নিরপেক্ষ অনুমানক (বিএলইউ) is

(1) এর অর্থ শূন্য

(2) অসম্পর্কিত হয়

(3) ধ্রুব বৈকল্পিকতা আছে

এখানে লক্ষ্য করুন যে এখানে স্বাভাবিকতার কোনও শর্ত নেই (বা ত্রুটিগুলি আইআইডি হওয়ার কোনও শর্তও )।

আপনি যখন আত্মবিশ্বাসের ব্যবধান এবং / বা মূল্যগুলি পাওয়ার চেষ্টা করছেন তখন স্বাভাবিকতার শর্তটি কার্যকর হয়। @ মিশেল চেরনিকের উল্লেখ হিসাবে (+1, বিটিডাব্লু) ততক্ষণ ত্রুটিগুলি স্বাভাবিক হওয়ার সময় পর্যন্ত যখন আপনি স্বাভাবিকতা থেকে প্রস্থান পদ্ধতি দ্বারা পরিচালিত হতে পারে ততক্ষণ আপনি দৃust় সূচনা ব্যবহার করতে পারেন - উদাহরণস্বরূপ, (যেমন আমরা এই থ্রেডে আলোচনা করেছি ) হুবার এম সত্য-ত্রুটি বিতরণ যখন স্বাভাবিক এবং দীর্ঘ লেজযুক্ত বিতরণের মধ্যে মিশ্রণ হয় (যা আপনার উদাহরণটি দেখে মনে হয়) তবে স্বাভাবিকতা থেকে অন্য প্রস্থানগুলির জন্য সহায়ক নাও হতে পারে -স্টিমেটর মজবুত অনুমান সরবরাহ করতে পারে। মাইলের মধ্যে একটি আকর্ষণীয় সম্ভাবনা রয়েছে যা ওএলএস অনুমানের জন্য আস্থার ব্যবধানগুলি অর্জন করার জন্য বুটস্ট্র্যাপিং এবং হুবার-ভিত্তিক অনুমানের সাথে এটি কীভাবে তুলনা করে তা দেখে।পিএম

সম্পাদনা: আমি প্রায়শই শুনেছি যে আপনি অ-স্বাভাবিক ত্রুটিগুলি যত্ন নেওয়ার জন্য কেন্দ্রীয় সীমাবদ্ধ তত্ত্বের উপর নির্ভর করতে পারেন - এটি সর্বদা সত্য নয় (আমি কেবল প্রতিবাদের উদাহরণগুলির বিষয়ে বলছি না যেখানে উপপাদ্য ব্যর্থ হয়)। ইন বাস্তব তথ্য উদাহরণ ওপি বোঝায়, আমরা একটি বড় নমুনা আকার আছে কিন্তু একটি দীর্ঘ-টেইলড ত্রুটি বন্টন প্রমাণ দেখতে পারেন - পরিস্থিতিতে যেখানে আপনি দীর্ঘ ত্রুটি টেইলড আছে, আপনি অগত্যা দিতে কেন্দ্রীয় সীমা উপপাদ্য উপর নির্ভর করতে পারবে না বাস্তবসম্মত সসীম নমুনা আকারের জন্য আপনি আনুমানিক পক্ষপাতহীন অনুমান। উদাহরণস্বরূপ, ত্রুটিগুলি যদি 2.01 ডিগ্রির স্বাধীনতার সাথে একটি ডিস্ট্রিবিউশন অনুসরণ করে (যা স্পষ্টভাবে এর বেশি নয়টি2.01 ওপি-র ডেটা-তে দেখা ত্রুটিগুলির তুলনায় দীর্ঘ-লেজযুক্ত), সহগের প্রাক্কলনগুলি সাধারণভাবে বিতরণ করা হয়, তবে অন্যান্য সংক্ষিপ্ত-লেজযুক্ত বিতরণগুলির তুলনায় এটি "কিক ইন" করতে অনেক বেশি সময় নেয়।

নীচে, আমি একটি অশোধিত সিমুলেশন সঙ্গে প্রকট মধ্যে Rযে যখন , যেখানে ε আমি ~ T 2.01 , এর স্যাম্পলিং বন্টন β 1 এখনও বেশ দীর্ঘ টেইলড এমনকি যখন নমুনা আকার হয় এন = 4000 :Yআমি=1+ +2এক্সআমি+ +εআমিεআমি~টি2.01β^1এন=4000

set.seed(5678)
B = matrix(0,1000,2)
for(i in 1:1000)
{
    x = rnorm(4000) 
    y = 1 + 2*x + rt(4000,2.01)
    g = lm(y~x)
    B[i,] = coef(g)
}
qqnorm(B[,2])
qqline(B[,2])

এখানে চিত্র বর্ণনা লিখুন


2
+1, এটি বিষয়টির সত্যই একটি দুর্দান্ত ওভারভিউ। আমি বিশেষভাবে সম্পাদনা প্রশংসা করি। সম্পর্কে বিশেষ কিছু আছে কি ? এটা ভয়ানক নির্দিষ্ট মনে হয়। =2.01
গুং - মনিকা পুনরায়

2
@ গুং, ধন্যবাদ - আমি বেছে নিয়েছি যেহেতু টি- ডিস্ট্রিবিউটেড এলোমেলো ভেরিয়েবলের বৈকল্পিকতা বিদ্যমান নেই যখন d f 2 থাকে এবং তাই কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি প্রয়োগ না হয়। =2.01টি2
ম্যাক্রো

1
@ গৌরব, এটি দীর্ঘকালীন লেজ ত্রুটি থাকা অবস্থায় আপনি সিএলটি অন্ধভাবে বিশ্বাস করতে পারবেন না তা প্রমাণ করার জন্য এটি একটি সংলগ্ন উদাহরণ। আমি সম্মত অনেক অ্যাপ্লিকেশনের জন্য কিন্তু উদাহরণঃ (মধ্যে চরম হয় stats.stackexchange.com/questions/29636/... ) ওপি রাখতে, ডেটা শো উল্লেখ একটি খুব দীর্ঘ টেইলড ত্রুটি বন্টন - আকৃতি থেকে একটু ভিন্ন বিতরণ, তবে এটি স্পষ্টভাবে কম দীর্ঘ-লেজযুক্ত নয়, এবং এটি বাস্তব তথ্য থেকে ফলাফল। এটি হাইলাইট করার জন্য আমি আমার "সম্পাদনা" সম্পাদনা করব। টি2.01
ম্যাক্রো

2
পি

2
@ গ্যাস্ট, আমি কখনই ওএলএসের বিরুদ্ধে তর্ক করি না। আসলে, আমি মনে করি আমার উত্তরের একটি বড় অংশটি হ'ল যে কোনও বিতরণী অনুমান বিবেচনা না করেই ওএলএস করণীয় যুক্তিসঙ্গত জিনিস ছিল। আমি কখনই তর্ক করিনি যে কঠোর স্বাভাবিকতা অবশ্যই অনুমানের জন্য মেনে চলতে হবে - আমি যা বলছি তা হ'ল, যখন আপনার দীর্ঘ লেজযুক্ত ত্রুটি থাকে, তখন স্বাভাবিক আনুমানিকতার ভিত্তিতে অনুমান বিভ্রান্তিকর হতে পারে (আমি নিশ্চিত না / কীভাবে যদি এতে একমত না হয় আপনি যা বলছেন সব সহ) এবং একজনকে বিকল্প হিসাবে বিবেচনা করার পরামর্শ দেওয়া হবে (যেমন বুটস্ট্র্যাপ)। ।
ম্যাক্রো

10

আমি মনে করি আপনি অবশিষ্টাংশের সমস্ত সম্পত্তি দেখতে চান।

  1. স্বাভাবিক অবস্থা
  2. ধ্রুব বৈকল্পিক
  3. একটি covariate এর সাথে সম্পর্কিত
  4. উপরের সংমিশ্রণ

যদি এটি মাত্র 1 হয় এবং এটি একটি ভারী লেজের কারণে হেভিটেলস বা স্কিউনেসের কারণে হয় তবে শক্তিশালী প্রতিরোধ ব্যবস্থা ভাল পদ্ধতির হতে পারে বা সম্ভবত স্বাভাবিকতায় রূপান্তরিত হতে পারে। যদি এটি অ স্থির বৈকল্পিক হয় তবে একটি বৈকল্পিক স্থিতিশীল রূপান্তর বা ভেরিয়েন্স ফাংশনকে মডেল করার চেষ্টা করুন। যদি এটি মাত্র 3 হয় তবে সেই কোভেরিয়েট জড়িত মডেলের একটি ভিন্ন রূপের পরামর্শ দেয়। ভেক্টর বা রেডিয়ুয়ালগুলি বুটস্ট্র্যাপিংয়ে যে সমস্যাই হোক না কেন সর্বদা একটি বিকল্প।


1 এর জন্য, আপনি ভারী লেজযুক্ত অবশিষ্টাংশের স্বাভাবিকতায় রূপান্তর সম্পর্কে কিছুটা ব্যাখ্যা করতে পারেন?
রবার্ট কুব্রিক

2
লগ রূপান্তর বা বাক্স-কক্সের সাথে ছোট ল্যাম্বদা লেজগুলি সঙ্কুচিত করে। এটি কিছু ভারী এবং স্কিউড বিতরণের জন্য কাজ করতে পারে। কোনও রূপান্তরগুলি খুব ভারী-লেজযুক্ত বিতরণের জন্য কাজ করবে কিনা আমি জানি না।
মাইকেল চেরনিক

3
মাইকেলের উত্তরে উত্তর। রিগ্রেশন অনুমান এবং সাধারণ বিপরীতে জড়িত আত্মবিশ্বাসের ব্যবধানগুলির জন্য আমি নিয়মিত বুটস্ট্র্যাপ ব্যবহার শুরু করেছি এবং আমার আর rmsপ্যাকেজে এটি সহজ করে তুলেছি । তবে আপনি যেমন পরামর্শ দিয়েছিলেন, এমন একটি রূপান্তর সন্ধান করুন যা বৈকল্পিক স্থিতিশীলতার উন্নতি করে এবং কখনও কখনও অবশিষ্টাংশের স্বাভাবিকতা উন্নত করে আমাদের প্রায়শই বিভিন্ন সুবিধা রয়েছে, এমনকি যদি আমরা বুটস্ট্র্যাপ করিও। "ভুল" রূপান্তরটি ব্যবহার করে স্বল্প স্কোয়ারের অনুমানগুলি খুব অদক্ষ হতে পারে এবং পূর্বাভাসগুলিতে বৃহত গড় পরম এবং মাঝারি পরম ত্রুটির দিকে পরিচালিত করে। আমি সেমিপ্রেমেট্রিক রিগ্রেশন মডেলগুলিও ব্যবহার করতে চাই।
ফ্র্যাঙ্ক হ্যারেল

2

আমার অভিজ্ঞতা সম্পূর্ণরূপে মাইকেল চেরনিকের সাথে একমত। কেবলমাত্র সময়েই কোনও ডেটা ট্রান্সফরমেশন প্রয়োগ করা মডেলিংয়ের ত্রুটিটিকে সাধারণভাবে বিতরণ করে না, এটি হিটারোস্কেস্টাস্টিটিও সংশোধন করতে পারে।

দুঃখিত, তবে অন্যথায় যেমন একটি পাগল পরিমাণে তথ্য সংগ্রহ করা বা কম দক্ষ শক্তিশালী রিগ্রেশন পদ্ধতি ব্যবহার করার মতো পরামর্শ দেওয়া আমার মতামত, এই বিজ্ঞান / শিল্পের অনুশীলন করা ভুল পথে চালিত।


1

ম্যাক্রো (উপরে jsut) সঠিক উত্তরটি বলেছেন। আমি কিছুটা নির্ভুলতার কারণ আমার একই প্রশ্ন ছিল

অবশিষ্টাংশগুলির স্বাভাবিকতার শর্তটি তখন দরকারী যখন অবশিষ্টাংশগুলিও সমকামী। এরপরে ফলাফলটি হয় যে ওএলএসের সমস্ত অনুমানকারী (লিনিয়ার বা অ-রৈখিক) এর মধ্যে সবচেয়ে ছোট পার্থক্য থাকে ।

বর্ধিত ওএলএস অনুমান:

  1. (তোমার দর্শন লগ করা|এক্সআমি=এক্স)=0
  2. (এক্সআমি,ওয়াইআমি),আমি=1,...,এন,
  3. বড় outliers বিরল
  4. আপনি হোমসকেস্টেস্টিক
  5. এন(0,σ2)

যদি 1-5 টি যাচাই করা হয়, তবে ওএলএস এর সমস্ত অনুমানকারী (লিনিয়ার বা অ-রৈখিক) এর মধ্যে সবচেয়ে ছোটতম পার্থক্য রয়েছে ।

যদি কেবল 1-4 টি যাচাই করা হয়, তবে গাউস-মার্কোভের দ্বারা, ওএলএস হ'ল সেরা লিনিয়ার (কেবল!) অনুমানকারী (ব্লু)।

উত্স: স্টক এবং ওয়াটসন, একোমেট্রিক্স + আমার কোর্স (ইপিএফএল, একনোমেট্রিক্স)


Y অবশিষ্টাংশগুলিতে সাধারণ ন্যূনতম স্কোয়ারগুলির জন্য স্বাভাবিকতার প্রয়োজন নেই, যদিও স্বাভাবিকতা কিছু পছন্দসই বৈশিষ্ট্য প্রদান করে, উদাহরণস্বরূপ, সর্বাধিক সম্ভাবনা বিশ্লেষণের জন্য। পরেরটি প্রায়শই আকাইকে তথ্য মানদণ্ডের জন্য ব্যবহৃত হয়। তবে এটি অপ্রয়োজনীয়ভাবে সীমাবদ্ধ, অভাবনীয়ভাবে সম্মুখীন হয়েছে এবং আরও আনুষ্ঠানিক প্রয়োজনীয়তা হ'ল হোমসিসেস্টাস্টিটির জন্য, স্বাভাবিকতা নয়, যেটি ভাগ্যবান যেহেতু বিপরীত ক্ষেত্রে, y এর মধ্যে কমপক্ষে স্কোয়ারগুলির জন্য খুব কম ব্যবহার হবে।
কার্ল

@ কার্ল: কঠোরভাবে বলতে গেলে ওএলএসের জন্য কোনও ধরণের প্রয়োজন নেই, এমনকি 1 বা 2 নয় (এক্সেলকে একটি রিগ্রেশন চালাতে বলুন এবং এটিতে কোনও প্রশ্ন জিজ্ঞাসা করা হবে না): স্বাভাবিকতা এমন একাধিক বৈশিষ্ট্যের মধ্যে যা অনুমানকে বোধগম্য করে তোলে, যেমন ভবিষ্যদ্বাণী, আত্মবিশ্বাস অন্তর, পরীক্ষা।
প্যাট্রিকটি

Y

আমাদের অবশ্যই একই কথা বলা উচিত। আপনার প্রথম মন্তব্যের বাক্যটি আমাকে বিভ্রান্ত করেছে।
প্যাট্রিকটি

1

অ-স্বাভাবিক অবস্থার জন্য কেউ কখনও কখনও শক্তিশালী রিগ্রেশন অবলম্বন করতে পারে , বিশেষত পদ্ধতির লিঙ্কগুলি ব্যবহার করে ।

অ-স্বাভাবিকতার জন্য প্রসঙ্গ উপস্থাপন করার জন্য এটি লিনিয়ার ওএলএস রিগ্রেশন সম্পর্কিত অনুমানগুলি পর্যালোচনা করতে সহায়তা করতে পারে , যা হ'ল :

  • দুর্বল exogeneity । এর মূল অর্থ হ'ল প্রেডিকটর ভেরিয়েবল, এক্স , এলোমেলো ভেরিয়েবলের পরিবর্তে স্থির মান হিসাবে বিবেচনা করা যেতে পারে। এর অর্থ, উদাহরণস্বরূপ, ভবিষ্যদ্বাণীকারী ভেরিয়েবলগুলি ত্রুটিমুক্ত বলে ধরে নেওয়া হয় — এটি পরিমাপের ত্রুটির সাথে দূষিত নয়। এই অনুমানটি হ'ল যা প্রায়শই লঙ্ঘিত হয় এবং এই অনুমানের তালিকা অনুসরণ করে গণনার হিসাবে ত্রুটি বাড়ে।
  • রৈখিকতা। এর অর্থ যে প্রতিক্রিয়া ভেরিয়েবলের গড়টি হ'ল প্যারামিটারগুলির একটি লিনিয়ার সংমিশ্রণ (রিগ্রেশন সহগ) এবং ভবিষ্যদ্বাণীকারী ভেরিয়েবল। নোট করুন যে এই অনুমানটি প্রথমে মনে হয় তার চেয়ে অনেক কম সীমাবদ্ধ। কারণ ভবিষ্যদ্বাণীকারী ভেরিয়েবলগুলি স্থির মান হিসাবে বিবেচিত হয় (উপরে দেখুন), লিনিয়ারিটি পরামিতিগুলিতে কেবলমাত্র একটি সীমাবদ্ধতা। ভবিষ্যদ্বাণীকারী ভেরিয়েবলগুলি নিজেরাই ইচ্ছামত রূপান্তরিত হতে পারে এবং বাস্তবে একই অন্তর্নিহিত ভবিষ্যদ্বাণী ভেরিয়েবলের একাধিক অনুলিপি যুক্ত করা যেতে পারে, প্রত্যেকে আলাদা আলাদা রূপান্তরিত হয়েছিল।
  • কনস্ট্যান্ট ভেরিয়েন্স (ওরফে হোমোসেসডেস্টিটি)। এর অর্থ হ'ল পূর্বাভাসীর ভেরিয়েবলের মান নির্বিশেষে প্রতিক্রিয়ার ভেরিয়েবলের বিভিন্ন মানগুলির ত্রুটির ক্ষেত্রে একই বৈচিত্র রয়েছে। অনুশীলনে এই অনুমানটি অবৈধ (যেমন ত্রুটিগুলি হিটারোসেসডাস্টিক) যদি প্রতিক্রিয়ার ভেরিয়েবলটি বিস্তৃত আকারে পৃথক হতে পারে। ভিন্ন ভিন্ন ত্রুটির বৈকল্পিকতা পরীক্ষা করার জন্য, বা যখন অবশিষ্টাংশের একটি প্যাটার্ন সমকামীত্বের মডেল অনুমানগুলি লঙ্ঘন করে ( এক্স এর সমস্ত পয়েন্টের জন্য 'সেরা-ফিটিং লাইনের চারপাশে ত্রুটি সমানভাবে পরিবর্তিত হয়)), অবশেষ ত্রুটি এবং পূর্বাভাসিত মানগুলির মধ্যে "ফ্যানিং এফেক্ট" সন্ধান করা বুদ্ধিমানের কাজ। এর অর্থ হ'ল ভবিষ্যদ্বাণীপূর্ণ ভেরিয়েবলগুলির বিরুদ্ধে চক্রান্ত করার সময় পরম বা স্কোয়ার অবশিষ্টাংশগুলিতে একটি নিয়মতান্ত্রিক পরিবর্তন হবে। ত্রুটিগুলি রিগ্রেশন লাইন জুড়ে সমানভাবে বিতরণ করা হবে না। হেটেরোসেসটেস্টিটিটির ফলে পয়েন্টগুলির চারপাশে আলাদা আলাদা বৈচিত্রের গড় ওভারের ফলস্বরূপ একক ভেরিয়েন্স পাওয়া যায় যা সঠিকভাবে লাইনের সমস্ত বৈকল্পিকতা উপস্থাপন করে। বাস্তবে, অবশিষ্টাংশগুলি লিনিয়ার রিগ্রেশন লাইনের পাশাপাশি পয়েন্টগুলির জন্য বৃহত্তর এবং ছোট মানগুলির জন্য তাদের পূর্বাভাসযুক্ত প্লটগুলিতে ক্লাস্টারযুক্ত এবং ছড়িয়ে যায় এবং মডেলের জন্য গড় স্কোয়ার ত্রুটিটি ভুল হবে।
  • ত্রুটির স্বাধীনতা। এটি ধরে নিয়েছে যে প্রতিক্রিয়ার ভেরিয়েবলগুলির ত্রুটিগুলি একে অপরের সাথে সম্পর্কিত নয়। (প্রকৃত পরিসংখ্যানগত স্বাধীনতা নিছক পারস্পরিক সম্পর্কের অভাবের তুলনায় একটি শক্তিশালী শর্ত এবং প্রায়শই প্রয়োজন হয় না, যদিও এটি ধরে রাখার বিষয়টি জানা থাকলে এটি ব্যবহার করা যেতে পারে This এই ক্লাস্টার বিশ্লেষণ এবং মিথস্ক্রিয়া সংশোধনের মাধ্যমে পরীক্ষা করা যেতে পারে)) কিছু পদ্ধতি (যেমন সাধারণীকরণ) সংক্ষিপ্ত স্কোয়ারগুলি) সংযুক্ত ত্রুটিগুলি পরিচালনা করতে সক্ষম, যদিও তাদের সাধারণত উল্লেখযোগ্যভাবে আরও বেশি ডেটার প্রয়োজন হয় যদি না কোনও প্রকার নিয়মিতকরণ অবৈধ ত্রুটিগুলি ধরে নেওয়ার দিকে মডেলটিকে পক্ষপাত করতে ব্যবহার না করা হয়। বায়সিয়ান লিনিয়ার রিগ্রেশন এই সমস্যাটি পরিচালনা করার একটি সাধারণ উপায়।
  • ত্রুটির শর্তাবলী এবং রেজিস্ট্রারদের মধ্যে পরিসংখ্যানগত সম্পর্ক নির্ণয় পদ্ধতিতে পক্ষপাতদুষ্ট এবং সামঞ্জস্যপূর্ণ হওয়ার মতো নমুনা বৈশিষ্ট্যযুক্ত কিনা তা নির্ধারণে গুরুত্বপূর্ণ ভূমিকা পালন করে।

  • পূর্বাভাসকারী ভেরিয়েবল x এর বিন্যাস বা সম্ভাব্যতা বন্টন এর অনুমানের নির্ভুলতার উপর একটি বড় প্রভাব ফেলে β নমুনার নমুনা এবং নকশার নমুনা অত্যন্ত উন্নত পরিসংখ্যানের উপক্ষেত্র যা collecting এর নির্ভুল প্রাক্কলন অর্জনের জন্য এমনভাবে ডেটা সংগ্রহের জন্য গাইডেন্স সরবরাহ করে β

টিY=1টি(-,+ +)

অবশিষ্টাংশের ক্ষেত্রে কচী বিতরণকে অনুরোধ করা স্বেচ্ছাসেবী হয় যে যখন উত্পাদনের ত্রুটিগুলি কচিকে বিতরণ করা হয়, তখন ডেটাগুলির মাধ্যমে একটি উত্সাহী রেখা থেকে ওএলএসের অবশিষ্টাংশগুলি আরও কম নির্ভরযোগ্য হয়, অর্থাৎ আবর্জনা আবদ্ধ করা --- এই ক্ষেত্রে, কেউ থিল-সেন রিগ্রেশন রিগ্রেশন ব্যবহার করতে পারে । থিল-সেন অবশ্যই অ-স্বাভাবিক অবশিষ্টাংশের জন্য ওএলএসের চেয়ে বেশি শক্তিশালী, যেমন, কচির বিতরণ ত্রুটি আত্মবিশ্বাসের ব্যবধানকে হ্রাস করবে না এবং ওএলএসের বিপরীতে এটি একটি দ্বি-দ্বন্দ্বপ্রবণতাও রয়েছে, তবে দ্বিবিভক্ত ক্ষেত্রে এটি এখনও পক্ষপাতদুষ্ট। পাসিং-বাবলোক রিগ্রেশন আরও দ্বিবিড়িত নিরপেক্ষ হতে পারে, তবে নেতিবাচক রিগ্রেশন opালু প্রযোজ্য নয়। এটি সবচেয়ে বেশি পদ্ধতিগুলির তুলনা অধ্যয়নের জন্য ব্যবহৃত হয়। ডেমিং রিগ্রেশন উল্লেখ করা উচিতএখানে, থেইল-সেন এবং পাসিং-বাবলোকের মতবিরোধগুলির মতো নয়, এটি দ্বিঘাতীয় সমস্যার আসল সমাধান, তবে এই অন্যান্য সংকটগুলির দৃust়তা নেই। আরও কেন্দ্রীয় মান অন্তর্ভুক্ত করার জন্য ডেটা কাটা দ্বারা দৃ Rob়তা বৃদ্ধি করা যেতে পারে, উদাহরণস্বরূপ, র্যান্ডম নমুনা সম্মতি (আরএএনএসএসি) একটি পর্যালোচনা পদ্ধতি যা পর্যবেক্ষণকারী ডেটাগুলির একটি সেট থেকে একটি গাণিতিক মডেলের পরামিতিগুলি অনুমান করার জন্য হয়।

এক্স1এক্সYএক্সYY2এক্সYএক্সY=(এক্স)

  1. লংফোর্ড, এনটি (2001) "চিঠিপত্রের"। রয়্যাল স্ট্যাটিস্টিকাল সোসাইটির জার্নাল, সিরিজ এ। 164: 565. doi: 10.1111 / 1467-985x.00219
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.