ওয়াই সাধারণত বিতরণ করা উচিত এমন ভুল ধারণাটি কোথা থেকে এসেছে?


45

আপাতদৃষ্টিতে স্বনামধন্য সূত্রগুলি দাবি করে যে নির্ভরশীল ভেরিয়েবলটি সাধারণত বিতরণ করা উচিত:

মডেল অনুমান: Y সাধারণত বিতরণ করা হয়, ত্রুটিগুলি সাধারণত বিতরণ করা হয়, eiN(0,σ2) , এবং স্বতন্ত্র এবং X স্থির থাকে, এবং ধ্রুব বৈকল্পিক σ2

পেন স্টেট, স্টেট 504 বিচ্ছিন্ন ডেটার বিশ্লেষণ

দ্বিতীয়ত, লিনিয়ার রিগ্রেশন বিশ্লেষণের জন্য সমস্ত ভেরিয়েবলগুলি মাল্টিভারিয়েট স্বাভাবিক হওয়া দরকার।

পরিসংখ্যান সমাধান, লিনিয়ার রিগ্রেশন অনুমান

প্রতিক্রিয়া ভেরিয়েবলের একটি সাধারণ বিতরণ থাকলে এটি উপযুক্ত

উইকিপিডিয়া, সাধারণ রৈখিক মডেল

কীভাবে বা কেন এই ভুল ধারণাটি ছড়িয়ে পড়েছে তার জন্য কি এখানে একটি ভাল ব্যাখ্যা রয়েছে? এর উত্স কি জানা যায়?

সম্পর্কিত


17
দু: খিত। আপনি এখানে একটি ভাল কাজ করছেন ...
jboman

7
Y

8
@ মিশেল চেরনিক "ওয়াই সাধারণত বিতরণ করা হয়" স্পষ্টতই মিথ্যা। এটি আর তে দেখুন: X <- runif(n=100)তারপরে Y <- 3 + .5*X + rnorm(n=100, mean = 0, sd = .1)হিস্টোগ্রামগুলি নিয়ে খেলুন নিজেকে নিশ্চিত করুন যে এক্স বা ওয়াই উভয়ই সাধারণত বিতরণ করা হয় না। তারপরে summary(lm(Y ~ X)), এবং ইন্টারসেপ্টটি 3 এর কতটা কাছে এবং X এর opeালু 0.5 এর কাছাকাছি থেকে খুব ঘনিষ্ঠ মনোযোগ দিন। ধারণাটি হ'ল ত্রুটিগুলি সাধারণত বিতরণ করা হয়।
অ্যালেক্সিস

9
@ অ্যালেক্সিস আমি বিশ্বাস করি মাইকেল যা বলার চেষ্টা করছিল তা হ'ল যে বহুবিচিত্র সাধারণ ধারণা অনুমান যথেষ্ট তবে প্রয়োজনীয় নয় এটি পরিষ্কারভাবে কীভাবে একজনকে উইকিপিডিয়া উদ্ধৃতি পড়তে হবে। দ্বিতীয় উক্তিটি অবশ্যই অনুমান করা ভুল যে এই অনুমানগুলি প্রয়োজনীয়। প্রথম উদ্ধৃতিটি দ্ব্যর্থক তবে মাইকেল দ্বারা বর্ণিত অর্থে উদারভাবে পড়া যেতে পারে।
whuber

6
আমি যা বলছিলাম তা হ'ল স্বাভাবিকতা অনুমিতি নির্দিষ্ট বৈশিষ্ট্য বোঝায়। উদাহরণস্বরূপ সাধারণ লিনিয়ার রিগ্রেশন হিসাবে যদি আপনি ধরে নেন যে ত্রুটি শর্তগুলি শূন্য গড় এবং ধ্রুবক বৈকল্পের সাথে আইড স্বাভাবিক হয় তবে রিগ্রেশন প্যারামিটারগুলির সর্বনিম্ন বর্গ অনুমান সর্বাধিক সম্ভাবনা। স্বাভাবিকতা সর্বনিম্ন স্কোয়ার বাদে সমস্ত অনুমান রাখা এখন সর্বাধিক সম্ভাবনা নয় তবে এখনও ন্যূনতম বৈকল্পিক নিরপেক্ষ।
মাইকেল চেরনিক

উত্তর:


13

'ওয়াই অবশ্যই বিতরণ করা উচিত'

অবশ্যই?


আপনি যে ক্ষেত্রে উল্লেখ করেছেন এটি ম্লান ভাষা (সংক্ষেপে 'ওয়াইয়ের ত্রুটিটি সাধারণত বিতরণ করা উচিত' ) তবে তারা সত্যই (দৃ strongly়তার সাথে) বলেন না যে প্রতিক্রিয়া অবশ্যই সাধারণত বিতরণ করা উচিত , বা কমপক্ষে এটি মনে হয় না আমার যে তাদের কথার মত উদ্দেশ্য ছিল।

পেন স্টেট কোর্স উপাদান

YYi

E(Yi)=β0+β1xi
Yi

YiN(β0+β1xi,σ2)

YYi

  • জিএলএম (বাইনারি লজিস্টিক রিগ্রেশন) এর কিছু বৈকল্পিক ব্যাখ্যা করার সময়,

    YBinomial(n,π)

  • কিছু সংজ্ঞায়

    YYY

YiY

  • Yi

পরিসংখ্যান সংক্রান্ত ওয়েবপৃষ্ঠা

একটি অত্যন্ত সংক্ষিপ্ত, সরলীকৃত, স্টাইলাইজড বিবরণ। আমি নিশ্চিত না যে আপনার এটিকে গুরুত্ব সহকারে নেওয়া উচিত। উদাহরণস্বরূপ, এটি সম্পর্কে কথা বলতে

.. সমস্ত ভেরিয়েবলকে মাল্টিভারিয়েট করার জন্য সাধারণভাবে প্রয়োজন ...

সুতরাং এটি কেবল প্রতিক্রিয়া পরিবর্তনশীল নয়,

এবং 'মাল্টিভারিয়েট' বর্ণনাকারকও অস্পষ্ট। কীভাবে তা ব্যাখ্যা করা যায় তা সম্পর্কে আমি নিশ্চিত নই।

উইকিপিডিয়া নিবন্ধ

বন্ধনীতে একটি অতিরিক্ত প্রসঙ্গ ব্যাখ্যা করা হয়েছে:

সাধারণ লিনিয়ার রিগ্রেশন একটি প্রদত্ত অজানা পরিমাণের (রেসপন্স ভেরিয়েবল, একটি এলোমেলো ভেরিয়েবল) প্রত্যাশিত মানগুলির একটি সেট (পূর্বাভাসক) এর একটি লিনিয়ার সংমিশ্রণ হিসাবে প্রত্যাশিত মানটির পূর্বাভাস দেয় । এর দ্বারা বোঝা যায় যে ভবিষ্যদ্বাণীকের একটি ধ্রুবক পরিবর্তন প্রতিক্রিয়াশীল ভেরিয়েবলের (যেমন লিনিয়ার-প্রতিক্রিয়া মডেল) ধ্রুবক পরিবর্তনের দিকে নিয়ে যায়। প্রতিক্রিয়া ভেরিয়েবলের একটি সাধারণ বিতরণ থাকলে এটি যথাযথ হয় (স্বজ্ঞাতভাবে, যখন কোনও প্রতিক্রিয়ার ভেরিয়েবল কোনও স্থির "শূন্য মান" না দিয়ে উভয় দিকের মধ্যে অনির্দিষ্টকালের জন্য পৃথকভাবে পরিবর্তিত হতে পারে, বা কেবলমাত্র যে পরিমাণে কেবল অপেক্ষাকৃত কম পরিমাণে পরিবর্তিত হয়, যেমন মানব উচ্চতা)।

y+ϵϵN(0,σ)

নির্দিষ্ট লাইনটি 8মার্চ 2012 এ যুক্ত করা হয়েছে , তবে নোট করুন যে উইকিপিডিয়া নিবন্ধের প্রথম লাইনটি এখনও "সাধারণ লিনিয়ার রিগ্রেশনটির একটি নমনীয় সাধারণীকরণ যা প্রতিক্রিয়া ভেরিয়েবলগুলির ক্ষেত্রে সাধারণ বিতরণ ছাড়া অন্য ত্রুটি বিতরণের মডেলগুলি দেয় " এর জন্য পড়ে এবং এটি নয় এত বেশি (সর্বত্র নয়) ভুল।


উপসংহার

সুতরাং, এই তিনটি উদাহরণের ভিত্তিতে (যা প্রকৃতপক্ষে ভুল ধারণা তৈরি করতে পারে, বা কমপক্ষে ভুল বোঝাবুঝি হতে পারে) আমি এটি বলব না যে "এই ভুল ধারণাটি ছড়িয়ে পড়েছে" । বা কমপক্ষে এটি আমার কাছে মনে হয় না যে এই তিনটি উদাহরণের অভিপ্রেতটিই যুক্তিযুক্ত যে ওয়াই সাধারণত বিতরণ করা উচিত (যদিও আমি মনে করি না এই সমস্যাটি এখানে স্ট্যাকেক্সচেঞ্জের আগে উত্থাপিত হয়েছিল, সাধারণত বিতরণ ত্রুটি এবং সাধারণভাবে বিতরণ হওয়া প্রতিক্রিয়ার ভেরিয়েবলের মধ্যে অদলবদল হয় করা সহজ)।

সুতরাং, 'Y অবশ্যই অবশ্যই বিতরণ করা উচিত' এই ধারণাটি আমার কাছে মনে হয় একটি বিস্তৃত বিশ্বাস / ভুল ধারণা (যেমন কোনও রেড হেরিংয়ের মতো ছড়িয়ে পড়ে) এর মতো নয়, তবে সাধারণ ত্রুটির মতো (যা ছড়িয়ে নেই তবে প্রতিটিবার স্বাধীনভাবে তৈরি করা হয়) )।


অতিরিক্ত মন্তব্য

এই ওয়েবসাইটে ভুলের একটি উদাহরণ নিম্নলিখিত প্রশ্নে রয়েছে

কি যদি অবশিষ্টাংশগুলি সাধারণত বিতরণ করা হয় তবে y হয় না?

আমি এটিকে একটি প্রাথমিক প্রশ্ন হিসাবে বিবেচনা করব। এটি পেন স্টেট কোর্সের উপাদান, উইকিপিডিয়া ওয়েবসাইটের মতো উপকরণগুলিতে উপস্থিত নেই এবং সম্প্রতি 'আর এর সাথে লিনিয়ার রিগ্রেশন বাড়ানো' বইয়ের মন্তব্যে উল্লেখ করেছে।

এই রচনাগুলির লেখকগণ সঠিকভাবে উপাদানটি বুঝতে পারেন। প্রকৃতপক্ষে, তারা 'ওয়াই অবশ্যই বিতরণ করা উচিত' এর মতো বাক্যাংশ ব্যবহার করে তবে প্রসঙ্গ এবং ব্যবহৃত সূত্রগুলির উপর ভিত্তি করে আপনি দেখতে পাচ্ছেন যে এগুলির অর্থ 'ওয়াই, এক্স এর উপর শর্তযুক্ত, অবশ্যই সাধারণভাবে বিতরণ করা উচিত' এবং নয় 'প্রান্তিক ওয়াই অবশ্যই সাধারণত বিতরণ করা '। তারা নিজেরাই ধারণাকে ভুল ধারণা দিচ্ছে না এবং পরিসংখ্যানবিদদের এবং বই এবং অন্যান্য কোর্সের উপকরণ লেখার লোকদের মধ্যে কমপক্ষে ধারণাটি ব্যাপক নয়। তবে তাদের অস্পষ্ট শব্দগুলি ভুলভাবে লেখা ভুল ধারণা তৈরির কারণ হতে পারে।


3
+1 যা বলেছিল: আমি মনে করি আমরা এখানে প্রায় সকলেই ওয়াইয়ের প্রান্তিক স্বাভাবিকতা প্রমাণ করে প্রচুর প্রশ্ন দেখেছি ... কিছুটা ভুল ধারণা রয়েছে। :)
অ্যালেক্সিস

হ্যাঁ আমি সম্মত হলাম যে 'y সাধারণত বিতরণ করা হয়' এর ধারণা প্রায়শই ঘটে (আমি সহজেই উদাহরণগুলি খুঁজে পাই না, তবে এটি এমন কারণ হতে পারে যে লোকেরা এই জিনিসগুলিকে রেখার মাঝে বর্ণনা করে, সাধারণ কীওয়ার্ড সহ নয়)। তবে, আমি বিশ্বাস করি যে এটি 'সাধারণ' এমন কিছু নয় যা এতটা ' ছড়িয়ে দেওয়া'। এবং কমপক্ষে, অবশ্যই ওপি দ্বারা প্রদত্ত তিনটি উদাহরণ খুব শক্তিশালী নয় (ভুল ধারণাটি ছড়িয়ে দেওয়ার ইঙ্গিত দেওয়ার দিক থেকে শক্তিশালী নয়, যদিও তারা ভাষার প্যাথলজিকাল ব্যবহার এবং কীভাবে ত্রুটিগুলির উদ্ভব হতে পারে তা বর্ণনা করে)।
সেক্সটাস এম্পেরিকাস

@ মার্তিজন ওয়েটারিংস: আমি আপনার বক্তব্যটির সাথে একমত হতে চাই "আমি বলব না যে এই ভুল ধারণাটি ছড়িয়ে পড়েছে"। বেশিরভাগ স্নাতক পরিসংখ্যান প্রোগ্রামে প্রয়োজনীয় পড়া হিসাবে ব্যবহৃত তাঁর বইয়ের সাথে লাইনারি রিগ্রেশন প্রসারিত বইতে জুলিয়ান ফারাওয়ে এই বইয়ের প্রিফেসে পৃষ্ঠার একাদশে উল্লেখ করেছে যে "স্ট্যান্ডার্ড লিনিয়ার মডেলটি নরমাল প্রতিক্রিয়াগুলি পরিচালনা করতে পারে না, যেমন, হিসাবে গণনা বা অনুপাত হিসাবে "।
কালার স্ট্যাটিস্টিকস

n1(r1)(c1)

1
y=β0+β1x1+...βpxp+ϵϵপ্রতিক্রিয়া উল্লেখ করা হয়েছে যে নির্দিষ্ট বিতরণ থাকা উচিত।
সেক্সটাস এম্পেরিকাস

29

কীভাবে / কেন এই ভুল ধারণাটি ছড়িয়ে পড়েছে তার জন্য কি এখানে একটি ভাল ব্যাখ্যা রয়েছে? এর উত্স কি জানা যায়?

আমরা সাধারণত আন্ডারগ্রাজুয়েটদের অনেক শাখায় পরিসংখ্যানের একটি "সরলিকৃত" সংস্করণ শিখি। আমি মনোবিজ্ঞানে রয়েছি, এবং যখন আমি স্নাতক স্নাতকদের বলার চেষ্টা করি যে নাল হাইপোথিসিসটি সত্য, এইজন্য পি- ভ্যালুগুলি "ডেটা বা আরও চরম ডেটা হওয়ার সম্ভাবনা", "সহকর্মীরা আমাকে বলে যে আমি আমার প্রয়োজনের চেয়ে আরও বিশদ আবরণ করছি ঢাকতে. যেহেতু আমি এটিকে যতটা করা দরকার তার চেয়ে আরও কঠিন করে তুলছি ইত্যাদি। যেহেতু ক্লাসে শিক্ষার্থীরা পরিসংখ্যান সহ এ জাতীয় বিস্তৃত স্বাচ্ছন্দ্য (বা এর অভাব) রাখে, প্রশিক্ষকরা সাধারণত এটিকে সহজ রাখেন: "আমরা এটিকে একটি নির্ভরযোগ্য সন্ধান হিসাবে বিবেচনা করি যদি p <.05, "উদাহরণস্বরূপ, তাদের পি- ভ্যালুয়ের আসল সংজ্ঞা দেওয়ার পরিবর্তে ।

আমি মনে করি এখানেই কেন ভুল ধারণাটি ছড়িয়ে পড়েছে তার ব্যাখ্যা। উদাহরণস্বরূপ, আপনি মডেলটি লিখতে পারেন:

Y=β0+β1X+ϵϵN(0,σϵ2)

এটি আবার লিখিত হতে পারে:

Y|XN(β0+β1X,σϵ2)

যার অর্থ হ'ল "ওয়াই, এক্স-এর শর্তসাপেক্ষে সাধারণত পূর্বাভাসিত মানগুলি এবং কিছু বৈকল্পিকতার সাথে বিতরণ করা হয়।"

এটি ব্যাখ্যা করা কঠিন, তাই সংক্ষিপ্ত লোকেরা কেবল এটাই বলতে পারে: "ওয়াই অবশ্যই সাধারণত বিতরণ করা উচিত।" অথবা যখন এটি মূলত তাদের কাছে ব্যাখ্যা করা হয়েছিল, লোকেরা শর্তাধীন অংশটি ভুল বুঝেছিল - যেহেতু এটি সত্য, সত্যই বিভ্রান্তিকর।

সুতরাং জিনিসগুলি মারাত্মক জটিল না করার প্রয়াসে, প্রশিক্ষকরা বেশিরভাগ শিক্ষার্থীদের অতিরিক্ত মাত্রায় বিভ্রান্ত না করার জন্য তারা যা বলছেন তা কেবল সহজ করে দেয়। এবং তারপরে লোকেরা তাদের পরিসংখ্যানগত শিক্ষা বা পরিসংখ্যানচর্চায় সেই ভুল ধারণাটি দিয়ে চালিয়ে যায়। স্ট্যানে বায়েশিয়ান মডেলিং করা শুরু না করা পর্যন্ত আমি নিজেই ধারণাটি পুরোপুরি বুঝতে পারি নি, যার জন্য আপনাকে আপনার অনুমানগুলি এইভাবে লিখতে হবে:

model {
  vector[n_obs] yhat;

  for(i in 1:n_obs) {
    yhat[i] = beta[1] + beta[2] * x1[i] + beta[3] * x2[i];
  }

  y ~ normal(yhat, sigma);
}

এছাড়াও, জিইউআইয়ের সাথে প্রচুর পরিসংখ্যান প্যাকেজে (আপনার দিকে, এসপিএসএসের দিকে তাকিয়ে) প্রান্তিক বিতরণ সাধারণত বিতরণ করা হয়েছে কিনা তা যাচাই করা সহজ (সাধারণ হিস্টোগ্রাম) অবশিষ্টাংশগুলি সাধারণত বিতরণ করা হয়েছে কিনা তা যাচাই করা (রেগ্রেশন চালান, অবশিষ্টগুলি সংরক্ষণ করুন, সেই অবশিষ্টাংশগুলিতে হিস্টোগ্রাম চালান)।

সুতরাং, আমি মনে করি যে ভুল ধারণাটি মূলত শিক্ষার্থীদের এটিকে সঠিক উপায়ে শেখার মধ্যে বিভ্রান্তি, সত্যিকারের এবং বোধগম্য - বিভ্রান্তি থেকে দূরে রাখার জন্য বিশদ বিলোপ করার চেষ্টা করা প্রশিক্ষকদের কারণে এবং এই দুটি ক্ষেত্রেই প্রান্তিক স্বাভাবিকতা যাচাই করে সহজেই আরও শক্তিশালী হয়েছিল সর্বাধিক ব্যবহারকারী-বান্ধব পরিসংখ্যান প্যাকেজ।


2
আমি মনে করি আপনি সঠিক আছেন। অনেকে শর্তযুক্ত অংশটি বুঝতে পারে না don't তারা কেবল সাধারণ বিতরণ মনে করে।
স্মার্টচিস

3
আমি সম্মত হই যে এই ত্রুটিটি ঘটে / ছড়িয়ে পড়ে এমন মোডগুলির মধ্যে এটি একটি হতে পারে। পেন রাজ্য কোর্সের উপাদানগুলি অবশ্য আমার কাছে এই 'ইচ্ছাকৃত' সরলকরণের কারণে নয় বলে মনে হয় এবং এটি opালু স্বরলিপি লেখার কারণেও হয়। এটি কিছুটা ছোট (কোর্স) নোটের মতো। অথবা স্ট্যাকএক্সচেঞ্জের ভাষাগুলিতে সরলকরণের মত মন্তব্য পছন্দ করুন। কিছু জায়গায় তারা সঠিক শব্দ ব্যবহার করে। (ব্যক্তিগতভাবে, আমার স্কিমেটিক্স / চিত্রগুলি আমার শব্দ / সূত্রগুলির চেয়ে ভাল, তবে এর অর্থ এই নয় যে আমি যা লিখি তা যদি ভুল হয় তবে অবশ্যই এটি একটি ভুল ধারণা)
Sextus Empiricus

1
@ মার্তিজন ওয়েটারিংস সম্মত specific নির্দিষ্ট ভাষা ব্যবহার না করে কাউকে বিভ্রান্ত করা খুব সহজ। পরিসংখ্যান অনুমানের মতো বিমূর্ত হিসাবে আপনার ভাষার সাথে সর্বদা সুনির্দিষ্ট হওয়া শক্ত এবং অনেক স্মার্ট লোক সাধারণ ভুল করে, এর ফলে ব্যাপক ভুল ধারণা তৈরি করে।
মার্ক হোয়াইট

1
মার্কউইট, আমরা কীভাবে শেখাচ্ছি সে সম্পর্কে আপনি যে মনোনিবেশ করেছেন সেটার জন্য আমি সত্যিই প্রশংসা করি ... আমি মনে করি যে এটি "ভুল ধারণা" ছড়িয়ে দেওয়ার বিষয়ে ওপি'র আগ্রহের একটি গুরুত্বপূর্ণ উপায়ে কথা বলেছে (কী কী এবং কোনটি ভুল ধারণা নয় তার সংক্ষিপ্তসারগুলি ছাড়াও) )।
অ্যালেক্সিস

16

রিগ্রেশন বিশ্লেষণ নতুনদের পক্ষে কঠিন কারণ বিভিন্ন ফলাফল রয়েছে যা বিভিন্ন সূচনা অনুমান দ্বারা জড়িত। দুর্বল শুরুর অনুমানগুলি কিছু ফলাফলকে ন্যায়সঙ্গত করতে পারে তবে আপনি শক্তিশালী অনুমান যুক্ত করলে আপনি আরও শক্তিশালী ফলাফল পেতে পারেন। ফলাফলগুলির সম্পূর্ণ গাণিতিক উত্সের সাথে অপরিচিত লোকেরা প্রায়শই একটি ফলাফলের জন্য প্রয়োজনীয় অনুমানগুলি ভুল বুঝতে পারে, হয় তাদের ফলাফলের জন্য খুব বেশি দুর্বল হয়ে তাদের মডেল প্রকাশ করে বা ফলাফলের জন্য এই প্রয়োজনীয় বিশ্বাসে কিছু অপ্রয়োজনীয় অনুমান পোষণ করে can ।

অতিরিক্ত ফলাফল পেতে শক্তিশালী অনুমান যুক্ত করা সম্ভব হলেও, রিগ্রেশন বিশ্লেষণ প্রতিক্রিয়া ভেক্টরের শর্তযুক্ত বিতরণ নিয়ে নিজেকে উদ্বেগ দেয় । যদি কোনও মডেল এর বাইরে চলে যায় তবে এটি মাল্টিভারিয়েট বিশ্লেষণের অঞ্চলে প্রবেশ করছে, এবং কঠোরভাবে (ন্যায়বিচার) কোনও রিগ্রেশন মডেল নয়। বিষয়টি আরও জটিল যে সত্য যে তারা শর্তযুক্ত বিতরণ (ডিজাইনের ম্যাট্রিক্সে বর্ণনামূলক ভেরিয়েবলগুলি দিয়ে থাকে) তা শর্তযুক্ত করে তোলার ক্ষেত্রে সর্বদা সতর্ক না হয়ে রিগ্রেশনে বিতরণমূলক ফলাফলগুলি উল্লেখ করা সাধারণ বিষয় by মডেলগুলি শর্তসাপেক্ষ বিতরণ ছাড়িয়ে যাওয়ার ক্ষেত্রে (ব্যাখ্যামূলক ভেক্টরগুলির জন্য একটি প্রান্তিক বিতরণ ধরে ধরে) ব্যবহারকারীর এই পার্থক্যটি নির্দিষ্ট করার ক্ষেত্রে যত্নবান হওয়া উচিত; দুর্ভাগ্যক্রমে লোকেরা সর্বদা এটিতে সতর্ক থাকে না।


হোমস্কেস্টেস্টিক লিনিয়ার রিগ্রেশন মডেল: সাধারণত ব্যবহৃত প্রথম দিকের বিন্দুটি মডেলের ফর্মটি ধরে নেওয়া এবং প্রথমে কোনও স্বাভাবিকতার কোনও ধারণা না নিয়ে প্রথম দুটি ত্রুটি-মুহুর্ত গ্রহণ করা:

Y=xβ+εE(ε|x)=0V(ε|x)I.

এই সেটআপটি আপনাকে সহগের জন্য ওএলএস অনুমানকারী, ত্রুটির বৈকল্পের জন্য নিরপেক্ষ অনুমানক, অবশিষ্টাংশ এবং এই সমস্ত এলোমেলো পরিমাণের মুহূর্তগুলি (ডিজাইনের ম্যাট্রিক্সের বর্ণনামূলক ভেরিয়েবলের শর্তসাপেক্ষ) পাওয়ার অনুমতি দেওয়ার জন্য যথেষ্ট। এটা তোলে এইসব পরিমাণে পূর্ণ শর্তাধীন বিতরণ পেতে করার অনুমতি দেয় না, কিন্তু যদি এটা asymptotic ডিস্ট্রিবিউশন করার আবেদন করার জন্য অনুমতি দেয় বড় এবং কিছু অতিরিক্ত অনুমানগুলোর সীমিত আচরণের উপর স্থাপন করা হয় । আরও যেতে ত্রুটি ভেক্টরের জন্য একটি নির্দিষ্ট বিতরণ ফর্ম ধরে নেওয়া সাধারণ।এক্সnx

সাধারণ ত্রুটি: হোমোসকেডাস্টিক লিনিয়ার রিগ্রেশন মডেলের বেশিরভাগ চিকিত্সা ধরে নেওয়া হয় যে ত্রুটি ভেক্টরটি সাধারণত বিতরণ করা হয় যা এই মুহুর্তের অনুমানের সাথে মিলিতভাবে দেয়:

ε|xN(0,σ2I).

এই অতিরিক্ত অনুমানটি সহগের জন্য ওএলএস অনুমানকারীটি মডেলটির জন্য এমএলই রয়েছে তা নিশ্চিত করার জন্য যথেষ্ট, এবং এর অর্থ হ'ল সহগের হিসাবরক্ষক এবং অবশিষ্টাংশগুলি সাধারণত বিতরণ করা হয় এবং ত্রুটির প্রকরণের জন্য অনুমানকারীকে একটি স্কেলড স্কোয়ার্ড বিতরণ করা হয় (সমস্ত ডিজাইনের ম্যাট্রিক্সের ব্যাখ্যামূলক ভেরিয়েবলের শর্তসাপেক্ষে)। এটিও নিশ্চিত করে যে প্রতিক্রিয়া ভেক্টরটি শর্তাধীনভাবে সাধারণত বিতরণ করা হয়। এটি বিশ্লেষণের ব্যাখ্যামূলক পরিবর্তনশীলগুলিতে শর্তসাপেক্ষে বিতরণমূলক ফলাফল দেয় যা আত্মবিশ্বাসের ব্যবধান এবং হাইপোথিসিস টেস্টগুলি নির্মাণের অনুমতি দেয়। যদি বিশ্লেষক প্রতিক্রিয়াটির প্রান্তিক বিতরণ সম্পর্কে অনুসন্ধান করতে চান, তাদের আরও এগিয়ে গিয়ে মডেলের ব্যাখ্যামূলক পরিবর্তনশীলগুলির জন্য একটি বিতরণ অনুমান করা উচিত।

যৌথভাবে-সাধারণ ব্যাখ্যামূলক ভেরিয়েবলগুলি: হোমোসেসডাস্টিক লিনিয়ার রিগ্রেশন মডেলের কিছু চিকিত্সা স্ট্যান্ডার্ড চিকিত্সার চেয়ে আরও বেশি এগিয়ে যায় এবং নির্দিষ্ট ব্যাখ্যামূলক ভেরিয়েবলগুলির শর্ত থাকে না। (যুক্তিযুক্তভাবে এটি রিগ্রেশন মডেলিংয়ের বাইরে এবং মাল্টিভারিয়েট বিশ্লেষণে রূপান্তর) লেটিং হতে তম ব্যাখ্যামূলক ভেক্টর ( নকশা ম্যাট্রিক্স তম সারি) আমরা আছে: আমি iX(i)ii

X(1),...,X(n)IID N(μX,ΣX).

প্রতিক্রিয়া ভেক্টরটি স্বাভাবিকভাবে বিতরণ করা হয়েছে তা নিশ্চিত করার জন্য এই অতিরিক্ত অনুমান যথেষ্ট। এটি একটি দৃ ass় ধারণা এবং এটি বেশিরভাগ সমস্যায় সাধারণত চাপানো হয় না। যেমন বলা হয়েছে, এটি মডেলটিকে রিগ্রেশন মডেলিংয়ের অঞ্চলের বাইরে এবং বহুবিশ্লেষ বিশ্লেষণে নিয়ে যায়।


1
আপনি একে একে দৃ stronger় অনুমানের প্রচলন করেছিলেন এবং এর প্রভাবগুলি বর্ণনা করেছেন I
কালারস্ট্যাটিস্টিকস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.