সর্বনিম্ন স্কোয়ার অনুমান


9

নিম্নলিখিত রৈখিক সম্পর্ক ধরে: , যেখানে নির্ভরশীল পরিবর্তনশীল হয় একটি একক স্বাধীন পরিবর্তনশীল এবং ত্রুটি পরিভাষা।Yi=β0+β1Xi+uiYiXiui

শেয়ার & ওয়াটসন (অর্থনীতি পরিচিতি; মতে অধ্যায় 4 ), তৃতীয় লিস্ট স্কোয়ার ধৃষ্টতা হয় চতুর্থ মুহূর্তগুলোতে এবং হয় নন-জিরো এবং সসীম ।Xiui(0<E(Xi4)< and 0<E(ui4)<)

আমার তিনটি প্রশ্ন আছে:

  1. আমি এই অনুমানের ভূমিকাটি পুরোপুরি বুঝতে পারি না। যদি এই অনুমানটি ধরে না রাখে বা অনুমানের জন্য আমাদের কি এই অনুমানের প্রয়োজন হয় তবে ওএলএস কি পক্ষপাতদুষ্ট এবং বেমানান?

  2. স্টক এবং ওয়াটসন লিখুন "এই ধৃষ্টতা অত্যন্ত বড় মান একটি পর্যবেক্ষণ অঙ্কনের সম্ভাবনা সীমিত বা ।" তবে আমার স্বজ্ঞাততাটি হ'ল এই অনুমানটি চরম। আমাদের যদি বড় আউটলিয়ার থাকে (যেমন চতুর্থ মুহূর্ত বড় হয়) তবে এই মানগুলি এখনও সসীম থাকলে আমরা কি সমস্যায় আছি? উপায় দ্বারা: অন্তর্নিহিত সংজ্ঞা একটি আউটলেটর কী?Xiui

  3. আমরা হিসাবে এই সূত্রবদ্ধ করতে পারি রয়েছে: "ক্রুটোসিস এবং অশূন্য এবং সসীম হয়?"Xiui


দুর্ভাগ্যক্রমে আমি এখন পুরোপুরি উত্তর লিখতে পারি না তবে আপনাকে প্রশ্নের উত্তর দিতে: 1, ওএলএস ধারাবাহিকতা নির্বিশেষে কাজ করে। 2, আউটলিয়ারদের সম্পর্কে সুস্পষ্ট সংজ্ঞাটি বিদ্যমান নেই, তবে ওএলএস বহিরাগতদের উপস্থিতিতে বড় নমুনায় দুর্দান্ত কাজ করে। 3, আমার জীবনের জন্য আমি এমন উদাহরণের কথা ভাবতে পারি না যেখানে এটি সত্য হবে না, তবে কেউ আমাকে ভুল প্রমাণ করতে পারে তাই কোনও গ্যারান্টি নেই
Repmat

5
আমি বিতর্ক করি "তবে ওএলএস আউটলিয়ারদের উপস্থিতিতে বৃহত্তর নমুনায় ভাল কাজ করে" ... এক্স-স্পেসে (যেমন একটি প্রভাবশালী পর্যবেক্ষণ) একটি যথেষ্ট পরিমাণে আউটলেট নিয়ে যান এবং একটি বিন্দু এলএস ফিটকে এর মধ্য দিয়ে যেতে বাধ্য করতে পারে; যদি এটি ওয়াই-দিকের দিক থেকেও বাহ্যিক হয় তবে আপনার লাইনটি এখনও এক পয়েন্ট হলেও চলবে, তা যতই চরম হোক না কেন।
গ্লেন_বি -রিনস্টেট মনিকা

2
আউটলিয়ারগুলি সংজ্ঞায়িত করা সহজ। এগুলি পর্যবেক্ষণগুলি হ'ল ডেটাগুলির পরিমাণের প্যাটার্নের সাথে অসঙ্গতিপূর্ণ। গ্লেন_বি-র উদাহরণ হিসাবে দেখানো হয়েছে যে ডেটাসেটের অন্যান্য সমস্ত পর্যবেক্ষণকে ছাড়িয়ে যাওয়ার সীমাতে এই জাতীয় পয়েন্টটির ফিটের উপর অপ্রতিরোধ্য প্রভাব রয়েছে এবং এটি উচ্চ পক্ষপাতদায়ক অনুমানের দিকে নিয়ে যায়।
ব্যবহারকারী 603

1
@ ইউজার 603 অবশ্যই ... এবং তাই কী ... আমি এখনও এমন একটি প্রোগ্রাম / স্ক্রিপ্টের মুখোমুখি হয়েছি যা স্বয়ংক্রিয়ভাবে বহিরাগতদের সনাক্ত করে এবং পরিষ্কারভাবে করে যে আমরা সকলেই একমত হ'ল সঠিক উপায় ... সুতরাং আমি যখন আপনার অনুভূতির সাথে একমত হই, এটি
ওপিকে

@ রেপমেট: দয়া করে ওপি'র প্রশ্নটি আবার পড়ুন। আমার মন্তব্যটি সেখানে একটি বাক্যটির সরাসরি উত্তর দেয় যা একটি প্রশ্ন চিহ্ন দ্বারা বিরতিযুক্ত হয়।
ব্যবহারকারী 60

উত্তর:


9

আপনাকে যা না OLS ঔজ্জ্বল্যের প্রেক্ষাপটে মূল্নির্ধারক এর দৃঢ়তা জন্য 4 র্থ মুহুর্তগুলিতে অনুমানের প্রয়োজন, কিন্তু আপনার উচ্চতর মুহুর্তগুলিতে প্রয়োজন অনুমানের না এবং মধ্যে asymptotic স্বাভাবিক জন্য এবং ধারাবাহিকভাবে অনুমান কি মধ্যে asymptotic সহভেদাংক ম্যাট্রিক্স হয়।xϵ

যদিও কিছু দিক থেকে এটি একটি গাণিতিক, প্রযুক্তিগত বিন্দু, ব্যবহারিক বিষয় নয়। সীমাবদ্ধ নমুনাগুলিতে কিছুটা ক্ষেত্রে ওএলএসকে ভালভাবে কাজ করার জন্য হিসাবে অ্যাসিপটোটিক ধারাবাহিকতা বা স্বাভাবিকতা অর্জনের জন্য প্রয়োজনীয় ন্যূনতম অনুমানের চেয়ে বেশি প্রয়োজন ।n

ধারাবাহিকতার জন্য পর্যাপ্ত শর্তাদি:

আপনার যদি রিগ্রেশন সমীকরণ থাকে:

yi=xiβ+ϵi

ওএলএসের অনুমানকারী as as এইভাবে লেখা যেতে পারে: b^

b^=β+(XXn)1(Xϵn)

জন্য দৃঢ়তা , আপনি বৃহৎ সংখ্যক এর Kolmogorov এর আইন প্রয়োগ বা সিরিয়াল নির্ভরতা, কিছু Karlín এবং টেলর এর Ergodic উপপাদ্য মত যাতে সঙ্গে সময়-সিরিজ ক্ষেত্রে, পাবে প্রয়োজন:

1nXXpE[xixi]1nXϵpE[xiϵi]

প্রয়োজনীয় অন্যান্য অনুমানগুলি হ'ল:

  • E[xixi] সম্পূর্ণ পদমর্যাদার এবং সুতরাং ম্যাট্রিক্সটি অবিচ্ছিন্ন।
  • Regressors পূর্ব নির্ধারিত হয় বা কঠোরভাবে exogenous যাতে ।E[xiϵi]=0

তারপরে এবং আপনি(XXn)1(Xϵn)p0b^pβ

আপনি কেন্দ্রীয় সীমা উপপাদ্য প্রয়োগ করতে চান তাহলে তারপর আপনি উচ্চতর মুহুর্তগুলিতে অনুমানের প্রয়োজন, উদাহরণস্বরূপ, যেখানে । কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য হ'ল as এর অ্যাসিম্পটিক স্বাভাবিকতা দেয় এবং আপনাকে স্ট্যান্ডার্ড ত্রুটি সম্পর্কে কথা বলতে দেয়। দ্বিতীয় মুহুর্তের জন্য উপস্থিত থাকার জন্য আপনার চতুর্থ মুহূর্তের এবং অস্তিত্ব থাকতে হবে। আপনি যুক্তি দিতে চান যে যেখানেE[gigi]gi=xiϵib^E[gigi]xϵn(1nixiϵi)dN(0,Σ)Σ=E[xixiϵi2] । এটি কাজ করার জন্য, সীমাবদ্ধ হতে হবে।Σ

হায়াসির একনোমেট্রিক্সে একটি দুর্দান্ত আলোচনা (যা এই পোস্টকে অনুপ্রাণিত করেছিল) দেওয়া হয়েছে । (চতুর্থ মুহূর্তের জন্য এবং সমবায়ু ম্যাট্রিক্সের অনুমানের জন্য পৃষ্ঠা 149 দেখুন See)

আলোচনা:

চতুর্থ মুহুর্তে এই প্রয়োজনীয়তাগুলি সম্ভবত ব্যবহারিক বিন্দুর চেয়ে প্রযুক্তিগত বিন্দু। আপনি সম্ভবত প্যাথলজিকাল বিতরণগুলির মুখোমুখি হচ্ছেন না যেখানে প্রতিদিনের ডেটাতে এটি সমস্যা? ওএলএস-এর আরও সাধারণ বা অন্যান্য অনুমানগুলি অবাক হওয়ার জন্য।

স্ট্যাকেক্সচেঞ্জে নিঃসন্দেহে অন্য কোথাও উত্তর দেওয়া একটি আলাদা প্রশ্ন, অ্যাসিপটোটিক ফলাফলের কাছাকাছি যেতে সীমাবদ্ধ নমুনার জন্য আপনার কতটা বড় নমুনা দরকার is কিছু ধারণা আছে যাতে চমত্কার আউটলিয়াররা ধীরে ধীরে একত্রিত হওয়ার দিকে পরিচালিত করে। উদাহরণস্বরূপ, সত্যিই উচ্চ বৈকল্পিকের সাথে লগনরমাল বিতরণের গড়ের অনুমান করার চেষ্টা করুন। নমুনাটির গড় অর্থ জনসংখ্যার একটি সামঞ্জস্যপূর্ণ, নিরপেক্ষ অনুমানক, তবে লগ-স্বাভাবিক ক্ষেত্রে পাগল অতিরিক্ত কুরটোসিস ইত্যাদি ... (লিঙ্কটি অনুসরণ করুন), সীমাবদ্ধ নমুনার ফলাফলগুলি সত্যই বন্ধ off

স্নাতক বনাম অসীম গণিতের একটি অত্যন্ত গুরুত্বপূর্ণ পার্থক্য। প্রতিদিনের পরিসংখ্যানগুলিতে আপনি যে সমস্যার মুখোমুখি হন তা নয়। ব্যবহারিক সমস্যাগুলি ছোট বনাম বড় বিভাগে বেশি। বৈকল্পিকতা, কুর্তোসিস ইত্যাদি কি এতটা ছোট যে আমি আমার নমুনার আকারের ভিত্তিতে যুক্তিসঙ্গত অনুমানগুলি অর্জন করতে পারি?

প্যাথলজিকাল উদাহরণ যেখানে ওএলএসের অনুমানকারী সামঞ্জস্যপূর্ণ তবে অ্যাসিপোটোটিকভাবে স্বাভাবিক নয়

বিবেচনা:

yi=bxi+ϵi
যেখানে তবে টি-ডিস্ট্রিবিউশন থেকে 2 ডিগ্রি স্বাধীনতার সাথে আঁকা is । OLS ঔজ্জ্বল্যের প্রেক্ষাপটে করার সম্ভাবনা মধ্যে এগোয় অনুমান কিন্তু OLS ঔজ্জ্বল্যের প্রেক্ষাপটে জন্য নমুনা বন্টন অনুমান স্বাভাবিকভাবে বিতরণ করা হয় না। নীচে for এর 10000 টি পর্যবেক্ষণ সহ একটি রিগ্রেশন 10000 অনুকরণের উপর ভিত্তি করে distributionxiN(0,1)ϵiVar(ϵi)=bb^b^অনুমানকারীদের জন্য কিউকিউপ্লট (বিতরণকে সাধারণ রূপান্তর করে না)

of এর বিতরণ স্বাভাবিক নয়, লেজগুলি খুব ভারী। তবে আপনি যদি স্বাধীনতার ডিগ্রি 3 তে বাড়িয়ে দেন যাতে moment এর দ্বিতীয় মুহূর্তটি বিদ্যমান থাকে তবে কেন্দ্রীয় সীমাটি প্রযোজ্য এবং আপনি পান: b^ϵiঅনুমানকারীদের জন্য কিউকিউপ্লট (বিতরণকে স্বাভাবিক রূপান্তর করে)

এটি উত্পন্ন করার কোড:

beta = [-4; 3.7];
n = 1e5;    
n_sim = 10000;    
for s=1:n_sim
    X = [ones(n, 1), randn(n, 1)];  
    u  = trnd(2,n,1) / 100;
    y = X * beta + u;

    b(:,s) = X \ y;
end
b = b';
qqplot(b(:,2));

1
চমৎকার উত্তর. তবে নিম্নলিখিতগুলি প্রকৃতপক্ষে প্রসঙ্গে নির্ভর করে: আপনি প্রতিদিনের ডেটাতে অস্তিত্বহীন চতুর্থ মুহুর্তের সাথে প্যাথলজিকাল বিতরণের মুখোমুখি হচ্ছেন না। আর্থিক তথ্য (আর্থিক সম্পদে লগ-রিটার্ন) সাধারণত সীমাবদ্ধ চতুর্থ মুহূর্ত না হওয়ার মতো ভারী লেজযুক্ত। সুতরাং চতুর্থ মুহূর্তটি নিয়ে উদ্বেগটি সেখানে খুব বাস্তব। (আপনি সম্ভবত এটি আপনার দাবির জন্য প্যারেন্টিকাল কাউন্টারিক্স নমুনা হিসাবে যুক্ত করতে পারেন Also) এছাড়াও, একটি প্রশ্ন: আপনার উদাহরণস্বরূপ, সীমাবদ্ধ চতুর্থ মুহূর্ত না থাকা সত্ত্বেও কেন অ্যাসিম্পটিক স্বাভাবিকতা অর্জন করে? t(3)
রিচার্ড হার্ডি

1
@RichardHardy আপনি চান যেখানে । আপনি যে 4 র্থ মুহূর্ত প্রয়োজন অস্তিত্ব, এবং মূলত সালে দ্বিতীয় মুহূর্ত যখন সঙ্গে সম্পর্কহীন থাকে । n(1nixiϵi)dN(0,Σ)Σ=E[xixiϵi2]ΣΣϵiϵi2xixi
ম্যাথু গন

6
  1. এটি যথেষ্ট অনুমান, তবে একটি ন্যূনতম এক নয় [1]। ওএলএস এই অবস্থার অধীনে পক্ষপাতদুষ্ট নয়, এটি কেবল বেমানান। চূড়ান্ত প্রভাব ফেলতে পারে এবং / অথবা আপনি যদি খুব বড় অবশিষ্টাংশ পেতে পারেন তখন ওএলএসের অ্যাসিম্পটিক বৈশিষ্ট্যগুলি ভেঙে যায় । আপনি লিন্ডবার্গ ফিলার কেন্দ্রীয় সীমাবদ্ধ তত্ত্বের আনুষ্ঠানিক উপস্থাপনের মুখোমুখি হতে পারেন নি, তবে এটিই তারা এখানে চতুর্থ মুহুর্তের অবস্থার সাথে সম্বোধন করছে, এবং লিন্ডবার্গ শর্তটি মূলত একই জিনিসটি আমাদের বলে: কোনও প্রভাব ছাড়াই পয়েন্ট, কোনও ওভারলেজ হাই লিভারেজ নেই পয়েন্ট [2]।X

  2. ব্যবহারিক প্রয়োগগুলির জন্য সিদ্ধ হয়ে গেলে পরিসংখ্যানগুলির এই তাত্ত্বিক আন্ডারপ্লিনগুলি প্রচুর বিভ্রান্তির সৃষ্টি করে। আউটলারের কোনও সংজ্ঞা নেই, এটি একটি স্বজ্ঞাত ধারণা। এটিকে মোটামুটিভাবে বোঝার জন্য, পর্যবেক্ষণটি একটি উচ্চতর লিভারেজ পয়েন্ট বা উচ্চ প্রভাব পয়েন্ট হতে হবে, উদাহরণস্বরূপ, মুছে ফেলা ডায়াগনস্টিক (ডিএফ বিটা) খুব বড়, বা যার জন্য ভবিষ্যদ্বাণীকারীদের মধ্যে মহালানোবিসের দূরত্ব বড় (অবিচ্ছিন্ন পরিসংখ্যানগুলিতে) এটি কেবল একটি জেড স্কোর)। তবে আসুন ব্যবহারিক বিষয়ে ফিরে আসুন: যদি আমি লোক এবং তাদের পরিবারের আয়ের একটি র্যান্ডম জরিপ পরিচালনা করি এবং 100 জন ব্যক্তির মধ্যে আমি নমুনা প্রাপ্ত ব্যক্তির মধ্যে 1 জন, আমার সর্বোত্তম অনুমান যে মিলিয়নেয়াররা জনসংখ্যার 1% প্রতিনিধি । বায়োস্টাটিস্টিক্সের একটি বক্তৃতায় এই প্রিন্সিপালগুলিকে আলোচনা করা হয় এবং জোর দেওয়া হয় যে কোনও ডায়াগনস্টিক টুল মূলত অনুসন্ধানী [3]।না তা না হয়, "বিশ্লেষণ যা বাদ আউটলিয়ার আমি বিশ্বাস", "মুছে ফেলার এক পর্যায়ে সম্পূর্ণভাবে আমার বিশ্লেষণ পরিবর্তন করেছেন।"

  3. কুর্তোসিস একটি পরিমিত পরিমাণ যা কোনও বিতরণের দ্বিতীয় মুহুর্তের উপর নির্ভর করে, তবে এই মানগুলির জন্য সীমাবদ্ধ, শূন্য-বিহীন বৈকল্পিকতা অনুমিত হওয়া কারণ এই সম্পত্তিটি চতুর্থ মুহূর্তে ধরে রাখা অসম্ভব তবে দ্বিতীয়টিতে নয়। সুতরাং মূলত হ্যাঁ, তবে সামগ্রিকভাবে আমি কুর্তোসিস বা চতুর্থ মুহূর্ত কখনও পরিদর্শন করিনি। আমি এগুলিকে ব্যবহারিক বা স্বজ্ঞাত মাপ হিসাবে খুঁজে পাই না। আজকের দিনে যখন কোনও হিস্টোগ্রাম বা স্ক্যাটার প্লটটি কারও আঙুলের স্ন্যাপ দ্বারা উত্পাদিত হয়, তখন আমাদের এই প্লটগুলি পরিদর্শন করে গুণগত গ্রাফিকাল ডায়াগনস্টিক পরিসংখ্যানগুলি ব্যবহার করা সুদৃ .় করে।

[1] /math/79773/how-does-one-prove-that-lindeberg-condition-is-satised

[2] http://projecteuclid.org/download/pdf_1/euclid.ss/1177013818

[3] http://facchool.washington.edu/semerson/b517_2012/b517L03-2012-10-03/b517L03-2012-10-03.html


যেমনটি আগে উল্লেখ করা হয়েছে , আউটলিয়ারদের সম্পর্কে যখন তাদের মধ্যে একের বেশি থাকে তখন তাদের অন্তর্নিহিততা ভেঙে যায়। তারা অগত্যা ডিএফ বিটা প্লটটিতে দাঁড়াবে না বা বড় জেড-স্কোর পাবে না কারণ এই পরিসংখ্যানগুলি নিজেরাই বহিরাগতদের দ্বারা দমন করা যায়। যেমনটি আমরা আগে আলোচনা করেছি, আউটলিয়াররা , যদি তা পরীক্ষা না করা হয় তবে পক্ষপাতমূলক সহগ উত্পাদন করবে আপনি যদি না তাদের অপসারণ করেন বা তাদের কাছে কোনও প্রাক্কলন কৌশলটি ব্যবহার না করেন।
ব্যবহারকারী 603

1
আমি আরও সাধারণভাবে মনে করি, মতামত প্রকাশ করার সময়, আপনার উত্তরগুলি প্রাসঙ্গিক সাহিত্যের পয়েন্টারগুলি অন্তর্ভুক্ত করে লাভ করতে পারে যাতে ওপি জানতে পারে যে এই মতামতের মধ্যে কোনটি বহুলভাবে রাখা আছে।
ব্যবহারকারী 603

@ ইউজার 603 আপনার প্রথম মন্তব্যে, আমি ডিএফবেটাস (বা কোনও ডায়াগনস্টিক সরঞ্জাম) বিদেশী সনাক্তকারীদের সনাক্তকরণের একচেটিয়া পদ্ধতি হিসাবে চিহ্নিত করিনি, তবে অবশ্যই একটি দরকারী। আধা-প্যারামেট্রিক ইনফারেন্স (অর্থ মডেল সঠিক) সম্পাদনকারীরা এলএস মডেলগুলিকে পক্ষপাতিত্ব করে না, আপনি কি প্যারামিমেট্রিক এলএস বাদে অন্য কোনও ক্ষেত্রে একটি রেফারেন্স বা এমনকি উদাহরণ উপস্থাপন করতে পারেন? আপনার দ্বিতীয় মন্তব্যটি একটি ভাল, এবং উদ্ধৃতি সরবরাহ করতে আমি পরবর্তী কয়েক মুহূর্ত নেব।
অ্যাডামো

আপনার বক্তব্য, "ওএলএস এই শর্তাবলীতে পক্ষপাতদুষ্ট নয়, এটি কেবল অসঙ্গতিপূর্ণ" সঠিক নয়। উচ্চতর মুহুর্তগুলি অ্যাসিপোটোটিক স্বাভাবিকতার জন্য প্রয়োজন। আইআইডি স্যাম্পলগুলিতে ধারাবাহিকতার জন্য তাদের প্রয়োজন হয় না যেখানে কোলমোগোরভ লার্জ অফ লম্বার নাম্বার প্রয়োগ হয়।
ম্যাথু গন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.