এটির কারণ হতে স্বতন্ত্র ভেরিয়েবলগুলির মধ্যে খুব সামান্য সম্পর্ক রয়েছে takes
কেন তা দেখতে, নিম্নলিখিত চেষ্টা করুন:
দশটি ভেক্টরের 50 টি সেট আঁকুন সহগ সহ স্ট্যান্ডার্ড।(x1,x2,…,x10)
জন্য গণনা করুন । এটি স্বতন্ত্রভাবে স্ট্যান্ডার্ডকে সাধারণ করে তোলে তবে তাদের মধ্যে কিছু সংযোগ রয়েছে।yi=(xi+xi+1)/2–√i=1,2,…,9yi
গণনা । নোট করুন যে ।w=x1+x2+⋯+x10w=2–√(y1+y3+y5+y7+y9)
কিছু স্বাধীন স্বাভাবিকভাবে বিতরণ ত্রুটি যোগ । একটু পরীক্ষা আমি সেখানে পাওয়া গেছে সঙ্গে চমত্কার ভাল কাজ করে। সুতরাং, হল প্লাস কিছু ত্রুটির যোগফল । এছাড়া এর সমষ্টি কিছু প্লাস একই ত্রুটি।wz=w+εε∼N(0,6)zxiyi
আমরা কে স্বতন্ত্র ভেরিয়েবল এবং নির্ভরশীল ভেরিয়েবল হিসাবে বিবেচনা করব।yiz
উপরের এবং বাম পাশে সহ এবং ক্রমানুসারে এগিয়ে চলেছে এমন একটি ডেটাসেটের একটি স্ক্র্যাপরপ্লট ম্যাট্রিক্স এখানে ।zyi
এবং এর মধ্যে প্রত্যাশিত সম্পর্কগুলি যখন এবং অন্যথায়। অনুধাবন পারস্পরিক সম্পর্ক 62% পর্যন্ত। এগুলি তির্যকের পাশের আরও শক্ত স্ক্রেটারপ্লট হিসাবে প্রদর্শিত হয়।yiyj1/2|i−j|=10
বিরুদ্ধে এর রিগ্রেশন দেখুন :zyi
Source | SS df MS Number of obs = 50
-------------+------------------------------ F( 9, 40) = 4.57
Model | 1684.15999 9 187.128887 Prob > F = 0.0003
Residual | 1636.70545 40 40.9176363 R-squared = 0.5071
-------------+------------------------------ Adj R-squared = 0.3963
Total | 3320.86544 49 67.7727641 Root MSE = 6.3967
------------------------------------------------------------------------------
z | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
y1 | 2.184007 1.264074 1.73 0.092 -.3707815 4.738795
y2 | 1.537829 1.809436 0.85 0.400 -2.119178 5.194837
y3 | 2.621185 2.140416 1.22 0.228 -1.704757 6.947127
y4 | .6024704 2.176045 0.28 0.783 -3.795481 5.000421
y5 | 1.692758 2.196725 0.77 0.445 -2.746989 6.132506
y6 | .0290429 2.094395 0.01 0.989 -4.203888 4.261974
y7 | .7794273 2.197227 0.35 0.725 -3.661333 5.220188
y8 | -2.485206 2.19327 -1.13 0.264 -6.91797 1.947558
y9 | 1.844671 1.744538 1.06 0.297 -1.681172 5.370514
_cons | .8498024 .9613522 0.88 0.382 -1.093163 2.792768
------------------------------------------------------------------------------
এফ পরিসংখ্যাত অত্যন্ত গুরুত্বপূর্ণ কিন্তু কেউই স্বাধীন ভেরিয়েবল, এমনকি তাদের সব 9 কোনো সমন্বয় ছাড়া।
কী চলছে তা দেখার জন্য, কেবল বিজোড় সংখ্যাযুক্ত বিরুদ্ধে প্রতিরোধকে বিবেচনা করুন :zyi
Source | SS df MS Number of obs = 50
-------------+------------------------------ F( 5, 44) = 7.77
Model | 1556.88498 5 311.376997 Prob > F = 0.0000
Residual | 1763.98046 44 40.0904649 R-squared = 0.4688
-------------+------------------------------ Adj R-squared = 0.4085
Total | 3320.86544 49 67.7727641 Root MSE = 6.3317
------------------------------------------------------------------------------
z | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
y1 | 2.943948 .8138525 3.62 0.001 1.303736 4.58416
y3 | 3.403871 1.080173 3.15 0.003 1.226925 5.580818
y5 | 2.458887 .955118 2.57 0.013 .533973 4.383801
y7 | -.3859711 .9742503 -0.40 0.694 -2.349443 1.577501
y9 | .1298614 .9795983 0.13 0.895 -1.844389 2.104112
_cons | 1.118512 .9241601 1.21 0.233 -.7440107 2.981034
------------------------------------------------------------------------------
এর মধ্যে কিছু ভেরিয়েবল অত্যন্ত উল্লেখযোগ্য, এমনকি একটি Bonferroni সামঞ্জস্য রয়েছে। (এই ফলাফলগুলি দেখে আরও অনেক কিছু বলা যায় তবে এটি আমাদের মূল বিষয় থেকে দূরে সরিয়ে নিয়ে যায় would)
এর পিছনে স্বজ্ঞাততাটি হ'ল মূলত ভেরিয়েবলগুলির একটি উপসেটের উপর নির্ভর করে (তবে অগত্যা কোনও অনন্য সাবসেটের উপরে নয়)। এই সাবসেটের পরিপূরক ( ) কারণে মূলত কোনও তথ্য যোগ করে না - যদিও সামান্য — সাবসেটের সাথেই।y 2 , y 4 , y 6 , y 8 zzy2,y4,y6,y8z
সময় ধারাবাহিক বিশ্লেষণে এই ধরণের পরিস্থিতি তৈরি হবে । সাবস্ক্রিপ্টগুলি আমরা সময়ের হিসাবে বিবেচনা করতে পারি। এর অনেক সময় সিরিজের মতো তাদের মধ্যে একটি স্বল্প-পরিসরের সিরিয়াল সম্পর্ককে প্ররোচিত করেছে। এর কারণে, আমরা নিয়মিত বিরতিতে সিরিজটি সাব্পলিং করে অল্প তথ্য নষ্ট করি।yi
একটি উপসংহার যা আমরা এগুলি থেকে আঁকতে পারি তা হ'ল যখন খুব বেশি ভেরিয়েবলগুলি কোনও মডেলের অন্তর্ভুক্ত হয় তখন তারা সত্যিকারের তাৎপর্যগুলি মাস্ক করতে পারে। এর প্রথম চিহ্নটি হ'ল অত্যন্ত তাত্পর্যপূর্ণ সামগ্রিক এফ পরিসংখ্যান সহ পৃথক সহগের জন্য তাত্পর্যপূর্ণ-টি-টেস্টের সাথে নয়। (এমনকি কিছু ভেরিয়েবল স্বতন্ত্রভাবে তাত্পর্যপূর্ণ হওয়া সত্ত্বেও, এটি স্বয়ংক্রিয়ভাবে অন্যরা নয় বলে বোঝায় না step এটি ধাপে ধাপে প্রতিরোধের কৌশলগুলির অন্যতম একটি মূল ত্রুটি: তারা এই মুখোশধারার সমস্যার শিকার হয়)) ঘটনাক্রমে, বৈকল্পিক মুদ্রার কারণগুলিপ্রথম প্রতিরোধের পরিসীমাটিতে 2.55 থেকে 6.09 এর মধ্যে 4.79 গড় ছিল: ঠিক থাম্বের সবচেয়ে রক্ষণশীল নিয়ম অনুসারে কিছু বহুবিধ লাইন সনাক্তকরণের সীমান্তরেখায়; অন্যান্য নিয়ম অনুসারে প্রান্তিকের নীচে (যেখানে 10 একটি উচ্চতর কাট অফ)।