কী চলতে পারে তা বোঝার জন্য, বর্ণিত পদ্ধতিতে আচরণ করে এমন ডেটা উত্পন্ন (এবং বিশ্লেষণ) করা শিক্ষামূলক।
সরলতার জন্য, আসুন সেই ষষ্ঠ স্বাধীন ভেরিয়েবলটি ভুলে যাই। সুতরাং, প্রশ্ন এক নির্ভরশীল ভেরিয়েবলের রিগ্রেশন বর্ণনা পাঁচটি স্বাধীন ভেরিয়েবল বিরুদ্ধে এক্স 1 , x 2 , x 3 , x 4 , x 5 , যাYএক্স1, এক্স2, এক্স3, এক্স4, এক্স5
প্রতিটি সাধারণ রিগ্রেশন 0.01 থেকে 0.001 এর চেয়ে কম স্তরে গুরুত্বপূর্ণ ।Y। Xআমি0.010.001
একাধিক রিগ্রেশন কেবলমাত্র x 1 এবং x 2 এর জন্য উল্লেখযোগ্য সহগের ফলন দেয় ।Y। X1+ ⋯ + এক্স5এক্স1এক্স2
সমস্ত ভেরিয়েন্স মুদ্রাস্ফীতি কারণগুলি (ভিআইএফ) কম, এটি নকশার ম্যাট্রিক্সে ভাল কন্ডিশনার নির্দেশ করে (এটি, x i এর মধ্যে সমলগ্নতার অভাব )।এক্সআমি
আসুন নিম্নলিখিত হিসাবে এটি ঘটায়:
জেনারেট করুন জন্য স্বাভাবিকভাবে বিতরণ মান এক্স 1 এবং এক্স 2 । (আমরা পরে n নির্বাচন করব ।)এনএক্স1এক্স2এন
যাক যেখানে ε গড় স্বাধীন স্বাভাবিক ত্রুটি 0 । Trial এর জন্য উপযুক্ত মানক বিচ্যুতি খুঁজতে কিছু বিচার এবং ত্রুটি প্রয়োজন ; 1 / 100 কাজ করে জরিমানা (এবং বরং নাটকীয় হল: Y হয় অত্যন্ত ভাল সঙ্গে সম্পর্কিত এক্স 1 এবং এক্স 2 , যদিও এটি শুধুমাত্র পরিমিতরূপে সঙ্গে সম্পর্কিত এক্স 1 এবং এক্স 2 স্বতন্ত্রভাবে)।Y= এক্স1+ এক্স2+ + εε0ε1 / 100Yএক্স1এক্স2এক্স1এক্স2
যাক = এক্স 1 / 5 + + δ , ঞ = 3 , 4 , 5 , যেখানে δ স্বাধীন আদর্শ স্বাভাবিক ত্রুটি। এটা তৈরি করে এক্স 3 , x 4 , x 5 শুধুমাত্র সামান্য উপর নির্ভরশীল এক্স 1 । যাইহোক, x 1 এবং y এর মধ্যে শক্ত সম্পর্কের মাধ্যমে, এটি y এবং এই x j এর মধ্যে একটি ছোট সম্পর্ক স্থাপন করে ।এক্সঞএক্স1/ 5+δj = 3 , 4 , 5δএক্স3, এক্স4, এক্স5এক্স1এক্স1YYএক্সঞ
এখানে ঘষা আছে: যদি আমরা করতে বৃহৎ যথেষ্ট, এই সামান্য সম্পর্কযুক্তরূপে উল্লেখযোগ্য কোফিসিয়েন্টস পরিণাম ডেকে আনবে, যদিও Y প্রায় পুরোটাই শুধুমাত্র প্রথম দুই ভেরিয়েবল দ্বারা "ব্যাখ্যা"।এনY
আমি দেখতে পেয়েছি যে রিপোর্ট করা পি-মানগুলি পুনঃপ্রজননের জন্য ঠিক কাজ করে works এখানে ছয়টি ভেরিয়েবলের একটি স্ক্যাটারপ্ল্লট ম্যাট্রিক্স রয়েছে:n = 500
ডান কলামটি (বা নীচের সারি) পরিদর্শন করে আপনি দেখতে পাচ্ছেন যে এক্স এর 1 এবং x 2 এর সাথে এর একটি ভাল (ধনাত্মক) সম্পর্ক আছে তবে অন্যান্য ভেরিয়েবলের সাথে সামান্য আপাত সম্পর্ক রয়েছে lation এই ম্যাট্রিক্সের বাকী অংশটি পরিদর্শন করে আপনি দেখতে পাচ্ছেন যে স্বাধীন ভেরিয়েবল এক্স 1 , … , এক্স 5 পারস্পরিক নিরবচ্ছিন্ন বলে মনে হচ্ছে (এলোমেলো δYএক্স1এক্স2এক্স1, … , এক্স5δআমরা জানি যে ক্ষুদ্র নির্ভরশীলতাগুলি আছে তা মুখোশ করুন)) কোনও ব্যতিক্রমী ডেটা নেই - ভয়ঙ্করভাবে বহিরাগত বা উচ্চ উত্তোলনের সাথে কিছুই নেই। হিস্টোগ্রামগুলি দেখায় যে সমস্ত ছয়টি চলক আনুমানিকভাবে সাধারণত বিতরণ করা হয়, উপায় দ্বারা: এই ডেটাগুলি যতটা সম্ভব সম্ভবত "সাধারণ ভ্যানিলা" হিসাবে সাধারণ হিসাবে বিতরণ করা যায়।
রিগ্রেশনে বিরুদ্ধে এক্স 1 এবং এক্স 2 , পি-মান মূলত 0. পৃথক রিগ্রেশন হয় Y বিরুদ্ধে এক্স 3 , তারপর Y বিরুদ্ধে এক্স 4 , এবং Y বিরুদ্ধে এক্স 5 , পি-মান 0,0024, 0,0083 হয় , এবং 0.00064 যথাক্রমে: অর্থাৎ এগুলি "অত্যন্ত তাৎপর্যপূর্ণ"। তবে সম্পূর্ণ একাধিক রিগ্রেশনে, সংশ্লিষ্ট পি-মানগুলি যথাক্রমে .46, .36 এবং .52 এ স্ফীত হয়: মোটেই তাৎপর্যপূর্ণ নয়। এই জন্য কারণ যে একবার Y বিরুদ্ধে regressed হয়েছে এক্স 1 এবং এক্সYএক্স1এক্স2Yএক্স3Yএক্স4Yএক্স5Yএক্স1 , শুধুমাত্র জিনিস "ব্যাখ্যা" বামে অবশিষ্টাংশ, যা আনুমানিক হবে ত্রুটির অতি ক্ষুদ্র পরিমাণ ε , এবং এই ত্রুটি প্রায় পুরোপুরি অবশিষ্ট অসম্পর্কিত হয় এক্স আমি । ("প্রায়" সঠিক: সত্যিকার অর্থেই ছোট্ট একটি সম্পর্ক রয়েছে যা থেকে অনুমান করা হয় যে বাকী অংশগুলি x 1 এবং x 2 এর মান থেকে কিছু অংশে গণনা করা হয়েছিলএবং x i , i = 3 , 4 , 5 এর কিছু দুর্বলতা রয়েছে) সাথে সম্পর্ক এক্স 1 এবং এক্স 2 । এই অবশিষ্ট সম্পর্ক কার্যত সনাক্তকরণের অযোগ্য, যদিও, হিসাবে আমরা দেখেছি।)এক্স2εএক্সআমিএক্স1এক্স2এক্সআমিi = 3 , 4 , 5এক্স1এক্স2
ডিজাইনের ম্যাট্রিক্সের কন্ডিশনার সংখ্যাটি কেবল ২.১17: এটি খুব কম, উচ্চতর বহুবিশেষের কোনও ইঙ্গিত দেখাচ্ছে না। (কোলিনারিটির নিখুঁত অভাবটি 1 এর কন্ডিশনিং সংখ্যায় প্রতিফলিত হবে তবে বাস্তবে এটি কেবল কৃত্রিম ডেটা এবং নকশা করা পরীক্ষাগুলিতেই দেখা যায় -6--6 পরিসরে শর্তাধীন সংখ্যা (বা আরও বেশি ভেরিয়েবল সহ আরও উচ্চতর) অবিস্মরণীয়)) এটি সিমুলেশনটি সম্পূর্ণ করে: এটি সমস্যার প্রতিটি দিক সফলভাবে পুনরুত্পাদন করেছে।
এই বিশ্লেষণগুলির যে অফুরন্ত অন্তর্দৃষ্টি রয়েছে তার মধ্যে অন্তর্ভুক্ত রয়েছে
পি-মানগুলি সরাসরি প্রান্তিকতা সম্পর্কে কিছু বলে না। তারা তথ্যের পরিমাণের উপর দৃ strongly়ভাবে নির্ভর করে।
একাধিক রিগ্রেশন এবং পি-ভ্যালু সম্পর্কিত সম্পর্কগুলিতে পি-ভ্যালুগুলির মধ্যে সম্পর্ক (স্বতন্ত্র ভেরিয়েবলের সাবসেটগুলি জড়িত) জটিল এবং সাধারণত অবিশ্বাস্য।
ফলস্বরূপ, অন্যদের যুক্তি অনুসারে, পি-মানগুলি মডেল নির্বাচনের জন্য আপনার একক গাইড (বা এমনকি আপনার মূল গাইড) হওয়া উচিত নয়।
সম্পাদন করা
এই ঘটনাটি প্রকাশের জন্য পক্ষে 500 এর চেয়ে বেশি হওয়া বড় নয় । এন500 প্রশ্নে অতিরিক্ত তথ্য দ্বারা অনুপ্রাণিত নিম্নলিখিত একটি ডেটাসেটের সঙ্গে একটি অনুরূপ ফ্যাশন নির্মাণ হয় (এই ক্ষেত্রে এক্স ঞ = 0.4 এক্স 1 + + 0.4 এক্স 2 + + δ জন্য ঞ = 3 , 4 , 5 )। এটি এক্স 1 - 2 এবং এক্স 3 - 5 এর মধ্যে 0.38 থেকে 0.73 এর পারস্পরিক সম্পর্ক তৈরি করেn=24xj=0.4x1+0.4x2+δj=3,4,5x1−2x3−5। ডিজাইনের ম্যাট্রিক্সের শর্ত সংখ্যা 9.05: কিছুটা কম তবে ভয়ঙ্কর নয়। ( থাম্বের কিছু নিয়ম বলেছে যে শর্তের সংখ্যা 10 এর চেয়ে বেশি ঠিক আছে)) এর বিপরীতে পৃথক সংস্থাগুলির পি-মানগুলি 0.002, 0.015 এবং 0.008: অত্যন্ত তাৎপর্যপূর্ণ থেকে তাৎপর্যপূর্ণ। সুতরাং, কিছু বহুবিশ্লেষ জড়িত, তবে এটি এত বড় নয় যে এটি পরিবর্তনের জন্য কেউ কাজ করবে। প্রাথমিক অন্তর্দৃষ্টি একই থাকেx3,x4,x5: তাত্পর্য এবং বহুবিধ লাইন বিভিন্ন জিনিস; তাদের মধ্যে কেবল হালকা গাণিতিক প্রতিবন্ধকতা রয়েছে; এমনকি একক ভেরিয়েবলের অন্তর্ভুক্তি বা বাদ দেওয়াও সম্ভব, এমনকি গুরুতর বহুবিধ লম্বা সমস্যা না হয়েও সমস্ত পি-মানগুলিতে গভীর প্রভাব ফেলতে পারে।
x1 x2 x3 x4 x5 y
-1.78256 -0.334959 -1.22672 -1.11643 0.233048 -2.12772
0.796957 -0.282075 1.11182 0.773499 0.954179 0.511363
0.956733 0.925203 1.65832 0.25006 -0.273526 1.89336
0.346049 0.0111112 1.57815 0.767076 1.48114 0.365872
-0.73198 -1.56574 -1.06783 -0.914841 -1.68338 -2.30272
0.221718 -0.175337 -0.0922871 1.25869 -1.05304 0.0268453
1.71033 0.0487565 -0.435238 -0.239226 1.08944 1.76248
0.936259 1.00507 1.56755 0.715845 1.50658 1.93177
-0.664651 0.531793 -0.150516 -0.577719 2.57178 -0.121927
-0.0847412 -1.14022 0.577469 0.694189 -1.02427 -1.2199
-1.30773 1.40016 -1.5949 0.506035 0.539175 0.0955259
-0.55336 1.93245 1.34462 1.15979 2.25317 1.38259
1.6934 0.192212 0.965777 0.283766 3.63855 1.86975
-0.715726 0.259011 -0.674307 0.864498 0.504759 -0.478025
-0.800315 -0.655506 0.0899015 -2.19869 -0.941662 -1.46332
-0.169604 -1.08992 -1.80457 -0.350718 0.818985 -1.2727
0.365721 1.10428 0.33128 -0.0163167 0.295945 1.48115
0.215779 2.233 0.33428 1.07424 0.815481 2.4511
1.07042 0.0490205 -0.195314 0.101451 -0.721812 1.11711
-0.478905 -0.438893 -1.54429 0.798461 -0.774219 -0.90456
1.2487 1.03267 0.958559 1.26925 1.31709 2.26846
-0.124634 -0.616711 0.334179 0.404281 0.531215 -0.747697
-1.82317 1.11467 0.407822 -0.937689 -1.90806 -0.723693
-1.34046 1.16957 0.271146 1.71505 0.910682 -0.176185