রিগ্রেশনের জন্য ভেরিয়েবলগুলি নির্বাচন করতে প্রধান উপাদান বিশ্লেষণ কীভাবে ব্যবহার করবেন?


12

আমি বর্তমানে মডেলিংয়ে ব্যবহারের জন্য ভেরিয়েবলগুলি নির্বাচন করতে প্রধান উপাদান বিশ্লেষণ ব্যবহার করছি। এই মুহুর্তে, আমি আমার পরীক্ষাগুলিতে এ, বি এবং সি পরিমাপ করি - আমি যা জানতে চাই তা হল: আমি কি আরও কম পরিমাপ করতে পারি এবং সময় এবং প্রচেষ্টা বাঁচাতে সি এবং বা বি রেকর্ডিং বন্ধ করতে পারি?

আমি দেখতে পেলাম যে সমস্ত 3 ভেরিয়েবলগুলি আমার প্রথম মূল উপাদানটির উপর ভারী চাপায় যা আমার ডেটাতে 60% বৈকল্পিকের জন্য দায়ী। উপাদানগুলির স্কোরগুলি আমাকে বলে যে আমি যদি একটি নির্দিষ্ট অনুপাতের (এএ + বিবি + সিসি) সাথে এই ভেরিয়েবলগুলি যুক্ত করি। আমি আমার ডেটাসেটের প্রতিটি মামলার জন্য পিসি 1 এ স্কোর পেতে পারি এবং মডেলিংয়ের ক্ষেত্রে এই স্কোরটি ভেরিয়েবল হিসাবে ব্যবহার করতে পারি, তবে এটি আমাকে বি এবং সি পরিমাপ বন্ধ করতে দেয় না doesn't

আমি যদি পিসি 1 এ এবং বি এবং সি এর লোডিংগুলি বর্গক্ষেত্র করি তবে আমি দেখতে পাচ্ছি যে পিসি 1 এর ভেরিয়েবলের 65% এবং ভেরিয়েবল বি পিসি 1 এবং ভেরিয়েবল সিতে 50% পরিবর্তনেরও 50% থাকে, কিছু কিছু পিসি 1 এর ভেরিয়েন্সের প্রতিটি ভেরিয়েবল এ, বি এবং সি এর সাথে অন্য ভেরিয়েবলের সাথে ভাগ করা হয় তবে এ সামান্য আরও বেশি হিসাবে শীর্ষে অ্যাকাউন্টিংয়ে আসে A

মডেলিংয়ে ব্যবহার করার জন্য আমি কেবল ভেরিয়েবল এ বা সম্ভবত (এএ + বিবি, যদি প্রয়োজন) পছন্দ করতে পারি তবে এটি কী ভুল হবে কারণ এই ভেরিয়েবলটি পিসি 1-এ পরিবর্তনের একটি বৃহত অনুপাত বর্ণনা করে এবং এর ফলে পরিবর্তনের একটি বৃহত অনুপাত বর্ণনা করে তথ্যটি?

অতীতে আপনি কোন পদ্ধতির জন্য গিয়েছিলেন?

  • একক ভেরিয়েবল যা ভারী ভারী লোডার থাকা সত্ত্বেও পিসি 1 তে সবচেয়ে ভারী বোঝায়?
  • সমস্ত ভেরিয়েবল ব্যবহার করে পিসি 1 তে কম্পোনেন্ট স্কোরগুলি কী তারা সমস্ত ভারী লোডার হয়?

উত্তর:


14

আপনি উল্লেখ করেছেন না কি "মডেলিং" আপনার উপর পরিকল্পনা, কিন্তু শোনাচ্ছে মত তুমি কেমন নির্বাচন সম্পর্কে বলছি স্বাধীন মধ্যে ভেরিয়েবল , বি , আর সি এর (বলুন) উদ্দেশ্যে একটি চতুর্থ regressing নির্ভরশীল পরিবর্তনশীল ডব্লিউ তাদের উপর।একজনবিসিওয়াট

এই পদ্ধতির ভুল হতে পারে তা দেখতে , তিনটি স্বতন্ত্রভাবে সাধারণত বিতরণযোগ্য ভেরিয়েবলগুলি , ওয়াই এবং জেডকে ইউনিট বৈকল্পিক বিবেচনা করুন। জন্য সত্য, অন্তর্নিহিত মডেল একটি ছোট ধ্রুবক চয়ন β « 1 , সত্যিই একটি অতি ক্ষুদ্র ধ্রুবক ε « β , এবং (নির্ভরশীল পরিবর্তনশীল) দিন ওয়াট = জেড (প্লাস ত্রুটির স্বাধীন একটি সামান্য বিট এক্স , ওয়াই , এবং জেড )।এক্সওয়াইজেডβ«1ε«βওয়াট=জেডএক্সওয়াইজেড

ধরুন স্বাধীন ভেরিয়েবল তোমার কি আছে , বি = এক্স - ε ওয়াই , এবং সি = β জেড । তারপরে ডাব্লু এবং সি দৃ strongly়ভাবে সম্পর্কযুক্ত (ত্রুটির বিভিন্নতার উপর নির্ভর করে), কারণ প্রতিটি জেডের একাধিকের কাছাকাছি । তবে ডাব্লু A বা B এর যে কোনও একটির সাথে সম্পর্কযুক্ত নয় । কারণ β ছোট, { , বি , সি } এর জন্য প্রথম প্রধান উপাদানএকজন=এক্স+ +εওয়াইবি=এক্স-εওয়াইসি=βজেডওয়াটসিজেডওয়াটএকজনবিβ{একজন,বি,সি}সমান্তরাল সঙ্গে eigenvalue 2 » β এবং বি এই উপাদানটিতে প্রচুর পরিমাণে লোড করে এবং সি লোডগুলি মোটেই নয় কারণ এটি এক্স (এবং ওয়াই ) এর থেকে পৃথক। তবুও, আপনি যদি কেবল এবং বি রেখে স্বাধীন ভেরিয়েবলগুলি থেকে সি মুছে ফেলেন তবে আপনি নির্ভরশীল ভেরিয়েবল সম্পর্কে সমস্ত তথ্য ফেলে দেবেন কারণ ডাব্লু , , এবং বি স্বতন্ত্র!এক্স2»βএকজনবিসিএক্সওয়াইসিএকজনবিওয়াটএকজনবি

এই উদাহরণটি দেখায় যে রিগ্রেশনের জন্য আপনি কীভাবে নির্ভরশীলটির সাথে স্বতন্ত্র ভেরিয়েবলগুলি সম্পর্কযুক্ত তা মনোযোগ দিতে চান; আপনি কেবল স্বাধীন ভেরিয়েবলের মধ্যে সম্পর্ক বিশ্লেষণ করে পালাতে পারবেন না।


1
এটি কি হওয়া উচিত নয় Z + ϵ Y ? একজন=এক্স+ +εওয়াইজেড+ +εওয়াই
shabbychef

@ শ্যাবি হ্যাঁ, ধন্যবাদ (ওপি এর নামের সাথে মেলে খোলার জন্য আমাকে সমস্ত ভেরিয়েবলের নাম পরিবর্তন করতে হয়েছিল এবং
এটিকে গোল করে ফেলেছিল

4

আপনার যদি মাত্র 3 আইভি থাকে তবে আপনি কেন তাদের হ্রাস করতে চান?

অর্থাত, আপনার নমুনাটি কি খুব ছোট (যাতে 3 আইভিও অতিমাত্রায় ঝুঁকিপূর্ণ হয়)? এই ক্ষেত্রে, আংশিক ন্যূনতম স্কোয়ারগুলি বিবেচনা করুন

বা পরিমাপগুলি কি খুব ব্যয়বহুল (তাই ভবিষ্যতে, আপনি কেবল একটি চতুর্থ পরিমাপ করতে চান)? এই ক্ষেত্রে, আমি পৃথকভাবে এবং একসাথে প্রতিটি IV এর সাথে আলাদা আলাদা অবস্থানগুলি দেখার বিষয়ে বিবেচনা করব।

বা আপনার অতীতে কেউ পার্সিমনিটির মানকে বেশি জোর দিয়েছিল? এই ক্ষেত্রে, সমস্ত 3 আইভি অন্তর্ভুক্ত করবেন না কেন?

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.