ভিআইএফ, শর্ত সূচি এবং ইগেনালিয়ুগুলি


15

আমি বর্তমানে আমার ডেটাসেটে বহুবিধ লাইন মূল্যায়ন করছি।

নীচে / উপরে ভিআইএফ এবং শর্ত সূচকের কোন প্রান্তিক মান কোনও সমস্যা প্রস্তাব করে?

ভিআইএফ: আমি শুনেছি ভিআইএফ একটি সমস্যা।10

দুটি সমস্যা ভেরিয়েবল অপসারণের পরে, প্রতিটি ভেরিয়েবলের জন্য ভিআইএফ । ভেরিয়েবলগুলির আরও চিকিত্সার দরকার আছে বা এই ভিএফটি কি ঠিক আছে?3.96

কন্ডিশন সূচক: আমি শুনেছি 30 বা ততোধিকের একটি শর্ত সূচক (সিআই) সমস্যা। আমার সর্বোচ্চ সিআই 16.66। এটা কি কোন সমস্যা?

অন্যান্য ব্যাপার:

  • অন্য কোন ডস / দান বিবেচনা করা প্রয়োজন?
  • আমার মনে রাখা দরকার এমন আরও কি কি জিনিস আছে?

1
প্রশ্নটি পরিষ্কার করুন। বিশেষত, এগুলি আগে থেকে কিছু মন্তব্য ছিল: @ চিএল দ্বারা - "আপনার একটি স্পষ্ট প্রশ্ন সহ স্পষ্ট প্রশ্নগুলি লেখার বিষয়টি বিবেচনা করা উচিত (সেগুলি তাদের নিজেরাই আকর্ষণীয়) এবং আপনার মূল প্রশ্নের সাথে সম্পর্কিত অতিরিক্ত ইনফোসের জন্য মন্তব্যগুলি সংরক্ষণ করুন, অনুসরণ না- আপ "। @ শানে দ্বারা - "এই বর্তমান প্রশ্নটি সম্পর্কে: এটি আরও উন্নত হতে পারে কারণ এটি একটি পরিষ্কার সাধারণ থ্রেড ছাড়াই অনেকগুলি বিভিন্ন প্রশ্ন জিজ্ঞাসা করেছিল you আপনি কি সাধারণভাবে বহুতল্লিকতার প্রতি আগ্রহী? বা আপনি ভিআইএফ-তে আগ্রহী? এগুলি বের করে দেওয়া ভাল হবে would স্বচ্ছতার জন্য."

উত্তর:


5

মাল্টিকোলাইনারিটির সমস্যাটি বেশিরভাগ একনোমেট্রিক পাঠ্যপুস্তকেই ভালভাবে অধ্যয়ন করা হয়। তবুও উইকিপিডিয়ায় একটি ভাল নিবন্ধ রয়েছে যা মূলত বেশিরভাগ মূল সমস্যার সংক্ষিপ্তসার করে।

অনুশীলনে একাধিকজনকে বোঝাতে শুরু করে যদি এটি প্যারামিটারের অস্থিরতার জন্য কিছু ভিজ্যুয়াল লক্ষণ সৃষ্টি করে (তাদের বেশিরভাগই অ (দরিদ্র) বিপরীতমুখী দ্বারা জড়িত থাকে) এক্সটিএক্স ম্যাট্রিক্স):

  1. ঘূর্ণায়মান রিগ্রেশনগুলি বা উপাত্তের ছোট ছোট উপ-নমুনাগুলিতে অনুমান করার সময় প্যারামিটারের অনুমানগুলিতে বড় পরিবর্তন
  2. প্যারামিটার অনুমানের গড়, পরবর্তীটি তুচ্ছ হতে পারে (দ্বারা টি পরীক্ষা) যদিও জাঙ্ক-রিগ্রেশন এফ পরীক্ষা ফলাফলের উচ্চ যৌথ তাত্পর্য দেখায়
  3. ভিআইএফ পরিসংখ্যান (সহায়ক রিগ্রেশনগুলির গড় মান) কেবল সহনশীলতার স্তরের আপনার প্রয়োজনীয়তার উপর নির্ভর করে, বেশিরভাগ ব্যবহারিক পরামর্শগুলি একটি গ্রহণযোগ্য সহনশীলতা 0.2 বা 0.1 এর চেয়ে কম রাখে যার অর্থ সহকারী গড়গুলি সম্পর্কিত গড় আর2সমস্যাটি সনাক্ত করতে 0.9 বা 0.8 এর চেয়ে বেশি হওয়া উচিত। সুতরাং ভিআইএফ-র থাম্ব-এর 10 এবং 5 মানের চেয়ে বড় হওয়া উচিত। ছোট নমুনায় (50 টিরও কম পয়েন্ট) 5 পছন্দনীয়, বৃহত্তর আপনি বৃহত্তর মানগুলিতে যেতে পারেন।
  4. কন্ডিশন ইনডেক্স আপনার ক্ষেত্রে ভিআইএফের বিকল্প, ভিআইএফ বা সিআই না উভয়ই সমস্যাটি রয়ে গেছে তা দেখায় না, তাই আপনি এই ফলাফলের উপর পরিসংখ্যানগতভাবে সন্তুষ্ট হতে পারেন , তবে ...

সম্ভবত তাত্ত্বিকভাবে নয়, যেহেতু এটি ঘটতে পারে (এবং সাধারণত এটি হয়) যে মডেলটিতে উপস্থিত থাকতে আপনার সমস্ত ভেরিয়েবলের প্রয়োজন। প্রাসঙ্গিক ভেরিয়েবলগুলি বাদ দেওয়া (বাদ দেওয়া ভেরিয়েবল সমস্যা) যাইহোক পক্ষপাতদুষ্ট এবং বেমানান প্যারামিটারের অনুমান করবে। অন্যদিকে আপনাকে সমস্ত ফোকাস ভেরিয়েবলগুলি কেবলমাত্র যুক্ত করতে বাধ্য করা যেতে পারে কারণ আপনার বিশ্লেষণ এর উপর ভিত্তি করে। ডেটা মাইনিং পদ্ধতির ক্ষেত্রে যদিও আপনি সেরা ফিটগুলির সন্ধানে আরও প্রযুক্তিগত।

সুতরাং বিকল্পগুলি মনে রাখবেন (যে আমি নিজেরাই ব্যবহার করব):

  1. আরও ডেটা পয়েন্ট পান (স্মরণ করুন যে ভিআইএফ প্রয়োজনীয়তা বৃহত্তর ডেটা সেটগুলির জন্য ছোট এবং ব্যাখ্যামূলক ভেরিয়েবলগুলি ধীরে ধীরে পরিবর্তিত হয়, সময় বা ক্রস-বিভাগের কিছু গুরুত্বপূর্ণ পয়েন্টের জন্য পরিবর্তিত হতে পারে)
  2. অধ্যক্ষ উপাদানগুলির মাধ্যমে ল্যাটেন্ট ফ্যাক্টরগুলি অনুসন্ধান করুন (পরবর্তীগুলি অর্থকোনাল সংমিশ্রণগুলি তাই নির্মাণের দ্বারা বহু-কোলাইনার নয়, আরও সমস্ত বিবরণী ভেরিয়েবল জড়িত রয়েছে)
  3. রিজ-রিগ্রেশন (এটি প্যারামিটারের অনুমানগুলিতে ছোট পক্ষপাতের পরিচয় দেয় তবে তাদের অত্যন্ত স্থিতিশীল করে তোলে)

কিছু অন্যান্য কৌশল উল্লিখিত উইকি নিবন্ধে রয়েছে।


3

আমি বিশ্বাস করি বেলিসি বলেছিলেন যে 10 এর বেশি সিআই একটি সম্ভাব্য মধ্যপন্থী সমস্যার সূচক, যখন 30 এরও বেশি বেশি গুরুতর।

তবে, হাই কন্ডিশনের সূচকগুলিতে আপনার ভেরিয়েবলের সেট দ্বারা ভাগ করা বৈকল্পিকের দিকে নজর দেওয়া উচিত। যে পরিবর্তনশীলতা যে একটি পরিবর্তনশীল এবং ইন্টারসেপ্ট জড়িত তা সমস্যাযুক্ত কিনা এবং বিতর্কিত পরিবর্তনশীলটিকে কেন্দ্র করে সমস্যাটি থেকে মুক্তি পেয়েছে বা কেবল অন্যত্র চলে গেছে কিনা তা নিয়ে বিতর্ক রয়েছে (বা শেষবারের মতো আমি এই সাহিত্যটি পড়েছিলাম) is

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.