অ-রৈখিক মডেলগুলি ব্যবহার করার সময় কি কোনও একাধিক কলিনারিটির বিষয়ে উদ্বিগ্ন হওয়া উচিত?


13

বলুন আমাদের বেশিরভাগ শ্রেণিবদ্ধ বৈশিষ্ট্যযুক্ত বাইনারি শ্রেণিবদ্ধকরণ সমস্যা রয়েছে। আমরা এটি শিখতে কিছু অ-লিনিয়ার মডেল (যেমন এক্সজিবিস্ট বা র্যান্ডম বন) ব্যবহার করি।

  • এখনও কি বহু-তাত্পর্য সম্পর্কে উদ্বিগ্ন হওয়া উচিত? কেন?
  • যদি উপরের উত্তরটি সত্য হয় তবে কোনওরাই কী এই লড়াইয়ের সাথে বিবেচনা করবেন যে এই ধরণের নন-লিনিয়ার মডেল ব্যবহার করা হচ্ছে?

উত্তর:


7

একাধিক কলিনারিটি নির্দিষ্ট মডেলগুলির জন্য সমস্যা হবে না। যেমন এলোমেলো বন বা সিদ্ধান্ত গাছ। উদাহরণস্বরূপ, যদি আমাদের দুটি অভিন্ন কলাম থাকে তবে সিদ্ধান্ত গাছ / এলোমেলো অরণ্য প্রতিটি বিভাজনে স্বয়ংক্রিয়ভাবে একটি কলাম "ড্রপ" করবে। এবং মডেল এখনও ভাল কাজ করবে।

এছাড়াও নিয়মিতকরণ হ'ল মাল্টি-কোলাইনারিটি সমস্যাটিকে "ফিক্স" করার একটি উপায়। আমার উত্তর লজিস্টিক রিগ্রেশন নিয়মিতকরণের বিশদ দেয়।


5
আমি মনে করি যদি নিয়মিতকরণের মাধ্যমে সমস্যাটি "ঠিক করা" হচ্ছে ঠিক কী তা যদি আপনি ব্যাখ্যা করেন তবে এটির উন্নতি হবে।
ম্যাথু ড্রুরি

2

পার্টিতে দেরীতে, তবে যাইহোক এখানেই আমার উত্তর, এবং এটি "হ্যাঁ", মডেল / পদ্ধতিটি লিনিয়ার হোক বা না থাকুক বা মূল কাজটি ভবিষ্যদ্বাণী বা শ্রেণিবিন্যাসকে বিবেচনা না করেই সর্বদা কোলিনারিটি সম্পর্কে উদ্বিগ্ন হওয়া উচিত।

পদ্ধতি হিসাবে ডেটা সেট এবং র‌্যান্ডম ফরেস্টে উপস্থিত বেশ কয়েকটি লিনিয়ার পারস্পরিক কোভারিয়েটস / বৈশিষ্ট্যগুলি ধরুন। স্পষ্টতই, নোডের জন্য এলোমেলো নির্বাচন কেবল (বা বেশিরভাগ ক্ষেত্রে) কলিনারি বৈশিষ্ট্যগুলি বেছে নিতে পারে যা ফলস্বরূপ দুর্বল হয়ে যায় এবং এটি বারবার ঘটতে পারে, ফলে কার্যকারিতাটিকে নেতিবাচকভাবে প্রভাবিত করে।

এখন, কলিনারি বৈশিষ্ট্যগুলি অন্যান্য (কল-লাইনবিহীন) বৈশিষ্ট্যগুলির তুলনায় ফলাফল সম্পর্কে কম তথ্যবহুল হতে পারে এবং এগুলি যেভাবেই বৈশিষ্ট্য সেট থেকে বাদ দেওয়ার জন্য বিবেচনা করা উচিত। তবে, ধরে নিন যে বৈশিষ্ট্যগুলি আরএফ দ্বারা উত্পাদিত 'বৈশিষ্ট্য গুরুত্ব' তালিকায় উচ্চ স্থানে রয়েছে। এগুলি হিসাবে অকারণে মাত্রিক মাত্রা বাড়িয়ে ডেটা সেটে রাখা হবে। সুতরাং, বাস্তবে, আমি সর্বদা, একটি অনুসন্ধানের পদক্ষেপ হিসাবে (অনেকের মধ্যে সম্পর্কিত) লিনিয়ার পারস্পরিক সম্পর্ক সহ বৈশিষ্ট্যগুলির যুগল সংযুক্তি পরীক্ষা করে দেখি।


আমি বিশ্বাস করি যে কয়েকটি ক্ষেত্রে যখন বহু-তাত্পর্যকে নিরাপদে উপেক্ষা করা যায়, কিছু ক্ষেত্রে এখানে আলোচনা করা হয়: পরিসংখ্যানিক
ডাঃ নিশা অরোরা

0
  1. এখনও কি বহু-তাত্পর্য সম্পর্কে উদ্বিগ্ন হওয়া উচিত? কেন?

যদি অ-লিনিয়ার মডেলটি গাছ ভিত্তিক মডেল হয়, তবে আপনার এটিকে গুরুতর বিবেচনা করা উচিত নয়। বিভিন্ন গাছের মডেলের আলাদা আলাদা চুক্তি পদ্ধতি থাকবে, যেমন এলোমেলো বনগুলি তাদের উভয়কেই রাখবে (কারণ তারা স্বাধীনভাবে গাছ তৈরি করে এবং এলোমেলোভাবে প্রতিটি গাছের জন্য বৈশিষ্ট্যটি নির্বাচন করে), তবে এটি পূর্বাভাসের কার্যকারিতা সম্পর্কে কোনও প্রভাব ফেলবে না, এমনকি আপনি এটি মুছে ফেলেন অপ্রয়োজনীয় তবে এক্সজিস্টের জন্য, এটি তাদের যে কোনওটিকে বেছে নেবে এবং শেষ গাছ তৈরি হওয়া অবধি এটি ব্যবহার করবে।

  1. যদি উপরের উত্তরটি সত্য হয় তবে কোনওরাই কী এই লড়াইয়ের সাথে বিবেচনা করবেন যে এই ধরণের নন-লিনিয়ার মডেল ব্যবহার করা হচ্ছে?

এটি কেবলমাত্র ব্যাখ্যার অর্থ সম্পর্কে, সুতরাং সর্বাধিক সম্পর্ক সম্পর্কিত ভেরিয়েবলটি সরিয়ে দেওয়ার পরামর্শ দেওয়া হচ্ছে।


-3

মাল্টি-কোলাইনারিটি সর্বদা একটি সম্ভাব্য সমস্যা। মডেলটিতে ভবিষ্যদ্বাণীকারী পরিবর্তনশীলগুলি যখন লৈখিকভাবে সম্পর্কিত হয় (যেমন, যখন সহপাঠ উপস্থিত থাকে) তখন ভবিষ্যদ্বাণীকে প্রভাবিত করে।


1
ধন্যবাদ, যদি (1) ফোকাসটি পূর্বাভাসের পারফরম্যান্স হয় (এবং ব্যাখ্যাযোগ্যতা নয়) এবং (2) মডেলটি অ-রৈখিক হয় তবে কেন এটি এখনও সমস্যা হতে পারে সে সম্পর্কে বিশদ বিবরণ করতে আপনি কি আপত্তি করবেন? (এবং ঠিক কীভাবে এটি প্রকাশিত হবে?)
জোশ

মডেলটিতে ভবিষ্যদ্বাণীকারী এই ভেরিয়েবলগুলি যখন লৈখিকভাবে সম্পর্কিত হয় (অর্থাত্ কোলাইনারিটি উপস্থিত থাকে) তখন ভবিষ্যদ্বাণীকে প্রভাবিত করে।
মাইকেল আর। চেরনিক

1
ভবিষ্যদ্বাণী প্রভাবিত কিভাবে, ঠিক? বিটিডাব্লু , stats.stackexchange.com/a/138082/99274 , আপনার উত্তরে কিছু লিঙ্ক রাখুন বা "সেখানে ছিলেন, সম্পন্ন" জনতার ক্রোধের মুখোমুখি হন।
কার্ল

7
শ্রেণিবিন্যাস যেহেতু ভবিষ্যদ্বাণীগুলির সাথে এত ঘনিষ্ঠভাবে জড়িত, এবং পূর্বাভাস বহুবিধরনের শিকার না হওয়ার ঝোঁক রয়েছে তাই আপনার যুক্তিটিকে সমর্থন করা জরুরী যে এটি সর্বদা একটি "সম্ভাব্য সমস্যা" বিশেষত প্রশ্নে উল্লিখিত নির্দিষ্ট মডেলগুলির জন্য for শ্রেণীবদ্ধের জন্য সমস্যাটি কীভাবে হবে এবং কেন?
whuber

12
আমি নিশ্চিত আপনি প্রশ্নটি ভিক্ষা করছেন। হোবার জিজ্ঞাসা করেছিলেন কেন ভবিষ্যদ্বাণীটি বহুবিধ লাইনে আক্রান্ত হয় এবং আপনি মূলত প্রতিক্রিয়া ব্যক্ত করেছিলেন "ভবিষ্যদ্বাণীটি বহুবিধ লাইনে পড়ে থাকে কারণ ভবিষ্যদ্বাণীটি বহুবিধ লম্বা হয়" "
ম্যাথু ড্রুরি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.