সাধারণভাবে, মাত্রিকতার অভিশাপ একটি স্থানের মাধ্যমে অনুসন্ধানের সমস্যাটিকে আরও অনেক কঠিন করে তোলে এবং বেশিরভাগ অ্যালগরিদমকে প্রভাবিত করে যা তাদের ভেক্টর স্পেস বিভাজনের মাধ্যমে "শিখায়"। আমাদের অপ্টিমাইজেশান সমস্যার মাত্রা তত বেশি হ'ল আমাদের প্রয়োজনীয় স্থানটি পূরণ করার জন্য আমাদের আরও বেশি ডেটা প্রয়োজন।
সাধারণ রৈখিক মডেল
β^= ( এক্স'এক্স)- 1এক্স'Y
সিদ্ধান্ত গাছগুলি
সিদ্ধান্ত গাছগুলিও মাত্রিকতার অভিশাপে ভোগে। সিদ্ধান্তের গাছগুলি প্রতিটি নোডে সরাসরি নমুনা স্থানকে বিভাজন করে। নমুনার স্থান বাড়ার সাথে সাথে ডেটা পয়েন্টগুলির মধ্যে দূরত্ব বাড়তে থাকে, যা "ভাল" বিভাজন খুঁজে পাওয়া আরও শক্ত করে তোলে।
এলোমেলো বন
এলোমেলো বনগুলি তাদের ভবিষ্যদ্বাণী করতে সিদ্ধান্ত গাছের সংগ্রহ ব্যবহার করে। তবে আপনার সমস্যার সমস্ত বৈশিষ্ট্য ব্যবহার না করে পৃথক গাছগুলি কেবলমাত্র বৈশিষ্ট্যের একটি উপসেট ব্যবহার করে। এটি প্রতিটি গাছ যে স্থানটিকে সর্বোত্তম করে তুলছে তা হ্রাস করে এবং মাত্রিকতার অভিশাপের সমস্যা মোকাবেলায় সহায়তা করতে পারে।
অ্যাডা বুস্টের মতো বুস্টেড ট্রি-এর বুস্টিং অ্যালগরিদমগুলি মাত্রিকতার অভিশাপে ভুগছে এবং নিয়মিতকরণ ব্যবহার না করা হলে ওভারফিটের ঝোঁক থাকে। আমি গভীরতায় যাব না, কারণ পোস্টটি কি অ্যাডাবোস্ট কম বা বেশি বেশি ঝুঁকির ঝুঁকিতে রয়েছে?
কেন আমি চেয়ে ভাল কারণ ব্যাখ্যা।
নিউরাল নেটওয়ার্ক
নিউরাল নেটওয়ার্কগুলি এই অর্থে অদ্ভুত যে তারা উভয়ই আর্কিটেকচার, অ্যাক্টিভেশনস, গভীরতা ইত্যাদির উপর নির্ভরশীল মাত্রিকতার অভিশাপ দ্বারা প্রভাবিত হয় না এবং তাই মাত্রিকতার অভিশাপটি পুনরাবৃত্তি করতে সমস্যা হ'ল একটি বিশাল পরিমাণের পয়েন্ট উচ্চমাত্রায় প্রয়োজনীয় একটি ইনপুট স্থান আবরণ মাত্রা। গভীর স্নায়বিক নেটওয়ার্কগুলির ব্যাখ্যা করার একটি উপায় হ'ল সমস্ত স্তরটি খুব শেষ স্তরটিকে উচ্চ মাত্রিক বহুগুণকে একটি নিম্ন মাত্রিক বহুগুণে জটিল প্রক্ষেপণ হিসাবে প্রত্যাশা করে যেখানে শেষ স্তরটি শীর্ষে শ্রেণিবদ্ধ হয়। সুতরাং উদাহরণস্বরূপ শ্রেণিবদ্ধকরণের জন্য একটি বিবর্তনমূলক নেটওয়ার্কে যেখানে শেষ স্তরটি একটি সফটম্যাক্স স্তর, আমরা আর্কিটেকচারটি একটি ছোট মাত্রায় একটি অ-রৈখিক প্রজেকশন এবং তারপরে একটি প্রক্ষেপণে বহু-লজিক্যাল লজিস্টিক রিগ্রেশন (সফটম্যাক্স স্তর) হিসাবে ব্যাখ্যা করতে পারি। সুতরাং এক অর্থে আমাদের উপাত্তগুলির সংকুচিত উপস্থাপনা আমাদেরকে মাত্রিকতার অভিশাপকে আটকানোর অনুমতি দেয়। আবার এটি একটি ব্যাখ্যা, বাস্তবে মাত্রিকতার অভিশাপ প্রকৃতপক্ষে স্নায়বিক নেটওয়ার্কগুলিকে প্রভাবিত করে, তবে উপরে বর্ণিত মডেলগুলির একই স্তরে নয়।
অতিরিক্ত নিয়মিতকরণ হওয়ার কারণে এসভিএম এসভিএম সাধারণ রৈখিক মডেলগুলির বেশি পরিমাণে চাপ না দেয়। আরও বিশদের জন্য এই পোস্টটি দেখুন এসভিএম, ওভারফিটিং, মাত্রিকতার অভিশাপ ।
কে-এনএন, কে-মিনস
কে-গড় এবং কে-এনএন উভয়ই মাত্রিকতার অভিশাপ দ্বারা প্রভাবিত হয়েছে, যেহেতু উভয়ই এল 2 স্কোয়ার দূরত্ব পরিমাপ ব্যবহার করে। মাত্রাগুলির পরিমাণ বাড়ার সাথে সাথে বিভিন্ন ডেটা-পয়েন্টের মধ্যকার দূরত্বও বৃদ্ধি পায়। এই কারণেই দূরত্ব আরও বর্ণনামূলক হবে আশা করে আরও স্থান কভার করার জন্য আপনার আরও বেশি পরিমাণের পয়েন্ট প্রয়োজন।
মডেলগুলি সম্পর্কে সুনির্দিষ্ট জিজ্ঞাসা করুন কারণ আমার উত্তরগুলি বেশ সাধারণ। আশাকরি এটা সাহায্য করবে.