@ জিগিস্টারের প্রতিক্রিয়াটিকে মেশিন লার্নিং জার্গনের ক্ষেত্রে রাখার জন্য: বুটস্ট্র্যাপ সংগ্রহের কৌশলগুলির (যেমন র্যান্ডম অরণ্য) পিছনে ধারণাটি হ'ল "এলোমেলো" বা "অস্থিরতা" এর কিছু উপাদান সহ ডেটাতে অনেক কম-পক্ষপাত, উচ্চ-বৈকল্পিক মডেল ফিট করে। এলোমেলো বনের ক্ষেত্রে, বুটস্ট্র্যাপিংয়ের মাধ্যমে এবং গাছের প্রতিটি নোডকে বিভক্ত করার জন্য র্যান্ডম বৈশিষ্ট্যগুলির একটি সেট বাছাইয়ের মাধ্যমে অস্থিরতা যুক্ত করা হয়। এই গোলমাল, কিন্তু কম পক্ষপাতের জুড়ে গড়ে গাছগুলি যে কোনও পৃথক গাছের উচ্চতম পরিবর্তনকে হ্রাস করে।
যখন রিগ্রেশন / শ্রেণিবিন্যাস গাছগুলি "নিম্ন-পক্ষপাত, উচ্চ-বৈকল্পিক" মডেল, লিনিয়ার রিগ্রেশন মডেলগুলি সাধারণত বিপরীত হয় - "উচ্চ-পক্ষপাত, নিম্ন-বৈকল্পিক।" সুতরাং, লিনিয়ার মডেলগুলির সাথে প্রায়শই যে সমস্যার মুখোমুখি হয় তা হ'ল পক্ষপাত হ্রাস করে, বৈকল্পিকতা হ্রাস করে না। বুটস্ট্র্যাপ একত্রিত করার জন্য এটি সহজভাবে করা হয় না।
একটি অতিরিক্ত সমস্যা হ'ল বুটস্ট্র্যাপিং সাধারণত একটি রৈখিক মডেলগুলিতে পর্যাপ্ত "এলোমেলো" বা "অস্থিরতা" সরবরাহ করতে পারে না। আমি প্রত্যাশা করব যে বুটস্ট্র্যাপের নমুনাগুলির এলোমেলোতার জন্য একটি রিগ্রেশন ট্রি আরও সংবেদনশীল হবে, যেহেতু প্রতিটি পাত সাধারণত সাধারণত হাতে গোনা কয়েকটি তথ্য পয়েন্ট ধারণ করে। অতিরিক্তভাবে, প্রতিটি নোডে ভেরিয়েবলের এলোমেলো উপসেটে গাছকে বিভক্ত করে রিগ্রেশন গাছগুলি স্টোচাস্টিকালি বৃদ্ধি করা যেতে পারে। এটি কেন গুরুত্বপূর্ণ এই জন্য এই পূর্ববর্তী প্রশ্নটি দেখুন: এম এলোমেলো বৈশিষ্ট্যের ভিত্তিতে এলোমেলো বন কেন বিভক্ত হয়?
যা যা বলা হচ্ছে, আপনি অবশ্যই লিনিয়ার মডেলগুলিতে বুটস্ট্র্যাপিং ব্যবহার করতে পারেন [LINK] , এবং এটি নির্দিষ্ট প্রসঙ্গে খুব সহায়ক হতে পারে। যাইহোক, অনুপ্রেরণা বুটস্ট্র্যাপ সংগ্রহের কৌশলগুলির চেয়ে অনেক আলাদা।
a_0 + a_1 * x_1 + ... + a_d * x_d
, ফলস্বরূপ গড় লিনিয়ার ফাংশন (বুটস্ট্র্যাপ একত্রিত করার পরে) এখনও আপনি একইরূপে রৈখিক কার্যকরী ফর্ম রাখেন (যেমন 'বেস লার্নার')।