প্রতিরোধের জন্য এলোমেলো বন কি একটি 'সত্য' রিগ্রেশন?


18

এলোমেলো বনগুলি রিগ্রেশনের জন্য ব্যবহৃত হয়। যাইহোক, আমি যা বুঝি সেগুলি থেকে তারা প্রতিটি পাতায় একটি গড় লক্ষ্যমাত্রা নির্ধারণ করে। যেহেতু প্রতিটি গাছে কেবল সীমিত পাতাগুলি রয়েছে, কেবলমাত্র নির্দিষ্ট মান রয়েছে যা লক্ষ্য আমাদের রিগ্রেশন মডেল থেকে অর্জন করতে পারে। সুতরাং এটি কি কেবল 'বিচ্ছিন্ন' রিগ্রেশন নয় (ধাপে ফাংশনের মতো) এবং লিনিয়ার রিগ্রেশন'র মতো নয় যা 'ধারাবাহিক'?

আমি কি এটি সঠিকভাবে বুঝতে পারি? যদি হ্যাঁ, এলোমেলোভাবে এলোমেলো বন কী সুবিধা দেয়?


উত্তর:


23

এটি সঠিক - এলোমেলো বন অবিচ্ছিন্ন পরিবর্তনশীলগুলিকে পৃথক করে দেয় যেহেতু তারা সিদ্ধান্ত গাছের ভিত্তিতে হয়, যা পুনরাবৃত্ত বাইনারি বিভাজনের মাধ্যমে কাজ করে। তবে পর্যাপ্ত ডেটা এবং পর্যাপ্ত বিভাজন সহ, অনেক ছোট পদক্ষেপ সহ একটি ধাপে ফাংশন একটি মসৃণ ফাংশন আনুমানিক করতে পারে। সুতরাং এটি কোনও সমস্যা হওয়ার দরকার নেই। আপনি যদি সত্যই কোনও একক ভবিষ্যদ্বাণীকারীর দ্বারা মসৃণ প্রতিক্রিয়া অর্জন করতে চান তবে আপনি কোনও নির্দিষ্ট পরিবর্তনশীলের আংশিক প্রভাব গণনা করুন এবং এটিতে একটি মসৃণ ফাংশন ফিট করুন (এটি মডেলটি নিজেই প্রভাবিত করে না, যা এই পদক্ষেপের চরিত্রটি ধরে রাখবে)।

এলোমেলো বন কিছু অ্যাপ্লিকেশনগুলির জন্য স্ট্যান্ডার্ড রিগ্রেশন কৌশলগুলির তুলনায় বেশ কয়েকটি সুবিধা দেয়। মাত্র তিনটি উল্লেখ করতে:

  1. তারা নির্বিচারে অনেক ভবিষ্যদ্বাণী ব্যবহারের অনুমতি দেয় (ডেটা পয়েন্টের চেয়ে আরও বেশি ভবিষ্যদ্বাণী করা সম্ভব)
  2. এগুলি প্রাক্কলিত বিশদ ছাড়াই জটিল আনলাইনার আকারগুলি আনুমানিক করতে পারে
  3. তারা কোনও পূর্বের স্পেসিফিকেশন ছাড়াই পূর্বাভাসের মধ্যে জটিল ইন্টারঅ্যাকশন ক্যাপচার করতে পারে ।

এটি একটি 'সত্য' রিগ্রেশন কিনা তা হিসাবে এটি কিছুটা অর্থোত্তর। সর্বোপরি, পিসওয়াস রিগ্রেশন হ'ল রিগ্রেশন, তবে এটি মসৃণও নয়। নীচের মন্তব্যগুলিতে যেমন উল্লেখ করা হয়েছে তেমন একটি স্পষ্টিকর ভবিষ্যদ্বাণী নিয়ে যে কোনও প্রতিরোধ রয়েছে।


7
এছাড়াও, কেবল শ্রেণিবদ্ধ বৈশিষ্ট্যগুলির সাথে রিগ্রেশনও মসৃণ হবে না।
টিম

3
এমনকি একটি পৃথক বৈশিষ্ট্য সহ একটি রিগ্রেশন কি মসৃণ হতে পারে?
ডেভ

4

এটি পৃথক, তবে তারপরে স্থির সংখ্যার বিট সহ ভাসমান পয়েন্ট সংখ্যা আকারে যে কোনও আউটপুট পৃথক হবে। যদি কোনও গাছে 100 টি পাতা থাকে তবে এটি 100 টি বিভিন্ন নম্বর দিতে পারে। আপনার যদি প্রতিটি 100 টি পাতা সহ 100 টি আলাদা গাছ থাকে তবে আপনার এলোমেলো বনটিতে তাত্ত্বিকভাবে 100 ^ 100 বিভিন্ন মান থাকতে পারে, যা 200 (দশমিক) অঙ্কের নির্ভুলতা বা ~ 600 বিট দিতে পারে। অবশ্যই, কিছু ওভারল্যাপ হতে চলেছে, তাই আপনি আসলে 100 ^ 100 বিভিন্ন মান দেখতে যাচ্ছেন না। বিতরণ যত বেশি আপনি চূড়ান্ত হিসাবে পেতে আরও বিচ্ছিন্ন পেতে ঝোঁক; প্রতিটি গাছে কিছুটা ন্যূনতম পাতা (একটি পাত যা একটি আউটপুট দেয় যা অন্য সমস্ত পাতার চেয়ে কম বা তার সমান হয়) পেতে চলেছে এবং একবার প্রতিটি গাছ থেকে ন্যূনতম পাতা পেলে আপনি কোনও কম পেতে পারবেন না। সুতরাং বনের জন্য কিছু ন্যূনতম সামগ্রিক মান হতে চলেছে, এবং যখন আপনি এই মানটি থেকে বিচ্যুত হন, আপনি কয়েকটি গাছ বাদ দিয়ে সর্বনিম্ন পাতায় থাকা সমস্ত গাছের সাথে শুরু করতে যাচ্ছেন, যাতে পৃথক জাম্পের সর্বনিম্ন মান বৃদ্ধি থেকে ছোট বিচ্যুতি ঘটে। তবে চূড়ান্তভাবে নির্ভরযোগ্যতা হ্রাস হ'ল সাধারণভাবে, কেবল এলোমেলো বন নয় reg


পাতাগুলি প্রশিক্ষণের ডেটা থেকে যে কোনও মান সংরক্ষণ করতে পারে (তাই সঠিক প্রশিক্ষণের ডেটা সহ 100 টি পাতার 100 টি গাছ 10,000 টি আলাদা আলাদা মান সংরক্ষণ করতে পারে)। তবে প্রত্যাবর্তিত মানটি প্রতিটি গাছ থেকে নির্বাচিত পাতার মধ্যম mean সুতরাং আপনার কাছে 2 টি গাছ বা 100 গাছ আছে কিনা সেই মানটির যথার্থতার বিটের সংখ্যা একই।
ড্যারেন কুক

3

উত্তরটি আপনার রিগ্রেশন সম্পর্কিত সংজ্ঞা কী তার উপর নির্ভর করবে , রিগ্রেশন মডেলের সংজ্ঞা এবং সীমানাঙ্কন দেখুন । তবে একটি সাধারণ সংজ্ঞা (বা কোনও সংজ্ঞার অংশ) হ'ল রিগ্রেশন মডেলগুলি শর্তাধীন প্রত্যাশা । এবং একটি রিগ্রেশন ট্রি প্রকৃতপক্ষে শর্তাধীন প্রত্যাশার একটি অনুমানকারী হিসাবে দেখা যেতে পারে।

পাতার নোডগুলিতে আপনি সেই পাতায় পৌঁছে যাওয়া নমুনা পর্যবেক্ষণগুলির গড়ের পূর্বাভাস দেন এবং একটি গাণিতিক গড়টি প্রত্যাশার একটি অনুমানকারী। গাছের শাখা প্যাটার্নটি কন্ডিশনারকে উপস্থাপন করে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.