ব্রেইমের এলোমেলো বন কি তথ্য লাভ বা গিনি সূচক ব্যবহার করে?


15

আমি জানতে চাই যে ব্রেম্যানের এলোমেলো বন (আর র্যান্ডমফোরস্ট প্যাকেজের এলোমেলো বন) কোনও বিভাজন মাপদণ্ড (বৈশিষ্ট্য নির্বাচনের মানদণ্ড) তথ্য লাভ বা গিনি সূচক হিসাবে ব্যবহার করে? আমি এটি http://www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htm এ এবং আর-এ র্যান্ডমফোরস্ট প্যাকেজটির জন্য ডকুমেন্টেশনে সন্ধান করার চেষ্টা করেছি, তবে কেবলমাত্র আমি খুঁজে পেলাম যে গিনি সূচকটি ব্যবহার করা যেতে পারে পরিবর্তনশীল গুরুত্ব গণনা।


আমি আরও ভাবছি যে এলোমেলো বনের গাছগুলি এলোমেলোভাবে প্যাকেজে বাইনারি হয় কিনা।
কেউ

উত্তর:


16

আর, লিঃ দ্বারা র মধ্যে র্যান্ডমফোরস্ট প্যাকেজটি মূল কোডের একটি বন্দর যা সি-কোড (অনুবাদকৃত) কিছু অবশিষ্ট ফোরআরান কোড এবং আর র‍্যাপার কোডের মিশ্রণ। ব্রেক পয়েন্ট এবং মাতৃ ভেরিয়েবলগুলি জুড়ে সামগ্রিক সেরা বিভাজন স্থির করতে, কোড গিনি-লাভের অনুরূপ একটি স্কোরিং ফাংশন ব্যবহার করে:

GiniGain(N,X)=Gini(N)|N1||N|Gini(N1)|N2||N|Gini(N2)

XNN1N2N|.|নোডের উপাদানগুলির সংখ্যা।

Gini(N)=1k=1Kpk2K নোড বিভাগ সংখ্যা

জিআমিএনআমি(এন)

|এন2||এন|জিআমিএনআমি(এন2)α|এন2|জিআমিএনআমি(এন2)=|এন2|(1-Σ=1কেপি2)=|এন2|Σএনএকটিগুলিগুলি2,2|এন2|2

এনএকটিগুলিগুলি1,|এন2| মনোনীতকারী এবং ডিনোমিনেটর উভয়কেই স্থাপন করা হয়।

তুচ্ছ ধ্রুবক অপসারণ 1- সমীকরণ থেকে যেমন সর্বোত্তম বিভক্ত সিদ্ধান্তটি নোডের আকারের ওজনফলকে বর্গক্ষেত্রের প্রসারকে বাড়িয়ে তোলে ...

স্কোর = |N1|k=1Kp1,k2+|N2|k=1Kp2,k2=|N1|k=1Knclass1,k2|N1|2+|N2|k=1Knclass2,k2|N2|2 =k=1Knclass2,k21|N1|1+k=1Knclass2,k21|N1|2 =nominator1/denominator1+nominator2/denominator2

The implementation also allows for classwise up/down weighting of samples. Also very important when the implementation update this modified gini-gain, moving a single sample from one node to the other is very efficient. The sample can be substracted from nominators/denominators of one node and added to the others. I wrote a prototype-RF some months ago, ignorantly recomputing from scratch gini-gain for every break-point and that was slower :)

If several splits scores are best, a random winner is picked.

This answer was based on inspecting source file "randomForest.x.x.tar.gz/src/classTree.c" line 209-250

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.