সমস্ত প্রজাতি বিতরণ মডেলিং সাহিত্যের পরামর্শ দেয় যে সম্ভাবনাগুলি (উদাহরণস্বরূপ, র্যান্ডমফোরেস্টস) ছাড়িয়ে এমন একটি মডেল ব্যবহার করে কোনও প্রজাতির উপস্থিতি / অনুপস্থিতির পূর্বাভাস দেওয়ার সময়, প্রান্তিক সম্ভাব্যতার পছন্দ বাছাই করা যার দ্বারা একটি প্রজাতিকে উপস্থিতি বা অনুপস্থিতি হিসাবে শ্রেণীবদ্ধ করা গুরুত্বপূর্ণ এবং এক হওয়া উচিত সর্বদা 0.5 এর ডিফল্ট উপর নির্ভর করে না। আমি এই সাহায্যে কিছু সাহায্য প্রয়োজন! আমার কোডটি এখানে:
library(randomForest)
library(PresenceAbsence)
#build model
RFfit <- randomForest(Y ~ x1 + x2 + x3 + x4 + x5, data=mydata, mytry = 2, ntrees=500)
#eventually I will apply this to (predict for) new data but for first I predict back to training data to compare observed vs. predicted
RFpred <- predict(RFfit, mydata, type = "prob")
#put the observed vs. predicted in the same dataframe
ObsPred <- data.frame(cbind(mydata), Predicted=RFpred)
#create auc.roc plot
auc.roc.plot(ObsPred, threshold = 10, xlab="1-Specificity (false positives)",
ylab="Sensitivity (true positives)", main="ROC plot", color=TRUE,
find.auc=TRUE, opt.thresholds=TRUE, opt.methods=9)
এ থেকে আমি স্থির করেছিলাম যে পূর্বাভাসযুক্ত সম্ভাবনাগুলি থেকে শ্রেণিবিন্যাসের উপস্থিতির জন্য আমি যে প্রান্তিকতাটি ব্যবহার করতে চাই তা ০.০ এর ডিফল্ট নয় 0. আমি এই তথ্যটি দিয়ে কী করব তা পুরোপুরি বুঝতে পারছি না। আমার আউটপুটটির মানচিত্র তৈরি করার সময় আমি কি কেবল এই প্রান্তিকতা ব্যবহার করি? অবিচ্ছিন্ন সম্ভাব্যতার সাথে আমি সহজেই একটি ম্যাপযুক্ত আউটপুট তৈরি করতে পারতাম তবে কেবল বর্তমানে উপস্থিত 0.7 এর চেয়ে বেশি মানের এবং আবার <0.7 অনুপস্থিত হিসাবে পুনরায় শ্রেণিবদ্ধ করতে পারি।
বা, আমি কি এই তথ্যটি নিতে চাই এবং কাট-অফ প্যারামিটারটি ব্যবহার করে আমার র্যান্ডমফোরেস্ট মডেলিংটি আবার চালাতে চাই? কাট-অফ প্যারামিটারটি ঠিক কী করছে? এটি ফলাফল ভোট পরিবর্তন করে? (বর্তমানে এটি "সংখ্যাগরিষ্ঠ" বলে)। আমি এই কাট-অফ প্যারামিটারটি কীভাবে ব্যবহার করব? আমি ডকুমেন্টেশন বুঝতে পারি না! ধন্যবাদ!