কার্ট মডেলগুলি তৈরি করতে rpart () রুটিনে আপনি নিজের গাছটিকে ছাঁটাই করতে চান এমন জটিলতা পরামিতি নির্দিষ্ট করে। জটিলতা পরামিতি বাছাই করার জন্য আমি দুটি পৃথক সুপারিশ দেখেছি:
ন্যূনতম সম্ভাব্য ক্রস-বৈধতাযুক্ত ত্রুটির সাথে যুক্ত জটিলতা পরামিতিটি চয়ন করুন। এই পদ্ধতিটি কুইক-আর এবং এইচএসআর দ্বারা প্রস্তাবিত ।
সর্বশ্রেষ্ঠ জটিলতা পরামিতিটি বেছে নিন যার আনুমানিক ক্রস-বৈধতাযুক্ত ত্রুটি এখনও ন্যূনতম সম্ভাব্য ক্রস-বৈধতা ত্রুটির একটি এসই এর মধ্যে রয়েছে। এটি প্যাকেজ ডকুমেন্টেশনের আমার ব্যাখ্যা, যা বলে: "ছাঁটাইয়ের জন্য সিপির একটি ভাল পছন্দ প্রায়শই বামতম মান যার জন্য গড়টি অনুভূমিক রেখার নীচে থাকে" এই প্লটটির উল্লেখ ।
সিপির দুটি পছন্দ আমার ডেটাসেটে বেশ আলাদা গাছ উত্পাদন করে।
দেখে মনে হয় যে প্রথম পদ্ধতিটি সবসময় আরও জটিল, সম্ভাব্য পরিমাণে উপযুক্ত, গাছ তৈরি করবে produce সাহিত্যে অন্যান্য সুবিধা, অসুবিধাগুলি, সুপারিশ ইত্যাদির কি আছে? কোন পদ্ধতিটি ব্যবহার করবেন তা সিদ্ধান্ত নেওয়ার সময় আমার কি বিবেচনায় রাখা উচিত? আমি আমার বিশেষ মডেলিংয়ের সমস্যাটি সম্পর্কে আরও তথ্য সরবরাহ করতে পারি যদি তা কার্যকর হয় তবে অন্যের সাথে প্রাসঙ্গিক হওয়ার জন্য এই প্রশ্নটি যথেষ্ট বিস্তৃত রাখার চেষ্টা করছি।
party
প্যাকেজ যা তাত্পর্য পরীক্ষা করে (সাধারণত আমি প্রস্তাবিত কিছু না, তবে এটি এখানে প্রাসঙ্গিক বলে মনে হয়)। সর্বদা হিসাবে, যদিও, সেরা পরীক্ষাটি হ'ল উপযোগিতা এবং জ্ঞান; আপনি যদি মূলত ব্যাখ্যায় আগ্রহী হন এটি বিশেষত সত্য।