যে কোনও শ্রেণিবদ্ধের ইনপুটগুলির জন্য কীভাবে 'অস্তিত্বহীন' ডেটা পরিচালনা করতে হয় সে সম্পর্কে সত্যই আমি কোনও ভাল পাঠ্য বা উদাহরণ পাইনি। আমি অনুপস্থিত ডেটাতে অনেক কিছু পড়েছি তবে মাল্টিভারিয়েট ইনপুটগুলির সাথে সম্পর্কিত বা না থাকতে পারে এমন ডেটা সম্পর্কে কী করা যায়। আমি বুঝতে পারি এটি একটি খুব জটিল প্রশ্ন এবং ব্যবহৃত প্রশিক্ষণের পদ্ধতিগুলির উপর নির্ভর করে তারতম্য হবে ...
উদাহরণস্বরূপ যদি ভাল সঠিক ডেটা সহ বেশ কয়েকটি রানার জন্য ল্যাপটাইমের পূর্বাভাস দেওয়ার চেষ্টা করা হয়। অনেকগুলি ইনপুটগুলির মধ্যে, অনেকের মধ্যে সম্ভাব্য ভেরিয়েবলগুলি:
- ইনপুট পরিবর্তনযোগ্য - প্রথমবারের রানার (ওয়াই / এন)
- ইনপুট পরিবর্তনযোগ্য - পূর্ববর্তী ল্যাপটাইম (0 - 500 সেকেন্ড)
- ইনপুট পরিবর্তনশীল - বয়স
- ইনপুট পরিবর্তনশীল - উচ্চতা। । । আরও অনেক ইনপুট ভেরিয়েবল ইত্যাদি
& আউটপুট ভবিষ্যদ্বাণী - ভবিষ্যদ্বাণী করা ল্যাপটাইম (0 - 500 সেকেন্ড)
'২.প্রাইরিশ ল্যাপটাইম' এর জন্য একটি 'মিসিং ভেরিয়েবল' বেশ কয়েকটি উপায়ে গণনা করা যায় তবে '1। প্রথমবারের রানার 'সর্বদা এন এর সমান হবে। তবে প্রথমবারের রানার জন্য 'নন অস্তিত্বের ডেটা' (যেখানে 'প্রথমবারের রানার' = ওয়াই) '2 এর জন্য আমার কী মূল্য / চিকিত্সা দেওয়া উচিত। আগের ল্যাপটাইম '?
উদাহরণস্বরূপ '2। পূর্ববর্তী ল্যাপটাইম '-৯৯ বা ০ হিসাবে এটিকে বিতরণটি নাটকীয়ভাবে আঁকতে পারে এবং এটিকে নতুন রানার দুর্দান্ত পারফরম্যান্সের মতো দেখায়।
আমার বর্তমান প্রশিক্ষণের পদ্ধতিগুলি লজিস্টিক রিগ্রেশন, এসভিএম, এনএন এবং সিদ্ধান্ত গাছ ব্যবহার করে আসছে