আমার কাছে ন্যূনতম সংখ্যক বৈশিষ্ট্য রয়েছে যা পরিবর্তিত হয় না এবং কয়েকটি অতিরিক্ত বৈশিষ্ট্য যা পরিবর্তন করতে পারে এবং ফলাফলের উপর তার বড় প্রভাব ফেলতে পারে। আমার ডেটা-সেটটি দেখতে এমন দেখাচ্ছে:
বৈশিষ্ট্যগুলি হ'ল এ, বি, সি (সর্বদা উপস্থিত) এবং ডি, ই, এফ, জি, এইচ (কখনও কখনও উপস্থিত)
A = 10, B = 10, C = 10 outcome = 10
A = 8, B = 7, C = 8 outcome = 8.5
A = 10, B = 5, C = 11, D = 15 outcome = 178
A = 10, B = 10, C = 10, E = 10, G = 18 outcome = 19
A = 10, B = 8, C = 9, E = 8, F = 4 outcome = 250
A = 10, B = 11, C = 13, E = 8, F = 4 outcome = 320
...
আমি ফলাফলের মানটি পূর্বাভাস দিতে চাই এবং ফলাফল নির্ধারণের জন্য অতিরিক্ত পরামিতিগুলির সংমিশ্রণ খুব গুরুত্বপূর্ণ। এই উদাহরণে, E এবং F এর উপস্থিতি একটি বড় ফলাফলের দিকে পরিচালিত করে, যেখানে E এবং G এর উপস্থিতি নেই। কোন মেশিন লার্নিং অ্যালগরিদম বা কৌশলগুলি এই ঘটনাটি ক্যাপচার করতে ভাল?