এটি চিত্রিত করার জন্য সবচেয়ে সাধারণ উদাহরণটি হ'ল এক্সওআর সমস্যা (নীচের চিত্রটি দেখুন)। ভাবুন যে আপনাকে এবং y সমন্বিত ডেটা এবং বাইনারি ক্লাস দ্বারা পূর্বাভাস দেওয়া হবে। আপনি নিজের মেশিন লার্নিং অ্যালগরিদমটি নিজেই সঠিক সিদ্ধান্তের সীমানা নির্ধারণের জন্য আশা করতে পারেন, তবে আপনি যদি অতিরিক্ত বৈশিষ্ট্য z = x y উত্পন্ন করেন তবে সমস্যাটি তুচ্ছ হয়ে উঠবে কারণ z > 0 আপনাকে শ্রেণিবিন্যাসের জন্য প্রায় নিখুঁত সিদ্ধান্তের মানদণ্ড দেয় এবং আপনি কেবল সহজ ব্যবহার করেছেন গাণিতিক!xyz=xyz>0
সুতরাং অনেক ক্ষেত্রে আপনি আলগোরিদম থেকে সমাধানটি খুঁজে পেতে আশা করতে পারেন, বিকল্পভাবে, বৈশিষ্ট্য ইঞ্জিনিয়ারিং দ্বারা আপনি সমস্যাটি সহজ করতে পারেন । সহজ সমস্যাগুলি সমাধান করা সহজ এবং দ্রুত এবং কম জটিল অ্যালগরিদম প্রয়োজন। সাধারণ অ্যালগরিদমগুলি প্রায়শই বেশি দৃust় হয়, ফলাফলগুলি প্রায়শই বেশি ব্যাখ্যাযোগ্য হয়, তারা আরও স্কেলযোগ্য (কম গণনামূলক সংস্থান, প্রশিক্ষণের সময় ইত্যাদি) এবং বহনযোগ্য। লন্ডনে পাইডাটা সম্মেলন থেকে দেওয়া ভিনসেন্ট ডি ওয়ার্মারডামের অসাধারণ আলোচনায় আপনি আরও উদাহরণ এবং ব্যাখ্যা পেতে পারেন ।
তদুপরি, মেশিন লার্নিং বিপণনকারীরা আপনাকে যা বলে তা বিশ্বাস করবেন না। বেশিরভাগ ক্ষেত্রে অ্যালগরিদমগুলি "নিজেরাই শিখবে না"। আপনার সাধারণত সীমিত সময়, সংস্থান, গণনা শক্তি এবং ডেটা সাধারণত আকার সীমিত থাকে এবং গোলমাল হয়, এর কোনটিই সহায়তা করে না।
এটি চূড়ান্ত দিকে নিয়ে যাওয়া, আপনি পরীক্ষার ফলাফলের হাতে লেখা নোটগুলির ফটো হিসাবে আপনার ডেটা সরবরাহ করতে এবং এটিকে জটিল নিউরাল নেটওয়ার্কে দিতে পারেন। এটি প্রথমে ছবিগুলির ডেটা সনাক্ত করতে, তারপরে এটি বুঝতে শিখতে এবং ভবিষ্যদ্বাণী করা শিখত। এটি করতে, মডেলটিকে প্রশিক্ষণ এবং টিউন করার জন্য আপনার একটি শক্তিশালী কম্পিউটার এবং প্রচুর সময় প্রয়োজন এবং জটিল নিউরাল নেটওয়ার্ক ব্যবহার করার কারণে বিপুল পরিমাণে ডেটা প্রয়োজন। কম্পিউটার-পঠনযোগ্য ফর্ম্যাটে (সংখ্যার টেবিল হিসাবে) তথ্য সরবরাহ করা, সমস্যাটিকে খুব সহজ করে তোলে, যেহেতু আপনার সমস্ত চরিত্রের স্বীকৃতি প্রয়োজন নেই। আপনি বৈশিষ্ট্য ইঞ্জিনিয়ারিংকে পরবর্তী পদক্ষেপ হিসাবে ভাবতে পারেন, যেখানে আপনি অর্থকে তৈরি করার জন্য ডেটাটিকে এমনভাবে রূপান্তরিত করেনবৈশিষ্ট্যগুলি, যাতে আপনার অ্যালগরিদমের নিজস্বটি বের করার চেয়ে কম পরিমাণ থাকে। একটি উপমা দেওয়ার জন্য, এটি এমন হয় যে আপনি বিদেশী ভাষায় কোনও বই পড়তে চেয়েছিলেন, যাতে আপনার প্রথমে ভাষাটি শেখার দরকার ছিল, যে ভাষাটি আপনি বোঝেন সেই ভাষায় এটি অনুবাদ করেছিলেন reading
টাইটানিকের ডেটা উদাহরণে, আপনার অ্যালগরিদমটি বোঝার দরকার ছিল যে পরিবারের সদস্যদের সংশ্লেষ করার অর্থ "পরিবারের আকার" বৈশিষ্ট্যটি পেতে (হ্যাঁ, আমি এটি এখানে ব্যক্তিগতকৃত করছি)। এটি একটি মানুষের পক্ষে একটি সুস্পষ্ট বৈশিষ্ট্য, তবে আপনি যদি সংখ্যার কয়েকটি কলাম হিসাবে ডেটা দেখেন তবে তা সুস্পষ্ট নয়। অন্যান্য কলামগুলির সাথে একত্রে বিবেচিত হলে কোন কলামগুলি অর্থবহ তা যদি আপনি না জানেন তবে অ্যালগরিদম এ জাতীয় কলামগুলির প্রতিটি সম্ভাব্য সংমিশ্রণ চেষ্টা করে এটি নির্ধারণ করতে পারে। অবশ্যই, আমাদের এটি করার চতুর পদ্ধতি রয়েছে তবে তবুও, যদি এই মুহুর্তে তথ্যটি অ্যালগরিদমকে দেওয়া হয় তবে এটি অনেক সহজ।