আমি মেশিন লার্নিংয়ে একজন নতুন আগত (কিছু পরিসংখ্যানও), জ্ঞান শিখছি (তদারকি / নিরীক্ষণযোগ্য শিখার অ্যালগরিদম, প্রাসঙ্গিক অপ্টিমাইজেশন পদ্ধতি, নিয়মিতকরণ, কিছু দর্শন (যেমন পক্ষপাত-বৈচিত্র্য বাণিজ্য-বন্ধ?)) শিখছি। আমি জানি যে কোনও বাস্তব অনুশীলন না করে, আমি সেই মেশিন লার্নিং স্টাফগুলি সম্পর্কে গভীর ধারণা অর্জন করতে পারি না।
তাই আমি বাস্তব ডেটা দিয়ে কিছু শ্রেণিবিন্যাস সমস্যা দিয়ে শুরু করি, হস্তাক্ষর ডিজিটের শ্রেণিবিন্যাস (এমএনআইএসটি) বলুন। আমার অবাক করার বিষয়, কোনও বৈশিষ্ট্য শিখন / ইঞ্জিনিয়ারিং ছাড়াই নির্ভুলতা 0.97 এ পৌঁছেছে ইনপুট হিসাবে কাঁচা পিক্সেল মান সহ এলোমেলো-বন শ্রেণিবদ্ধ ব্যবহার করে। আমি অন্যান্য শেখার অ্যালগরিদমগুলি যেমন এসভিএম, এলআরটি পরামিতিগুলির সাথে টিউন করার চেষ্টা করেছি।
তারপরে আমি হারিয়ে গেলাম, খুব সহজ হবে নাকি আমি এখানে কিছু মিস করছি? শুধু কি সরঞ্জামদণ্ড থেকে একটি শেখার অ্যালগরিদম চয়ন এবং কিছু পরামিতি টিউন?
এটি যদি অনুশীলনে মেশিন লার্নিংয়ের বিষয়ে হয় তবে আমি এই ক্ষেত্রে আমার আগ্রহ হারাব। আমি কিছু দিন ধরে কিছু ব্লগ ভেবেছিলাম এবং পড়েছি এবং আমি কিছু সিদ্ধান্তে পৌঁছেছি:
অনুশীলনে মেশিন লার্নিংয়ের সবচেয়ে গুরুত্বপূর্ণ অংশটি হ'ল ফিচার ইঞ্জিনিয়ারিং , যা তথ্য দেওয়া হয়, বৈশিষ্ট্যের আরও ভাল প্রতিনিধিত্ব খুঁজে বের করুন।
কোনটি অ্যালগরিদম ব্যবহার করতে হবে তা শিখতেও গুরুত্বপূর্ণ, প্যারামিটার টিউনিংও, তবে চূড়ান্ত পছন্দটি পরীক্ষা-নিরীক্ষার বিষয়ে আরও বেশি।
আমি নিশ্চিত যে আমি এটি সঠিকভাবে বুঝতে পেরেছি না, আশা করি যে কেউ আমাকে সংশোধন করতে পারে এবং অনুশীলনে মেশিন লার্নিং সম্পর্কে আমাকে কিছু পরামর্শ দিতে পারে।