মেশিন লার্নিংয়ের আবিষ্কারের সাথে সাথে আমি বিভিন্ন আকর্ষণীয় কৌশলগুলি দেখতে পাই যেমন:
- অ্যালগরিদমগুলি স্বয়ংক্রিয়ভাবে কৌশলগুলির সাথে টিউন করুন যেমন
grid search
, - একই "টাইপ" এর বিভিন্ন অ্যালগরিদমের সংমিশ্রণের মাধ্যমে আরও সঠিক ফলাফল পান, যা
boosting
, - বিভিন্ন অ্যালগরিদমের সংমিশ্রণের মাধ্যমে আরও সঠিক ফলাফল পান (তবে একই ধরণের অ্যালগোরিদম নয়), এটি
stacking
, - এবং সম্ভবত আরও অনেক কিছু আমাকে এখনও আবিষ্কার করতে হবে ...
আমার প্রশ্নটি নিম্নলিখিত: এই সমস্ত টুকরা রয়েছে। তবে কী এগুলিকে একত্রে অ্যালগরিদম তৈরি করা সম্ভব যা ইনপুট ক্লিন হওয়া ডেটা হিসাবে গ্রহণ করে এবং সমস্ত কৌশলগুলির মধ্যে সবচেয়ে ভাল ব্যবহার করে ভাল ফলাফল আউটপুট করে? (অবশ্যই এটি কোনও পেশাদার ডেটা সায়েন্টিস্টের চেয়ে কম দক্ষ হবে তবে তিনি আমার চেয়ে ভাল হবেন!) যদি হ্যাঁ, আপনার কি নমুনা কোড রয়েছে বা ফ্রেমওয়ার্কগুলি জানেন যে এটি করতে পারে?
সম্পাদনা: কিছু উত্তরের পরে মনে হচ্ছে কিছু সংকীর্ণ করতে হবে। আসুন একটি উদাহরণ নেওয়া যাক, শ্রেণিবদ্ধ ডেটা সহ আমাদের একটি কলাম রয়েছে, আসুন y
আমরা এটি কল করি এবং আমরা এটি X
ডুমারি বা আসল সংখ্যাসূচক ডেটা (উচ্চতা, তাপমাত্রা) এমন সংখ্যাসূচক ডেটা থেকে ভবিষ্যদ্বাণী করতে চাই । আমরা ধরে নিলাম পরিষ্কারের কাজ আগেও হয়ে গেছে। এমন কোন অ্যালগোরিদম রয়েছে যা এই জাতীয় ডেটা নিতে পারে এবং পূর্বাভাস দেয়? (একাধিক অ্যালগরিদমগুলি পরীক্ষা করে, সেগুলি টিউন করে, বুস্টিং ইত্যাদি)) যদি হ্যাঁ, তবে এটি গণনাগতভাবে দক্ষ (যদি আমরা সাধারণ অ্যালগরিদমের সাথে তুলনা করি তবে একটি যুক্তিসঙ্গত সময়ে কি গণনা করা হয়), এবং আপনার কোডের উদাহরণ রয়েছে?
auto.arima
( forecast
গ্রন্থাগার থেকে ) মানুষের চেয়ে ভাল হতে পারে - রব হ্যান্ডম্যান তার উপস্থাপনাগুলিতে বেশ কয়েকবার উল্লেখ করেছেন। সুতরাং এমন কিছু ক্ষেত্র রয়েছে যেখানে কিছু ধরণের "স্বয়ংক্রিয় শিক্ষণ" সাফল্যের সাথে প্রয়োগ করা হয়।