আমার এই সেমিস্টারে একটি মেশিন লার্নিং কোর্স রয়েছে এবং অধ্যাপক আমাদের ক্লাসে চালু করা একটি মেশিন লার্নিং পদ্ধতির মাধ্যমে একটি বাস্তব-বিশ্ব সমস্যা খুঁজে পেতে এবং এটি সমাধান করতে বলেছিলেন :
- সিদ্ধান্ত গাছ
- কৃত্রিম নিউরাল নেটওয়ার্ক
- সমর্থন ভেক্টর মেশিন
- উদাহরণস্বরূপ-ভিত্তিক লার্নিং ( kNN , LWL )
- বায়েশিয়ান নেটওয়ার্কস
- শক্তিবৃদ্ধি শেখা
আমি স্ট্যাকওভারফ্লো এবং স্ট্যাকএক্সচেঞ্জের অন্যতম অনুরাগী এবং এই ওয়েবসাইটগুলির ডেটাবেস ডাম্পগুলি জনসাধারণকে সরবরাহ করা হয় কারণ তারা দুর্দান্ত! আমি আশা করি আমি এই ডাটাবেসগুলি সম্পর্কে একটি ভাল মেশিন লার্নিং চ্যালেঞ্জ খুঁজে পেতে এবং এটি সমাধান করতে পারতাম।
আমার ধারণা
আমার মনে একটি ধারণা এসেছিল প্রশ্নোত্তর দেহে প্রবেশ করা শব্দের উপর ভিত্তি করে প্রশ্নের জন্য ট্যাগগুলির পূর্বাভাস। আমি মনে করি যে কোনও প্রশ্নের জন্য ট্যাগগুলি শেখার জন্য বায়েশিয়ান নেটওয়ার্কটি সঠিক সরঞ্জাম তবে আরও গবেষণা দরকার need যাইহোক, শেখার পর্ব শেখার পরে যখন ব্যবহারকারী প্রশ্নটি প্রবেশ করে শেষ করেন তখন তার জন্য কিছু ট্যাগ প্রস্তাব দেওয়া উচিত।
আমাকে বলুন :
আমি পরিসংখ্যান সম্প্রদায়কে এমএল দুটি প্রশ্ন সম্পর্কে অভিজ্ঞ ব্যক্তি হিসাবে জিজ্ঞাসা করতে চাই:
আপনি কি মনে করেন ট্যাগ পরামর্শ অন্তত একটি সমস্যা যা সমাধান করার কোনও সুযোগ আছে? এটি সম্পর্কে আপনার কোনও পরামর্শ আছে? আমি কিছুটা চিন্তিত কারণ স্ট্যাকেক্সচেঞ্জ এধরণের বৈশিষ্ট্যটি এখনও প্রয়োগ করে না।
স্ট্যাকেক্সচেঞ্জের ডাটাবেসের ভিত্তিতে এমএল প্রকল্পের জন্য আপনার কাছে অন্য কোনও / আরও ভাল ধারণা আছে? স্ট্যাকেক্সচেঞ্জের ডেটাবেসগুলি থেকে কিছু শেখার জন্য আমার পক্ষে সত্যিই খুব কঠিন find
ডাটাবেস ত্রুটি সম্পর্কে বিবেচনা: আমি উল্লেখ করতে চাই যে যদিও ডাটাবেসগুলি বিশাল এবং অনেকগুলি উদাহরণ রয়েছে তবে সেগুলি নিখুঁত নয় এবং ত্রুটির শিকার হয়। সুস্পষ্ট একটি হ'ল ব্যবহারকারীদের বয়স যা অবিশ্বাস্য। এমনকি প্রশ্নের জন্য নির্বাচিত ট্যাগগুলিও 100% সঠিক নয়। যাইহোক, কোনও সমস্যা বাছাই করার ক্ষেত্রে আমাদের ডেটার নির্ভুলতার শতাংশ বিবেচনা করা উচিত।
সমস্যাটি নিজেই বিবেচনা করা: আমার প্রকল্পটি data-mining
এমন বা এর মতো কিছু হওয়া উচিত নয় । এটি কেবল বাস্তব-বিশ্বে এমএল পদ্ধতিগুলির প্রয়োগ হওয়া উচিত।