আমি 1 মিলিয়ন লেবেলযুক্ত নথি সমন্বিত কর্পাসে পাঠ্য শ্রেণিবিন্যাসের জন্য সাইকিট লিনিয়ার সাপোর্ট ভেক্টর মেশিন (এসভিএম) শ্রেণিবদ্ধ ব্যবহার করার পরিকল্পনা করছি। আমি যা করার পরিকল্পনা করছি তা হল, যখন কোনও ব্যবহারকারী কোনও কীওয়ার্ড প্রবেশ করে, শ্রেণিবদ্ধকারী প্রথমে এটি একটি বিভাগে শ্রেণিবদ্ধ করবে এবং তারপরে পরবর্তী তথ্য পুনরুদ্ধার কোয়েরিটি সেই বিভাগের ক্যাটাগরির নথির মধ্যেই ঘটবে। আমার কিছু প্রশ্ন আছে:
- আমি কীভাবে নিশ্চিত করব যে শ্রেণিবিন্যাস বেশি সময় নিবে না? আমি চাই না যে আরও ভাল ফলাফল পেতে ব্যবহারকারীদের কোনও শ্রেণিবদ্ধকরণের জন্য অপেক্ষা করতে সময় কাটাতে হবে।
- ওয়েবসাইট / ওয়েব অ্যাপ্লিকেশনগুলির জন্য পাইথনের বিজ্ঞান পাঠাগারটি কি এটি উপযুক্ত?
- কেউ কি জানেন যে কীভাবে অ্যামাজন বা ফ্লিপকার্ট ব্যবহারকারীর প্রশ্নের উপর শ্রেণিবিন্যাস সম্পাদন করে বা তারা সম্পূর্ণ ভিন্ন যুক্তি ব্যবহার করে?