আমার ডেটাসেটটিতে ভেক্টর সিকোয়েন্স রয়েছে। প্রতিটি ভেক্টরের 50 টি বাস্তব-মূল্যবান মাত্রা রয়েছে। সিকোয়েন্সে ভেক্টরের সংখ্যা 3-5 থেকে 10-15 পর্যন্ত রয়েছে। অন্য কথায়, একটি ক্রম দৈর্ঘ্য নির্দিষ্ট করা হয় না।
সিকোয়েন্সগুলির কিছু ন্যায্য পরিমাণ (ভেক্টর নয়!) একটি শ্রেণির লেবেল দ্বারা টীকাযুক্ত। আমার কাজটি একটি শ্রেণিবদ্ধ শিখতে হবে যা ভেক্টরগুলির একটি ক্রম দেয়, পুরো ক্রমটির জন্য ক্লাস লেবেল গণনা করা হয়।
আমি তথ্যের সঠিক প্রকৃতি বলতে পারি না তবে ক্রমগুলির প্রকৃতি সাময়িক নয়। তবুও, কোনও ভেক্টর লেবেল ( ) পরিবর্তন না করে একটি ভেক্টর এর সাথে যাবে না । অন্য কথায়, ভেক্টরগুলির ক্রমটি গুরুত্বপূর্ণ। ভেক্টরগুলি নিজেরাই তুলনীয়, উদাহরণস্বরূপ কোনও বিন্দু পণ্যটি গণনা করা এবং এই সাদৃশ্য মানটি ব্যবহার করা বোধগম্য।
আমার প্রশ্ন হ'ল: কী কী সরঞ্জাম / অ্যালগরিদম যা এই জাতীয় ডেটা শ্রেণিবদ্ধ করতে সহায়তা করতে পারে?
আপডেট: ডেটাতে এমন একটি সম্পত্তি রয়েছে যা এক বা খুব কম সংখ্যক ভেক্টর ক্লাস লেবেলকে দৃ strongly়ভাবে প্রভাবিত করে।
সম্ভাব্য সমাধান: কিছু গবেষণার পরে দেখে মনে হচ্ছে রিটার্নাল নিউরাল নেটওয়ার্কস (আরএনএন) বিলটি বেশ স্বাভাবিকভাবেই ফিট করে। বহুল আলোচিত ধারণাটি হ'ল প্রসঙ্গ আকারের বাছাই করুন , শব্দ ভেক্টরকে যুক্ত করুন, সর্বাধিক পুলিং করুন এবং এটি ক্লাসিকাল এনএন এর মাধ্যমে খাওয়ান। একটি বাক্যে প্রতিটি সম্ভাব্য প্রসঙ্গে উইন্ডো অবস্থানে, একটি বৈশিষ্ট্য ভেক্টর নির্মিত হয়। চূড়ান্ত বৈশিষ্ট্য ভেক্টর উদাহরণস্বরূপ সর্বাধিক পুলিং ব্যবহার করে নির্মিত হয়েছে। নেটওয়ার্কের পরামিতিগুলি সামঞ্জস্য করার জন্য ব্যাকপ্রপাগেশন করা হয়। আমি ইতিমধ্যে কিছু ইতিবাচক ফলাফল পেয়েছি (জিপিইউ একটি আবশ্যক)।