ভেক্টর ক্রম শ্রেণিবিন্যাস


9

আমার ডেটাসেটটিতে ভেক্টর সিকোয়েন্স রয়েছে। প্রতিটি ভেক্টরের 50 টি বাস্তব-মূল্যবান মাত্রা রয়েছে। সিকোয়েন্সে ভেক্টরের সংখ্যা 3-5 থেকে 10-15 পর্যন্ত রয়েছে। অন্য কথায়, একটি ক্রম দৈর্ঘ্য নির্দিষ্ট করা হয় না।

সিকোয়েন্সগুলির কিছু ন্যায্য পরিমাণ (ভেক্টর নয়!) একটি শ্রেণির লেবেল দ্বারা টীকাযুক্ত। আমার কাজটি একটি শ্রেণিবদ্ধ শিখতে হবে যা ভেক্টরগুলির একটি ক্রম দেয়, পুরো ক্রমটির জন্য ক্লাস লেবেল গণনা করা হয়।

আমি তথ্যের সঠিক প্রকৃতি বলতে পারি না তবে ক্রমগুলির প্রকৃতি সাময়িক নয়। তবুও, কোনও ভেক্টর লেবেল ( ) পরিবর্তন না করে একটি ভেক্টর এর সাথে যাবে না । অন্য কথায়, ভেক্টরগুলির ক্রমটি গুরুত্বপূর্ণ। ভেক্টরগুলি নিজেরাই তুলনীয়, উদাহরণস্বরূপ কোনও বিন্দু পণ্যটি গণনা করা এবং এই সাদৃশ্য মানটি ব্যবহার করা বোধগম্য।xiএক্সআমি

আমার প্রশ্ন হ'ল: কী কী সরঞ্জাম / অ্যালগরিদম যা এই জাতীয় ডেটা শ্রেণিবদ্ধ করতে সহায়তা করতে পারে?

আপডেট: ডেটাতে এমন একটি সম্পত্তি রয়েছে যা এক বা খুব কম সংখ্যক ভেক্টর ক্লাস লেবেলকে দৃ strongly়ভাবে প্রভাবিত করে।

সম্ভাব্য সমাধান: কিছু গবেষণার পরে দেখে মনে হচ্ছে রিটার্নাল নিউরাল নেটওয়ার্কস (আরএনএন) বিলটি বেশ স্বাভাবিকভাবেই ফিট করে। বহুল আলোচিত ধারণাটি হ'ল প্রসঙ্গ আকারের বাছাই করুন , শব্দ ভেক্টরকে যুক্ত করুন, সর্বাধিক পুলিং করুন এবং এটি ক্লাসিকাল এনএন এর মাধ্যমে খাওয়ান। একটি বাক্যে প্রতিটি সম্ভাব্য প্রসঙ্গে উইন্ডো অবস্থানে, একটি বৈশিষ্ট্য ভেক্টর নির্মিত হয়। চূড়ান্ত বৈশিষ্ট্য ভেক্টর উদাহরণস্বরূপ সর্বাধিক পুলিং ব্যবহার করে নির্মিত হয়েছে। নেটওয়ার্কের পরামিতিগুলি সামঞ্জস্য করার জন্য ব্যাকপ্রপাগেশন করা হয়। আমি ইতিমধ্যে কিছু ইতিবাচক ফলাফল পেয়েছি (জিপিইউ একটি আবশ্যক)।

উত্তর:


3

আপনি আরও বিশদ প্রকাশ করতে না পারায়, আমি আমার উত্তরে কিছুটা জেনেরিক হতে বাধ্য হই। আমি আশা করি তবুও এটি সহায়ক হবে। প্রথমত, আমি কেবল শ্রেণিবিন্যাসের আগে সিকোয়েন্সগুলি হ্রাস করার বিষয়টি বিবেচনা করব (এটি বিন্দু পণ্য বা অন্য কোনও কিছু ব্যবহার করেই করা উচিত) যদি আপনি নিশ্চিত করতে পারেন যে আপনার পরে শ্রেণিবিন্যাসের জন্য প্রয়োজনীয় তথ্য হারাবেন না। সুতরাং শ্রেণিবিন্যাসের প্রকৃতি সম্পর্কে আপনার যদি কিছু অন্তর্দৃষ্টি থাকে তবে এই পদ্ধতিটি কেবল সম্ভব। একটি সাধারণ উদাহরণ দেওয়ার জন্য: যদি শ্রেণি লেবেলটি আপনার ক্রম অনুসারে কেবল ভেক্টরের সংখ্যা হয় তবে আপনি বিন্দুর পণ্য থেকে শ্রেণিবদ্ধ লেবেলটি পূর্বাভাস দেওয়ার ক্ষেত্রে খুব সফল হন না।

সুতরাং, আমি শ্রেণিবিন্যাসের জন্য একটি ইনপুট হিসাবে সম্পূর্ণ ক্রমটি গ্রহণ করব এবং আপনি যে সিকোয়েন্সটি বিবেচনা করতে চান তার উপরে সর্বাধিক চাপিয়ে দেব। আপনি প্রথমে আপনার প্রশিক্ষণ সেটে সর্বোচ্চ সিক্যুয়েন্স দৈর্ঘ্য মিটার অনুসন্ধান করে এবং তারপর 50-মাত্রিক ভেক্টরগুলির প্রতিটি ক্রমকে 50 * মিটার মাত্রার একটি ভেক্টরে পরিণত করে, সম্ভবত আপনার অনুক্রমটি যদি না থাকে তবে শেষে কিছু অনুপস্থিত মান রয়েছে সর্বোচ্চ দর্ঘ্য. আপনি সম্ভবত এই হারিয়ে যাওয়া মানগুলি থেকে মুক্তি পেতে চাইবেন এবং আপনি সেগুলি কেবল শূন্য দ্বারা প্রতিস্থাপন করতে চাইতে পারেন।

আপনি এখান থেকে দুটি রাস্তা যেতে পারবেন: ১) আপনি উচ্চ শ্রেণির জন্য উপযুক্ত হিসাবে পরিচিত শ্রেণিবদ্ধকরণ পদ্ধতিগুলি সরাসরি প্রয়োগ করেন। সরল কিছু চেষ্টা করুন যা নিষ্পাপ বায়েসের মতো বেশি সুরের দরকার নেই। এই পদ্ধতিটি যদি না হয় তবে খুব বেশি সময় না হারাতে এই পদ্ধতির ব্যবহারযোগ্য কিনা তা আপনি দেখতে পারবেন। ২) আপনি মাত্রা কমাতে এবং শ্রেণিবিন্যাসের প্রকৃতি আরও ভাল করে বোঝার জন্য প্রথমে চেষ্টা করুন। আপনি প্রধান উপাদানগুলির বিশ্লেষণের মতো কিছু ব্যবহার করতে বা প্রতিটি ভেক্টর উপাদান এবং শ্রেণীর লেবেলের মধ্যে পারস্পরিক সম্পর্ক / সংযোগ বিশ্লেষণ করতে চাইতে পারেন। আপনি যদি সফল হন তবে শ্রেণিবিন্যাস প্রয়োগের আগে আপনার ইনপুটটির মাত্রাটি কীভাবে হ্রাস করতে হবে তা আপনি জানেন।

আপনি যদি এই ধারণাগুলির কোনও অনুসরণ করতে চান তবে দয়া করে মনে রাখবেন যে আপনার ডেটা এবং শ্রেণিবিন্যাসের সুনির্দিষ্ট বিবরণগুলি উপরে প্রস্তাবিত যে কোনও ধারণাকে অনিবার্য রেন্ডার করতে পারে। সুতরাং দয়া করে আপনার জানা সমস্ত বিবরণ যাচাই করতে সাবধান হন তবে আপনি নিজের সময় নষ্ট করছেন না তা নিশ্চিত করার আগে এখানে পোস্ট করতে পারবেন না।


0

ডেটাতে এমন একটি সম্পত্তি রয়েছে যা এক বা খুব কম সংখ্যক ভেক্টর ক্লাস লেবেলকে শক্তিশালীভাবে প্রভাবিত করে।

সর্বোত্তম (এবং সবচেয়ে সহজ) পদ্ধতিটি হ'ল প্রতিটি ভেক্টরটিতে কেবল ক্লাসিফারকে প্রশিক্ষণ দেওয়া এবং তারপরে একটি নির্দিষ্ট অনুক্রমের জন্য ভেক্টরগুলির জুড়ে ভবিষ্যদ্বাণীগুলি গড় করা। গুরুত্বপূর্ণ ভেক্টরগুলি তাদের ভবিষ্যদ্বাণীগুলিতে দৃ strongly়ভাবে প্রভাবিত হবে, অন্যদিকে গুরুত্বহীন ভেক্টরগুলির জন্য ভবিষ্যদ্বাণীগুলি 0.5 (বা একটি বাইনারি শ্রেণিবদ্ধকরণ সমস্যার জন্য অনুরূপ) এর কাছাকাছি হবে।


আসলে তা না. বিশেষ করে যদি আপনি গুরুত্বপূর্ণ তথ্য ছাড়া অনেক ভেক্টর আছে .. আপনি যে রুট যেতে থাকে, তাহলে স্পষ্টভাবে LSTM :) ব্যবহার
পীর
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.