নিম্নলিখিত 1 টি মাত্রিক ক্রম অনুমান করুন:
A, B, C, Z, B, B, #, C, C, C, V, $, W, A, % ...
বর্ণগুলি A, B, C, ..
এখানে 'সাধারণ' ইভেন্টগুলি উপস্থাপন করে।
প্রতীকগুলি #, $, %, ...
এখানে 'বিশেষ' ইভেন্টগুলির প্রতিনিধিত্ব করে
সমস্ত ইভেন্টের মধ্যে অস্থায়ী ব্যবধান অ-অভিন্ন (সেকেন্ড থেকে কয়েক দিন পর্যন্ত) যদিও অতীতের কোনও ঘটনা ভবিষ্যতের ঘটনাগুলিকে প্রভাবিত করার সম্ভাবনা কম থাকে। আদর্শভাবে আমি এই সময়গুলিতে স্পষ্টভাবে বিলম্ব বিবেচনা করতে পারি।
10000 সাধারণ ইভেন্ট প্রকারের ক্রম এবং 100 টি বিশেষ ইভেন্ট প্রকারের ক্রমে রয়েছে। একটি বিশেষ ইভেন্টের আগের সাধারণ ইভেন্টগুলির পরিমাণ পরিবর্তিত হয় তবে এটি 100-300 এর বেশি হওয়ার সম্ভাবনা কম।
মৌলিকভাবে আমি সাধারণ ইভেন্টের ক্রমগুলির নিদর্শনগুলি খুঁজতে আগ্রহী যা শেষ হয়ে যায় বিশেষ ইভেন্টগুলির জন্য ভবিষ্যদ্বাণীপূর্ণ।
এখন আপনি এটি বিভিন্ন উপায়ে যোগাযোগ করতে পারেন: বৈশিষ্ট্য ভেক্টর তৈরি করা + স্ট্যান্ডার্ড শ্রেণিবদ্ধকরণ, সমিতি নিয়ম শিখন, এইচএমএম ইত্যাদি feature
এই ক্ষেত্রে একটি এলএসটিএম ভিত্তিক নেটওয়ার্ক কীভাবে সেরা ফিটবে তা আমি আগ্রহী। সোজা কথা হ'ল কার্পার্থির চর-আরএনএন এর মতো কিছু করা এবং পরবর্তী ইতিহাসের পূর্বে একটি ইতিহাসের পূর্বাভাস দেওয়া। তারপরে একটি নতুন সিকোয়েন্সের জন্য
C, Z, Q, V, V, ... , V, W
আপনি এটি মডেলটির মাধ্যমে চালাতে পারেন এবং দেখতে পাবেন কোন বিশেষ ইভেন্টটি সম্ভবত পরবর্তী সম্ভাব্য। তবে এটি পুরোপুরি সঠিক মানায় না।
যেহেতু এটি একটি অস্থায়ী শ্রেণিবিন্যাসের সমস্যা তাই এটি যথাযথ জিনিসটি মনে হচ্ছে তবে এটি অ্যালেক্স গ্রাভের বর্ণিত সংযোগবাদী টেম্পোরাল শ্রেণিবিন্যাস ব্যবহার করা ।
যাইহোক, এই মুহুর্তে বেশি বিনিয়োগের আগে আমি LSTM কীভাবে উপযুক্ত হবে তা অনুধাবন করতে আরও কিছু সহজ এবং দ্রুত পরীক্ষা করার জন্য সন্ধান করছি। টেনসরফ্লো কিছু সময় একটি সিটিসি উদাহরণ দেখতে পাবে , তবে এখনও তা নয়।
সুতরাং আমার (সাব) প্রশ্নগুলি হ'ল:
- উপরের সমস্যাটি দেওয়া হয়েছে এবং আমি এলএসটিএম নিয়ে পরীক্ষা করতে চাই, এটি কি চর-আরএনএন টাইপ পদ্ধতির চেষ্টা করা ভাল, আমি যদি বুলেটটি কামড়ান এবং সিটিসি-র সাথে আঁকড়ে ধরতে পারি, বা আরও ভাল কোনও জায়গা শুরু করতে পারি?
- আপনি কীভাবে আন্ত-ইভেন্টের সময় তথ্য সুস্পষ্টভাবে সংযুক্ত করবেন। কোনও অপ-ইভেন্ট ইভেন্ট সহ স্থির ঘড়িটি ব্যবহার করা স্পষ্টতই কাজ করে তবে কুৎসিত বলে মনে হয়।
- ধরে নিই যে আমি একটি এলএসটিএমকে প্রশিক্ষণ দিতে পেরেছি তা কি ধরণের ইভেন্ট 'মোটিফগুলি' গ্রহণ করেছে তা দেখার জন্য মডেলটি পরীক্ষা করার কোনও উপায় আছে? (অর্থাত্, বন্দীদের মধ্যে ফিল্টারগুলির সাথে সাদৃশ্য)
যে কোনও নমুনা কোড (পাইথন পছন্দসই) সর্বদা সহায়ক।
সম্পাদনা: ক্রমটিতে কিছু শব্দ আছে তা যোগ করার জন্য noise কিছু ইভেন্ট নিরাপদে উপেক্ষা করা যেতে পারে তবে ঠিক কোনটি সামনে সবসময় বলা সম্ভব নয়। সুতরাং আদর্শভাবে মডেল (এবং এটি থেকে প্রাপ্ত মোটিফগুলি) এর বিরুদ্ধে দৃ rob়।