সময় সিরিজের জন্য লজিস্টিক রিগ্রেশন


21

অতীতের পর্যবেক্ষণের ভিত্তিতে সবেমাত্র উপস্থিত হওয়া ডেটা (অর্থাৎ সারি) এর নির্ভরশীল ভেরিয়েবলের মান পূর্বাভাস দেওয়ার জন্য আমি স্ট্রিমিং ডেটা (বহুমাত্রিক সময় সিরিজ) এর প্রসঙ্গে একটি বাইনারি লজিস্টিক রিগ্রেশন মডেলটি ব্যবহার করতে চাই। যতদূর আমি জানি, লজিস্টিক রিগ্রেশন traditionতিহ্যগতভাবে পোস্টমর্টেম বিশ্লেষণের জন্য ব্যবহৃত হয়, যেখানে প্রতিটি নির্ভরশীল পরিবর্তনশীল ইতিমধ্যে সেট করা হয়েছে (হয় পরিদর্শন দ্বারা বা অধ্যয়নের প্রকৃতির দ্বারা)।

যদিও টাইম সিরিজের ক্ষেত্রে কী ঘটে, যেখানে আমরা historicalতিহাসিক তথ্যগুলির (যেমন শেষ সেকেন্ডের সময় উইন্ডোতে উদাহরণস্বরূপ) নির্ভরশীল পরিবর্তনশীল সম্পর্কে পূর্বাভাস (উড়ানের উপরে) তৈরি করতে চাই এবং অবশ্যই পূর্ববর্তীটি নির্ভরশীল ভেরিয়েবলের অনুমান?টি

এবং যদি আপনি সময়ের সাথে উপরোক্ত সিস্টেমটি দেখতে পান তবে এটি কীভাবে তৈরি করা উচিত যাতে রিগ্রেশনটি কাজ করতে পারে? আমরা লেবেল দ্বারা প্রথমে প্রশিক্ষণের আছে না, (অর্থাত 0 বা 1 থেকে নির্ভরশীল পরিবর্তনশীল সেটিং) এর বলে আমাদের তথ্য প্রথম 50 সারি দিন এবং তারপর ভেক্টরের বর্তমান হিসাব ব্যবহার নির্ভরশীল পরিবর্তনশীল হচ্ছে নতুন সম্ভাবনা অনুমান করার জন্য 0 বা 1 সবেমাত্র এসেছে এমন ডেটার জন্য (যেমন সিস্টেমে সবেমাত্র যুক্ত হওয়া নতুন সারি)?β

আমার সমস্যাটিকে আরও সুস্পষ্ট করার জন্য, আমি এমন একটি সিস্টেম তৈরি করার চেষ্টা করছি যা পূর্ববর্তী সমস্ত নির্ভরশীল বা ব্যাখ্যামূলক জ্ঞানের (পর্যবেক্ষণ বা অনুমান) প্রদত্ত সারি অনুসারে একটি ডেটাসেট সারি পার্স করে এবং বাইনারি ফলাফল (নির্ভরশীল পরিবর্তনশীল) এর পূর্বাভাস দেওয়ার চেষ্টা করে একটি নির্দিষ্ট সময় উইন্ডোতে উপস্থিত ভেরিয়েবলগুলি। আমার সিস্টেমটি Rerl এ রয়েছে এবং অনুমানের জন্য আর ব্যবহার করে।


5
আপনি কি আপনার ডেটাতে একটি সম্পর্কিত সম্পর্ক স্থাপন করতে পারেন? আপনার ক্ষেত্রে লগইট লিঙ্ক সহ জিএলএমএম-এর একটি বিশেষ কেস, তবে যুক্তিসঙ্গত উত্তর পেতে সময় সিরিজের ডেটাতে পারস্পরিক সম্পর্ক অবশ্যই সঠিকভাবে মডেল করা উচিত।
সানকুলসু

1
YটিYটি-1

2
আপনি কি দয়া করে আমার জন্য কোনও দৃ concrete় সমাধান দেওয়ার জন্য আপনার ডেটার সংক্ষিপ্ত বিবরণ দিতে পারবেন? আপনার সমস্যাটি এই স্ট্যাটাসের
সানকুলসু

2
আমার কাছে নিম্নলিখিত ফর্মটির একটি নেটওয়ার্ক ট্র্যাফিক সময় সিরিজ রয়েছে: প্রোটোকল, এসআরসিআইপি এসসিআরপিপোর্ট, ডেসিটিপ, ডেসটপোর্ট, টাইমসেক, টাইমসেক, প্যাকলেন্থ টিসিপি, 200.80.199.105,3523,207.216.233.144,9658,11223344,941818,62 ইউডিপি, 142.144.155.120 5 1751,244.72.151.2,1935, 11223344,941843,60 আমি কোনও অনুমান করতে চাই যে কোনও প্যাকেট (বা প্যাকেটের দল) স্ব-প্রশিক্ষিত মডেল তৈরির জন্য লেবেলযুক্ত ডেটাসেটের জ্ঞান ব্যবহার করে দূষিত কিনা। উচ্চতর পরিমাণে ট্র্যাফিকের জন্য সিস্টেমকে আরও কার্যকর করার জন্য এবং গড় গড়ের কথা আমি উপরের মেট্রিকগুলিতে প্রয়োগ করা হয়।
রেজিস্ট্রার

2
এটি সত্যিই কোনও সমর্থন ভেক্টর মেশিনের কাজের জন্য মনে হচ্ছে। আমি কিছু অনুপস্থিত করছি? আপনি যদি স্বতঃসংশ্লিষ্টতা বা আপনার ডেটার সময়-সিরিজ কাঠামো সম্পর্কে সত্যিই উদ্বিগ্ন হন তবে আপনি আরিমা এবং / অথবা একটি বহুস্তর অনুদৈর্ঘ্য মডেল চেষ্টা করতে পারেন। দ্রাঘিমাংশীয় মডেলগুলিতে আমি উইলেট এবং সিঙ্গারের অ্যাপ্লাইড লম্বিটুডিনাল ডেটা অ্যানালাইসিসের পরামর্শ দিচ্ছি , যার জন্য ইউসিএলএ এটিএস সাইটে আর কোডের উদাহরণ রয়েছে।
আশাব

উত্তর:


6

দুটি বিষয় বিবেচনা করতে হবে:

  1. কেবলমাত্র শেষ এন ইনপুট নমুনাগুলি ব্যবহার করুন। ধরে নিচ্ছি আপনার ইনপুট সিগন্যালটি মাত্রা D এর, তারপরে আপনার কাছে গ্রাউন্ড ট্রুথ লেবেল অনুসারে এন * ডি নমুনা রয়েছে। আপনি লজিস্টিক রিগ্রেশন সহ আপনার পছন্দ মতো কোনও শ্রেণিবদ্ধ ব্যবহার করে প্রশিক্ষণ দিতে পারেন। এইভাবে, প্রতিটি আউটপুট অন্য সমস্ত আউটপুট থেকে স্বতন্ত্র বলে বিবেচিত হয়।

  2. আপনার উত্পন্ন সর্বশেষ এন ইনপুট নমুনা এবং সর্বশেষ এন আউটপুট ব্যবহার করুন। সমস্যাটি তখন ভিটারবি ডিকোডিংয়ের মতো । আপনি ইনপুট নমুনাগুলির উপর ভিত্তি করে একটি নন-বাইনারি স্কোর উত্পন্ন করতে এবং ভিটারবি ডিকোডার ব্যবহার করে একাধিক নমুনার স্কোর একত্রিত করতে পারেন। এটি পদ্ধতি 1 এর চেয়ে ভাল you আপনি যদি এখন ফলাফলগুলির মধ্যে সাময়িক সম্পর্ক সম্পর্কে কিছু করেন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.