ক্লাস্টার সময় সিরিজ কিভাবে?


22

গুচ্ছ বিশ্লেষণ সম্পর্কে আমার একটি প্রশ্ন আছে। 3000 টি সংস্থা রয়েছে, তাদের 5 বছরেরও বেশি সময় ধরে বিদ্যুৎ ব্যবহার অনুযায়ী ক্লাস্টার করতে হয়। প্রতিটি কোম্পানির 5 বছরের মধ্যে প্রতি ঘন্টা জন্য মান আছে। আমি জানতে চাই যে কিছু সময়সীমার মধ্যে কিছু সংস্থার ব্যবহার ক্ষমতাতে একই প্যাটার্ন রয়েছে কিনা। ফলাফলগুলি বিদ্যুতের ব্যবহারের দৈনিক পূর্বাভাসের জন্য ব্যবহার করা উচিত। আপনার যদি এসপিএসএসে টাইম সিরিজ ক্লাস্টার করার কিছু ধারণা থাকে তবে দয়া করে আমার সাথে ভাগ করুন।


1
আমি আপনাকে পৃষ্ঠার ডানদিকে সম্পর্কিত লিঙ্কগুলি চেক করার পরামর্শ দিচ্ছি। খুব অনুরূপ প্রকৃতির বেশ কয়েকটি প্রশ্ন রয়েছে, দেখুন কি বক্র আকারের উপর ভিত্তি করে টাইম-সিরিজ ক্লাস্টারিং করা সম্ভব? এবং দীর্ঘমেয়াদী তথ্য মডেলিং যেখানে সময়ের প্রভাব মাত্র দুটি উদাহরণের জন্য ব্যক্তিদের মধ্যে কার্যকরী আকারে পরিবর্তিত হয়
অ্যান্ডি ডব্লিউ

এসএএস-তে প্রোক মিলিটি টাইম সিরিজ ক্লাস্টার করতে পারে।
পূর্বাভাসকারী

উত্তর:


11

ক) ডেটা প্রিপ্রোসেসিংয়ে প্রচুর সময় ব্যয় করুন। প্রিপ্রোসেসিং আপনার কাজের 90%।

খ) সময় সিরিজের জন্য একটি উপযুক্ত মিলের পরিমাপ চয়ন করুন। উদাহরণস্বরূপ, থ্রেশহোল্ড ক্রসিং দূরত্ব এখানে ভাল পছন্দ হতে পারে। আপনার যদি ভিন্ন সময় অঞ্চল না থাকে তবে আপনি সম্ভবত গতিময় সময় বর্ধমান দূরত্বের ইচ্ছা করবেন না। প্রকৃত প্রস্থ (যা সম্ভবত সংস্থার সাথে সংস্থার তুলনায় খুব আলাদা হবে) মনোযোগ না দেওয়ার সময় অস্থায়ী প্যাটার্নগুলি সনাক্ত করতে থ্রোসোল্ড ক্রসিং আরও উপযুক্ত হতে পারে।

গ) হায়ারারিকাল ক্লাস্টারিং বা ডিবিএসসিএএন এর মতো পদ্ধতিগুলি ব্যবহার করে যেগুলি নির্বিচারে দূরত্বের ফাংশনগুলির সাথে কাজ করতে পারে ফলাফলগুলি অবিচ্ছিন্নতার ম্যাট্রিক্সকে ক্লাস্টার করুন।


আপনি কী ব্যাখ্যা করতে পারেন যে কেন ডায়নামিক টাইম ওয়ার্পিং দূরত্ব টাইম সিরিজ ক্লাস্টারিংয়ের জন্য ভাল বিকল্প নয়?
হার্দিক গুপ্ত

এটি সাধারণ বিবৃতি ছিল না। এটি ভাল কিনা তা নির্ভর করে আপনি সময় বাড়ানোর অনুমতি দিতে চান কিনা তার উপর নির্ভর করে।
অ্যানি-মাউস-রিনস্টেট মনিকা

7

আপনি দৈনিক, সাপ্তাহিক এবং বার্ষিক পর্যায়ক্রমিক সাথে প্রতি ঘন্টা সময় সিরিজের পূর্বাভাস দেখতে চাইতে পারেনপ্রতিদিনের ডেটা এবং ছুটির দিন / রেজিস্ট্রারদের সাথে জড়িত প্রতি ঘন্টা ডেটা আলোচনার জন্য। আপনার 5 বছরের ডেটা রয়েছে যখন অন্যান্য আলোচনায় 883 দৈনিক মান জড়িত। আমার পরামর্শটি হ'ল আপনি হ'ল সপ্তাহের দিনের মতো রেজিস্ট্রারগুলিকে অন্তর্ভুক্ত করে প্রতি ঘণ্টার পূর্বাভাস তৈরি করতে পারেন; বছরের অতিরিক্ত সপ্তাহ এবং ছুটির দিনে অতিরিক্ত অনুমানকারী হিসাবে প্রতিদিনের যোগফল ব্যবহার করে। এইভাবে আপনার 3,000 সংস্থার প্রত্যেকটির 24 টি মডেল থাকবে। এখন আপনি যা করতে চান তা এক মুহুর্তে, 3,000 মডেলের একটি সাধারণ এআরিম্যাক্স কাঠামো ব্যবহার করে রেজিস্ট্রারগুলির প্রত্যেকের কাছাকাছি প্রতিক্রিয়ার নিদর্শন হিসাবে হিসাবরক্ষণ করুন, সপ্তাহের দিন, সপ্তাহের দিন পরিবর্তন বহিরাগতদের বিচ্ছিন্ন করার সময় প্যারামিটার এবং সাপ্তাহিক সূচক। তারপরে আপনি বিশ্বব্যাপী সমস্ত 3000 সংস্থা ব্যবহার করে প্যারামিটারগুলি অনুমান করতে পারেন। একটি চৌ পরীক্ষা করুন http://en.wikedia.org/wiki/Chow_testপরামিতিগুলির স্থিরতা এবং প্রত্যাখ্যান ক্লাস্টারের ভিত্তিতে সংস্থাগুলিকে সমজাতীয় গ্রুপে পরিণত করা। আমি এটিকে একক মাত্রা ক্লাস্টার বিশ্লেষণ হিসাবে উল্লেখ করেছি। যেহেতু এসপিএসএসের সময় সিরিজের খুব সীমিত ক্ষমতা রয়েছে আপনি সফ্টওয়্যারটির জন্য অন্য কোথাও সন্ধান করতে পারেন।


1
"ভ্যানিলা "টিকে আর সম্পর্কে ব্যবহার করার জন্য একটি বিজোড় শব্দ মনে হয়; আরও সাধারণ আর পরিভাষায় অনুবাদ সম্পর্কে পরিষ্কার নয়। বেস আর এবং সিআরএএন থেকে অতিরিক্ত অবদান প্যাকেজগুলির মধ্যে যে কোনও পার্থক্য সত্যই অভিজ্ঞ ব্যবহারকারী, বা এমনকি নবজাতকদেরকে কামড়ায় না কারণ তারা সমান মুক্ত এবং সমানভাবে অ্যাক্সেসযোগ্য। আমার ধারণাটি এমন যে যার এসপিএসএসে অ্যাক্সেস ছিল তিনি মোটামুটি সহজেই বলতে পারেন যে এসপিএসএসে বর্তমানে প্রোগ্রামিং ছাড়া কিছু সম্ভব নয়; আর সম্পর্কে একই বলতে সমস্ত সময়ের সিরিজ প্যাকেজগুলির সাথে পরিচিতি প্রয়োজন।
নিক কক্স
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.