আমার কাছে টাইম সিরিজের ডেটা সেট আছে। প্রতিটি সিরিজ একই সময়কাল জুড়ে, যদিও প্রতিটি সময় সিরিজের আসল তারিখগুলি সমস্ত 'লাইন আপ' না করে may
এটি বলার অপেক্ষা রাখে না, যদি টাইম সিরিজটি 2 ডি ম্যাট্রিক্সে পড়তে হয় তবে এটি এমন কিছু দেখায়:
date T1 T2 T3 .... TN
1/1/01 100 59 42 N/A
2/1/01 120 29 N/A 42.5
3/1/01 110 N/A 12 36.82
4/1/01 N/A 59 40 61.82
5/1/01 05 99 42 23.68
...
31/12/01 100 59 42 N/A
etc
আমি একটি আর স্ক্রিপ্ট লিখতে চাই যা টাইম সিরিজ {টি 1, টি 2, ... টিএন} কে 'পরিবারগুলিতে' আলাদা করে দেয় যেখানে একটি পরিবারকে সিরিজের সেট হিসাবে সংজ্ঞায়িত করা হয় যা একে অপরের সাথে "সহানুভূতিতে চলে আসে"।
'ক্লাস্টারিং' অংশের জন্য, আমাকে এক ধরণের দূরত্ব পরিমাপ নির্বাচন / সংজ্ঞায়িত করতে হবে। আমি এটি সম্পর্কে কীভাবে যেতে পারি তা সম্পর্কে পুরোপুরি নিশ্চিত নই, যেহেতু আমি সময় সিরিজ নিয়ে কাজ করছি, এবং একজোড়া ধারাবাহিকতা যা অন্তর অন্তর সহানুভূতিতে চলে যেতে পারে, পরবর্তী সময়ে অন্তর্ভুক্ত নাও করতে পারে।
আমি নিশ্চিত যে এখানে আমার চেয়ে অনেক বেশি অভিজ্ঞ / চতুর লোক রয়েছেন, তাই দূরত্ব পরিমাপের জন্য কীভাবে অ্যালগরিদম / হিউরিস্টিক ব্যবহার করতে হবে এবং কীভাবে সময় সিরিজের গুচ্ছায় ব্যবহার করতে হবে সে সম্পর্কে আমি যে কোনও পরামর্শ, ধারণার জন্য কৃতজ্ঞ থাকব।
আমার ধারণা হ'ল এটি করার জন্য কোনও প্রতিষ্ঠিত শক্তিশালী পরিসংখ্যান পদ্ধতি নেই, সুতরাং লোকেরা কীভাবে এই সমস্যার সমাধান করে / সমাধান করে তা দেখে আমি খুব আগ্রহী হব - একটি পরিসংখ্যানবিদদের মতো চিন্তাভাবনা করুন।