টেম্পোরাল ডেটার জন্য উপযুক্ত ক্লাস্টারিং কৌশল?


13

আমার কাছে ক্রিয়াকলাপের ফ্রিকোয়েন্সিগুলির অস্থায়ী ডেটা রয়েছে। আমি ডেটাতে ক্লাস্টারগুলি সনাক্ত করতে চাই যা অনুরূপ ক্রিয়াকলাপের স্তরের সাথে সময়ের স্বতন্ত্র সময়কে নির্দেশ করে। আদর্শভাবে আমি ক্লাস্টারগুলির সংখ্যা উল্লেখ না করেই ক্লাস্টারগুলি সনাক্ত করতে চাই ।

উপযুক্ত ক্লাস্টারিং কৌশলগুলি কী কী? যদি আমার প্রশ্নের উত্তর দেওয়ার জন্য পর্যাপ্ত তথ্য না থাকে তবে উপযুক্ত ক্লাস্টারিং কৌশলগুলি নির্ধারণের জন্য আমার প্রয়োজনীয় তথ্যগুলির টুকরোগুলি কী কী?

নীচে আমি যে ধরণের ডেটা / ক্লাস্টারিংয়ের কল্পনা করছি তার একটি চিত্রণ দেওয়া হল: সময় জুড়ে গুচ্ছ


প্লটটি আমার কাছে স্মুথনেড (ইন্টারপোল্টেড) দেখাচ্ছে। এটি সম্ভবত বিভ্রান্তিকর। এবং "অনুদৈর্ঘ্য" আমি জিওডাটার সাথে যুক্ত ছিলাম, তবে দৃশ্যত আপনি কোনও সময়ের সিরিজটির দিকে তাকিয়ে আছেন?
কিট আছে - অ্যানি-মুউসে

1
প্লটের দিকে খুব বেশি মনোযোগ দেবেন না, এটি কেবল উদাহরণ। আমি যেটি অর্জন করতে চাই তা হ'ল সময়ের সাথে পৃথক পৃথক পর্বগুলির ভিত্তিতে পৃথক পর্বগুলি। অনুদৈর্ঘ্য, আমার মনের মধ্যে, সময়গত ডেটা হিসাবে একই দেখতে যেমন en.wikipedia.org/wiki/Longitudinal_study
histelheim

কারণ ক্লাস্টারিং, আপনি বেশিরভাগ হিসেবে এই শব্দটি দেখতে হবে en.wikipedia.org/wiki/Longitude - আপনার প্রশ্নটি থেকে এটা স্পষ্ট নয় কি আপনি ক্লাস্টারের করতে চাই। আপনি ক্লাস্টার যেমন সময়ের ব্যবধানগুলি যা "বিষয়গুলি" জুড়ে একইরকম আচরণ করে বা বিষয়গুলি যা সময়ের সাথে একই অগ্রগতি দেখায়।
কিট আছে - অ্যানি-মুউসে

1
বিভ্রান্তি এড়াতে আমি 'দ্রাঘিমাংশকে' বদলে 'অস্থায়ী' করে ফেলেছি। আপনার শব্দগুলি ব্যবহার করে, আমি মনে করি আমি সময়ের ব্যবধানগুলি ক্লাস্টার করতে চাই । তবে এটি আমার কাছে গুরুত্বপূর্ণ যে গুচ্ছগুলি আলাদা, সময় মতো ধারাবাহিক পর্ব।
হিশেলহাইম

"টাইম সিরিজ বিভাজন" বা "রেজিম স্যুইচিং মডেল" কীওয়ার্ড সহ অনুসন্ধানগুলি আপনাকে সহায়তা করতে পারে।
ইয়ভেস

উত্তর:


6

আমার নিজের গবেষণা থেকে মনে হয় যে গাউসিয়ান হিডেন মার্কোভ মডেলগুলি বেশ উপযুক্ত হতে পারে: http://scikit-learn.org/stable/auto_example/plot_hmm_stock_analysis.html#example-plot-hmm-stock- analysis-py

এটি অবশ্যই ক্রিয়াকলাপের স্বতন্ত্র পর্বগুলি খুঁজে পেয়েছে বলে মনে হচ্ছে।

গাউসিয়ান লুকানো মার্কভ মডেল


সময়ের আগে কয়টি লুকানো রাজ্য রয়েছে তা জানতে হবে না? তার কাছাকাছি যাওয়ার কোনও উপায় আছে?
জেসিওয়ং

@ জেসিওয়ং আমার ধারণা, এড়াতে আপনি একটি ননপ্যারমেট্রিক বায়েশিয়ান বৈকল্পিক (অসীম লুকানো মার্কোভ মডেল) ব্যবহার করতে পারেন।
jtobin

যদিও অনেক পরে: এইচএমএম সাময়িকভাবে গ্রুপ / গ্রুপ ইভেন্টগুলি (চিত্র থেকে এটি কী দেখায়) বলে মনে হয় না। তবে, যা জিজ্ঞাসা করা হয়েছে তা হল টেম্পোরাল ক্লাস্টারগুলি কীভাবে পাবেন? আমি টেম্পোরাল ক্লাস্টারিং স্টাফ হিসাবে কাজ করছি হিসাবে আমি ঠিক কৌতূহলী।
রাসেলবি

3

আপনার সমস্যাটি আমি যা দেখছি তার অনুরূপ এবং এই প্রশ্নটি যা অনুরূপ, তবে খুব কম ব্যাখ্যা করা হয়েছে।

তাদের উত্তর পরিবর্তন সনাক্তকরণের একটি ভাল সারাংশের লিঙ্ক করে। সম্ভাব্য সমাধানগুলির জন্য, একটি দ্রুত গুগল অনুসন্ধানে গুগল কোডে একটি পরিবর্তন পয়েন্ট বিশ্লেষণ প্যাকেজ পাওয়া গেছে । এটি করার জন্য আর এরও কিছু সরঞ্জাম রয়েছে। bcpপ্যাকেজ চমত্কার শক্তিশালী এবং সত্যিই সহজ ব্যবহার করা হয়। ডেটা আসার সাথে সাথে আপনি যদি ফ্লাইতে এটি করতে চান তবে কাগজটি "জিনোমিক ডেটার সাথে প্রয়োগের সাথে অন-লাইন চেঞ্জপয়েন্ট সনাক্তকরণ এবং প্যারামিটারের অনুমান" সত্যই একটি পরিশীলিত পদ্ধতির বর্ণনা দিয়েছে, যদিও সতর্ক করে দেওয়া হয়েছে যে এটি সামান্য চ্যালেঞ্জিং। এর রয়েছে strucchangeপ্যাকেজ, কিন্তু এই কম ভাল আমার জন্য কাজ করেছে।


1

ওয়েভলেটগুলি আপনাকে বিভিন্ন বৈশিষ্ট্য সহ পিরিয়ড সনাক্ত করতে সহায়তা করতে পারে। তবে আমি নিশ্চিত নই যে এমন কোনও পদ্ধতি রয়েছে যা আপনার টাইমসারিগুলিকে আপনার জন্য পৃথক সময়ের মধ্যে বিভক্ত করবে। এটি দেখে মনে হচ্ছে অনেকগুলি তত্ত্ব রয়েছে যা আমি কেবল শুরুতে এসেছি। আমি অন্যান্য পরামর্শ পড়ার প্রত্যাশায় ..

তরঙ্গলেটের উপর একটি নিখরচায় বইয়ের অধ্যায়।

তরঙ্গলিপিগুলির সাথে তাত্পর্যপূর্ণ পরীক্ষার জন্য একটি আর প্যাকেজ।


1

আপনি কি এই পৃষ্ঠাটি দেখেছেন: ইউসিআর সময় সিরিজের শ্রেণিবদ্ধকরণ / ক্লাস্টারিং পৃষ্ঠা ?

সেখানে আপনি উভয়ই খুঁজে পেতে পারেন: অনুশীলনের জন্য ডেটাসেটগুলি এবং ফলাফল প্রকাশিত - আপনার নিজের বাস্তবায়নের পারফরম্যান্সের সাথে তুলনা করতে (সুপরিচিত মেশিন লার্নিং কৌশলগুলিরও জ্ঞাত পারফরম্যান্সের একটি লিঙ্ক রয়েছে)। তদতিরিক্ত, এই পৃষ্ঠাটি একটি জটিল কাগজপত্রের উদ্ধৃতি দিচ্ছে যা থেকে আপনি আপনার সমস্যা, ডেটা বা প্রয়োজন অনুসারে সেরা পদ্ধতির জন্য গবেষণার মাধ্যমে আরও এগিয়ে যেতে পারেন।

এছাড়াও, সিকিতুর http: // sequitur.info প্রয়োগ করে (সম্ভাব্যভাবে) এটি করার আরও একটি উপায় রয়েছে। আপনি যদি নিজের ডেটাটি স্বাভাবিকভাবেই স্বাভাবিক / আনুমানিক করতে সক্ষম হন, এটি আপনার সেই একই ব্যাকরণের "অনুরূপ ক্রিয়াকলাপের স্তরের সাথে স্বতন্ত্র সময়ের" এই কাগজটি দেখবে এবং অন্য একটি অনুসন্ধান করবে, কারণ আমি আরও লিঙ্ক যুক্ত করতে অক্ষম ...


3
আপনি কি এই পৃষ্ঠায় উপলব্ধ সংক্ষিপ্তসার সংক্ষিপ্তসার সরবরাহ করতে পারেন?
chl

অবশ্যই আমি পারি সেখান থেকে শুরু করে আমি আমার নিজস্ব শ্রেণিবদ্ধকরণ
সিনিয়র করা

1

আমি মনে করি আপনি বিভিন্ন সময় সিরিজের মিল খুঁজে পেতে ডায়নামিক টাইম র‍্যাপিং ব্যবহার করতে পারেন। এটি করার জন্য, আপনার অ্যারের মতো আপনার ওয়েভলেটটিকে সংগ্রহগুলিতে আলাদা করতে হবে। তবে গ্রানুলারিটি সমস্যা হবে এবং আপনার যদি প্রচুর সময় সিরিজ থাকে তবে প্রতিটি জোড়ের জন্য ডিটিএম দূরত্ব গণনা করার জন্য গণনা ব্যয়টি বেশ বড় হবে। সুতরাং লেবেল হিসাবে কাজ করার জন্য আপনার কিছু পূর্বনির্ধারণের প্রয়োজন হতে পারে।

পরীক্ষা করে দেখুন এই বাইরে। আমিও আপনার মতো কিছু কাজ করে যাচ্ছি এবং এই পৃষ্ঠাটি আমাকে কিছুটা সহায়তা করেছে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.