সময় সিরিজের পরিসংখ্যানগত মিল


15

ধরা যাক, এমন একটি সময় সিরিজ রয়েছে যা থেকে কেউ বিভিন্ন পরিমাপ যেমন সময়কাল, সর্বোচ্চ, সর্বনিম্ন, গড় ইত্যাদি গ্রহণ করতে পারে এবং তারপরে একই বৈশিষ্ট্য সহ একটি মডেল সাইন ওয়েভ তৈরি করতে এগুলি ব্যবহার করতে পারে, সেখানে এমন কোনও পরিসংখ্যানিক পদ্ধতি রয়েছে যা ব্যবহার করতে পারে এমন কোন সংখ্যাকে প্রমাণ করতে পারে? অনুমান করা মডেলটির সাথে প্রকৃত তথ্য কতটা ঘনিষ্ঠ হয়? সিরিজে ডেটা পয়েন্টের সংখ্যা 10 এবং 50 পয়েন্টের মধ্যে থাকবে।

আমার সম্পর্কে খুব সরলসাধ্য প্রথম চিন্তাটি ছিল সাইন ওয়েভের দিকনির্দেশক গতিবিধির জন্য মূল্য নির্ধারণ করা, অর্থাৎ +1 +1 +1 +1 -1 -1 -1 -1 -1 -1 -1 -1 +1 +1 +1 +1, আসল উপাত্তের সাথে একই করুন এবং তারপরে কোনওভাবে দিকনির্দেশনাটির চলাফেরার মিলের ডিগ্রি মাপুন।

সম্পাদনা: আমার ডেটা নিয়ে আমি কী করতে চাই এবং আমার মূল প্রশ্নের প্রতিক্রিয়ার আলোকে আরও চিন্তাভাবনা করা, প্রতিদ্বন্দ্বী অনুমানের মধ্যে নির্বাচন করার জন্য অ্যালগরিদম গ্রহণ করার জন্য আমার যা দরকার তা হল: অর্থাৎ আমার ডেটা মূলত রৈখিক (বা প্রবণতা) শব্দ সহ যা সম্ভবত চক্রীয় উপাদান থাকতে পারে; আমার ডেটা মূলত বলার মতো দিকনির্দেশক প্রবণতা সহ চক্রীয়; ডেটা মূলত কেবল গোলমাল; বা এটি এর মধ্যে যে কোনও একটির মধ্যে ক্রান্তিকালীন।

আমার চিন্তাভাবনাগুলি সম্ভবত কিছু প্রকার বায়েশীয় বিশ্লেষণ এবং ইউক্লিডিয়ান / এলএমএস মেট্রিককে একত্রিত করতে পারে। এই পদ্ধতির পদক্ষেপগুলি হবে

ডেটা পরিমাপ থেকে ধরে নেওয়া সাইন ওয়েভ তৈরি করুন

ডেটাতে একটি এলএমএস সোজা লাইন ফিট করুন

উপরের প্রত্যেকটির মূল ডেটা থেকে প্রস্থানের জন্য একটি ইউক্যালিডিয়ান বা এলএমএস মেট্রিক বের করুন

এই মেট্রিকের উপর ভিত্তি করে প্রত্যেকের জন্য একটি বয়েসিয়ান তৈরি করুন অর্থাত্ সম্মিলিত প্রস্থানের %০% অন্যের সাথে সংযুক্ত থাকে, ৪০% অপরটির সাথে থাকে, সুতরাং ৪০% পক্ষে

ডেটা বরাবর একটি উইন্ডোতে একটি ডেটা পয়েন্ট স্লাইড করুন এবং এই সামান্য পরিবর্তিত ডেটা সেটটির জন্য নতুন% মেট্রিকগুলি পেতে উপরেরটি পুনরাবৃত্তি করুন - এটিই নতুন প্রমাণ - একটি উত্তরোত্তর তৈরি করার জন্য বায়সিয়ান বিশ্লেষণ করুন এবং প্রতিটি অনুমানের পক্ষে সম্ভাবনাগুলি পরিবর্তন করুন

এই স্লাইডিং উইন্ডোটির সাথে পুরো ডেটা সেট (3000+ ডেটা পয়েন্ট) বরাবর পুনরাবৃত্তি করুন (উইন্ডোর দৈর্ঘ্য 10-50 ডেটা পয়েন্ট)। আশা / উদ্দেশ্যটি হ'ল ডেটা সেটের যে কোনও সময়ে প্রাধান্য / অনুকূল অনুমানকে চিহ্নিত করা এবং সময়ের সাথে কীভাবে এটি পরিবর্তিত হয়

এই সম্ভাব্য পদ্ধতিটি সম্পর্কে যে কোনও মন্তব্যই স্বাগত হবে, বিশেষত আমি কীভাবে বায়েশীয় বিশ্লেষণ অংশটি বাস্তবায়িত করতে পারি।

উত্তর:


7

ইউক্লিডিয়ান দূরত্বটি মেশিন লার্নিংয়ের একটি সাধারণ মেট্রিক। নিম্নলিখিত স্লাইডগুলি উল্লেখগুলির সাথে এই অঞ্চলের একটি ভাল ওভারভিউ সরবরাহ করে:

সময় সিরিজের শ্রেণিবিন্যাসের জন্য কেওগের মানদণ্ড পৃষ্ঠায় উল্লেখগুলিও দেখুন:


5

যদি আপনার কাছে একটি নির্দিষ্ট মডেল থাকে যার তুলনায় আপনি তুলনা করতে চান: আমি কোনও নির্দিষ্ট ডেটাসেটের বিপরীতে সম্ভাব্য পরামিতি মানগুলি হ্রাস করতে এবং স্কোর করার জন্য মেট্রিক হিসাবে ন্যূনতম-স্কোয়ারগুলি প্রস্তাব করব। মূলত আপনাকে যা করতে হবে তা হ'ল আপনার প্যারামিটারের অনুমানগুলি প্লাগ করতে হবে, পূর্বাভাসিত মানগুলি তৈরি করতে সেগুলি ব্যবহার করে এবং সত্য মানের থেকে গড় স্কোয়ার বিচ্যুতি গণনা করে।

যাইহোক, আপনি আপনার প্রশ্নকে কিছুটা ঘুরিয়ে দেওয়ার বিষয়ে বিবেচনা করতে পারেন: "কোন ডেটা আমার ডেটাতে সবচেয়ে ভাল ফিট করে?" সেক্ষেত্রে আমি সাধারণত বিতরণ করা ত্রুটি শর্তটি ধরে নেওয়ার পরামর্শ দেব - যার পক্ষে কেউ যুক্তি দিতে পারে তা ন্যূনতম স্কোয়ার অনুমানের অনুরূপ। তারপরে, আপনার মডেলটি বেছে নেওয়ার উপর নির্ভর করে আপনি কীভাবে অন্যান্য মডেল প্যারামিটারগুলি বিতরণ করেছেন (একটি বায়েসিয়ান পূর্বে বরাদ্দ করা হয়েছে) এবং প্যারামিটারগুলির বিতরণ থেকে নমুনা থেকে আরসিসি থেকে এমসিএমসি প্যাকেজের মতো কিছু ব্যবহার করবেন সে সম্পর্কে আপনি একটি ধারণা তৈরি করতে পারেন। তারপরে আপনি কোন মডেলের সেরা উপযুক্ত এটি সম্পর্কে ধারণা পেতে আপনি উত্তরোত্তর উপায়গুলি এবং বিভিন্ন রূপগুলি দেখতে পারেন।


আমার তথ্যগুলিতে ফিট করার জন্য আমার কাছে যদি দুটি সম্ভাব্য মডেল থাকে তবে আমার আসল প্রশ্নে বর্ণিত সাইন ওয়েভ এবং এলএমএস স্ট্রেইট লাইন ফিট থাকলে আমি কেবল সাইন ওয়েভের প্রকৃত ডেটা মানগুলি থেকে গড় স্কোয়ার বিচ্যুতিটির অবশিষ্টাংশের সাথে তুলনা করতে পারি? এলএমএস ফিট লাইন এবং তারপরে এই মডেলটি ডেটাতে আরও সঠিক ফিট করে এমন ভিত্তিতে নিম্ন সামগ্রিক মান সহ মডেলটি বেছে নিন? যদি তা হয়, তবে এটিও সম্ভবত অর্ধেক অংশে ডেটা বিভক্ত করা এবং একই সাইন ওয়েভ / এলএমএস ব্যবহার করে প্রতিটি মডেল কীভাবে সময়ের সাথে খারাপ / খারাপ হতে পারে তা দেখতে একইভাবে পৃথক একই অর্ধেকের সাথে একইভাবে কাজ করা বৈধ হবে কি?
ব্যাবেলপ্রুডিংডার

আমি নিশ্চিত নই. আমার পরামর্শ ছিল একটি সর্বনিম্ন স্কোয়ার্স মেট্রিক ব্যবহার করা, তবে আমি লিনিয়ার রিগ্রেশন চালানোর জন্য বলছিলাম না। আপনি পর্যায়ক্রমিক রিগ্রেশন চেক আউট করতে পারেন ।
এম। টিবিটস

আপনার অন্যান্য প্রশ্ন হিসাবে, আপনি অর্ধেক তথ্য কাটা করতে পারে, আমি এটি করতে খুব সতর্ক হতে হবে - কারণ এটি আপনাকে বিবেচনা করতে পারে ন্যূনতম ফ্রিকোয়েন্সি দ্বিগুণ করবে। আমি মনে করি আপনার ফুরিয়ার সহগগুলি (কোনও এফএফটি বা কোনও ডিসিটি নিন এবং সেগুলিতে আবার চাপ দিন?!? - নিশ্চিত নন ) দেখার দরকার পড়ে। বা সম্ভবত উপরে বর্ণিত হিসাবে পর্যায়ক্রমিক রিগ্রেশন।
এম। টিবিটস

3

কেবলমাত্র নির্দেশমূলক আন্দোলনের গুণগতভাবে প্রতিনিধিত্ব করার আপনার "সরলবোধী প্রথম চিন্তা" সময় সিরিজের তুলনা করার জন্য কেওগের স্যাক্স অ্যালগরিদমের সাথে একইভাবে মিল রয়েছে। আমি আপনাকে এটি একবার দেখে নেওয়ার পরামর্শ দিচ্ছি: এমোন কেওগ এবং জেসিকা লিন: স্যাক্স

আপনার সম্পাদনা থেকে মনে হচ্ছে আপনি এখন সমস্যাটিকে অন্যরকমভাবে মোকাবেলার বিষয়ে ভাবছেন, তবে আপনি দেখতে পাবেন যে SAX ধাঁধাটির একটি অংশ সরবরাহ করে।


0

আমি যখন পার্টিতে কিছুটা দেরি করেছি, আপনি যদি সাইনোসয়েডাল কিছু নিয়ে ভাবছেন তবে ওয়েভলেট ট্রান্সফর্মগুলি আপনার পকেটে রাখা ভাল সরঞ্জাম tool তত্ত্ব অনুসারে, আপনি বিভিন্ন "অংশ" (যেমন, বিভিন্ন আকার / ফ্রিকোয়েন্সিগুলির তরঙ্গ, নমন-তরঙ্গ উপাদান যেমন ট্রেন্ডস ইত্যাদি )গুলিতে একটি অনুক্রমকে পচানোর জন্য তরঙ্গকরণ রূপান্তর ব্যবহার করতে পারেন। একটি টন ব্যবহৃত তরঙ্গ রূপান্তর একটি নির্দিষ্ট ফর্মটি ফুরিয়ার ট্রান্সফর্ম, তবে এই ক্ষেত্রটিতে অনেক কাজ রয়েছে। আমি একটি বর্তমান প্যাকেজটির সুপারিশ করতে সক্ষম হতে চাই তবে আমি বেশ কিছুক্ষণের মধ্যে সংকেত বিশ্লেষণের কাজটি করিনি। তবে আমি এই শিরাতে কার্যকারিতা সমর্থনকারী কিছু মাতলাব প্যাকেজগুলি স্মরণ করছি।

আপনি যদি কেবল চক্রীয় ডেটাতে ট্রেন্ডগুলি অনুসন্ধান করার চেষ্টা করছেন তবে যাওয়ার আরেকটি দিক হ'ল মান-কেন্ডাল ট্রেন্ড পরীক্ষার মতো something এটি আবহাওয়া বা জলের গুণমানের পরিবর্তনগুলি সনাক্তকরণের মতো জিনিসের জন্য প্রচুর ব্যবহৃত হয়, যার শক্তিশালী seasonতুগত প্রভাব রয়েছে। এটিতে আরও কিছু উন্নত পদ্ধতির ঘণ্টা এবং হুইসেল নেই, তবে এটি একটি প্রবীণ পরিসংখ্যানগত পরীক্ষা যেহেতু এটি ব্যাখ্যা করা এবং রিপোর্ট করা মোটামুটি সহজ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.