দুটি ডেটা সেটের মধ্যে মিল খুঁজে বের করা


12

সংক্ষিপ্তসার : সর্বোত্তম পদ্ধতিটি অনুসন্ধানের চেষ্টা করে একটি একক মান ব্যবহার করে ডেটা দুটি প্রান্তিক করা ডেটার সেটগুলির মধ্যে মিলের সংক্ষিপ্তসার করে।

বিশদ :

আমার প্রশ্নটি চিত্রের সাহায্যে সবচেয়ে ভালভাবে ব্যাখ্যা করা হয়েছে। নীচের গ্রাফগুলি দুটি পৃথক ডেটা সেট দেখায়, প্রতিটি মান সহ লেবেলযুক্ত nfএবং nr। এক্স-অক্ষের বরাবর পয়েন্টগুলি উপস্থাপন করে যেখানে পরিমাপ নেওয়া হয়েছিল এবং y- অক্ষের মানগুলি ফলাফল হিসাবে পরিমাপ করা মান।

প্রতিটি গ্রাফের জন্য আমি প্রতিটি পরিমাপের বিন্দুতে মিল nfএবং nrমানগুলির সংক্ষিপ্তসার জন্য একক সংখ্যা চাই । এই উদাহরণে এটি দৃশ্যত সুস্পষ্ট যে প্রথম গ্রাফের ফলাফলগুলি দ্বিতীয় গ্রাফের চেয়ে কম মিলে। তবে আমার কাছে প্রচুর অন্যান্য ডেটা রয়েছে যেখানে পার্থক্যটি কম স্পষ্ট, তাই এই পরিমাণগতভাবে র‌্যাঙ্ক করতে সক্ষম হওয়া সহায়ক হবে।

আমি ভেবেছিলাম এমন কোনও মানক কৌশল থাকতে পারে যা সাধারণত ব্যবহৃত হয়। পরিসংখ্যানগত মিলের জন্য অনুসন্ধান করা বিভিন্ন রকমের ফলাফল দিয়েছে তবে আমি নিশ্চিত না যে কোনটি বেছে নেওয়া ভাল বা আমি প্রস্তুত জিনিসগুলি যদি আমার সমস্যার ক্ষেত্রে প্রয়োগ করে তবে আমি নিশ্চিত নই। সুতরাং আমি ভেবেছিলাম যদি একটি সহজ উত্তর থাকে তবে এই প্রশ্নটি এখানে জিজ্ঞাসা করার উপযুক্ত।

এখানে চিত্র বর্ণনা লিখুন


1
আপনি এই কাগজটি দেখতে চাইবেন যাতে তালিকাভুক্ত পদক্ষেপের আধিক্য রয়েছে। ( ব্যবহারকারী.uom.gr/~kouiruki/sung.pdf ) লিঙ্কটি যদি গণিতের মডেল ও পদ্ধতিগুলির আন্তর্জাতিক জার্নালে সুং-হিউক চা দ্বারা পরিচালিত "সম্ভাব্যতা ঘনত্বের কার্যকারিতাগুলির মধ্যে দূরত্ব / সাদৃশ্যতা সম্পর্কিত পরিমাপ সম্পর্কিত বিস্তৃত সমীক্ষা" নামে পরিচিত না হয় ফলিত বিজ্ঞানের ক্ষেত্রে যা মিলের পদক্ষেপের আধিক্য পর্যালোচনা করে।
arie64

ডায়নামিক টাইম ওয়ার্পিং দুটি সময়-সিরিজের মধ্যে মিলটি পরিমাপ করতে ব্যবহৃত হয়। এই কৌশলটি এখানে কাজটি করতে পারে। এই লিঙ্কটি দেখুন: en.wikedia.org/wiki/ ডায়নামিক_টাইম_ওয়ার্পিং
আমান আনন্দ

উত্তর:


6

2 টি রেখাচিত্রের মধ্যে অঞ্চল আপনাকে পার্থক্য দিতে পারে। অতএব যোগফল (এনআর-এনএফ) (সমস্ত পার্থক্যের সমষ্টি) 2 বক্ররেখার মধ্যবর্তী অঞ্চলের একটি সীমাবদ্ধতা হবে। আপনি যদি এটি আপেক্ষিক করতে চান তবে যোগফল (এনআর-এনএফ) / যোগ (এনএফ) ব্যবহার করা যেতে পারে। এগুলি আপনাকে প্রতিটি গ্রাফের জন্য 2 বক্ররেখার মধ্যে সাদৃশ্য নির্দেশ করে একটি একক মান দেবে।

সম্পাদনা করুন: পৃথক পয়েন্ট বা পর্যবেক্ষণ এবং সংযুক্ত লাইন বা বক্ররেখা না থাকলেও পার্থক্যের যোগফলের উপরোক্ত পদ্ধতিটি কার্যকর হবে তবে সেই ক্ষেত্রে, পার্থক্যের গড়গুলিও একটি সূচক হতে পারে এবং যেহেতু এটি অ্যাকাউন্টে নেওয়া হবে তত ভাল হতে পারে পর্যবেক্ষণ সংখ্যা।


1
আমি এটি চেষ্টা করব এবং দেখুন এটি কীভাবে কাজ করে। আমি এখনও এটি আরও আনুষ্ঠানিক প্রযুক্তির সাথে সম্পর্কিত করতে সক্ষম হবেন আশা করি। আমি ইউক্লিডিয়ান দূরত্ব সম্পর্কে পড়ছি এবং মনে হচ্ছে এটি এখানে প্রযুক্তির সাথে বেশ মিল। অতিরিক্ত নোট হিসাবেও যদিও আমার গ্রাফের সাথে সংযোগের লাইন রয়েছে আমি কেবলমাত্র পৃথক পয়েন্টগুলির জন্য যত্নশীল। আমি আসলে কার্ভগুলির তুলনা করছি না, কেবলমাত্র পরিমাপ করা মান। আমার প্রশ্নে তা পরিষ্কার ছিল কিনা তা আমি জানি না।
গ্যাব্রিয়েল দক্ষিণী

পয়েন্টগুলি সংযুক্ত না থাকলেও এটি কাজ করা উচিত।
rnso

1

'সাদৃশ্য' বলতে কী বোঝাতে চাইছেন আপনাকে আরও সংজ্ঞা দিতে হবে। বিশালতা কি ব্যাপার? নাকি শুধু আকৃতি?

যদি কেবল বিষয়গুলিকেই আকার দেয় তবে আপনি উভয় সময় সিরিজকে তাদের সর্বোচ্চ মান দ্বারা স্বাভাবিক করতে চান (যাতে তারা উভয়ই 0 থেকে 1 এর মধ্যে থাকে)।

আপনি যদি লিনিয়ার পারস্পরিক সম্পর্ক খুঁজছেন, একটি সাধারণ পিয়ারসন পারস্পরিক সম্পর্ক সঠিকভাবে কাজ করবে - যা মূলত সমবায়কে পরিমাপ করে।

উদাহরণস্বরূপ, অন্যান্য কৌশল রয়েছে যা সময় সিরিজের (মূলত এটি মসৃণকরণের) জন্য একটি লাইন বা বহুবর্ষের সাথে মাপসই করে এবং তারপরে মসৃণ বহুবচনগুলির সাথে তুলনা করতে পারে।

আপনি যদি পর্যায়ক্রমিক মিলের সন্ধান করছেন (যেমন সময় সিরিজের একটি নির্দিষ্ট সাইনোসয়েডাল উপাদান বা seasonতুসত্তা রয়েছে), প্রথমে ট্রেন্ডে টাইম সিরিজের পচন এবং asonsতু উপাদানগুলি বিবেচনা করুন। বা ফ্রিকোয়েন্সি ডোমেনের ডেটা তুলনা করতে FFT এর মতো কিছু ব্যবহার করা।

'অনুরূপ' কী হওয়া উচিত তার আরও সংজ্ঞা ছাড়াই আমি জানি সমস্ত বিষয়ে ts আশা করি এটা সাহায্য করবে.


0

আপনি প্রতিটি পরিমাপ পয়েন্টের জন্য (এনআর-এনএফ) ব্যবহার করতে পারেন, সংখ্যাটি যত কম (পরম মান) তত বেশি মানের অনুরূপ। একেবারে বৈজ্ঞানিক পদ্ধতির মতো নয়, দয়া করে আমাকে ক্ষমা করুন, আমার এই জিনিসগুলির কোনও সত্যিক প্রশিক্ষণ নেই। যদি আপনি কেবল ভিজ্যুয়ালের একটি সংখ্যার উপস্থাপনা খুঁজছেন, এটি করা উচিত।


1
আপনার পরামর্শের জন্য ধন্যবাদ. আমি সে সম্পর্কেও ভেবেছিলাম, তবে সমস্যাটি হ'ল আপেক্ষিক পার্থক্যের চেয়ে পরম পার্থক্য দ্বারা ওজন করা হবে। উদাহরণস্বরূপ আমি আরও অনুরূপ ডেটা সেটগুলিতে অন্তর্ভুক্ত করেছি এর মধ্যে আরও কম পরিপূর্ণ মান রয়েছে তবে পরিস্থিতি যদি বিপরীত হয় তবে আপনি এই কৌশলটি ব্যবহার করে একটি ভুল ব্যাখ্যা পেতে পারেন। আমার নিখুঁত পার্থক্যের চেয়ে তুলনামূলক মিল / পার্থক্য সংক্ষিপ্ত করা দরকার।
গ্যাব্রিয়েল দক্ষিণী

(এনআর-এনএফ) / এনএফ কাজ করবে? যে আপনি আপেক্ষিক পেতে হবে। আমি নিজে থেকে একই ধরণের পরিস্থিতি নিয়ে কাজ করছি বলে আমি আসল উত্তরটি দেখতে সত্যিই আগ্রহী।
মাইক জি

যদি তারা সমস্ত তুলনামূলক স্কেলে থাকে তবে আপনার অনুরূপগুলি সাধারণত কম হয় তা আপেক্ষিক মান সম্পর্কে নয়, এটি মিলটির ব্যাখ্যা সম্পর্কে। যদি দ্বিতীয় গ্রাফের মানগুলি 101-104 থেকে শুরু করে তবে এটি কী তাদের মিলের ব্যাখ্যা পরিবর্তন করবে? যদি তা হয় তবে আপনার এটি ব্যাখ্যা করা দরকার। ওয়াই-ভেরিয়েবলটি ঠিক কী সম্পর্কিত আরও বিশদ বিবরণ প্রয়োজন।
জন

@ জন এটি একটি ভাল বিষয়। আমার ধারণা এই সম্পর্কে আরও চিন্তা করা দরকার। Y এর মানগুলি একটি মানদণ্ডের জন্য গতিসম্পন্ন মান এবং আমি বিভিন্ন বিভিন্ন কনফিগারেশনের মধ্যে মিলের তুলনা করার চেষ্টা করছি। সুতরাং আমি অনুমান করি যে এই উত্তরের পরামর্শটি কার্যকর হতে পারে, আমি সংখ্যাগুলি দেখতে কেমন তা দেখার জন্য এটি চেষ্টা করতে পারি। আমি এখনও একটি পরিসংখ্যান কৌশল ব্যবহার করতে পছন্দ করি যা আরও আনুষ্ঠানিকভাবে গৃহীত হয় (যদি আমার সমস্যাটির জন্য কিছু থাকে)।
গ্যাব্রিয়েল দক্ষিণী
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.