আমি বিশ্লেষণের যে পদ্ধতিটি আমি ব্যবহার করছি তার একটি পরামর্শ চাই, এটি এটি পরিসংখ্যানগত দিক থেকে কার্যকর কিনা তা জানতে।
আমি দুটি বিন্দু প্রক্রিয়াগুলি এবং এবং আমি নির্ধারণ করতে চাই যদি এর ইভেন্টগুলি কোনওভাবে এর ইভেন্টগুলির সাথে সম্পর্কিত হয় ।
আমি সাহিত্যে যে পদ্ধতিগুলি খুঁজে পেয়েছি তার মধ্যে একটি হ'ল ক্রস পারস্পরিক সম্পর্কের হিস্টোগ্রাম তৈরি করা: প্রতিটি আমরা এর সমস্ত ঘটনার জন্য বিলম্ব খুঁজে যা সময়ের নির্দিষ্ট উইন্ডোতে পড়ে (আগে এবং পরে) ), এবং তারপরে আমরা এই সমস্ত বিলম্বের একটি হিস্টোগ্রাম তৈরি করি।
দুটি প্রক্রিয়া যদি পারস্পরিক সম্পর্কযুক্ত না হয় তবে আমি ফ্ল্যাট হিস্টোগ্রামের প্রত্যাশা করব, কারণ or পরে (বা তার আগে) এ কোনও ইভেন্ট হওয়ার সম্ভাবনা সমস্ত বিলম্বের সমান। অন্যদিকে, যদি হিস্টোগ্রামে শীর্ষগুলি থাকে তবে এটি পরামর্শ দেয় যে দুটি দফা প্রক্রিয়াটি একে অপরকে প্রভাবিত করছে (বা কমপক্ষে কিছু সাধারণ ইনপুট রয়েছে)।
এখন, এটি দুর্দান্ত এবং ভাল, তবে আমি কীভাবে নির্ধারণ করব যে হিস্টোগ্রামগুলির শিখর রয়েছে কিনা (আমার বলতে হবে যে আমার নির্দিষ্ট ডেটাগুলির জন্য সেগুলি স্পষ্টভাবে সমতল, তবে তার একটি পরিসংখ্যানগত পদ্ধতি থাকা ভাল হবে) নিশ্চিত করে)?
সুতরাং, আমি এখানে যা করেছি: আমি রাখার জন্য বেশ কয়েকটি (1000) বার হিস্টগ্রাম তৈরির প্রক্রিয়াটি আবার করেছি এবং এর "বদলানো" সংস্করণ ব্যবহার করেছি । এলোমেলো করতে আমি সমস্ত ইভেন্টের মধ্যে অন্তরগুলি গণনা করে, এলোমেলো করে একটি নতুন পয়েন্ট প্রক্রিয়া পুনঃস্থাপনের জন্য তাদের যোগফল। আরআই তে সহজভাবে এটি করুন:
times2.swp <- cumsum(sample(diff(times2)))
সুতরাং, আমি 1000 টি নতুন হিস্টগ্রাম দিয়ে শেষ করেছি, যা আমাকে তুলনায় events এর ইভেন্টগুলির ঘনত্ব দেখায় ।
এই হিস্টগ্রামের প্রতিটি বিনের জন্য (তারা সকলেই একইভাবে বিন্যস্ত) আমি হিস্টগ্রামের 95% ঘনত্ব গণনা করি। অন্য কথায় আমি বলছি, উদাহরণস্বরূপ: সময় দেরিতে 5 এমএস, শিফলেড পয়েন্ট প্রসেসগুলির 95% তে একটি ইভেন্টের পরে in তে কোনও ইভেন্ট সন্ধান করার সম্ভাবনা x থাকে ।
আমি তখন সমস্ত সময় বিলম্বের জন্য এই 95% মানটি নেব এবং এটিকে কিছু "আত্মবিশ্বাসের সীমা" হিসাবে ব্যবহার করব (সম্ভবত এটি সঠিক শব্দ নয়) যাতে মূল হিস্টোগ্রামে এই সীমাটি অতিক্রম করে এমন কোনও কিছুকে "সত্য হিসাবে বিবেচনা করা যায়" শিখর".
প্রশ্ন 1 : এই পদ্ধতিটি কি পরিসংখ্যানগতভাবে সঠিক? না হলে আপনি কীভাবে এই সমস্যা মোকাবেলা করবেন?
প্রশ্ন 2 : অন্য একটি জিনিস যা আমি দেখতে চাই তা হ'ল আমার ডেটার সাথে "দীর্ঘতর" ধরণের সম্পর্ক রয়েছে কিনা। উদাহরণস্বরূপ দুটি পয়েন্ট প্রক্রিয়াগুলিতে ইভেন্টের হারে একই রকম পরিবর্তন হতে পারে (নোট করুন যে তাদের বেশ কয়েকটি আলাদা রেট থাকতে পারে), তবে আমি কীভাবে এটি করব তা নিশ্চিত নই। আমি প্রতিটি বিন্দু প্রক্রিয়ার একটি "খাম" তৈরি করার চিন্তা করছিলাম কিছু ধরণের স্মুথল কার্নেল ব্যবহার করে এবং তারপর দুটি খামের ক্রস-পারস্পরিক সম্পর্ক বিশ্লেষণ করবো। আপনি কি অন্য কোনও সম্ভাব্য বিশ্লেষণের পরামর্শ দিতে পারেন?
আপনাকে ধন্যবাদ এবং এই দীর্ঘ প্রশ্নের জন্য দুঃখিত।