পয়েন্ট-প্রক্রিয়াগুলির মধ্যে ক্রস পারস্পরিক সম্পর্ক বিশ্লেষণ


15

আমি বিশ্লেষণের যে পদ্ধতিটি আমি ব্যবহার করছি তার একটি পরামর্শ চাই, এটি এটি পরিসংখ্যানগত দিক থেকে কার্যকর কিনা তা জানতে।

আমি দুটি বিন্দু প্রক্রিয়াগুলি এবং এবং আমি নির্ধারণ করতে চাই যদি এর ইভেন্টগুলি কোনওভাবে এর ইভেন্টগুলির সাথে সম্পর্কিত হয় ।T1=t11,t21,...,tn1T2=t12,t22,...,tm2T1T2

আমি সাহিত্যে যে পদ্ধতিগুলি খুঁজে পেয়েছি তার মধ্যে একটি হ'ল ক্রস পারস্পরিক সম্পর্কের হিস্টোগ্রাম তৈরি করা: প্রতিটি আমরা এর সমস্ত ঘটনার জন্য বিলম্ব খুঁজে যা সময়ের নির্দিষ্ট উইন্ডোতে পড়ে (আগে এবং পরে) ), এবং তারপরে আমরা এই সমস্ত বিলম্বের একটি হিস্টোগ্রাম তৈরি করি।tn1T2tn1

দুটি প্রক্রিয়া যদি পারস্পরিক সম্পর্কযুক্ত না হয় তবে আমি ফ্ল্যাট হিস্টোগ্রামের প্রত্যাশা করব, কারণ or পরে (বা তার আগে) এ কোনও ইভেন্ট হওয়ার সম্ভাবনা সমস্ত বিলম্বের সমান। অন্যদিকে, যদি হিস্টোগ্রামে শীর্ষগুলি থাকে তবে এটি পরামর্শ দেয় যে দুটি দফা প্রক্রিয়াটি একে অপরকে প্রভাবিত করছে (বা কমপক্ষে কিছু সাধারণ ইনপুট রয়েছে)।T2T1

এখন, এটি দুর্দান্ত এবং ভাল, তবে আমি কীভাবে নির্ধারণ করব যে হিস্টোগ্রামগুলির শিখর রয়েছে কিনা (আমার বলতে হবে যে আমার নির্দিষ্ট ডেটাগুলির জন্য সেগুলি স্পষ্টভাবে সমতল, তবে তার একটি পরিসংখ্যানগত পদ্ধতি থাকা ভাল হবে) নিশ্চিত করে)?

সুতরাং, আমি এখানে যা করেছি: আমি রাখার জন্য বেশ কয়েকটি (1000) বার হিস্টগ্রাম তৈরির প্রক্রিয়াটি আবার করেছি এবং এর "বদলানো" সংস্করণ ব্যবহার করেছি । এলোমেলো করতে আমি সমস্ত ইভেন্টের মধ্যে অন্তরগুলি গণনা করে, এলোমেলো করে একটি নতুন পয়েন্ট প্রক্রিয়া পুনঃস্থাপনের জন্য তাদের যোগফল। আরআই তে সহজভাবে এটি করুন:T1T2T2

times2.swp <- cumsum(sample(diff(times2)))

সুতরাং, আমি 1000 টি নতুন হিস্টগ্রাম দিয়ে শেষ করেছি, যা আমাকে তুলনায় events এর ইভেন্টগুলির ঘনত্ব দেখায় ।T2T1

এই হিস্টগ্রামের প্রতিটি বিনের জন্য (তারা সকলেই একইভাবে বিন্যস্ত) আমি হিস্টগ্রামের 95% ঘনত্ব গণনা করি। অন্য কথায় আমি বলছি, উদাহরণস্বরূপ: সময় দেরিতে 5 এমএস, শিফলেড পয়েন্ট প্রসেসগুলির 95% তে একটি ইভেন্টের পরে in তে কোনও ইভেন্ট সন্ধান করার সম্ভাবনা x থাকে ।T2T1

আমি তখন সমস্ত সময় বিলম্বের জন্য এই 95% মানটি নেব এবং এটিকে কিছু "আত্মবিশ্বাসের সীমা" হিসাবে ব্যবহার করব (সম্ভবত এটি সঠিক শব্দ নয়) যাতে মূল হিস্টোগ্রামে এই সীমাটি অতিক্রম করে এমন কোনও কিছুকে "সত্য হিসাবে বিবেচনা করা যায়" শিখর".

প্রশ্ন 1 : এই পদ্ধতিটি কি পরিসংখ্যানগতভাবে সঠিক? না হলে আপনি কীভাবে এই সমস্যা মোকাবেলা করবেন?

প্রশ্ন 2 : অন্য একটি জিনিস যা আমি দেখতে চাই তা হ'ল আমার ডেটার সাথে "দীর্ঘতর" ধরণের সম্পর্ক রয়েছে কিনা। উদাহরণস্বরূপ দুটি পয়েন্ট প্রক্রিয়াগুলিতে ইভেন্টের হারে একই রকম পরিবর্তন হতে পারে (নোট করুন যে তাদের বেশ কয়েকটি আলাদা রেট থাকতে পারে), তবে আমি কীভাবে এটি করব তা নিশ্চিত নই। আমি প্রতিটি বিন্দু প্রক্রিয়ার একটি "খাম" তৈরি করার চিন্তা করছিলাম কিছু ধরণের স্মুথল কার্নেল ব্যবহার করে এবং তারপর দুটি খামের ক্রস-পারস্পরিক সম্পর্ক বিশ্লেষণ করবো। আপনি কি অন্য কোনও সম্ভাব্য বিশ্লেষণের পরামর্শ দিতে পারেন?

আপনাকে ধন্যবাদ এবং এই দীর্ঘ প্রশ্নের জন্য দুঃখিত।

উত্তর:


11

এই সমস্যাটি দুই বা ততোধিক মাত্রায় বিশ্লেষণ করার একটি স্ট্যান্ডার্ড পদ্ধতি হ'ল রিপলির (ক্রস) কে ফাংশন , তবে এটিও এক মাত্রায় ব্যবহার না করার কোনও কারণ নেই। (একটি গুগল অনুসন্ধান রেফারেন্সগুলি খনন করতে ভাল কাজ করে)) মূলত, এটি সেই দূরত্বগুলির পিডিএফের সাথে হিস্টোগ্রামের সান্নিধ্যের চেয়ে দুটি উপলব্ধির মধ্যে পয়েন্টগুলির মধ্যে সমস্ত দূরত্বের সিডিএফ প্লট করে। (একটি বৈকল্পিক, এল ফাংশন, কে এবং নাল বিতরণের মধ্যে দুটি অভিন্ন অনিয়ন্ত্রিত প্রক্রিয়াগুলির মধ্যে পার্থক্যকে প্লট করে)) ঝরঝরে করে আপনি বিনয়ের বাছাই করার, মসৃণকরণের, ইত্যাদি প্রয়োজনীয়তার সাথে যে সমস্যার মুখোমুখি হয়ে উঠছেন সেগুলির বেশিরভাগ অংশকেই পাশ কাটিয়ে তোলে K সাধারণত সিমুলেশন মাধ্যমে তৈরি করা হয়। এটি আর এ করা সহজ R আর এর জন্য অনেক স্থানিক পরিসংখ্যান প্যাকেজ সরাসরি বা তাত্ক্ষণিকভাবে এই 1 ডি ক্ষেত্রে মানিয়ে নেওয়া যায়। রজার বিভান্ডেরসিআরএএন-এর ওভারভিউ পৃষ্ঠা এই প্যাকেজগুলি তালিকাভুক্ত করে: "পয়েন্ট প্যাটার্ন অ্যানালাইসিস" বিভাগটি পড়ুন।


আকর্ষণীয় ... আমি এই মুহুর্তে কিছুটা ব্যস্ত, তবে আমি অবশ্যই এটি দেখতে পারি!
নিকো
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.