দুটি অন্তর্নিহিত বিতরণ একই অন্তর্নিহিত জনসংখ্যা থেকে নমুনা দেওয়া আছে কিনা তা কীভাবে পরীক্ষা করবেন?


13

বলুন আপনাকে দুটি মাল্টিভিয়ারেট ডেটা সেট দেওয়া হয়েছে, একটি পুরানো এবং একটি নতুন বলুন এবং সেগুলি একই প্রক্রিয়াটি দ্বারা উত্পাদিত হয়েছিল বলে মনে করা হচ্ছে (যার জন্য আপনার কোনও মডেল নেই) তবে সম্ভবত, সংগ্রহ / তৈরির রেখা বরাবর কোথাও ডেটা, কিছু খারাপ লাগল went আপনি পুরানো ডেটা বা পুরানো ডেটা যুক্ত করার জন্য একটি বৈধতা সেট হিসাবে, নতুন ডেটা ব্যবহার করতে চাইবেন না।

আপনি এক ধরণের পরিসংখ্যান (প্রতি পরিবর্তনশীল), যেমন উইলকক্সন র‌্যাঙ্কের যোগফলটি করতে পারেন এবং কয়েকটি একাধিক পরীক্ষা সংশোধন করার চেষ্টা করতে পারেন তবে আমি নিশ্চিত নই যে এটি সর্বোত্তম (মাল্টিভারিয়েট ডেটার জটিলতাগুলি একাধিক পরীক্ষার বিষয়গুলি ছেড়ে দেওয়ার জন্য)। একটি উপায় হল একটি শ্রেণিবদ্ধকারী ব্যবহার করা এবং আপনি দুটি ডেটাসেটের মধ্যে বৈষম্য করতে পারেন কিনা তা দেখুন (সর্বোত্তম মানের একটি শ্রেণিবদ্ধ দেওয়া হয়েছে)। এটি কাজ করে বলে মনে হয় তবে এখনও ক) পারস্পাস আরও ভাল উপায় আছে খ) এটি কেন আলাদা তা বলার জন্য এটি সত্যই ডিজাইন করা হয়নি (অন্য কিছু না হলে এটি সেরা ভবিষ্যদ্বাণী ব্যবহার করবে এবং সম্ভবত আরও ভাল ভবিষ্যদ্বাণীকে মিস করবে যা ভাল ব্যক্তিরা সাবস্ক্রাইব করেছিল)

উত্তর:


3
http://131.95.113.139/courses/multivariate/mantel.pdf

আপনার ডেটাসেটগুলি একই আকারের হলে এটি করার দুটি সম্ভাব্য উপায় নিয়ে আলোচনা করে। মূল পদ্ধতিরটি হল আপনার দুটি পর্যবেক্ষণ ম্যাট্রিক্সের মধ্যে একটি দূরত্বের মেট্রিক গণনা করা। তারপরে সেই দূরত্বটি তাৎপর্যপূর্ণ কিনা তা নির্ধারণ করার জন্য, আপনি একটি ক্রয়ের পরীক্ষা ব্যবহার করেন ।

যদি আপনার ডেটাসেটগুলি একই আকার না হয় তবে আপনি ক্রস-ম্যাচ পরীক্ষাটি ব্যবহার করতে পারেন যদিও এটি খুব জনপ্রিয় বলে মনে হচ্ছে না। ক্রস-ম্যাচ পরীক্ষার পরিবর্তে আপনি নিজের ডেটা স্যাম্পল করার চেষ্টা করতে বা নিচে চেষ্টা করতে পারেন যাতে সেগুলি একই আকার হয়, তারপরে প্রথম কাগজে উল্লিখিত একটি পদ্ধতির ব্যবহার করে।


আপনি উল্লেখ করেছেন যে আমাদের যদি অসম আকারের ডেটাসেট থাকে তবে ক্রস ম্যাচ পরীক্ষাটি ব্যবহার করুন। তবে আপনার উল্লিখিত কাগজটি অনুসরণ করে, তারা সমান সমান ডেটাसेट ব্যবহার করে এবং দূরত্বের ভিত্তিতে জুড়ি দেওয়ার জন্য সন্ধান করে। আপনি এটি ব্যবহার করার কোন প্রমাণ পেয়েছেন? ক্রস-ম্যাচের জন্য রিলিজ নোট এমনকি, উদাহরণস্বরূপ ব্যবহারসমূহ ডেটাসেট সমান
lukeg

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.