আমি কী করার চেষ্টা করছি তা বর্ণনা করার জন্য কিছু ভাল পরিভাষা খুঁজছি, উত্সগুলি সন্ধান করা আরও সহজ করে তুলতে।
সুতরাং, বলুন আমার কাছে দুটি এবং A এবং B পয়েন্টের দুটি ক্লাস্টার রয়েছে, প্রত্যেকটিই দুটি এবং দুটি মান, X এবং Y এর সাথে যুক্ত, এবং আমি A এবং B এর মধ্যে "দূরত্ব" পরিমাপ করতে চাই - অর্থাৎ সম্ভবত একই বিতরণ থেকে তাদের নমুনা দেওয়া হয়েছিল কতটা সম্ভব? (আমি ধরে নিতে পারি যে বিতরণগুলি স্বাভাবিক)। উদাহরণস্বরূপ, যদি এক্স এবং ওয়াই A তে সংযুক্ত থাকে তবে বি তে নয়, বিতরণগুলি ভিন্ন।
স্বজ্ঞাতভাবে, আমি এ এর কোভেরিয়েন্স ম্যাট্রিক্সটি পেয়ে যাব এবং তারপরে বি এর প্রতিটি বিন্দু সেখানে কতটা ফিট হতে পারে তা দেখুন এবং তদ্বিপরীত (সম্ভবত মহালানোবিসের দূরত্বের মতো সামান্য ব্যবহার)।
তবে এটি কিছুটা "অ্যাড-হক", এবং সম্ভবত এটি বর্ণনা করার আরও কঠোর উপায় আছে (অবশ্যই, অনুশীলনে আমার কাছে দুটিরও বেশি ভেরিয়েবল সহ আরও দুটি ডাটা্যাসেট রয়েছে - আমি আমার ডেটাসেটগুলির মধ্যে কোনটি সনাক্ত করার চেষ্টা করছি outliers হয়)।
ধন্যবাদ!